- La Minute IA
- Posts
- 🤖 OpenAI dévoile ses modèles o3 et o4-mini : l'IA qui "pense avec les images"
🤖 OpenAI dévoile ses modèles o3 et o4-mini : l'IA qui "pense avec les images"
AUSSI : La fusion nucléaire et l'IA s'allient dans une course énergétique prometteuse

Accédez aux précédentes éditions de la newsletter en cliquant ici
Salut la team IA ! C'est reparti pour une nouvelle Minute IA ⏰
Au programme d'aujourd'hui :
Les nouveaux modèles d'OpenAI capables d'intégrer les images dans leur processus de réflexion
La perception contrastée des Français sur l'utilisation de l'IA dans le domaine médical
Google Sheets se transforme avec sa nouvelle formule IA pour générer du contenu et analyser des données
DolphinGemma, le modèle d'IA de Google qui tente de décoder le langage des dauphins
On aborde aussi le sujet du MCP (Model Context Protocol) qui va définir comment les IA interagissent entre-elles.
Prêt·e ? C'est parti...
LA DÉFINITION DU JOUR
Le MCP (Model Context Protocol) : Comprendre l'enjeu de l'interopérabilité des IA
Le MCP (Model Context Protocol) est un standard ouvert qui connaît actuellement une adoption rapide parmi les utilisateurs avancés de l'intelligence artificielle. Pour simplifier, il s'agit d'un protocole permettant aux applications d'IA (appelées "MCP Clients") de se connecter à des "MCP Servers" qui leur fournissent un ensemble d'outils auxquels l'application d'IA peut accéder.
Comment fonctionne le MCP ?
L'intérêt principal du MCP est de créer une norme standardisée permettant à n'importe quel client MCP d'utiliser les milliers de serveurs MCP disponibles. Cela ajoute une puissance considérable à des outils comme Claude, ChatGPT ou agent.ai.
La beauté du MCP réside dans sa standardisation : les clients n'ont pas besoin d'être codés spécifiquement pour des API particulières, et les serveurs n'ont pas à s'adapter à différents types de clients. Tout communique via un protocole unifié.
Par exemple, un utilisateur peut demander à son IA : "Recherche OpenAI dans le CRM HubSpot et envoie les détails à @dharmesh sur Slack, en incluant le temps écoulé depuis ma dernière interaction."
Les obstacles actuels à l'adoption massive
Malgré son potentiel, le MCP fait face à des défis majeurs :
Authentification : Comment déterminer qui a accès à quelles fonctionnalités ?
Confiance : Comment identifier les serveurs MCP fiables ?
Provisionnement : Actuellement, la plupart des serveurs sont partagés via GitHub et nécessitent un auto-hébergement.
Sécurité : La façon dont les modèles de langage interagissent avec les outils présente de nouveaux risques.
Aujourd'hui, le MCP reste principalement destiné aux utilisateurs techniques ou à des cas d'usage spécifiques.
L'idée à un milliard de dollars : MCP.net
Une solution potentielle serait de créer un réseau centralisé de serveurs MCP qui éliminerait les frictions d'adoption. Ce réseau pourrait :
Permettre à quiconque de soumettre un serveur MCP et de l'héberger sur le réseau
Offrir un système d'évaluation des serveurs
Proposer une recherche sémantique pour trouver les bons outils
Créer des "remixes" de serveurs combinant des outils de différentes sources
Cette plateforme serait comparable à un "Hugging Face pour MCP", facilitant la découverte et la connexion aux serveurs MCP pour tous les utilisateurs, experts comme débutants.
L’INFO PRINCIPALE
🧠 OpenAI dévoile ses modèles o3 et o4-mini : l'IA qui "pense avec les images"

OpenAI franchit un nouveau cap avec ses modèles o3 et o4-mini, des systèmes d'IA capables d'intégrer les images directement dans leur processus de réflexion. Un bond technologique remarquable dont témoigne cette expérience partagée sur Twitter :
o3 really blew my mind with this one.
I gave it an image of a menu of my favorite Chinese place in SF with no title or EXIF data, and it was able to search the web, match menu items, and locate it.
🤯
— Deedy (@deedydas)
8:42 PM • Apr 16, 2025
Détails :
Raisonnement visuel intégré : Contrairement aux anciennes versions qui pouvaient simplement "voir" les images, ces nouveaux modèles peuvent raisonner avec elles - zoomer, pivoter et les transformer dynamiquement pour résoudre des problèmes.
Analyse d'images de faible qualité : Même vos croquis les plus brouillons ou photos de tableaux blancs seront correctement analysés et compris.
Utilisation autonome des outils : Ces modèles peuvent utiliser seuls tous les outils de ChatGPT (recherche web, Python, génération d'images) pour résoudre des problèmes complexes.
Performance exceptionnelle : o3 établit de nouveaux records dans les domaines du code, des mathématiques et des sciences, avec 20% moins d'erreurs majeures dans les contextes professionnels réels. De son côté, o4-mini offre un raisonnement rapide et économique, surpassant même o3 dans certains tests mathématiques.
Un point de vigilance : Ces modèles ont une tendance plus marquée aux hallucinations, avec o3 inventant des informations dans 33% des cas sur certains benchmarks, et o4-mini atteignant 48%.
Pourquoi je vous en parle ⤵️
Ces nouvelles IA ne se contentent plus de répondre à vos questions - elles deviennent de véritables partenaires de résolution de problèmes. Disponibles dès maintenant pour les utilisateurs Plus, Pro et Team de ChatGPT, ces modèles marquent une étape importante vers des assistants IA qui collaborent comme de véritables collègues plutôt que comme de simples chatbots. L'introduction de ces modèles, testés selon le récent "Preparedness Framework", montre qu'OpenAI continue d'accélérer le rythme de l'innovation en IA.
🌟 La fusion nucléaire et l'IA : une course énergétique déterminante

Entre promesses révolutionnaires et défis titanesques, la fusion nucléaire et l'intelligence artificielle s'entremêlent dans une course qui pourrait redéfinir notre avenir énergétique. D'un côté, des entreprises comme Commonwealth Fusion et Helion Energy (soutenue par Sam Altman) travaillent sur une source d'énergie propre et quasi illimitée. De l'autre, l'essor fulgurant de l'IA soulève des questions sur sa consommation électrique croissante et son impact potentiel sur nos infrastructures énergétiques.
Détails :
La fusion nucléaire n'est plus une simple utopie scientifique - des progrès concrets se multiplient avec différentes approches technologiques
Si certains pays comme l'Irlande voient déjà 17% de leur électricité consommée par les data centers, l'AIE relativise l'impact global de l'IA à court terme
Une convergence fascinante se dessine : l'IA aide désormais à maîtriser la fusion, créant une synergie entre ces deux technologies d'avenir
Pourquoi je vous en parle ⤵️
L'IA révolutionne le contrôle des plasmas
En février 2024, les chercheurs de Princeton ont réalisé une percée majeure en utilisant l'intelligence artificielle pour anticiper et prévenir les instabilités du plasma dans les réacteurs à fusion. Leur système peut prévoir les problèmes de plasma spécifiques jusqu'à 300 millisecondes à l'avance - un délai court mais suffisant pour ajuster les paramètres et maintenir la stabilité.
Pendant ce temps, le tokamak WEST du CEA français a marqué l'histoire avec son enveloppe en tungstène innovante, maintenant un plasma à 50 millions de degrés pendant six minutes et atteignant 1,15 gigajoule de puissance.
La Chine ne reste pas en arrière avec son "soleil artificiel" EAST qui a pulvérisé les records en maintenant un plasma pendant près de 18 minutes à plus de 100 millions de degrés.
Au Canada, General Fusion apporte sa pierre à l'édifice avec son prototype LM26, développant une approche alternative aux tokamaks traditionnels.
🩺 L'intelligence artificielle en santé : que pensent les Français ?

Une récente étude réalisée par FLASHS pour la MedTech Galeon auprès de 2 003 Français révèle des perceptions contrastées concernant l'utilisation de l'IA dans le domaine médical. Alors que près d'un tiers des Français a déjà consulté une IA générative pour obtenir des conseils de santé, la confiance reste mitigée.

Détails :
La connaissance de l'IA médicale varie considérablement : 64% des Français en ont entendu parler, mais seulement 10% estiment bien la comprendre, avec un écart notable entre hommes (70%) et femmes (58%).
Les jeunes générations montrent plus d'ouverture : 68% des 18-24 ans utilisent l'IA médicale contre seulement 10% des plus de 65 ans.
L'IA est perçue comme particulièrement pertinente pour le diagnostic (48%) et la recherche de traitements (47%), bien que seuls 4% des répondants lui accordent une confiance totale.
Parmi ceux ayant déjà utilisé l'IA pour des questions de santé, six personnes sur dix ont suivi les recommandations reçues, et 17% l'ont fait sans consulter un médecin.
La tolérance à l'erreur illustre un paradoxe : seuls 9% acceptent une erreur d'IA contre 20% pour une erreur humaine.
Si 12% des Français pensent que l'IA pourrait surpasser les médecins dans l'ensemble du parcours de soins, 53% estiment qu'elle pourrait exceller dans des domaines spécifiques comme l'analyse d'images médicales.

Pourquoi je vous en parle ⤵️
Cette étude met en lumière les attentes des Français concernant l'équilibre entre innovation technologique et humain dans les soins. La transparence apparaît comme une exigence fondamentale : 4 Français sur 5 souhaitent être informés lorsque l'IA intervient dans leur prise en charge. L'avenir de l'IA médicale semble se dessiner autour d'une approche hybride, avec 49% des répondants favorables à ce que leur médecin utilise l'IA comme outil d'aide à la décision, mais pas comme substitut.
APPRENEZ À MAITRISER L’IA
🔢 Transformez vos feuilles de calcul avec l'IA dans Google Sheets

Dans ce tutoriel, découvrez comment utiliser la nouvelle formule IA de Google Sheets pour générer du contenu, analyser des données et créer des résultats personnalisés directement dans votre tableur—le tout avec une simple commande.
Étapes du tutoriel :
Ouvrez Google Sheets via votre compte Google Workspace (le déploiement se fait progressivement).
Dans n'importe quelle cellule, tapez =AI("votre prompt", [référence de cellule optionnelle]) avec des instructions précises comme "Résumez ce retour client en trois points".
Appliquez votre formule à plusieurs cellules en faisant glisser la poignée d'angle vers le bas d'une colonne entière pour un traitement par lots.
Combinez avec des fonctions standard comme IF() et CONCATENATE() pour créer des flux de travail puissants, et utilisez "Actualiser et insérer" chaque fois que vous avez besoin de contenu mis à jour.
Astuce : Vous pouvez également inclure des instructions de formatage directement dans votre prompt, comme "en format tableau" ou "sous forme de liste numérotée", pour contrôler l'apparence de votre résultat dans la cellule.
QUE DIT LA RECHERCHE
🐬 Google décode le langage des dauphins avec l'IA

DolphinGemma, le nouveau modèle d'IA spécialisé de Google, marque une avancée fascinante dans la compréhension du monde animal. Développé en collaboration avec des chercheurs de Georgia Tech, ce système analyse et génère des vocalisations de dauphins pour tenter de décrypter les schémas de leur communication.
Détails :
DolphinGemma s'appuie sur la technologie Gemma de Google et des outils audio avancés pour traiter les sons émis par les dauphins, en utilisant des décennies de données collectées par le Wild Dolphin Project.
Le modèle analyse les séquences sonores pour identifier des motifs et prédire les sons suivants, fonctionnant de manière similaire aux modèles de langage pour humains.
Google a également conçu un appareil sous-marin nommé CHAT, basé sur le Pixel 9, qui combine l'IA avec des haut-parleurs et microphones pour permettre une interaction en temps réel avec les dauphins.
Le code sera publié en open-source cet été, permettant aux chercheurs du monde entier de l'adapter à l'étude de différentes espèces de dauphins.
Pourquoi je vous en parle
Alors que les tentatives précédentes de communication avec les dauphins ont souvent rencontré des limites, cette combinaison de recherches approfondies et d'intelligence artificielle moderne pourrait enfin ouvrir la porte à une nouvelle compréhension de ces créatures intelligentes. Si DolphinGemma réussit, nous pourrions découvrir de nouveaux horizons dans notre compréhension de l'intelligence animale.
LES DERNIERS OUTILS À LA MODE
💡 LES OUTILS :
🔍 Origami propose des agents de recherche qui identifient les prospects idéaux pour votre entreprise, simplifiant considérablement le processus de génération de leads.
🎵 DiffRhythm vous permet de générer des chansons complètes de 4 minutes avec voix en seulement 10 secondes, offrant une solution rapide pour vos besoins en création musicale.
🧪 Reach by Artificial Societies vous aide à tester vos contenus dans une simulation de votre propre audience LinkedIn, pour des stratégies de communication plus efficaces.
🌐 Infinite Reality facilite la création de sites web 3D interactifs et d'expériences virtuelles pour votre marque sans nécessiter de compétences en programmation.
⚙️ Codex CLI est l'agent de codage open-source d'OpenAI conçu pour les terminaux, rendant la programmation plus accessible et intuitive.
DANS L’ACTUALITÉ
Une nouvelle étude sur la thérapie assistée par IA montre des résultats prometteurs avec une réduction de 51% des symptômes dépressifs et de 31% pour l'anxiété.
MiniMax a lancé Speech-02, un modèle de synthèse vocale capable de produire des résultats ultra-réalistes dans plus de 30 langues différentes.
Apple a déployé la mise à jour iOS 18.4, apportant les fonctionnalités d'Apple Intelligence aux utilisateurs européens d'iPhone, ainsi que visionOS 2.4 avec des capacités IA pour le Vision Pro.
Sam Altman a annoncé qu'OpenAI publiera son premier modèle à poids ouverts depuis GPT-2 dans les prochains mois, avec des événements de pré-lancement pour les développeurs.
L'Académie des Arts et Sciences du Cinéma a officiellement autorisé l'utilisation de l'IA dans la production cinématographique, précisant que son utilisation n'influencera pas les chances de nomination.
Guide de prompting GPT 4.1 par OpenAI Cookbook, offrant des conseils pratiques pour tirer le meilleur parti du dernier modèle.
VOTRE DOSE DE CONTENU JOURNALIÈRE
1/ 🏆 Cette époque est comparable à la ruée vers l'or, avec des prompts et agents IA comme outils modernes pour capturer l'attention et les données.
we’ll look back at this era like the gold rush.
except this time:
– picks + shovels = prompts + AI agents
– gold = attention, data, distribution
– miners = builders automating boring work
– gold pans = n8n, replit, bolt, lovable
– land grabs = ai-first domains + keywords
–— GREG ISENBERG (@gregisenberg)
4:37 PM • Apr 17, 2025
2/ 🏥 Bill Gates prédit que l'intelligence artificielle remplacera tous les médecins et enseignants dans moins de 10 ans.
Bill Gates is warning that all doctors and teachers will be replaced by AI in less than 10 years.
— Financelot (@FinanceLancelot)
2:16 PM • Apr 20, 2025
3/ 🧙 Une bande-annonce du Seigneur des Anneaux en style Studio Ghibli a été créée grâce au nouveau générateur d'images d'OpenAI et à Kling AI.
What if Studio Ghibli directed Lord of the Rings?
I spent $250 in Kling credits and 9 hours re-editing the Fellowship trailer to bring that vision to life—and I’ll show you exactly how I did it 👇🏼
— PJ Ace (@PJaccetturo)
6:53 AM • Mar 27, 2025
C’EST TOUT POUR AUJOURD’HUI
Merci d’avoir lu le travail fait par notre équipe d’a-chat-rnés 😼

Comment évalueriez-vous la newsletter d’aujourd’hui ?Votez ci-dessous pour nous aider à améliorer la newsletter pour vous. |
💡 Envie de contribuer, d’échanger des idées ou de construire des partenariats → [email protected] ou→ @mattioo81
👍️ Tu aimes ce que tu lis ? Abonnes-toi !
📺 Si tu préfères les contenus vidéos, je t'invite à t'abonner à ma chaîne YouTube.
- Mathieu
Reply