- La Minute IA
- Posts
- 📱 Google dévoile ses nouveaux assistants IA (et c'est impressionnant)
📱 Google dévoile ses nouveaux assistants IA (et c'est impressionnant)
AUSSI : 💡 Une IA de Harvard Détecte le Cancer avec 96% de Précision
Accédez aux précédentes éditions de la newsletter en cliquant ici
Salut la team IA ! J'espère que vous avez passé un joyeux Noël, entourés de vos proches. Bien que l'actualité ralentisse en cette fin d'année 2024, je reste fidèle au poste pour vous partager l'essentiel des nouvelles à ne pas manquer. C'est reparti pour une nouvelle Minute IA ⏰
Au programme d'aujourd'hui :
Découvrez les dernières avancées et projets en termes d’IA présentés par Google. 2025 s’annonce excitante !
La famille de modèles O3 d'OpenAI établit de nouveaux standards en matière de raisonnement artificiel.
CHIEF, l'IA développée par Harvard, transforme la détection du cancer avec une précision remarquable de 96%.
Google Cloud dévoile ses prédictions sur l'impact de l'IA dans le monde des affaires pour 2025.
Prêt·e ? C'est parti...
LA DÉFINITION DU JOUR
MidJourney
Midjourney est un générateur d'images par intelligence artificielle accessible via Discord ou sur son site web qui permet de créer des illustrations originales à partir de descriptions textuelles (prompts), connu pour ses rendus particulièrement artistiques et esthétiques.
L’INFO PRINCIPALE
Gemini 2.0, Project Astra, Jules : Les dernières innovations IA présentées par Google
Google ne cesse d’innover, et il y a pas mal de choses à déballer ici. Je vais commencer par les fonctionnalités déjà disponibles pour tous, puis je terminerai avec celles encore réservées à une poignée d’utilisateurs triés sur le volet.
Gemini 2.0 Flash Experimental (disponible dès maintenant)
Le modèle Gemini 2.0 Flash Experimental est le premier de la nouvelle série 2.0 que vous pouvez essayer dès aujourd’hui. Et franchement, c’est une belle avancée.
Ce modèle surpasse tous les anciens modèles 1.5 de Google, que ce soit en termes de performances sur les benchmarks ou de vitesse (2x plus rapide), tout en étant nettement plus compact. Cela montre que Google a fait des progrès fondamentaux en matière d’efficacité, pas seulement en puissance brute.
La grande nouveauté, c’est le Streaming Mode, une expérience presque magique : l’IA peut voir votre écran et discuter avec vous en temps réel, via la voix. Et le plus impressionnant ? Tout Gemini 2.0, y compris le mode Streaming, est totalement gratuit à essayer dans Google AI Studio et via l’API Gemini. Une telle technologie, de calibre professionnel, accessible gratuitement, c’est une vraie révolution.
Agents de recherche approfondie (Deep Research) (disponible dès maintenant)
Google propose aussi une fonctionnalité bluffante : Deep Research. Intégrée dans Gemini Advanced, cette nouveauté transforme l’IA en assistant de recherche ultra-complet.
Concrètement, l’agent crée un plan de recherche multi-étapes, que vous validez, puis explore le web de manière méthodique, avec plusieurs cycles de recherche et d’analyse. Imaginez un Perplexity, mais en beaucoup plus poussé.
Au final, vous obtenez un rapport structuré, avec des citations et des sources, prêt à être exporté dans Google Docs. Seule limite : cette fonctionnalité est réservée aux abonnés Gemini Advanced (payant). Si la recherche fait partie de votre quotidien, cela vaut clairement l’investissement.
Project Mariner (testeurs de confiance uniquement)
Project Mariner, c’est le prototype d’agent IA de Google pour les navigateurs. Actuellement en test via une extension expérimentale pour Chrome, il s’agit de leur première vraie tentative de faire interagir une IA avec les interfaces web.
L’IA peut naviguer sur les sites, cliquer, remplir des formulaires et effectuer des tâches multi-étapes comme un humain. Pour des raisons de sécurité, elle ne fonctionne que dans l’onglet actif et demande votre confirmation avant toute action sensible. On ne peut donc pas lancer 20 agents en parallèle, mais l’idée de déléguer les tâches ennuyeuses de navigation est prometteuse.
Pour l’instant, c’est réservé à des testeurs triés sur le volet, mais ce type de technologie ouvre la voie à un futur où l’IA gérera pour nous les tâches répétitives sur le web.
Agents de codage Jules (testeurs de confiance uniquement)
Jules est le nouvel agent de codage expérimental de Google, directement intégré à GitHub. Plus qu’un simple outil pour générer du code, Jules réfléchit comme un développeur.
Il peut planifier des tâches complexes, modifier plusieurs fichiers et préparer des pull requests pour corriger des bugs directement dans GitHub. Et mieux encore, il fonctionne de manière asynchrone : vous lui attribuez des tâches, et pendant qu’il les exécute, vous pouvez continuer votre propre travail.
Encore limité à quelques testeurs, Jules devrait être ouvert à davantage de développeurs début 2025. Une annonce à suivre de près !
Project Astra (testeurs de confiance uniquement)
Enfin, Project Astra, l’assistant universel de Google, évolue rapidement. Toujours en phase de test, cet assistant se veut capable de voir le monde en temps réel à vos côtés.
Ce qui change ? Une intégration encore plus poussée avec l’écosystème Google : il utilise Search, Lens et Maps comme des outils pour accomplir ses tâches. Il peut ainsi interpréter et agir sur des informations venant de multiples sources.
Autre nouveauté, sa capacité de mémoire : jusqu’à 10 minutes de mémoire active dans une session, avec des souvenirs de conversations passées pour une personnalisation accrue. Les essais incluent déjà des lunettes prototypes, et il me tarde de voir où cela va nous mener.
Le message est clair : Google ne mise plus uniquement sur la puissance brute de ses modèles, mais sur leur intégration pratique dans notre quotidien. Que ce soit pour automatiser nos tâches web, assister notre travail de développement, ou nous accompagner dans nos recherches, ces outils visent tous à augmenter notre productivité tout en restant accessibles.
2025 s'annonce comme une année charnière, où certaines de ces technologies expérimentales deviendront mainstream. Je n’imagine pas toutes les possibilités de pouvoir avoir un assistant qui réalise automatiquement des tâches sur notre navigateur chrome à notre place avec le project Mariner, j’ai hâte de tester en tout cas !
🤖 Les nouveaux modèles O3 d'OpenAI : Une avancée majeure dans le raisonnement artificiel
L'aboutissement des "12 Days of OpenAI" nous réserve une surprise de taille avec le lancement de la famille de modèles O3. Cette nouvelle génération, composée du O3 et du O3-mini, repousse les limites du raisonnement machine avec des performances remarquables.
Détails :
Performances exceptionnelles :
Programmation : Score ELO de 2727 sur Codeforces (+800 points vs O1)
Mathématiques : 96,7% sur AIME et 25,2% sur Frontier Math
Raisonnement scientifique : 87,7% sur GPQA Diamond (supérieur aux experts)
Compréhension conceptuelle : 87,5% sur ARC-AGI (dépassant la moyenne humaine)
O3-mini, la version optimisée :
Focus sur les tâches de programmation
Système de réglage du niveau de raisonnement (faible/moyen/élevé)
Disponibilité prévue : janvier 2025
Pourquoi je vous en parle ⤵️
Cette avancée marque un jalon important dans l'évolution de l'IA, même si nous sommes encore loin de l'AGI. Les performances du O3 établissent de nouveaux standards dans le domaine, tout en gardant à l'esprit que ces modèles conservent certaines limitations fondamentales.
Pour une vue d'ensemble complète, découvrez le récapitulatif des 12 jours d'annonces qui ont marqué cette fin d'année chez OpenAI.
APPRENEZ À MAITRISER L’IA
🎙️ Créez un agent conversationnel vocal pour votre site web
Découvrez comment ElevenLabs transforme l'expérience client avec sa nouvelle fonctionnalité d'agents conversationnels IA. Cette solution innovante permet d'intégrer un assistant vocal intelligent capable de parler naturellement avec vos visiteurs.
Les étapes pour mettre en place cet agent conversationnel :
Création du compte : Rendez-vous sur ElevenLabs et créez votre compte pour accéder à la section Agents
Configuration de l'agent : Définissez la personnalité de votre agent et rédigez son message d'accueil
Sélection vocale : Choisissez une voix existante ou créez une voix personnalisée pour des interactions plus authentiques
Personnalisation visuelle : Adaptez l'apparence du widget selon votre charte graphique
Intégration : Incorporez le code du widget sur votre site web
💡 Astuce pratique : Avant de déployer votre agent, utilisez le bouton "Test AI agent" pour vérifier la cohérence des réponses et leur alignement avec l'identité de votre marque. Cette étape est cruciale pour garantir une expérience utilisateur optimale.
QUE DIT LA RECHERCHE
🔬 CHIEF : L'IA de Harvard qui détecte le cancer avec une précision remarquable
Détails :
Un nouveau modèle d'IA nommé CHIEF (Clinical Histopathology Imaging Evaluation Foundation) vient d'être développé par la Harvard Medical School
Entraîné sur 44 téraoctets de données, incluant 15 millions d'images non étiquetées et 60 000 images de tissus
Capable de détecter 19 types de cancers différents avec une précision de 96%
Surpasse les systèmes existants de 36,1% dans l'analyse des tissus cancéreux
Le modèle est open source et disponible sur Github pour les chercheurs
Pourquoi je vous en parle :
Cette avancée représente une étape significative dans la détection précoce du cancer. Comparable à ChatGPT pour sa polyvalence, CHIEF se distingue par sa spécialisation dans l'analyse d'images médicales. Son approche innovante permet non seulement de détecter les tumeurs avec une grande précision, mais aussi d'évaluer l'agressivité du cancer et de prédire la réponse aux traitements. C'est un outil prometteur pour aider les professionnels de santé à prendre des décisions plus éclairées et rapides, potentiellement crucial pour sauver des vies.
LES DERNIERS OUTILS À LA MODE
💡 LES OUTILS :
📸 Google Imagen 3 franchit un nouveau cap dans la génération d'images par IA avec une qualité exceptionnelle et un rendu des détails bluffant.
🎨 Google Whisk propose une approche novatrice permettant de créer des visuels personnalisés en s'inspirant d'images existantes pour définir le sujet, la scène et le style.
☎️ NewOaks AI Phone Agent transforme la gestion des appels grâce à un agent téléphonique virtuel capable d'interagir naturellement en temps réel.
🧠 Findr se positionne comme votre second cerveau numérique, offrant une capacité de mémorisation illimitée grâce à l'IA.
📫 MagicMail simplifie la création d'emails professionnels en convertissant vos instructions textuelles en messages HTML stylisés et prêts à l'envoi.
📈 Betterwatchlist révolutionne le suivi boursier en fournissant des analyses en temps réel des mouvements de prix, alimentées par l'IA.
🎅 AI Santa by Tavus permet aux enfants du monde entier de discuter en vidéo avec le Père Noël dans 30 langues différentes pendant 5min.
DANS L’ACTUALITÉ
Midjourney dévoile sa nouvelle fonctionnalité Moodboards permettant aux utilisateurs de créer leurs propres styles de génération d'images en important une sélection de visuels de référence.
Meta améliore ses lunettes Ray-Ban connectées avec de nouvelles fonctionnalités comme la traduction en temps réel, un assistant IA et l'identification de musique via Shazam.
xAI déploie une version optimisée de Grok-2 sur X, offrant une vitesse triplée, un meilleur support multilingue et l'intégration de la recherche web.
Des chercheurs de Stanford initient un projet ambitieux visant à créer une cellule humaine virtuelle propulsée par l'IA pour révolutionner la recherche biologique.
[DeepLearning.AI propose](https://www.deeplearning.ai/short-course
VOTRE DOSE DE CONTENU JOURNALIÈRE
🔓 Un algorithme simple mais puissant pour tester les limites des IA
Le Best-of-N (BoN) se présente comme une nouvelle approche pour évaluer la robustesse des systèmes d'IA actuels à travers différentes modalités.
https://jplhughes.github.io/bon-jailbreaking🚀 Les prévisions de Google pour l'IA en entreprise
Une analyse prospective présentant les 5 principales transformations que l'intelligence artificielle apportera au monde des affaires d'ici 2025.
https://blog.google/products/google-cloud/ai-trends-business-2025/
C’EST TOUT POUR AUJOURD’HUI
Merci d’avoir lu le travail fait par notre équipe d’a-chat-rnés 😼
Comment évalueriez-vous la newsletter d’aujourd’hui ?Votez ci-dessous pour nous aider à améliorer la newsletter pour vous. |
💡 Pour m'aider à m’améliorer, développer de nouvelles idées ou des partenariats → [email protected] ou @mattioo81
👍️ Tu aimes ce que tu lis ? Abonnes-toi !
📺 Si tu préfères les contenus vidéos, je t'invite à t'abonner à ma chaîne YouTube.
- Mathieu
Reply