• La Minute IA
  • Posts
  • 📱 Google dévoile ses nouveaux assistants IA (et c'est impressionnant)

📱 Google dévoile ses nouveaux assistants IA (et c'est impressionnant)

AUSSI : 💡 Une IA de Harvard Détecte le Cancer avec 96% de Précision

Accédez aux précédentes éditions de la newsletter en cliquant ici

Salut la team IA ! J'espère que vous avez passé un joyeux Noël, entourés de vos proches. Bien que l'actualité ralentisse en cette fin d'année 2024, je reste fidèle au poste pour vous partager l'essentiel des nouvelles à ne pas manquer. C'est reparti pour une nouvelle Minute IA 

Au programme d'aujourd'hui :

  • Découvrez les dernières avancées et projets en termes d’IA présentés par Google. 2025 s’annonce excitante !

  • La famille de modèles O3 d'OpenAI établit de nouveaux standards en matière de raisonnement artificiel.

  • CHIEF, l'IA développée par Harvard, transforme la détection du cancer avec une précision remarquable de 96%.

  • Google Cloud dévoile ses prédictions sur l'impact de l'IA dans le monde des affaires pour 2025.

Prêt·e ? C'est parti...

LA DÉFINITION DU JOUR

MidJourney

Midjourney est un générateur d'images par intelligence artificielle accessible via Discord ou sur son site web qui permet de créer des illustrations originales à partir de descriptions textuelles (prompts), connu pour ses rendus particulièrement artistiques et esthétiques.

L’INFO PRINCIPALE

Gemini 2.0, Project Astra, Jules : Les dernières innovations IA présentées par Google

Google ne cesse d’innover, et il y a pas mal de choses à déballer ici. Je vais commencer par les fonctionnalités déjà disponibles pour tous, puis je terminerai avec celles encore réservées à une poignée d’utilisateurs triés sur le volet.

Gemini 2.0 Flash Experimental (disponible dès maintenant)

Le modèle Gemini 2.0 Flash Experimental est le premier de la nouvelle série 2.0 que vous pouvez essayer dès aujourd’hui. Et franchement, c’est une belle avancée.

Ce modèle surpasse tous les anciens modèles 1.5 de Google, que ce soit en termes de performances sur les benchmarks ou de vitesse (2x plus rapide), tout en étant nettement plus compact. Cela montre que Google a fait des progrès fondamentaux en matière d’efficacité, pas seulement en puissance brute.

La grande nouveauté, c’est le Streaming Mode, une expérience presque magique : l’IA peut voir votre écran et discuter avec vous en temps réel, via la voix. Et le plus impressionnant ? Tout Gemini 2.0, y compris le mode Streaming, est totalement gratuit à essayer dans Google AI Studio et via l’API Gemini. Une telle technologie, de calibre professionnel, accessible gratuitement, c’est une vraie révolution.

Agents de recherche approfondie (Deep Research) (disponible dès maintenant)

Google propose aussi une fonctionnalité bluffante : Deep Research. Intégrée dans Gemini Advanced, cette nouveauté transforme l’IA en assistant de recherche ultra-complet.

Concrètement, l’agent crée un plan de recherche multi-étapes, que vous validez, puis explore le web de manière méthodique, avec plusieurs cycles de recherche et d’analyse. Imaginez un Perplexity, mais en beaucoup plus poussé.

Au final, vous obtenez un rapport structuré, avec des citations et des sources, prêt à être exporté dans Google Docs. Seule limite : cette fonctionnalité est réservée aux abonnés Gemini Advanced (payant). Si la recherche fait partie de votre quotidien, cela vaut clairement l’investissement.

Project Mariner (testeurs de confiance uniquement)

Project Mariner, c’est le prototype d’agent IA de Google pour les navigateurs. Actuellement en test via une extension expérimentale pour Chrome, il s’agit de leur première vraie tentative de faire interagir une IA avec les interfaces web.

L’IA peut naviguer sur les sites, cliquer, remplir des formulaires et effectuer des tâches multi-étapes comme un humain. Pour des raisons de sécurité, elle ne fonctionne que dans l’onglet actif et demande votre confirmation avant toute action sensible. On ne peut donc pas lancer 20 agents en parallèle, mais l’idée de déléguer les tâches ennuyeuses de navigation est prometteuse.

Pour l’instant, c’est réservé à des testeurs triés sur le volet, mais ce type de technologie ouvre la voie à un futur où l’IA gérera pour nous les tâches répétitives sur le web.

Agents de codage Jules (testeurs de confiance uniquement)

Jules est le nouvel agent de codage expérimental de Google, directement intégré à GitHub. Plus qu’un simple outil pour générer du code, Jules réfléchit comme un développeur.

Il peut planifier des tâches complexes, modifier plusieurs fichiers et préparer des pull requests pour corriger des bugs directement dans GitHub. Et mieux encore, il fonctionne de manière asynchrone : vous lui attribuez des tâches, et pendant qu’il les exécute, vous pouvez continuer votre propre travail.

Encore limité à quelques testeurs, Jules devrait être ouvert à davantage de développeurs début 2025. Une annonce à suivre de près !

Project Astra (testeurs de confiance uniquement)

Enfin, Project Astra, l’assistant universel de Google, évolue rapidement. Toujours en phase de test, cet assistant se veut capable de voir le monde en temps réel à vos côtés.

Ce qui change ? Une intégration encore plus poussée avec l’écosystème Google : il utilise Search, Lens et Maps comme des outils pour accomplir ses tâches. Il peut ainsi interpréter et agir sur des informations venant de multiples sources.

Autre nouveauté, sa capacité de mémoire : jusqu’à 10 minutes de mémoire active dans une session, avec des souvenirs de conversations passées pour une personnalisation accrue. Les essais incluent déjà des lunettes prototypes, et il me tarde de voir où cela va nous mener.

Le message est clair : Google ne mise plus uniquement sur la puissance brute de ses modèles, mais sur leur intégration pratique dans notre quotidien. Que ce soit pour automatiser nos tâches web, assister notre travail de développement, ou nous accompagner dans nos recherches, ces outils visent tous à augmenter notre productivité tout en restant accessibles.

2025 s'annonce comme une année charnière, où certaines de ces technologies expérimentales deviendront mainstream. Je n’imagine pas toutes les possibilités de pouvoir avoir un assistant qui réalise automatiquement des tâches sur notre navigateur chrome à notre place avec le project Mariner, j’ai hâte de tester en tout cas !

🤖 Les nouveaux modèles O3 d'OpenAI : Une avancée majeure dans le raisonnement artificiel

L'aboutissement des "12 Days of OpenAI" nous réserve une surprise de taille avec le lancement de la famille de modèles O3. Cette nouvelle génération, composée du O3 et du O3-mini, repousse les limites du raisonnement machine avec des performances remarquables.

Détails :

  • Performances exceptionnelles :

    • Programmation : Score ELO de 2727 sur Codeforces (+800 points vs O1)

    • Mathématiques : 96,7% sur AIME et 25,2% sur Frontier Math

    • Raisonnement scientifique : 87,7% sur GPQA Diamond (supérieur aux experts)

    • Compréhension conceptuelle : 87,5% sur ARC-AGI (dépassant la moyenne humaine)

  • O3-mini, la version optimisée :

    • Focus sur les tâches de programmation

    • Système de réglage du niveau de raisonnement (faible/moyen/élevé)

    • Disponibilité prévue : janvier 2025

Pourquoi je vous en parle ⤵️

Cette avancée marque un jalon important dans l'évolution de l'IA, même si nous sommes encore loin de l'AGI. Les performances du O3 établissent de nouveaux standards dans le domaine, tout en gardant à l'esprit que ces modèles conservent certaines limitations fondamentales.

Pour une vue d'ensemble complète, découvrez le récapitulatif des 12 jours d'annonces qui ont marqué cette fin d'année chez OpenAI.

APPRENEZ À MAITRISER L’IA

🎙️ Créez un agent conversationnel vocal pour votre site web

Découvrez comment ElevenLabs transforme l'expérience client avec sa nouvelle fonctionnalité d'agents conversationnels IA. Cette solution innovante permet d'intégrer un assistant vocal intelligent capable de parler naturellement avec vos visiteurs.

Les étapes pour mettre en place cet agent conversationnel :

  1. Création du compte : Rendez-vous sur ElevenLabs et créez votre compte pour accéder à la section Agents

  2. Configuration de l'agent : Définissez la personnalité de votre agent et rédigez son message d'accueil

  3. Sélection vocale : Choisissez une voix existante ou créez une voix personnalisée pour des interactions plus authentiques

  4. Personnalisation visuelle : Adaptez l'apparence du widget selon votre charte graphique

  5. Intégration : Incorporez le code du widget sur votre site web

💡 Astuce pratique : Avant de déployer votre agent, utilisez le bouton "Test AI agent" pour vérifier la cohérence des réponses et leur alignement avec l'identité de votre marque. Cette étape est cruciale pour garantir une expérience utilisateur optimale.

QUE DIT LA RECHERCHE

🔬 CHIEF : L'IA de Harvard qui détecte le cancer avec une précision remarquable

Détails :

  • Un nouveau modèle d'IA nommé CHIEF (Clinical Histopathology Imaging Evaluation Foundation) vient d'être développé par la Harvard Medical School

  • Entraîné sur 44 téraoctets de données, incluant 15 millions d'images non étiquetées et 60 000 images de tissus

  • Capable de détecter 19 types de cancers différents avec une précision de 96%

  • Surpasse les systèmes existants de 36,1% dans l'analyse des tissus cancéreux

  • Le modèle est open source et disponible sur Github pour les chercheurs

Pourquoi je vous en parle :
Cette avancée représente une étape significative dans la détection précoce du cancer. Comparable à ChatGPT pour sa polyvalence, CHIEF se distingue par sa spécialisation dans l'analyse d'images médicales. Son approche innovante permet non seulement de détecter les tumeurs avec une grande précision, mais aussi d'évaluer l'agressivité du cancer et de prédire la réponse aux traitements. C'est un outil prometteur pour aider les professionnels de santé à prendre des décisions plus éclairées et rapides, potentiellement crucial pour sauver des vies.

LES DERNIERS OUTILS À LA MODE

💡 LES OUTILS :

  • 📸 Google Imagen 3 franchit un nouveau cap dans la génération d'images par IA avec une qualité exceptionnelle et un rendu des détails bluffant.

  • 🎨 Google Whisk propose une approche novatrice permettant de créer des visuels personnalisés en s'inspirant d'images existantes pour définir le sujet, la scène et le style.

  • ☎️ NewOaks AI Phone Agent transforme la gestion des appels grâce à un agent téléphonique virtuel capable d'interagir naturellement en temps réel.

  • 🧠 Findr se positionne comme votre second cerveau numérique, offrant une capacité de mémorisation illimitée grâce à l'IA.

  • 📫 MagicMail simplifie la création d'emails professionnels en convertissant vos instructions textuelles en messages HTML stylisés et prêts à l'envoi.

  • 📈 Betterwatchlist révolutionne le suivi boursier en fournissant des analyses en temps réel des mouvements de prix, alimentées par l'IA.

  • 🎅 AI Santa by Tavus permet aux enfants du monde entier de discuter en vidéo avec le Père Noël dans 30 langues différentes pendant 5min.

DANS L’ACTUALITÉ

  • Midjourney dévoile sa nouvelle fonctionnalité Moodboards permettant aux utilisateurs de créer leurs propres styles de génération d'images en important une sélection de visuels de référence.

  • Meta améliore ses lunettes Ray-Ban connectées avec de nouvelles fonctionnalités comme la traduction en temps réel, un assistant IA et l'identification de musique via Shazam.

  • xAI déploie une version optimisée de Grok-2 sur X, offrant une vitesse triplée, un meilleur support multilingue et l'intégration de la recherche web.

  • Des chercheurs de Stanford initient un projet ambitieux visant à créer une cellule humaine virtuelle propulsée par l'IA pour révolutionner la recherche biologique.

  • [DeepLearning.AI propose](https://www.deeplearning.ai/short-course

VOTRE DOSE DE CONTENU JOURNALIÈRE

  1. 🔓 Un algorithme simple mais puissant pour tester les limites des IA
    Le Best-of-N (BoN) se présente comme une nouvelle approche pour évaluer la robustesse des systèmes d'IA actuels à travers différentes modalités.
    https://jplhughes.github.io/bon-jailbreaking

  2. 🚀 Les prévisions de Google pour l'IA en entreprise
    Une analyse prospective présentant les 5 principales transformations que l'intelligence artificielle apportera au monde des affaires d'ici 2025.
    https://blog.google/products/google-cloud/ai-trends-business-2025/

C’EST TOUT POUR AUJOURD’HUI

Merci d’avoir lu le travail fait par notre équipe d’a-chat-rnés 😼

Comment évalueriez-vous la newsletter d’aujourd’hui ?

Votez ci-dessous pour nous aider à améliorer la newsletter pour vous.

Connexion ou S'abonner pour participer aux sondages.

💡 Pour m'aider à m’améliorer, développer de nouvelles idées ou des partenariats → [email protected] ou @mattioo81

👍️ Tu aimes ce que tu lis ? Abonnes-toi !

📺 Si tu préfères les contenus vidéos, je t'invite à t'abonner à ma chaîne YouTube.

- Mathieu

Reply

or to participate.