Crédit photo : Villa Mariale

AInsights : vos informations de niveau exécutif sur les derniers développements en matière d’IA générative…

Rencontrez l’agent 00AI… votre nouveau Q pour vous aider à naviguer dans votre vie professionnelle et personnelle.

Google a organisé son événement I/O et tout ce que la société a annoncé est non seulement perturbateur ou progressif dans l’espace GenAI, mais aussi pour lui-même.

Passons en revue les annonces, puis approfondissons pour analyser comment elles rivalisent avec OpenAI, Meta, Anthropic et Perplexity.

Tout d’abord, Google a annoncé l’intégration de Gemini AI pour plusieurs produits clés, ce qui est un signe de l’avenir des produits matériels et logiciels de nouvelle génération. À un moment donné, l’IA en fera simplement partie interface utilisateurqui agit comme un assistant travaillant avec vous en temps réel ou enfin comme un agent proactif en votre nom.

  1. Génération automatique de descriptions de films/émissions de télévision dans Google TV.
  2. Contenu de réalité augmentée géospatiale dans Google Maps.
  3. Quiz générés par l’IA sur des vidéos éducatives YouTube.
  4. Recherche en langage naturel dans Google Photos (fonctionnalité « Demander à photos »). C’est en soi énorme. Combien de photos avez-vous sur votre téléphone ou dans le cloud que vous ne reverrez probablement jamais ? Vous pouvez trouver des images en les décrivant simplement à l’IA !
  5. Prise en charge de l’IA pour la rédaction, la synthèse et les retours de commerce électronique dans Gmail. Veuillez élargir votre recherche d’e-mails maintenant ! Pourquoi est-ce encore un défi en 2024 !?

Google I/O en moins de 10 minutes

Mise à jour du modèle Gemini 2

Google a également annoncé un nouveau modèle de 27 milliards de paramètres pour Gemini 2 (détails actuels de la version 1,5). Ici), son offre d’IA de nouvelle génération optimisée pour des performances efficaces sur les GPU. Ce modèle plus grand peut prendre en charge la plus grande entrée de tous les modèles d’IA disponibles dans le commerce.

Veo et Imagen 3 pour les développeurs

Google a dévoilé Veo, son dernier modèle de génération vidéo haute résolution qui vise à concurrencer Sora et Midjourney, et Imagen 3, son modèle texte-image de la plus haute qualité qui promet des images plus réalistes.

Ces outils seront dans un premier temps disponibles pour certains créateurs.

Aperçus audio et bac à sable IA

Google a introduit « Audio Overviews », une fonctionnalité qui génère des discussions audio basées sur la saisie de texte, et « AI Sandbox », un ensemble d’outils d’IA génératifs permettant de créer de la musique et des sons à partir de la saisie de l’utilisateur.

Aperçus de l’IA dans la recherche

La recherche Google introduit « AI Digests » pour fournir des résumés rapides des réponses aux requêtes de recherche complexes, ainsi que des capacités de planification de type assistant pour les tâches en plusieurs étapes.

Google a introduit la possibilité de poser des questions ouvertes et de recevoir des réponses détaillées et cohérentes générées par les modèles d’IA. Cela permet aux utilisateurs de recevoir des informations plus complètes qui vont au-delà d’une simple liste de liens.

Agents IA : Google a introduit des agents d’IA capables d’engager un dialogue mutuel pour aider les utilisateurs à accomplir des tâches en plusieurs étapes telles que des projets de recherche, d’analyse et de création. Ces agents utilisent les derniers modèles linguistiques pour fournir une assistance personnalisée.

Recherche multimodale : Google a étendu ses capacités de recherche pour comprendre et générer des réponses en combinant du texte, des images, de l’audio et d’autres modalités. Cela permet aux utilisateurs de rechercher des images ou des clips audio et d’obtenir des résultats multimédias pertinents.

Contexte plus long : Les modèles de recherche de Google sont désormais capables de comprendre et d’intégrer un contexte beaucoup plus long à partir de l’historique des requêtes d’un utilisateur et de ses interactions précédentes. Cela permet des expériences de recherche plus contextuelles et personnalisées.

Ces nouvelles capacités de recherche basées sur l’IA visent à fournir un accès plus naturel, interactif et complet à l’information par rapport à la recherche traditionnelle basée sur des mots clés. Ils exploitent les dernières avancées de Google en matière de grands modèles linguistiques et d’IA multimodale pour offrir une expérience de recherche plus conviviale et plus intelligente.

Ce que nous devons encore voir, cependant, ce sont des outils pour les entreprises qui doivent être de l’autre côté de la recherche par l’IA. Il est clair que les comportements de recherche évoluent, mais la façon dont les produits et services apparaissent de l’autre côté de la découverte est le prochain Far West.

Coéquipier IA pour Google Workspace

La fonctionnalité AI Teammate s’intègre à Google Workspace et permet de créer une collection de travaux consultable à partir de messages et de fils de discussion par courrier électronique, fournissant des analyses et des résumés.

Projet Astra – Assistant IA

Google a dévoilé Project Astra, un prototype d’assistant d’IA développé par DeepMind qui peut aider les utilisateurs dans des tâches telles que l’identification de l’environnement, la recherche d’objets perdus, la révision du code et la réponse aux questions en temps réel.

Il s’agit de loin de l’assistant IA le plus prometteur de Google et, d’ailleurs, il n’est pas encore disponible. Le projet Astra représente la vision de Google pour l’avenir des assistants IA… et plus encore.

Nous pourrions également très bien être à l’aube d’une prochaine génération de Google Glass. Et cette fois, ce ne sera pas aussi fastidieux, puisque Meta et Ray-Ban ont contribué à rendre l’IA portable consommable.

Alors c’est quoi?

Project Astra est un agent d’IA multimodal capable de percevoir et de répondre à des informations en temps réel via du texte, de la vidéo, des images et de la voix. Il peut accéder simultanément aux informations provenant d’Internet et de son environnement via l’appareil photo d’un smartphone ou des lunettes intelligentes. Le système encode les images vidéo et la voix dans une chronologie et les met en cache pour une récupération et une réponse efficaces. Par exemple, dans la démo ci-dessous, vous voyez un flux vidéo en direct panoramique d’une pièce où l’utilisateur fait une pause, dessine sur l’écran et tire une flèche, demandant à l’assistant IA d’identifier l’objet. Dans un autre exemple, le flux vidéo continue de se déplacer lorsque l’utilisateur lui demande d’identifier les objets qui produisent du son. L’assistant IA identifie avec précision un haut-parleur audio.

Principales caractéristiques du projet Astra

Identifie les objets, les sons et leurs parties spécifiques en temps réel grâce à la vision par ordinateur et au traitement audio.

Comprend le contexte et l’emplacement en fonction des indices visuels de l’environnement.

Fournit des explications et des informations sur les objets, les extraits de code ou les scénarios qu’il perçoit.

Participe aux interactions conversationnelles naturelles et s’adapte aux interruptions et aux modèles de parole.

Fournit une assistance proactive et des rappels en fonction du contexte de l’utilisateur et des interactions précédentes.

Impact sur les entreprises

Le projet Astra représente une avancée significative dans les capacités de l’IA et offre plusieurs avantages potentiels pour les entreprises :

Productivité accrue : un assistant IA capable de comprendre et de répondre aux complexités des scénarios du monde réel pourrait rationaliser diverses tâches, augmentant ainsi la productivité et l’efficacité des employés.

Expérience client améliorée : les entreprises pourraient tirer parti des capacités multimodales du projet Astra pour fournir un support client plus intuitif et personnalisé, améliorant ainsi l’expérience client globale.

Prise de décision avancée : en traitant et en synthétisant des informations provenant de plusieurs sources en temps réel,

Le projet Astra pourrait donner aux dirigeants et aux décideurs des informations et des recommandations basées sur les données.
Opportunités d’innovation : les capacités avancées d’IA du projet Astra pourraient ouvrir la voie à de nouveaux produits, services et modèles commerciaux qui tirent parti des interactions multimodales et de la connaissance contextuelle.

Bien que le projet Astra soit encore en développement, Google prévoit d’intégrer certaines de ses fonctionnalités dans des produits tels que l’application Gemini et l’expérience Web plus tard cette année. Les chefs d’entreprise devraient suivre de près les progrès du projet Astra et examiner comment ses capacités d’IA de pointe pourraient profiter à leurs entreprises et stimuler l’innovation.

Et voici vos AInsights cette fois. Maintenant, vous et moi pouvons réfléchir à l’avenir de la recherche et du travail basés sur l’IA, aux créations de niveau supérieur que nous produirons et à la manière dont nous naviguerons dans notre monde et notre entreprise avec l’IA à nos côtés.

Veuillez vous abonner à AInsights, Ici.

Si vous souhaitez rejoindre ma liste de diffusion principale pour les actualités et les événements, veuillez suivre : un quantum de solos.