Lors du récent événement Made by Google, Google a dévoilé sa nouvelle fonctionnalité basée sur l’intelligence artificielle, Gemini Live. Cet outil innovant offre aux utilisateurs la possibilité d’engager des conversations vocales avec une IA, alimentée par le dernier modèle de langage étendu de Google.
En se positionnant comme un concurrent direct du mode vocal avancé d’OpenAI dans ChatGPT, qui reste en phase de test alpha limité, Google a franchi une étape importante en étant le premier à publier cette fonctionnalité entièrement développée. Alors qu’OpenAI avait initialement introduit un concept similaire, la rapidité avec laquelle Google l’a mis en œuvre en surprend plus d’un.
Que propose Gemini Live ?
Gemini Live améliore les interactions mobiles avec l’IA en permettant des conversations dynamiques et fluides. Cette fonctionnalité unique permet aux utilisateurs d’interrompre l’IA en cours de réponse pour explorer des points spécifiques plus en profondeur ou de mettre en pause et de reprendre les discussions à leur convenance, offrant ainsi un acolyte numérique accessible à tout moment.
De plus, Gemini Live prend en charge le fonctionnement mains libres. Les utilisateurs peuvent poursuivre leurs interactions avec l’IA même lorsque leur téléphone est en arrière-plan ou verrouillé, imitant ainsi le déroulement naturel d’un appel téléphonique traditionnel. À partir d’aujourd’hui, cette fonctionnalité est disponible en anglais pour les abonnés Gemini Advanced sur Android, et la prise en charge est prévue pour les utilisateurs iOS et dans d’autres langues dans un avenir proche.
Les utilisateurs pourront bientôt profiter de nouvelles extensions telles que Keep, Tasks, Utilities et des fonctionnalités avancées sur YouTube Music. Par exemple, les utilisateurs peuvent récupérer des recettes à partir d’e-mails, compiler des listes de courses ou créer des playlists musicales nostalgiques, le tout sans avoir à passer d’une application à l’autre.
De plus, l’extension Calendrier permettra aux utilisateurs de gérer leur emploi du temps plus efficacement. En prenant simplement une photo du flyer d’un concert, les utilisateurs pourront vérifier leur disponibilité à cette date et programmer des rappels pour acheter des billets.
L’intégration poussée de Gemini enrichit encore davantage l’écosystème Android en offrant des fonctionnalités contextuelles qui améliorent l’expérience utilisateur. Les utilisateurs peuvent accéder à Gemini en appuyant simplement et longuement sur le bouton d’alimentation ou en disant « Ok Google ». Cette intégration permet aux utilisateurs d’interagir directement avec le contenu de leurs écrans, par exemple en demandant des détails sur une vidéo qu’ils regardent sur YouTube ou en demandant à Gemini d’ajouter des restaurants à partir d’un vlog de voyage dans Google Maps.
Google s’attaque également au double défi consistant à améliorer les capacités de l’IA tout en garantissant rapidité et précision. De nouveaux modèles comme Gemini 1.5 Flash sont introduits pour fournir des réponses plus rapides et plus fiables. Google prévoit de continuer à affiner ces aspects et d’étendre les intégrations avec d’autres services Google, notamment Home et Messages.
Google a mis en place certaines restrictions avec Gemini Live, comme l’explique le chef de produit Leland Rechis. Notamment, la fonctionnalité ne permettra pas de chanter ou d’imiter des voix au-delà des dix options prédéfinies. Cette décision est probablement une mesure de précaution pour éviter les problèmes de droits d’auteur.
De plus, contrairement à son concurrent OpenAI, qui mettait l’accent sur la reconnaissance vocale émotionnelle lors de ses démonstrations, Google a choisi de ne pas donner la priorité à la capacité de Gemini Live à détecter les nuances émotionnelles dans les voix des utilisateurs. Cette focalisation – ou son absence – pourrait être considérée comme une divergence stratégique par rapport à OpenAI, en particulier compte tenu des controverses passées comme l’incident où un utilisateur a été victime d’une attaque de Gemini Live. La voix d’OpenAI ressemble beaucoup à celle de l’actrice Scarlett Johansson.
Crédit de l’image en vedette : Google