Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Gemini Live est là pour rivaliser avec le mode vocal avancé de ChatGPT

byKerem Gülen
août 14, 2024
in Non classé
Share on FacebookShare on Twitter

Lors du récent événement Made by Google, Google a dévoilé sa nouvelle fonctionnalité basée sur l’intelligence artificielle, Gemini Live. Cet outil innovant offre aux utilisateurs la possibilité d’engager des conversations vocales avec une IA, alimentée par le dernier modèle de langage étendu de Google.

En se positionnant comme un concurrent direct du mode vocal avancé d’OpenAI dans ChatGPT, qui reste en phase de test alpha limité, Google a franchi une étape importante en étant le premier à publier cette fonctionnalité entièrement développée. Alors qu’OpenAI avait initialement introduit un concept similaire, la rapidité avec laquelle Google l’a mis en œuvre en surprend plus d’un.

Que propose Gemini Live ?

Gemini Live améliore les interactions mobiles avec l’IA en permettant des conversations dynamiques et fluides. Cette fonctionnalité unique permet aux utilisateurs d’interrompre l’IA en cours de réponse pour explorer des points spécifiques plus en profondeur ou de mettre en pause et de reprendre les discussions à leur convenance, offrant ainsi un acolyte numérique accessible à tout moment.

De plus, Gemini Live prend en charge le fonctionnement mains libres. Les utilisateurs peuvent poursuivre leurs interactions avec l’IA même lorsque leur téléphone est en arrière-plan ou verrouillé, imitant ainsi le déroulement naturel d’un appel téléphonique traditionnel. À partir d’aujourd’hui, cette fonctionnalité est disponible en anglais pour les abonnés Gemini Advanced sur Android, et la prise en charge est prévue pour les utilisateurs iOS et dans d’autres langues dans un avenir proche.

Les utilisateurs pourront bientôt profiter de nouvelles extensions telles que Keep, Tasks, Utilities et des fonctionnalités avancées sur YouTube Music. Par exemple, les utilisateurs peuvent récupérer des recettes à partir d’e-mails, compiler des listes de courses ou créer des playlists musicales nostalgiques, le tout sans avoir à passer d’une application à l’autre.

De plus, l’extension Calendrier permettra aux utilisateurs de gérer leur emploi du temps plus efficacement. En prenant simplement une photo du flyer d’un concert, les utilisateurs pourront vérifier leur disponibilité à cette date et programmer des rappels pour acheter des billets.

L’intégration poussée de Gemini enrichit encore davantage l’écosystème Android en offrant des fonctionnalités contextuelles qui améliorent l’expérience utilisateur. Les utilisateurs peuvent accéder à Gemini en appuyant simplement et longuement sur le bouton d’alimentation ou en disant « Ok Google ». Cette intégration permet aux utilisateurs d’interagir directement avec le contenu de leurs écrans, par exemple en demandant des détails sur une vidéo qu’ils regardent sur YouTube ou en demandant à Gemini d’ajouter des restaurants à partir d’un vlog de voyage dans Google Maps.

Google s’attaque également au double défi consistant à améliorer les capacités de l’IA tout en garantissant rapidité et précision. De nouveaux modèles comme Gemini 1.5 Flash sont introduits pour fournir des réponses plus rapides et plus fiables. Google prévoit de continuer à affiner ces aspects et d’étendre les intégrations avec d’autres services Google, notamment Home et Messages.

Google a mis en place certaines restrictions avec Gemini Live, comme l’explique le chef de produit Leland Rechis. Notamment, la fonctionnalité ne permettra pas de chanter ou d’imiter des voix au-delà des dix options prédéfinies. Cette décision est probablement une mesure de précaution pour éviter les problèmes de droits d’auteur.

De plus, contrairement à son concurrent OpenAI, qui mettait l’accent sur la reconnaissance vocale émotionnelle lors de ses démonstrations, Google a choisi de ne pas donner la priorité à la capacité de Gemini Live à détecter les nuances émotionnelles dans les voix des utilisateurs. Cette focalisation – ou son absence – pourrait être considérée comme une divergence stratégique par rapport à OpenAI, en particulier compte tenu des controverses passées comme l’incident où un utilisateur a été victime d’une attaque de Gemini Live. La voix d’OpenAI ressemble beaucoup à celle de l’actrice Scarlett Johansson.


Crédit de l’image en vedette : Google

Related Posts

OpenAI unifie les équipes pour créer un appareil audio avec Jony Ive

OpenAI unifie les équipes pour créer un appareil audio avec Jony Ive

janvier 2, 2026
Goldman Sachs et les banques européennes ciblent les rôles de back-office pour l'IA

Goldman Sachs et les banques européennes ciblent les rôles de back-office pour l'IA

janvier 2, 2026
Nvidia acquiert une participation de 5 milliards de dollars dans Intel pour une alliance stratégique

Nvidia acquiert une participation de 5 milliards de dollars dans Intel pour une alliance stratégique

janvier 2, 2026
Amazon bloque 1 800 employés nord-coréens du travail à distance

Amazon bloque 1 800 employés nord-coréens du travail à distance

janvier 2, 2026
Nvidia s'efforce de combler le déficit de 2 millions de puces des géants chinois de la technologie

Nvidia s'efforce de combler le déficit de 2 millions de puces des géants chinois de la technologie

janvier 2, 2026
Les grosses batteries font grimper les ventes de Honor à 71 millions en 2025

Les grosses batteries font grimper les ventes de Honor à 71 millions en 2025

janvier 2, 2026

Recent Posts

  • OpenAI unifie les équipes pour créer un appareil audio avec Jony Ive
  • Goldman Sachs et les banques européennes ciblent les rôles de back-office pour l'IA
  • Nvidia acquiert une participation de 5 milliards de dollars dans Intel pour une alliance stratégique
  • Amazon bloque 1 800 employés nord-coréens du travail à distance
  • Nvidia s'efforce de combler le déficit de 2 millions de puces des géants chinois de la technologie

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.