Gemini 2.0 a fuité cette semaine, suscitant l’anticipation de la dernière version du modèle d’IA de Google. Catalogue de tests identifié un modèle intitulé Gemini-2.0-Pro-Exp-0111 sur l’application Web Gemini, disponible uniquement pour certains utilisateurs dans la section Gemini Advanced. Cette découverte a intensifié les spéculations sur les capacités potentielles de Gemini 2.0 et suggère que Google pourrait bientôt se préparer à un lancement public.
Le prochain modèle d’IA de Google : ce que nous savons jusqu’à présent
Le modèle Gemini-2.0-Pro-Exp-0111 apparaîtrait comme une option pour les abonnés payants de Google One AI Premium, qui bénéficient déjà d’un accès exclusif à des outils avancés tels que Gemini Advanced. Les utilisateurs gratuits ont toujours accès à Gemini 1.5 Flash, mais la rumeur dit que Google pourrait également introduire un Gemini 2.0 Flash pour eux. Catalogue de tests a noté que le modèle expérimental répond rapidement aux invites et inclut des fonctionnalités telles que la génération d’images et la recherche sur le Web. Cependant, le modèle n’est pas encore disponible pour une utilisation générale, ce qui indique qu’il pourrait encore faire l’objet de tests internes.
Le modèle actuel est qualifié de « notre modèle expérimental », selon Google. Cependant, il reste incertain si cette balise expérimentale laisse présager qu’elle est prête à être rendue publique ou si elle fait simplement partie des tests préliminaires de Google.
Une application Gemini autonome pour iPhone à l’horizon ?
Pour ajouter à l’intrigue, Google semble travailler sur une application Gemini autonome spécialement destinée aux utilisateurs d’iPhone. Bien que les utilisateurs d’iPhone aient pu accéder à Gemini AI via l’application Google, Catalogue de tests a signalé l’observation d’une application Gemini dédiée brièvement disponible sur l’App Store. Cette application, qui comprend la recherche vocale, la génération de texte et la création d’images, promet une expérience plus directe avec les fonctionnalités d’IA de Google pour les utilisateurs iOS. La recherche vocale, présentée lors du Google I/O 2024, était l’une des fonctionnalités les plus remarquables, offrant une interaction conversationnelle et avancée avec l’IA.
Si elle est lancée, cette application autonome constituerait un ajout important pour les utilisateurs d’iPhone qui n’ont peut-être pas accès aux fonctionnalités avancées d’IA d’Apple. Cette décision s’inscrit dans la stratégie de Google visant à améliorer l’accessibilité multiplateforme, offrant ainsi une alternative viable aux outils d’IA natifs d’Apple.
Rivaliser avec OpenAI et anticiper un lancement en décembre
Le calendrier de la fuite de Gemini 2.0 correspond aux attentes d’une sortie officielle d’ici la fin de 2024, alors que Google vise à suivre le rythme du lancement prévu par OpenAI de son modèle Orion. Les deux sociétés se préparent à dévoiler leurs modèles d’IA de nouvelle génération, ouvrant la voie à une concurrence intense dans le domaine de l’IA.
Alors que Google et OpenAI sont tous deux engagés dans une course pour dominer la prochaine vague de technologies d’IA, l’arrivée imminente de Gemini 2.0 pourrait renforcer considérablement la présence de Google. L’avantage supplémentaire d’une application iOS dédiée permet à Google de toucher les utilisateurs sur plusieurs plates-formes, un avantage stratégique dans ce paysage concurrentiel.
Gemini Live peut désormais parler français, allemand, portugais, hindi et espagnol
Une nouvelle ère pour les offres d’IA de Google
La fuite de Gemini 2.0 et la sortie éventuelle d’une application Gemini pour iPhone soulignent l’engagement de Google à fournir une IA de pointe à un public plus large. À mesure que ces développements se déroulent, ils pourraient redéfinir la manière dont les utilisateurs interagissent avec l’IA sur tous les appareils, établissant ainsi une nouvelle norme pour les outils d’IA accessibles et performants.
Les déploiements minutieux de Google, combinés à l’inclusivité stratégique de la plate-forme, annoncent un avenir prometteur pour Gemini 2.0. Avec des améliorations potentielles telles que des temps de réponse plus rapides, la génération d’images et des capacités d’activation vocale, le modèle offre des avancées significatives par rapport à ses prédécesseurs.
Crédit image en vedette : Kerem Gülen/Idéogramme