Google déploie Gemini 2.5 Flash, un modèle d’IA plus rapide et plus efficace annoncé Lors de la conférence Google Cloud Next, élargissant la portée de sa dernière architecture d’IA au-delà de sa phase expérimentale initiale.
Après que Gemini 2.5 Pro ait fait tourner les têtes le mois dernier, Google déploie désormais une IA améliorée à travers son écosystème, clarifiant sa gamme de modèles. Flash rejoint Pro, commençant la vie sur la plate-forme Vertex AI axée sur les développeurs plutôt que sur l’application Gemini Consumer.
Gemini 2.5 Flash provient du même code de base que Gemini 2.5 Pro mais est conçu pour être plus rapide et moins cher à utiliser. Google a rassemblé les données d’interaction utilisateur de la version expérimentale de Pro, qui a contribué à façonner le développement de Flash.
Les modèles flash sont plus petits que leurs homologues professionnels, accélérant les réponses pour des requêtes plus simples et réduisant les coûts opérationnels, bien que Google ne divulgue pas des dénombrements de paramètres spécifiques. La pensée dynamique de 2,5 Pro et Flash est à la fois, permettant à l’IA d’ajuster son effort de raisonnement simulé en fonction de la requête.
Selon Ars Tecnicales demandes simples expérimentales de 2,5 prolongées «sur Thanghough», déclare Tulsee Doshi de Google. Gemini 2.5 Flash intègre un «raisonnement dynamique et contrôlable» plus avancé pour répondre à cela, en choisissant un «budget de réflexion» par rapport à la complexité prompt pour réduire les temps d’attente et les besoins de traitement.
Les développeurs utilisant Vertex AI prennent un contrôle granulaire sur ce budget de réflexion, permettant une réduction supplémentaire des coûts et une optimisation de la vitesse. Google prévoit également d’ajouter un réglage supervisé et une mise en cache de contexte pour les modèles Gemini 2.5 sur Vertex AI dans les prochaines semaines.
Par ailleurs, le modèle GEMINI 2.5 Pro plus grand alimente désormais l’outil de recherche en profondeur de Google, le mettant à niveau du précédent Gemini 2.0 Pro. La recherche profonde utilise des invites pour recueillir des données Internet et synthétiser des rapports détaillés sur un sujet.
Google indique que la mise à niveau de Gemini 2.5 Pro a amélioré la précision et l’utilité des rapports de recherche profonds. Citant les évaluations des utilisateurs, Google réclame une préférence supérieure à deux à un pour ses rapports par rapport à ceux de l’outil similaire d’OpenAI.
Bien que des recherches approfondies soient disponibles pour une utilisation limitée sur des comptes gratuits, la version exécutant Gemini 2.5 Pro est actuellement limitée aux abonnés Gemini Advanced.