Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

La mise en cache implicite vise à réduire les coûts API Gemini de 75%

byKerem Gülen
mai 9, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Google a lancé Une nouvelle fonctionnalité de son API Gemini appelée «mise en cache implicite», qui, selon la société, peut réduire les coûts de 75% pour les développeurs tiers en utilisant ses derniers modèles d’IA, Gemini 2.5 Pro et 2.5 Flash.

La fonctionnalité permet automatiquement les économies de coûts lorsqu’une demande d’API Gemini à un modèle frappe un cache, éliminant le besoin de configuration manuelle requise par la méthode de mise en cache explicite précédente. Selon Google, la mise en cache implicite est déclenchée lorsqu’une demande partage un préfixe commun avec une demande précédente, et le nombre de jetons invites minimum requis est de 1 024 pour 2,5 Flash et 2 048 pour 2,5 Pro.

Logan Kilpatrick, membre de l’équipe Gemini, annoncé Le lancement le 8 mai 2025, déclarant que la fonctionnalité peut fournir des économies de coûts importantes pour les développeurs. Google recommande aux développeurs de placer le contexte répétitif au début des demandes et d’ajouter le contexte de changement à la fin pour augmenter les chances de coups de cache implicites.

La mise en cache est une pratique largement adoptée dans l’industrie de l’IA qui réutilise les données fréquemment consultées ou pré-rémunérées pour réduire les exigences et les coûts informatiques. La méthode de mise en cache explicite précédente de Google obligeait les développeurs à définir manuellement les invites à haute fréquence, ce qui a souvent abouti à un travail supplémentaire et à des factures d’API parfois étonnamment importantes pour certains utilisateurs.

Certains développeurs avaient exprimé leur insatisfaction à l’égard de la mise en œuvre de la mise en cache explicite de Gemini 2.5 Pro, ce qui a incité l’équipe Gemini à s’excuser et à s’engager à apporter des modifications. La nouvelle fonctionnalité de mise en cache implicite répond à ces préoccupations en automatisant le processus de mise en cache et en transmettant les économies de coûts aux développeurs lorsqu’un coup de cache se produit.

Alors que Google affirme que la mise en cache implicite peut procéder à des économies de coûts de 75%, la société n’a pas fourni de vérification tierce de l’efficacité de la fonctionnalité. En tant que tels, les économies réelles peuvent varier en fonction de la façon dont les développeurs utilisent la fonctionnalité.


Crédit d’image en vedette

Tags: APIGémeauxGoogle

Related Posts

Amazon améliore Ring avec des capteurs et des alertes incendie au CES 2026

Amazon améliore Ring avec des capteurs et des alertes incendie au CES 2026

janvier 7, 2026
Un lanceur d’alerte viral sur Reddit exposé comme un canular de l’IA

Un lanceur d’alerte viral sur Reddit exposé comme un canular de l’IA

janvier 7, 2026
Pourquoi 2026 est l'année pour les métiers de la santé "Embauchable" Agents IA

Pourquoi 2026 est l'année pour les métiers de la santé "Embauchable" Agents IA

janvier 7, 2026
CES 2026 : Intel défie AMD avec la puce portable Panther Lake

CES 2026 : Intel défie AMD avec la puce portable Panther Lake

janvier 7, 2026
Motorola dévoile le Razr Fold pliable latéralement au CES 2026

Motorola dévoile le Razr Fold pliable latéralement au CES 2026

janvier 7, 2026
Lenovo dévoile les éditions ThinkPad X1 Aura au CES 2026

Lenovo dévoile les éditions ThinkPad X1 Aura au CES 2026

janvier 7, 2026

Recent Posts

  • La Chine enquête sur l'accord Manus de Meta sur des problèmes de contrôle des exportations
  • Amazon améliore Ring avec des capteurs et des alertes incendie au CES 2026
  • Un lanceur d’alerte viral sur Reddit exposé comme un canular de l’IA
  • Pourquoi 2026 est l'année pour les métiers de la santé "Embauchable" Agents IA
  • Une étude sur la nature projette des appareils de santé portables 2B d’ici 2050

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.