La bêta de l’application Android Gemini comprend désormais une fonctionnalité permettant aux utilisateurs de joindre des fichiers audio comme des MP3 pour discuter des conversations. Cette fonctionnalité, observée par Autorité Android Dans la version 16.30.59.sa.arm64 de la Google App Beta, présente une invite «parler en direct» lors de la pièce jointe de fichiers. Bien que présents, les capacités de traitement audio au sein de la version bêta ne sont pas encore entièrement opérationnelles.
Lors de la connexion d’un fichier audio, les utilisateurs sont présentés à la possibilité de taper une question ou de sélectionner l’invite «Talk Live». Les observations actuelles indiquent que Gemini ne traite pas systématiquement l’entrée audio. Dans certains cas, l’application ignore entièrement le fichier audio joint. Dans d’autres cas, les Gémeaux peuvent générer des réponses qui ne sont pas en corrélation avec le contenu audio, présentant un comportement cohérent avec les hallucinations du chatbot.
Malgré les limites actuelles de la version bêta Android, l’API Gemini prend déjà en charge l’entrée audio. Les développeurs peuvent utiliser l’API pour soumettre des fichiers audio et demander diverses tâches de traitement. Ces tâches comprennent la génération de descriptions du contenu audio, la résumé des informations parlées et la transcription de la parole. L’API répond également aux demandes d’horodatage spécifiques, telles que les segments de traitement de «2h30 à 3h29». Les formats audio pris en charge pour l’API incluent MP3, WAV et FLAC.
L’intégration de la pièce jointe de fichiers audio dans l’application Android Gemini est probablement un effort de développement continu de Google. Il n’y a aucune confirmation officielle concernant une date de lancement spécifique pour cette fonctionnalité. La fonctionnalité de téléchargement d’images est actuellement largement disponible dans l’application Android Gemini, suggérant que le support audio représente une progression ultérieure dans les capacités de l’application.