OpenAI a lancé capacités vidéo en temps réel dans ChatGPT, améliorant son mode vocal avancé avec une compréhension visuelle. Cette fonctionnalité, dont le déploiement a commencé le 12 décembre, permet aux utilisateurs d’interagir avec l’IA via leur caméra pour recevoir une assistance contextuelle. L’intégration signifie une avancée notable dans les capacités conversationnelles de l’IA, en particulier pour ceux qui sont abonnés à ChatGPT Plus, Team ou Pro.
OpenAI améliore ChatGPT avec des capacités vidéo en temps réel
Le mode vocal avancé comprend désormais des fonctionnalités d’analyse vidéo en temps réel et de partage d’écran. Les utilisateurs peuvent pointer leur téléphone vers des objets pour obtenir des réponses immédiates ou partager leurs écrans pour obtenir des explications détaillées sur les paramètres ou les problèmes. Cet ajout s’appuie sur les fonctionnalités précédentes, permettant une expérience utilisateur plus interactive. OpenAI a présenté cette fonctionnalité lors d’une diffusion en direct, démontrant sa capacité à engager des conversations informelles et à fournir des informations basées sur une entrée visuelle.
Côté disponibilité, le déploiement a débuté le 12 décembre et s’étendra sur la semaine suivante. Cependant, les utilisateurs européens ainsi que les abonnés ChatGPT Enterprise et Edu peuvent être confrontés à des retards ; ces utilisateurs recevront l’accès au début de l’année prochaine. Cette expansion indique l’accent mis par OpenAI sur l’amélioration de l’interaction des utilisateurs avec l’IA, conformément à son objectif primordial de fournir des fonctionnalités avancées au sein de sa suite de produits.
Intégrations avec iOS 18.2
Dans un développement parallèle, Apple a récemment introduit iOS 18.2, qui intègre plusieurs fonctionnalités ChatGPT dans Siri, les outils d’écriture et l’intelligence visuelle. L’intégration avec Siri permet à l’assistant vocal de reconnaître les requêtes qui ne sont pas à sa portée et de les rediriger vers ChatGPT. Les utilisateurs seront informés et devront approuver cette action avant qu’elle ne se poursuive.
Pour les utilisateurs d’appareils iPhone 16, Visual Intelligence leur permet de pointer leur caméra vers des objets ou des situations pour récupérer des informations via ChatGPT ou Google. De plus, la fonctionnalité Outils d’écriture comprend désormais un nouvel outil « Compose », permettant la création de contenu à partir de zéro en utilisant les capacités de ChatGPT. Ces fonctionnalités, mettant l’accent sur l’utilité et le contrôle de l’utilisateur, ont été structurées pour s’aligner sur les limites d’utilisation de ChatGPT, garantissant ainsi une expérience organisée.
Mises à jour des « 12 jours d’OpenAI »
OpenAI a organisé une campagne intitulée « 12 Days of OpenAI », qui débutera le 5 décembre, qui propose des sessions quotidiennes de diffusion en direct révélant de nouvelles fonctionnalités ou de nouveaux produits. Le PDG Sam Altman a décrit la campagne comme un mélange de mises à jour importantes et d’améliorations mineures. Parmi les annonces notables figurait l’introduction d’une nouvelle voix du Père Noël pour le mode vocal avancé, que les utilisateurs peuvent activer via une icône en forme de flocon de neige.
De plus, la campagne dévoilé Sora, le nouveau modèle vidéo d’OpenAI, désormais disponible pour ChatGPT Pro et utilisateurs Plus. Ce modèle peut générer du contenu texte-vidéo et vidéo-vidéo, élargissant considérablement les possibilités créatives disponibles pour les utilisateurs. D’autres mises à jour notables comprenaient le annonce de Canvas pour tous les utilisateurs Web, auparavant une fonctionnalité bêta, permettant une expérience de gestion de projet plus intégrée.
Pour l’avenir, OpenAI prévoit d’élargir ses offres, y compris une version complète de son modèle de langage o1, destinée à améliorer encore les capacités de raisonnement. La société vise à rendre le réglage fin du renforcement plus largement disponible, avec des applications actuellement recherchées auprès des instituts de recherche et des universités pour affiner les modèles d’IA pour des tâches spécifiques.
Crédit image en vedette : OpenAI