Meta Platforms Inc devrait améliorer ses capacités vocales avec la version à venir de son intelligence artificielle, Llama 4, comme indiqué par le Temps financier. Cette évolution s’aligne sur la stratégie de Meta pour se concentrer sur les agents de l’IA conversationnels au lieu des interactions traditionnelles basées sur le texte.
Meta’s Llama 4: Transformer l’IA avec des capacités vocales
L’introduction de caractéristiques vocales améliorées dans LLAMA 4 est attendue dans les semaines à venir, visant à faciliter un dialogue naturel bidirectionnel où les utilisateurs peuvent interrompre l’IA plutôt que d’adhérer strictement à un format de questions-réponses. Ce changement démontre l’engagement de Meta à transformer l’interaction des utilisateurs avec la technologie de l’IA.
Le PDG Mark Zuckerberg a décrit des objectifs ambitieux pour la société, désignant 2025 comme une année pivot pour sa gamme de produits d’IA, qui sont en cours de développement au milieu d’une concurrence accrue de sociétés telles qu’Openai, Microsoft et Google. Pour subir ces initiatives, Meta prévoit d’investir jusqu’à 65 milliards de dollars en 2025, se concentrant principalement sur ces dépenses sur l’infrastructure du centre de données.
Meta Ai approche 600 millions d’utilisateurs mensuels avec LLAMA 3.3
Parallèlement aux avancées dans Llama 4, Meta explore la possibilité d’abonnements premium pour son assistant AI, Meta AI, qui lui permettrait d’effectuer des tâches telles que la réservation de réservations et la création de vidéos. La société envisage également de mettre en œuvre des publications publicitaires ou parrainés dans les résultats de recherche de Meta AI.
Le chef de produit Chris Cox a indiqué que Llama 4 fonctionnerait comme un «modèle OMNI», permettant à la parole de fonctionner nativement dans le système, éliminant ainsi la nécessité de traduire la voix en texte et en retour. Il a souligné l’importance de cette capacité lors de la conférence Morgan Stanley Technology, Media & Telecom, déclarant: «Je pense que nous enroulons toujours la tête à quel point c’est puissant.»
Meta a discuté activement des garde-corps nécessaires pour la sortie du dernier modèle de lama tout en évaluant l’opportunité de réduire ces restrictions. Ces discussions surviennent au milieu des pressions concurrentielles, car des concurrents comme Openai et Elon Musk font également des progrès dans le déploiement des fonctionnalités vocales, y compris les offres de personnalité distinctes d’Openai et Grok 3, qui présente un «mode déroutant» qui répond de manière délibérément répréhensible.
L’année dernière, Meta a abordé les critiques concernant son Modèle de lama 2qui avait été réticent à répondre aux requêtes bénignes en dévoilant une version plus flexible dans Llama 3. L’intégration des commandes vocales est également une caractéristique clé des lunettes intelligentes Ray-Ban de Meta, qui ont gagné en popularité entre les consommateurs, indiquant en outre la stratégie de l’entreprise pour positionner les casques légers en tant que principaux dispositifs de calcul de l’avenir.
Crédit d’image en vedette: DiMa Solomin / Unsplash