Anthropic a annoncé le lancement de deux nouveaux modèles d’IA : un Claude 3.5 Sonnet amélioré et un nouveau Claude 3.5 Haiku. La mise à niveau Claude 3.5 Sonnet offre des améliorations globales, avec des gains significatifs en termes de capacités de codage. Le nouveau Claude 3.5 Haiku apporte des fonctionnalités d’IA avancées à un prix abordable, correspondant aux performances du précédent modèle phare d’Anthropic, Claude 3 Opus, tout en conservant une vitesse et un coût similaires à ceux de son prédécesseur.
Claude 3.5 Sonnet
Le Claude 3.5 Sonnet amélioré s’appuie sur le succès de son prédécesseur avec des performances améliorées dans diverses tâches, notamment en matière de codage. Anthropic a souligné que Claude 3.5 Sonnet est leader dans les tâches d’ingénierie logicielle, montrant des améliorations marquées dans les benchmarks tels que Banc SWE Vérifiéoù il est passé de 33,4 % à 49,0 %, surpassant les autres modèles du marché.
Le modèle a également bien fonctionné dans l’utilisation d’outils agents, améliorant les scores sur le Banc TAU de 62,6% à 69,2% dans le domaine du commerce de détail et de 36,0% à 46,0% dans le domaine aérien. Selon les premiers testeurs comme GitLab et Cognition, ces mises à niveau représentent un pas en avant substantiel pour le codage et l’automatisation basés sur l’IA, avec de meilleures capacités de raisonnement et une latence supplémentaire minimale.
Claude 3.5 Haïku
Claude 3.5 Haiku est conçu pour offrir des performances de pointe tout en maintenant des coûts faibles. Le modèle obtient de très bons résultats dans des benchmarks tels que SWE-bench Verified, atteignant 40,6 %, ce qui surpasse de nombreux agents utilisant d’autres modèles de pointe, notamment les originaux Claude 3.5 Sonnet et GPT-4o. Le modèle vise à servir les applications qui nécessitent une IA rapide et fiable, telles que les produits destinés aux utilisateurs et les tâches nécessitant des expériences personnalisées.
Anthropic publiera Claude 3.5 Haiku plus tard ce mois-ci, initialement disponible sous forme de modèle texte uniquement avec des plans pour la prise en charge de la saisie d’images à l’avenir. Il sera disponible via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud.
Claude AI d’Anthropic est maintenant sur votre iPad
L’utilisation de l’ordinateur est disponible en version bêta publique expérimentale
Anthropique a également introduit une nouvelle fonctionnalité expérimentale appelée « utilisation de l’ordinateur », disponible en version bêta publique. Les développeurs peuvent demander à Claude 3.5 Sonnet d’utiliser les ordinateurs comme un humain : regarder les écrans, déplacer les curseurs et taper. Cette fonctionnalité est encore expérimentale, avec certaines limites, mais des développeurs comme Replit et The Browser Company ont déjà commencé à explorer comment elle pourrait automatiser des processus complexes impliquant de nombreuses étapes.
Cette fonctionnalité vise à enseigner à l’IA des compétences informatiques générales, la rendant plus polyvalente dans l’exécution de tâches qui nécessitaient auparavant des outils personnalisés. Les développeurs peuvent accéder à cette version bêta via l’API d’Anthropic et d’autres plates-formes cloud majeures. Bien que les premiers résultats soient prometteurs, Anthropic reconnaît que la technologie est encore en développement, avec des difficultés à effectuer certaines tâches informatiques courantes telles que le défilement et le glissement.
Des entreprises telles qu’Asana, Canva, Cognition et DoorDash expérimentent les nouvelles fonctionnalités, explorant le potentiel de l’IA pour automatiser des processus qui nécessitaient traditionnellement une intervention humaine. Les premiers tests effectués par l’Institut américain de sécurité AI et l’Institut britannique de sécurité ont révélé que le Claude 3.5 Sonnet mis à jour répond aux normes de sécurité d’Anthropic et convient à un usage public.
Anthropic s’attaque également aux risques potentiels associés à la capacité de l’IA à interagir avec les ordinateurs. Pour garantir un déploiement responsable, l’entreprise a mis en œuvre de nouvelles mesures de sécurité pour identifier les utilisations abusives, notamment des classificateurs pour détecter les actions potentiellement dangereuses. Anthropic encourage les développeurs à utiliser la fonctionnalité bêta pour des tâches à faible risque pendant que la technologie mûrit.
La sortie par Anthropic des mises à niveau Claude 3.5 Sonnet et Claude 3.5 Haiku souligne la volonté de l’entreprise d’étendre les capacités de l’IA tout en maintenant normes de sécurité. L’ajout de capacités expérimentales d’utilisation informatique représente une nouvelle avancée dans le potentiel de l’IA à effectuer des tâches générales, offrant aux développeurs de nouvelles possibilités à explorer.
Crédits images : Anthropique