Le laboratoire de recherche et de développement de l’IA de Google, DeepMind, a dévoilé Alphaevolve, un système d’IA conçu pour résoudre des problèmes complexes en mathématiques et en sciences avec des solutions «gradables». Le système tire parti des modèles «ultramodernes», en particulier des modèles Gemini, pour générer, critiquer et évaluer les réponses possibles à un problème donné.
Alphaevolve introduit un mécanisme pour réduire les hallucinations dans les modèles d’IA en utilisant un système d’évaluation automatique. Ce système marque les réponses générées pour la précision, ce qui lui permet de travailler efficacement sur des problèmes qui peuvent être auto-évalués, en particulier dans des domaines comme l’informatique et l’optimisation du système.

Utiliser Alphaevolutionles utilisateurs doivent fournir une instruction de problème ainsi que des détails facultatifs tels que les instructions, les équations et la littérature pertinente. Ils doivent également fournir un mécanisme pour évaluer automatiquement les réponses du système, généralement sous la forme d’une formule. La capacité du système se limite à décrire les solutions comme des algorithmes, ce qui le rend moins adapté aux problèmes non numériques.
Lors des tests d’analyse comparative, Alphaevolve a été présenté avec environ 50 problèmes mathématiques dans diverses branches, y compris la géométrie et la combinatoire. Le système a réussi à «redécouvrir» les réponses les plus connues 75% du temps et a révélé des solutions améliorées dans 20% des cas. DeepMind a également appliqué Alphaevolve à des problèmes pratiques, tels que l’optimisation de l’efficacité du centre de données de Google et accélérant les courses de formation du modèle.
Vidéo: Google Deepmind
Selon ProfondeurAlphaevolve a généré un algorithme qui a récupéré 0,7% des ressources de calcul mondial de Google en moyenne et a suggéré une optimisation qui a réduit le temps global pour former des modèles Gémeaux de 1%. Bien qu’Alphaevolve ne fasse pas de découvertes révolutionnaires, il est prétendu gagner du temps et libérer des experts pour se concentrer sur des tâches plus critiques.
DeepMind prévoit de créer une interface utilisateur pour Alphaevolve et de lancer un programme d’accès anticipé pour des universitaires sélectionnés avant d’envisager un déploiement plus large. Le laboratoire affirme que les capacités d’Alphaevolve en font un outil précieux pour les experts du domaine.