Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

OpenAI GPT 5.2 résout le problème mathématique d'Erdő en 15 minutes

byAytun Çelebi
janvier 19, 2026
in Research
Home Research
Share on FacebookShare on Twitter

Le dernier modèle d'OpenAI a démontré une capacité inattendue à résoudre des problèmes mathématiques de haut niveau, selon des tests menés par un ingénieur logiciel et ancien chercheur quantitatif. Neel Somani. Somani a observé que le modèle générait une solution complète après 15 minutes de traitement d'un problème dans ChatGPT, formalisant ensuite la preuve avec l'outil Harmonic, confirmant son exactitude. Il a déclaré qu'il visait à établir une base de référence pour la capacité des grands modèles de langage (LLM) à résoudre des problèmes mathématiques ouverts. La chaîne de pensée du modèle faisait appel à des axiomes mathématiques, notamment la formule de Legendre, le postulat de Bertrand et le théorème de l'étoile de David. Il a localisé un article Math Overflow de 2013 du mathématicien de Harvard Noam Elkies, qui proposait une solution à un problème similaire, mais la preuve finale de ChatGPT différait et fournissait une solution plus complète à une version d'un problème posé par le mathématicien Paul Erdős. Depuis la sortie de GPT 5.2, que Somani a décrit comme « de manière anecdotique plus compétente en raisonnement mathématique que les itérations précédentes », un volume croissant de problèmes résolus a soulevé des questions sur la capacité des LLM à faire progresser les connaissances humaines. Somani s'est concentré sur les problèmes d'Erdős, une collection de plus de 1 000 conjectures maintenues en ligne, dont le sujet et la difficulté varient. Les premières solutions autonomes à ces problèmes sont apparues en novembre avec AlphaEvolve, un modèle propulsé par Gemini. Plus récemment, Somani et d’autres ont trouvé GPT 5.2 adepte des mathématiques de haut niveau. Depuis décembre, 15 problèmes sur le site Web d'Erdős sont passés de « ouverts » à « résolus », avec 11 solutions créditant des modèles d'IA. Le mathématicien Terence Tao, sur son Page GitHuba noté huit problèmes dans lesquels les modèles d'IA ont réalisé des progrès autonomes significatifs et six cas où les progrès ont nécessité de localiser et de s'appuyer sur des recherches antérieures. Tao a supposé à propos de Mastodon que la nature évolutive des systèmes d'IA les rend « mieux adaptés pour être systématiquement appliqués à la « longue traîne » de problèmes obscurs d'Erdős, dont beaucoup ont en fait des solutions simples », ajoutant que « bon nombre de ces problèmes d'Erdős plus faciles sont désormais plus susceptibles d'être résolus par des méthodes purement basées sur l'IA que par des moyens humains ou hybrides ». L’une des forces motrices de ce progrès est l’évolution vers la formalisation, un processus à forte intensité de main-d’œuvre pour vérifier et étendre le raisonnement mathématique. Même s’ils ne nécessitent pas d’IA, de nouveaux outils automatisés ont simplifié ce processus. L'assistant de preuve open source Lean, développé par Microsoft Research en 2013, est largement utilisé pour formaliser les preuves, et des outils d'IA comme Aristote d'Harmonic visent à automatiser une grande partie de ce travail. Tudor Achim, fondateur d'Harmonic, a déclaré que l'engagement des mathématiciens et des professeurs d'informatique dans les outils d'IA était plus important que le nombre de problèmes d'Erdős résolus. Achim a déclaré: « Ces personnes ont une réputation à protéger, donc quand ils disent qu'ils utilisent Aristote ou qu'ils utilisent ChatGPT, c'est une preuve réelle. »


Crédit image en vedette

Tags: chatgptmathématiques

Related Posts

Miggo Security contourne les défenses de Google Gemini via les invitations de calendrier

Miggo Security contourne les défenses de Google Gemini via les invitations de calendrier

janvier 21, 2026
Analyste Forrester : l’IA n’a pas réussi à faire avancer la productivité mondiale

Analyste Forrester : l’IA n’a pas réussi à faire avancer la productivité mondiale

janvier 20, 2026
Comment l'IA a créé le malware VoidLink en seulement sept jours

Comment l'IA a créé le malware VoidLink en seulement sept jours

janvier 20, 2026
Appfigures : les dépenses liées aux applications mobiles atteignent un record de 155,8 milliards de dollars

Appfigures : les dépenses liées aux applications mobiles atteignent un record de 155,8 milliards de dollars

janvier 15, 2026
La pénurie mondiale de puces mémoire fait monter en flèche les prix des PC

La pénurie mondiale de puces mémoire fait monter en flèche les prix des PC

janvier 14, 2026
Les ingénieurs construisent des robots inspirés des sauterelles pour résoudre l'épuisement de la batterie

Les ingénieurs construisent des robots inspirés des sauterelles pour résoudre l'épuisement de la batterie

janvier 14, 2026

Recent Posts

  • Snap paie des millions pour régler un procès contre la toxicomanie d'un adolescent
  • Le PDG d'Anthropic critique les États-Unis et Nvidia pour les ventes de puces IA à la Chine
  • Netflix prévoit une refonte de son application mobile en 2026 pour stimuler l'engagement quotidien des utilisateurs
  • OpenAI impose des filtres de sécurité aux adolescents via la prédiction comportementale de l'âge
  • Setapp Mobile cessera ses activités dans l'UE d'ici le 16 février

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.