Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Le laboratoire des machines de réflexion révèle des recherches sur l’élimination de l’aléatoire dans les réponses du modèle d’IA

byKerem Gülen
septembre 11, 2025
in Intelligence Artificielle
Home Nouvelles Intelligence Artificielle
Share on FacebookShare on Twitter
Google Preferred Source

Le laboratoire des machines de réflexion, soutenu par 2 milliards de dollars de financement de démarrage et doté d’anciens chercheurs d’OpenAI, a partagé ses premières informations détaillées. Le laboratoire a publié mercredi un article de blog pour examiner comment créer des modèles d’IA qui produisent des réponses plus cohérentes et reproductibles, résolvant un défi fondamental dans le développement de l’intelligence artificielle.

La cohérence des modèles d’IA cible la non-déterminisme dans les modèles de grande langue

Le billet de blog, intitulé « Vaincre le non-déterminisme dans l’inférence LLM», Vérogue pourquoi les modèles d’IA génèrent souvent des réponses variées à des questions identiques. Bien que cette variabilité ait été acceptée comme une caractéristique inhérente des modèles de gros langues, le laboratoire de réflexion considère ce non-déterminisme comme un problème solvable plutôt que comme une limitation inévitable.

L’orchestration du noyau GPU provoque une réponse aléatoire

Le chercheur Horace, il a écrit le Post, faisant valoir que le caractère aléatoire dans les modèles d’IA découle de la façon dont les noyaux GPU sont orchestrés pendant le traitement de l’inférence. Le traitement d’inférence fait référence aux étapes de calcul qui se produisent après que les utilisateurs ont soumis des requêtes, comme appuyer sur Entrée dans Chatgpt. Les noyaux GPU sont des programmes spécialisés fonctionnant sur les puces informatiques NVIDIA. Il pense que une gestion minutieuse de cette couche d’orchestration peut permettre aux modèles d’IA de générer des sorties plus prévisibles et cohérentes.

Les réponses cohérentes améliorent la formation à l’apprentissage du renforcement

Au-delà de l’amélioration de la fiabilité des applications d’entreprise et scientifiques, il suggère que les réponses reproductibles peuvent rationaliser la formation d’apprentissage par renforcement (RL). Les récompenses de renforcement récompensent les modèles AI pour les réponses correctes, mais les réponses incohérentes introduisent le bruit dans les données de formation. Des réponses plus cohérentes pourraient améliorer le processus RL, ce qui s’aligne sur les rapports précédents de l’information selon lesquels le laboratoire des machines de réflexion prévoit d’utiliser RL pour adapter les modèles d’IA à des besoins commerciaux spécifiques.

Premier lancement de produit prévu pour les mois à venir

L’ancienne directrice de la technologie d’Openai, Mira Murati, a annoncé en juillet que Thinking Machines Lab publiera son premier produit bientôt. Elle a indiqué que le produit sera « utile pour les chercheurs et les startups qui développaient des modèles personnalisés », bien que des détails spécifiques et si elle intègre les techniques de reproductibilité reste non divulguée.

L’engagement de recherche ouverte reflète l’approche ouverte précoce

Laboratoire de machines à penser a annoncé son intention de publier régulièrement des articles de blog, du code et des résultats de recherche au profit du public, mais aussi d’améliorer notre propre culture de recherche « . Le récent post lance une nouvelle série intitulée « Connexionnisme », reflétant cet engagement de transparence. Cette approche reflète l’engagement de recherche ouverte d’Openai, bien qu’Openai soit devenu moins transparent à mesure qu’il a grandi. Le blog de recherche fournit de rares informations sur les opérations de Thinking Machines Lab et indique que l’entreprise relève des défis de recherche d’IA importants tout en travaillant vers des produits qui justifient sa valorisation de 12 milliards de dollars.

Tags: En vedetteintelligence artificielleLaboratoire de machines à penser

Related Posts

Les Gémeaux sont-ils en panne ? Les utilisateurs signalent des problèmes avec Google Gemini

Les Gémeaux sont-ils en panne ? Les utilisateurs signalent des problèmes avec Google Gemini

juin 17, 2026
Meta apporte à Facebook des fonctionnalités de retouche photo et de chat basées sur l’IA

Meta apporte à Facebook des fonctionnalités de retouche photo et de chat basées sur l’IA

juin 16, 2026
The Atlantic découvre des millions de chansons protégées par le droit d’auteur dans les données de formation de l’IA

The Atlantic découvre des millions de chansons protégées par le droit d’auteur dans les données de formation de l’IA

juin 16, 2026
Hallucinations de l’IA dans le génie logiciel : GitHits lève 1,75 million de dollars pour créer le « Google for Code »

Hallucinations de l’IA dans le génie logiciel : GitHits lève 1,75 million de dollars pour créer le « Google for Code »

juin 16, 2026
Google intente une action en justice pour une opération de phishing assistée par IA abusant de Gemini

Google intente une action en justice pour une opération de phishing assistée par IA abusant de Gemini

juin 15, 2026
OpenAI dévoile le premier programme de partenariat officiel doté d’un soutien de 150 millions de dollars

OpenAI dévoile le premier programme de partenariat officiel doté d’un soutien de 150 millions de dollars

juin 15, 2026

Recent Posts

  • Ce que les startups européennes de l’IA construisent pour l’ère de l’entreprise
  • Des agents aux modèles mondiaux : ce que San Francisco a révélé sur la prochaine phase de l’IA
  • La plupart des PME britanniques consultent désormais l’IA avant leurs comptables
  • Les escroqueries par phishing ciblant les voyageurs ont atteint des niveaux records en 2026
  • L’apprentissage par transfert de l’IA accélère la recherche en cosmologie mais comporte des risques cachés

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.