Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

DeepSeek dit qu’il surpasse ChatGPT o1

byEditorial Team
novembre 21, 2024
in Intelligence Artificielle, Nouvelles
Home Nouvelles Intelligence Artificielle
Share on FacebookShare on Twitter
Google Preferred Source

Le laboratoire chinois d’IA DeepSeek a annoncé la sortie de son modèle DeepSeek-R1-Lite-Preview, qui, selon lui, rivalise avec le modèle o1 d’OpenAI. Le nouveau modèle offre une fonctionnalité unique : la transparence dans son processus de raisonnement, permettant aux utilisateurs de voir ses méthodes de résolution de problèmes étape par étape. Cette annonce intervient deux mois après le lancement d’OpenAI. o1-aperçu modèle, mettant en évidence une concurrence croissante dans l’espace de raisonnement de l’IA.

DeepSeek lance un modèle de raisonnement pour rivaliser avec OpenAI

DeepSeek-R1-Lite-Preview est accessible via un chatbot Web, Discussion en profondeuroù les utilisateurs peuvent interagir avec le modèle, limité à 50 messages par jour. Bien que des benchmarks détaillés et une carte modèle n’aient pas encore été publiés, les premières évaluations indiquent que le modèle de raisonnement présente des performances comparables aux benchmarks d’OpenAI sur les tâches AIME et MATH. DeepSeek affirme atteindre une précision de pointe de 91,6 % sur le benchmark MATH.

L’introduction de DeepSeek-R1 intervient alors que les lois d’échelle traditionnelles de l’IA, qui suggèrent que l’augmentation des données et de la puissance de calcul amélioreront les performances, commencent à montrer des rendements décroissants. En réponse, les entreprises recherchent de nouvelles approches, telles que celles qui sous-tendent les modèles de raisonnement tels que DeepSeek-R1. Contrairement aux modèles traditionnels, les modèles de raisonnement étendent leur traitement informatique lors de l’inférence pour améliorer les capacités de prise de décision.

Malgré ses caractéristiques prometteuses, le nouveau modèle adhère également aux protocoles de censure stricts courants dans la technologie chinoise de l’IA. Les observations ont confirmé que DeepSeek-R1 évite les sujets politiques sensibles, tels que les enquêtes concernant Xi Jinping ou Taiwan. Les utilisateurs ont signalé des tentatives réussies pour contourner ces restrictions, permettant au modèle de fournir un contenu non filtré dans certains scénarios. Cet aspect soulève des questions constantes sur l’équilibre entre fonctionnalité et conformité réglementaire pour les modèles d’IA développés dans des régions soumises à une surveillance gouvernementale stricte.

DeepSeek affirme que son modèle DeepSeek-R1, ou plus précisément DeepSeek-R1-Lite-Preview, correspond au modèle o1-preview d’OpenAI sur deux benchmarks d’IA importants, AIME et MATH. AIME évalue les performances d’un modèle à l’aide d’autres modèles d’IA, tandis que MATH teste la résolution de problèmes avec une collection de problèmes de mots. Cependant, le modèle présente des défauts. Certains utilisateurs sur X souligné que DeepSeek-R1, comme o1, est confronté à des défis liés au tic-tac-toe et à d’autres tâches basées sur la logique.

Pour l’avenir, DeepSeek prévoit de publier des versions open source de ses modèles R1 et d’étendre l’accès via des API, poursuivant ainsi son engagement envers la communauté de l’IA open source. La société est soutenue par High-Flyer Capital Management, qui suit une stratégie d’intégration de l’IA dans les décisions commerciales. Les opérations de High-Flyer comprennent des investissements substantiels dans l’infrastructure matérielle, avec des clusters de GPU Nvidia A100 pour la formation des modèles.


Crédit image en vedette : Recherche profonde

Tags: chatgptIArecherche profonde

Related Posts

Sony révèle God of War : Laufey pour PS5

Sony révèle God of War : Laufey pour PS5

juin 3, 2026
Microsoft dévoile Surface RTX Spark Dev Box pour les charges de travail d’IA

Microsoft dévoile Surface RTX Spark Dev Box pour les charges de travail d’IA

juin 3, 2026
Anthropic invite 150 organisations supplémentaires à participer au projet Glasswing

Anthropic invite 150 organisations supplémentaires à participer au projet Glasswing

juin 3, 2026
June Android Drop apporte des outils de sécurité et des fonctionnalités de recherche plus intelligentes

June Android Drop apporte des outils de sécurité et des fonctionnalités de recherche plus intelligentes

juin 3, 2026
Microsoft dévoile le projet Solara pour un avenir axé sur les agents

Microsoft dévoile le projet Solara pour un avenir axé sur les agents

juin 3, 2026
X lance des réponses vidéo de style TikTok pour les publications

X lance des réponses vidéo de style TikTok pour les publications

juin 3, 2026

Recent Posts

  • Les règles de désinscription de la recherche Google AI déclenchent le lancement du navigateur Enviromates
  • Sony révèle God of War : Laufey pour PS5
  • Les chercheurs débloquent une amélioration 20 fois supérieure dans des expériences laser ultrarapides
  • Microsoft dévoile Surface RTX Spark Dev Box pour les charges de travail d’IA
  • Les nouvelles puces Core Ultra d’Intel seraient rares

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.