Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

DeepSeek dit qu’il surpasse ChatGPT o1

byEditorial Team
novembre 21, 2024
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Le laboratoire chinois d’IA DeepSeek a annoncé la sortie de son modèle DeepSeek-R1-Lite-Preview, qui, selon lui, rivalise avec le modèle o1 d’OpenAI. Le nouveau modèle offre une fonctionnalité unique : la transparence dans son processus de raisonnement, permettant aux utilisateurs de voir ses méthodes de résolution de problèmes étape par étape. Cette annonce intervient deux mois après le lancement d’OpenAI. o1-aperçu modèle, mettant en évidence une concurrence croissante dans l’espace de raisonnement de l’IA.

DeepSeek lance un modèle de raisonnement pour rivaliser avec OpenAI

DeepSeek-R1-Lite-Preview est accessible via un chatbot Web, Discussion en profondeuroù les utilisateurs peuvent interagir avec le modèle, limité à 50 messages par jour. Bien que des benchmarks détaillés et une carte modèle n’aient pas encore été publiés, les premières évaluations indiquent que le modèle de raisonnement présente des performances comparables aux benchmarks d’OpenAI sur les tâches AIME et MATH. DeepSeek affirme atteindre une précision de pointe de 91,6 % sur le benchmark MATH.

L’introduction de DeepSeek-R1 intervient alors que les lois d’échelle traditionnelles de l’IA, qui suggèrent que l’augmentation des données et de la puissance de calcul amélioreront les performances, commencent à montrer des rendements décroissants. En réponse, les entreprises recherchent de nouvelles approches, telles que celles qui sous-tendent les modèles de raisonnement tels que DeepSeek-R1. Contrairement aux modèles traditionnels, les modèles de raisonnement étendent leur traitement informatique lors de l’inférence pour améliorer les capacités de prise de décision.

Malgré ses caractéristiques prometteuses, le nouveau modèle adhère également aux protocoles de censure stricts courants dans la technologie chinoise de l’IA. Les observations ont confirmé que DeepSeek-R1 évite les sujets politiques sensibles, tels que les enquêtes concernant Xi Jinping ou Taiwan. Les utilisateurs ont signalé des tentatives réussies pour contourner ces restrictions, permettant au modèle de fournir un contenu non filtré dans certains scénarios. Cet aspect soulève des questions constantes sur l’équilibre entre fonctionnalité et conformité réglementaire pour les modèles d’IA développés dans des régions soumises à une surveillance gouvernementale stricte.

DeepSeek affirme que son modèle DeepSeek-R1, ou plus précisément DeepSeek-R1-Lite-Preview, correspond au modèle o1-preview d’OpenAI sur deux benchmarks d’IA importants, AIME et MATH. AIME évalue les performances d’un modèle à l’aide d’autres modèles d’IA, tandis que MATH teste la résolution de problèmes avec une collection de problèmes de mots. Cependant, le modèle présente des défauts. Certains utilisateurs sur X souligné que DeepSeek-R1, comme o1, est confronté à des défis liés au tic-tac-toe et à d’autres tâches basées sur la logique.

Pour l’avenir, DeepSeek prévoit de publier des versions open source de ses modèles R1 et d’étendre l’accès via des API, poursuivant ainsi son engagement envers la communauté de l’IA open source. La société est soutenue par High-Flyer Capital Management, qui suit une stratégie d’intégration de l’IA dans les décisions commerciales. Les opérations de High-Flyer comprennent des investissements substantiels dans l’infrastructure matérielle, avec des clusters de GPU Nvidia A100 pour la formation des modèles.


Crédit image en vedette : Recherche profonde

Tags: chatgptIArecherche profonde

Related Posts

Spotify lance des listes de lecture guidées basées sur l'IA

Spotify lance des listes de lecture guidées basées sur l'IA

janvier 22, 2026
Snap déploie un suivi granulaire du temps d'écran dans la mise à jour de Family Center

Snap déploie un suivi granulaire du temps d'écran dans la mise à jour de Family Center

janvier 22, 2026
Google Photos repense le partage avec un carrousel plein écran immersif

Google Photos repense le partage avec un carrousel plein écran immersif

janvier 22, 2026
NexPhone lance un téléphone triple OS pour 549 $

NexPhone lance un téléphone triple OS pour 549 $

janvier 22, 2026
Anthropic revoit les tests d'embauche grâce à Claude AI

Anthropic revoit les tests d'embauche grâce à Claude AI

janvier 22, 2026
Blue Origin prévoit le lancement fin février de la troisième mission New Glenn

Blue Origin prévoit le lancement fin février de la troisième mission New Glenn

janvier 22, 2026

Recent Posts

  • Spotify lance des listes de lecture guidées basées sur l'IA
  • Snap déploie un suivi granulaire du temps d'écran dans la mise à jour de Family Center
  • Google Photos repense le partage avec un carrousel plein écran immersif
  • NexPhone lance un téléphone triple OS pour 549 $
  • Anthropic revoit les tests d'embauche grâce à Claude AI

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.