Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

DeepSeek dit qu’il surpasse ChatGPT o1

byEditorial Team
novembre 21, 2024
in Artificial Intelligence, News
Home Artificial Intelligence

Le laboratoire chinois d’IA DeepSeek a annoncé la sortie de son modèle DeepSeek-R1-Lite-Preview, qui, selon lui, rivalise avec le modèle o1 d’OpenAI. Le nouveau modèle offre une fonctionnalité unique : la transparence dans son processus de raisonnement, permettant aux utilisateurs de voir ses méthodes de résolution de problèmes étape par étape. Cette annonce intervient deux mois après le lancement d’OpenAI. o1-aperçu modèle, mettant en évidence une concurrence croissante dans l’espace de raisonnement de l’IA.

DeepSeek lance un modèle de raisonnement pour rivaliser avec OpenAI

DeepSeek-R1-Lite-Preview est accessible via un chatbot Web, Discussion en profondeuroù les utilisateurs peuvent interagir avec le modèle, limité à 50 messages par jour. Bien que des benchmarks détaillés et une carte modèle n’aient pas encore été publiés, les premières évaluations indiquent que le modèle de raisonnement présente des performances comparables aux benchmarks d’OpenAI sur les tâches AIME et MATH. DeepSeek affirme atteindre une précision de pointe de 91,6 % sur le benchmark MATH.

L’introduction de DeepSeek-R1 intervient alors que les lois d’échelle traditionnelles de l’IA, qui suggèrent que l’augmentation des données et de la puissance de calcul amélioreront les performances, commencent à montrer des rendements décroissants. En réponse, les entreprises recherchent de nouvelles approches, telles que celles qui sous-tendent les modèles de raisonnement tels que DeepSeek-R1. Contrairement aux modèles traditionnels, les modèles de raisonnement étendent leur traitement informatique lors de l’inférence pour améliorer les capacités de prise de décision.

Malgré ses caractéristiques prometteuses, le nouveau modèle adhère également aux protocoles de censure stricts courants dans la technologie chinoise de l’IA. Les observations ont confirmé que DeepSeek-R1 évite les sujets politiques sensibles, tels que les enquêtes concernant Xi Jinping ou Taiwan. Les utilisateurs ont signalé des tentatives réussies pour contourner ces restrictions, permettant au modèle de fournir un contenu non filtré dans certains scénarios. Cet aspect soulève des questions constantes sur l’équilibre entre fonctionnalité et conformité réglementaire pour les modèles d’IA développés dans des régions soumises à une surveillance gouvernementale stricte.

DeepSeek affirme que son modèle DeepSeek-R1, ou plus précisément DeepSeek-R1-Lite-Preview, correspond au modèle o1-preview d’OpenAI sur deux benchmarks d’IA importants, AIME et MATH. AIME évalue les performances d’un modèle à l’aide d’autres modèles d’IA, tandis que MATH teste la résolution de problèmes avec une collection de problèmes de mots. Cependant, le modèle présente des défauts. Certains utilisateurs sur X souligné que DeepSeek-R1, comme o1, est confronté à des défis liés au tic-tac-toe et à d’autres tâches basées sur la logique.

Pour l’avenir, DeepSeek prévoit de publier des versions open source de ses modèles R1 et d’étendre l’accès via des API, poursuivant ainsi son engagement envers la communauté de l’IA open source. La société est soutenue par High-Flyer Capital Management, qui suit une stratégie d’intégration de l’IA dans les décisions commerciales. Les opérations de High-Flyer comprennent des investissements substantiels dans l’infrastructure matérielle, avec des clusters de GPU Nvidia A100 pour la formation des modèles.


Crédit image en vedette : Recherche profonde

Tags: chatgptIArecherche profonde

Related Posts

Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

mai 9, 2025
La mise en cache implicite vise à réduire les coûts API Gemini de 75%

La mise en cache implicite vise à réduire les coûts API Gemini de 75%

mai 9, 2025
Chatgpt peut désormais analyser vos référentiels GitHub

Chatgpt peut désormais analyser vos référentiels GitHub

mai 9, 2025
Meta Threads a juste eu un peu X-ERIER

Meta Threads a juste eu un peu X-ERIER

mai 9, 2025
Ce robot Amazon a un sentiment de sensation

Ce robot Amazon a un sentiment de sensation

mai 9, 2025
Safari peut obtenir des options de recherche d’ouverture ou de perplexité AI

Safari peut obtenir des options de recherche d’ouverture ou de perplexité AI

mai 8, 2025

Recent Posts

  • Apprentissage automatique basé sur un modèle (MBML)
  • Traçage des performances ML
  • Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI
  • Skymizer lance Hyperthought Ai IP pour les appareils Smart Edge
  • Sigenergy fléchit la suite d’énergie complète de l’IAT à l’Europe intersolaire

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.