Le laboratoire chinois d’IA DeepSeek a annoncé la sortie de son modèle DeepSeek-R1-Lite-Preview, qui, selon lui, rivalise avec le modèle o1 d’OpenAI. Le nouveau modèle offre une fonctionnalité unique : la transparence dans son processus de raisonnement, permettant aux utilisateurs de voir ses méthodes de résolution de problèmes étape par étape. Cette annonce intervient deux mois après le lancement d’OpenAI. o1-aperçu modèle, mettant en évidence une concurrence croissante dans l’espace de raisonnement de l’IA.
DeepSeek lance un modèle de raisonnement pour rivaliser avec OpenAI
DeepSeek-R1-Lite-Preview est accessible via un chatbot Web, Discussion en profondeuroù les utilisateurs peuvent interagir avec le modèle, limité à 50 messages par jour. Bien que des benchmarks détaillés et une carte modèle n’aient pas encore été publiés, les premières évaluations indiquent que le modèle de raisonnement présente des performances comparables aux benchmarks d’OpenAI sur les tâches AIME et MATH. DeepSeek affirme atteindre une précision de pointe de 91,6 % sur le benchmark MATH.
L’introduction de DeepSeek-R1 intervient alors que les lois d’échelle traditionnelles de l’IA, qui suggèrent que l’augmentation des données et de la puissance de calcul amélioreront les performances, commencent à montrer des rendements décroissants. En réponse, les entreprises recherchent de nouvelles approches, telles que celles qui sous-tendent les modèles de raisonnement tels que DeepSeek-R1. Contrairement aux modèles traditionnels, les modèles de raisonnement étendent leur traitement informatique lors de l’inférence pour améliorer les capacités de prise de décision.
Malgré ses caractéristiques prometteuses, le nouveau modèle adhère également aux protocoles de censure stricts courants dans la technologie chinoise de l’IA. Les observations ont confirmé que DeepSeek-R1 évite les sujets politiques sensibles, tels que les enquêtes concernant Xi Jinping ou Taiwan. Les utilisateurs ont signalé des tentatives réussies pour contourner ces restrictions, permettant au modèle de fournir un contenu non filtré dans certains scénarios. Cet aspect soulève des questions constantes sur l’équilibre entre fonctionnalité et conformité réglementaire pour les modèles d’IA développés dans des régions soumises à une surveillance gouvernementale stricte.
DeepSeek affirme que son modèle DeepSeek-R1, ou plus précisément DeepSeek-R1-Lite-Preview, correspond au modèle o1-preview d’OpenAI sur deux benchmarks d’IA importants, AIME et MATH. AIME évalue les performances d’un modèle à l’aide d’autres modèles d’IA, tandis que MATH teste la résolution de problèmes avec une collection de problèmes de mots. Cependant, le modèle présente des défauts. Certains utilisateurs sur X souligné que DeepSeek-R1, comme o1, est confronté à des défis liés au tic-tac-toe et à d’autres tâches basées sur la logique.
Pour l’avenir, DeepSeek prévoit de publier des versions open source de ses modèles R1 et d’étendre l’accès via des API, poursuivant ainsi son engagement envers la communauté de l’IA open source. La société est soutenue par High-Flyer Capital Management, qui suit une stratégie d’intégration de l’IA dans les décisions commerciales. Les opérations de High-Flyer comprennent des investissements substantiels dans l’infrastructure matérielle, avec des clusters de GPU Nvidia A100 pour la formation des modèles.
Crédit image en vedette : Recherche profonde