Deepseek devrait accélérer le lancement de son nouveau modèle d’IA, R2, après le succès de son modèle précédent, R1, qui a récemment provoqué une vente de 1 billion de dollars sur les marchés actions mondiaux en raison de ses performances compétitives contre les homologues occidentaux.
Deepseek accélère le lancement du modèle R2 AI après le succès de R1
La startup basée à Hangzhou visait à l’origine à publier R2 début mai, mais fait maintenant pression pour un déploiement accéléré, selon trois sources familières avec la société. Le nouveau modèle devrait améliorer les capacités de codage et soutenir le raisonnement dans plusieurs langues au-delà de l’anglais. Deepseek n’a pas commenté ces développements.
R1, développé à l’aide de puces Nvidia moins puissantes, reste compétitive avec les modèles créés par les grandes entreprises technologiques américaines qui ont investi des centaines de milliards dans les technologies de l’IA. Vijayasimha Alilughatta, COO de Zensar, a déclaré que la libération de R2 pourrait avoir un impact significatif sur l’industrie de l’IA, ce qui remet en question la domination des chefs de marché existants.
Fondateur et éthique opérationnelle
Liang Wenfeng, fondateur de Deepseek et un milliardaire de son haut niveau de fonds de couverture quantitative, a gardé un profil bas depuis juillet 2024. Les anciens employés décrivent Deepseek comme fonctionnant plus comme un laboratoire de recherche qu’avec une entreprise conventionnelle, caractérisée par un style de gestion plat qui contraste avec la structure hiérarchique commune dans le secteur technologique de la Chine.
Liang, qui a commencé sa carrière dans l’imagerie intelligente et a ensuite géré une équipe de recherche, a été félicité pour l’embauche d’ingénieurs d’algorithmes supérieurs et de favoriser un environnement collaboratif. Les employés ont noté que beaucoup travaillaient des jours de huit heures, se sentant autorisés à contribuer à des projets clés. Liang met l’accent sur la qualité par rapport au développement approfondi des applications, après avoir commenté l’évitement des dépenses lourdes en faveur de l’affiner des modèles d’IA.
La compensation à Deepseek et High-Flyer serait généreuse; Les principaux scientifiques des données de High Flyer peuvent gagner jusqu’à 1,5 million de yuans par an, nettement plus élevé que les concurrents. High-Flyer lui-même est reconnu comme l’un des meilleurs fonds quantiques de la Chine, gérant des dizaines de milliards de yuan malgré des pressions réglementaires sur le secteur.
Deepseek a secoué le marché une fois et voici pourquoi il pourrait se reproduire
L’avantage concurrentiel de Deepseek découle des investissements importants de High Flyer dans la recherche et le pouvoir informatique. L’entreprise a alloué 70% de ses revenus à la recherche sur l’IA, construisant deux clusters d’IA de supercalcul, dont un composé de 10 000 puces NVIDIA A100 en 2020 et 2021. Le gouvernement chinois a initialement soulevé des préoccupations concernant la profondeur des puces massives, mais a finalement permis aux opérations de procéder en Chine en Chine en 2022.
Avec une concurrence limitée pour de telles ressources, Deepseek a attiré des chercheurs de premier plan. L’application de techniques rentables, telles que le mélange des experts (MOE) et l’attention latente multi-tête (MLA), a permis à l’entreprise de réduire les coûts informatiques tout en restant compétitifs. Le prix de Deepseek est estimé à 20 à 40 fois moins cher que les modèles similaires d’OpenAI, selon les analystes de Bernstein.
Depuis l’introduction de R1, les géants de la technologie occidentale ont ajusté leurs stratégies, reflétées dans les baisses de prix d’OpenAI et l’introduction de niveaux d’accès à prix réduit par Google. Les tests de référence de l’UST ont noté que R1 nécessitait souvent trois fois les jetons pour le raisonnement par rapport aux modèles réduits d’OpenAI.
Soutien du gouvernement
Deepseek a gagné service auprès du gouvernement chinois, comme en témoignent Liang assister à une réunion de haut niveau avec le premier ministre Li Qiang en tant que représentant du secteur de l’IA. Les gouvernements locaux et plusieurs entreprises publiques ont commencé à intégrer les modèles de Deepseek, indiquant une solide approbation de la direction chinoise, qui vise à démontrer la supériorité sur la technologie américaine.
Cette augmentation survient à un moment où les modèles de Deepseek font face à l’élimination des magasins d’applications dans certains pays, y compris la Corée du Sud et l’Italie, en raison de problèmes de confidentialité. Les experts avertissent que si Deepseek devient le modèle d’IA préféré pour les entités de l’État chinois, les régulateurs occidentaux peuvent répondre avec des restrictions accrues sur les exportations et les collaborations de la technologie de l’IA.
Liang a reconnu les défis posés par l’embargo sur les puces d’IA avancées, souligner le financement n’a pas été le principal problème pour Deepseek.
Crédit d’image en vedette: Matheus Bertelli / Pexels