La licorne chinoise de l'IA DeepSeek laisse l'industrie deviner concernant la sortie de ses modèles de nouvelle génération, V4 et R2. Malgré d'intenses spéculations sur un lancement potentiel lors du prochain Nouvel An lunaire, la société a refusé de commenter des dates précises.
Plutôt, l'entreprise laisse parler ses recherches. Ces dernières semaines, DeepSeek a publié plusieurs articles techniques décrivant de nouvelles méthodes pour contourner les limitations matérielles actuelles. Avec les sanctions américaines limitant l'accès de la Chine aux GPU Nvidia avancés, Les dernières recherches de DeepSeek se concentrent sur l'efficacité algorithmique.
Mardi, l'entreprise a présenté « Engramme, » une technique de mémoire conditionnelle conçue pour résoudre les pénuries de mémoire GPU à large bande passante, un goulot d'étranglement critique dans la mise à l'échelle de l'IA. Cela fait suite à un article co-écrit par le PDG Liang Wenfeng sur les « hyper-connexions à contraintes multiples » (mHC), un cadre visant à former des systèmes massifs de manière plus rentable.
Les analystes estiment que ces innovations constituent des mesures stratégiques visant à maintenir la dynamique malgré les vents contraires géopolitiques. « DeepSeek veut simplement prouver que l'innovation en matière d'infrastructure d'IA favoriserait l'efficacité, » a déclaré Zhang Ruiwang, un architecte de systèmes d'information basé à Pékin.
Si la date de sortie des successeurs des modèles V3 et R1 reste un mystère, la société a confirmé que son équipe de base reste intacte. Un article mis à jour sur le modèle R1 a noté que les 18 principaux scientifiques d'origine sont toujours dans l'entreprise, défiant les taux de rotation élevés de l'industrie chinoise.





