Deepseek, une éminente société d’IA chinoise, a fait face à des retards inattendus dans la publication de son modèle R2 en raison de difficultés techniques persistantes rencontrées avec les puces Ascend de Huawei. Les autorités chinoises avaient encouragé Deepseek à utiliser les transformateurs domestiques par rapport aux systèmes H20 de Nvidia.
Malgré l’aide sur place des ingénieurs Huawei, Deepseek n’a pas pu effectuer une formation réussie à l’aide de puces Ascend. Par conséquent, la société s’est appuyée sur le matériel NVIDIA pour les processus de formation tout en déploiement des puces Ascend pour les tâches d’inférence. Cette approche à double durwware souligne les défis de la transition pleinement vers l’infrastructure d’IA domestique pour des opérations complexes.
Le lancement du modèle R2, initialement prévu pour mai 2025, a été reporté. Ce retard provenait des obstacles techniques non résolus associés aux puces Ascend et aux exigences étendus d’étiquetage des données pour l’ensemble de données de formation mis à jour. Le fondateur de Deepseek, Liang Wenfeng, aurait exprimé l’insatisfaction à l’égard des progrès du développement du modèle, indiquant la nécessité d’un temps supplémentaire pour garantir que le modèle pourrait maintenir la position concurrentielle de Deepseek.
Les concurrents ont mis à profit les revers du développement de Deepseek. Le QWEN3 d’Alibaba, par exemple, a intégré des algorithmes de formation de base similaires à celui de Deepseek, tout en améliorant l’efficacité et la flexibilité dans ses propres systèmes. Ce développement met en évidence l’évolution rapide au sein des écosystèmes d’IA et le potentiel pour les rivaux de capitaliser sur les difficultés rencontrées par les startups individuelles.
L’initiative stratégique plus large de Pékin pour l’autosuffisance de l’IA a intensifié la pression sur les entreprises nationales pour adopter du matériel produit localement. Cette poussée vise à réduire la dépendance à l’égard des technologies étrangères, en particulier de sociétés comme NVIDIA. Cependant, la mise en œuvre de cette stratégie a révélé des disparités existantes dans la stabilité, la connectivité inter-puce et la maturité des logiciels lors de la comparaison des puces de Huawei avec les produits établis de Nvidia.
Nvidia a souligné l’importance stratégique de maintenir l’accès aux développeurs chinois, notant que les restrictions à l’adoption des technologies pourraient affecter négativement les intérêts de la sécurité économique et nationale. Les sociétés d’IA chinois naviguent dans un paysage complexe, équilibrant les directives gouvernementales pour utiliser du matériel national avec les réalités pratiques du développement et du déploiement de modèles de langue importants, qui nécessitent souvent des capacités de traitement avancées et fiables.
Malgré ces défis, le modèle R2 de Deepseek peut encore voir une sortie dans les prochaines semaines. Les performances éventuelles du modèle subiront probablement un examen minutieux, en particulier lorsqu’ils sont évalués contre des concurrents qui ont été formés à l’aide de matériel plus mature et établi. Cette situation illustre la tension continue entre les objectifs politiques nationaux, les capacités techniques disponibles et les exigences pratiques du déploiement d’IA du monde réel.





