Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Deepseek déplace les plus petites IA à Huawei Chips

byKerem Gülen
septembre 1, 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Deepseek utilisera des puces AI Huawei au lieu de Nvidia pour la formation de petits modèles d’IA, car la société cherche à réduire sa dépendance à l’égard des processeurs NVIDIA. Le changement arrive alors que Deepseek teste de nouveaux accélérateurs GPU de l’IA de divers fabricants.

Selon, Deepseek prévoit d’adopter des puces Huawei pour ses petits modèles d’IA. Cette initiative vise à réduire la dépendance de l’entreprise à l’égard de NVIDIA. Deepseek évalue actuellement de nouveaux accélérateurs GPU d’IA de Huawei, Baidu et Cambricon pour des modèles de formation plus petits que sa version AI R2.

Deepseek a l’intention de continuer à utiliser des processeurs NVIDIA pour son modèle de langue grand R2 AI (LLM), en les considérant comme une source fiable pour ses produits actuels. La société envisageait auparavant le processeur Ascend pour son modèle de raisonnement d’IA de nouvelle génération, mais pourrait reporter ce plan.

Deepseek a rencontré des défis avec le prochain modèle R2 AI. Malgré le soutien en génie de Huawei, les problèmes de développement ont conduit au report du lancement du modèle R2 AI. Les débuts du modèle R2 AI sont maintenant attendus plus tard cette année.

Deepseek s’appuie sur les chipsets de Nvidia pour construire le modèle de raisonnement R2 plus puissant. Parallèlement, il utilisera les processeurs Huawei Ascend pour la formation et le raffinement des itérations plus petites du modèle R2. La société n’a pas précisé de débutte pour les plates-formes de consommation en utilisant la technologie LLM Huawei AI Powered.

Un porte-parole de NVIDIA a déclaré: «La concurrence est indéniablement arrivée.

Image en vedette

 

Tags: ébrécheren profondeurEn vedetteHuawei

Related Posts

Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet

Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet

décembre 26, 2025
ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

décembre 26, 2025
Google NotebookLM présente "Mode conférence" pour un apprentissage de l’IA de 30 minutes

Google NotebookLM présente "Mode conférence" pour un apprentissage de l’IA de 30 minutes

décembre 26, 2025
Le robotaxis Waymo pourrait bénéficier de l’assistant embarqué Gemini AI

Le robotaxis Waymo pourrait bénéficier de l’assistant embarqué Gemini AI

décembre 26, 2025
Pourquoi NVIDIA abandonne Intel 18A pour ses puces IA de nouvelle génération

Pourquoi NVIDIA abandonne Intel 18A pour ses puces IA de nouvelle génération

décembre 25, 2025
ChatGPT pour gagner en Claude "Compétences" fonctionnalité

ChatGPT pour gagner en Claude "Compétences" fonctionnalité

décembre 25, 2025

Recent Posts

  • Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet
  • Bethesda vise 600 heures de jeu pour Fallout 5
  • ASUS défend le port d’alimentation mal aligné du RTX 5090 HyperX comme "conception intentionnelle"
  • NVIDIA open source CUDA Tile IR sur GitHub
  • Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.