Huawei a aurait développé Une nouvelle solution technologique pour l’inférence de l’IA, visant à atténuer la dépendance de la Chine à l’égard des puces de mémoire à large bande passante (HBM). L’entreprise prévoit de dévoiler cette innovation lors du Forum de demande de raisonnement Financial AI 2025 le 12 août.
L’événement «Financial IA Reaship Application Implementation and Development» sert de plate-forme pour les fournisseurs de technologie afin de démontrer leurs capacités d’IA et les applications pratiques actuelles de l’IA dans le secteur financier. L’annonce à venir de Huawei s’aligne sur cet objectif, introduisant une solution conçue pour lutter contre les dépendances actuelles sur la technologie étrangère.
L’inférence de l’IA est la phase opérationnelle d’un modèle d’IA, dans laquelle il applique ses connaissances acquises et ses méthodologies apprises pour générer des résultats précis et efficaces pour les utilisateurs finaux. Les puces mémoire à haute bande passante sont généralement privilégiées pour l’inférence IA en raison de leur latence réduite et de leur bande passante de mémoire accrue par rapport aux types de mémoire conventionnels. Cette caractéristique facilite le traitement accéléré des données, améliorant ainsi les performances de modèles de langue importants et améliorant le processus d’inférence global de l’IA. Cependant, l’accès de Huawei aux puces HBM a été restreint à la suite de sanctions américaines.
En réponse à ces restrictions, Huawei aurait conçu une solution technologique dans le domaine de l’inférence de l’IA. Cette innovation devrait réduire la dépendance de la Chine et de Huawei à l’égard des puces IA HBM tout en augmentant simultanément les performances d’inférence des modèles d’IA à grande échelle dans le pays. Cette évolution devrait renforcer considérablement l’écosystème inférieure inférieure inférieure de l’IA de la Chine.
Huawei continue de poursuivre des intégrations technologiques et des solutions technologiques auto-développées pour diminuer sa dépendance à l’égard des composantes d’origine américaine alors qu’elle élargit son activité d’IA au sein de la Chine. Les détails concernant la nouvelle technologie d’inférence de l’IA restent actuellement non divulgués, avec de plus amples informations attendues lors du prochain événement du 12 août.





