Le co-fondateur et PDG de Nvidia, Jensen Huang, a dévoilé la superpuce IA Vera Rubin lors de la conférence sur la technologie GPU à Washington, marquant le passage de l’entreprise au matériel d’IA au milieu du boom de l’IA, augmentant sa valeur marchande à près de 5 000 milliards de dollars. La plateforme Vera Rubin cible les charges de travail d’IA générative de haute intensité. Il intègre un seul processeur Vera équipé de 88 cœurs ARM personnalisés prenant en charge 176 threads. Ce processeur s’associe à deux GPU Rubin pour atteindre jusqu’à 100 pétaFLOPS de performances de calcul FP4. En tant qu’ordinateur rackable NVLink 72 de troisième génération de Nvidia, Vera Rubin succède aux modèles GB200 et GB300. Le système utilise un refroidissement liquide et intègre six mille milliards de transistors. Il comprend également 2 To de mémoire SOCAMM2 à faible latence pour gérer efficacement les tâches de traitement d’IA exigeantes. Dans sa configuration de base, Vera Rubin offre des performances de calcul brutes environ 100 fois supérieures à celles du DGX-1 basé sur Volta. Cette plate-forme antérieure, le système d’apprentissage profond initial de Nvidia, offrait 170 téraflops de performances maximales FP16. Cette augmentation substantielle souligne l’évolution de la capacité de calcul pour les applications d’IA au fil des années. Nvidia prévoit de publier Vera Rubin dans diverses configurations pour répondre à divers besoins. La configuration NVL144 comprend deux GPU de la taille d’un réticule, qui permettent jusqu’à 3,6 exaflops d’inférence FP4 et 1,2 exaflops de performances d’entraînement FP8. Pour des capacités améliorées, la configuration NVL144 CPX atteint 8 exaflops, ce qui représente 7,5 fois la puissance des systèmes GB300 NVL72 de génération actuelle. Pour répondre aux exigences des centres de données hyperscale en matière de traitement de charges de travail de contexte de modèle plus importantes, Nvidia présente le système Rubin Ultra NVL576. Cette variante utilise quatre GPU de la taille d’un réticule ainsi que jusqu’à 365 To de mémoire haute vitesse. Il fournit jusqu’à 15 exaflops d’inférence FP4 et 5 exaflops de performances d’entraînement FP8, ce qui représente une multiplication par 8 par rapport au GB300. Chaque GPU Rubin se compose de deux chipsets de calcul et de huit piles de mémoire HBM4, optimisant le débit de données et le calcul. La carte GPU comporte cinq connecteurs de fond de panier NVLink. Deux connecteurs en haut connectent les GPU au commutateur NVLink pour une interconnectivité à haut débit. Les trois connecteurs inférieurs gèrent l’alimentation électrique, l’interface PCIe et la connectivité CXL pour prendre en charge l’intégration dans des systèmes plus larges. Huang prévoit que les GPU Rubin entreront en production de masse au cours du second semestre 2026. Le lancement des systèmes NVL144 est prévu plus tard en 2026 ou début 2027. Pendant ce temps, les systèmes NVL576 devraient être disponibles au cours du second semestre 2027, conformément à la feuille de route de Nvidia pour faire progresser l’infrastructure d’IA. https://www.youtube.com/watch?v=lQHK61IDFH4





