Aujourd’hui, NVIDIA a lancé la plate-forme NVIDIA GH200 Grace Hopper de nouvelle génération, créée pour l’ère du calcul accéléré et de l’IA générative et basée sur une nouvelle superpuce Grace Hopper avec le premier processeur HBM3e au monde.
La dernière annonce de NVIDIA vient s’ajouter au GH200 avec HBM3 annoncé précédemment, qui est maintenant en production et devrait arriver sur le marché plus tard cette année. Cela suggère que NVIDIA publiera deux versions du même appareil, le modèle intégrant HBM3 et le modèle avec HBM3e suivant plus tard.
« Pour répondre à la demande croissante d’IA générative, les centres de données ont besoin de plates-formes informatiques accélérées avec des besoins spécialisés », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « La nouvelle plate-forme GH200 Grace Hopper Superchip offre cela avec une technologie de mémoire et une bande passante exceptionnelles pour améliorer le débit, la possibilité de connecter des GPU pour agréger les performances sans compromis et une conception de serveur qui peut être facilement déployée dans l’ensemble du centre de données. »
Spécifications NVIDIA GH200
Le nouveau GH200 Grace Hopper Superchip est construit sur un processeur Grace à 72 cœurs avec 480 Go de mémoire ECC LPDDR5X et un GPU de calcul GH100 avec 141 Go de mémoire HBM3E dans six piles de 24 Go et une interface mémoire de 6 144 bits. Malgré le fait que NVIDIA installe physiquement 144 Go de mémoire, seuls 141 Go sont disponibles pour des rendements améliorés.
IA NVIDIA Eye Contact peut être le sauveur de vos réunions en ligne
L’actuelle puce GH200 Grace Hopper de NVIDIA dispose de 96 Go de mémoire HBM3 et d’une bande passante inférieure à 4 To/s. En comparaison, le nouveau modèle améliore la capacité de mémoire d’environ 50 % et la bande passante de plus de 25 %. Ces avancées significatives permettent à la nouvelle plate-forme d’exécuter des modèles d’IA plus grands que l’ancienne version et offrent des gains de performances significatifs.
« La mémoire HBM3e, qui est 50 % plus rapide que la HBM3 actuelle, offre un total de 10 To/sec de bande passante combinée, permettant à la nouvelle plate-forme d’exécuter des modèles 3,5 fois plus grands que la version précédente tout en améliorant les performances avec une bande passante mémoire 3 fois plus rapide », a déclaré NVIDIA. dans le article de blog officiel.
Spécifications NVIDIA Grace Hopper | ||||
Grace Hopper (GH200) avec HBM3 | Grace Hopper (GH200) avec HBM3e | |||
Cœurs de processeur | 72 | 72 | ||
Architecture du processeur | Bras Neoverse V2 | Bras Neoverse V2 | ||
Capacité de mémoire du processeur | <= 480 Go LPDDR5X (ECC) | <= 480 Go LPDDR5X (ECC) | ||
Bande passante mémoire du processeur | <=512 Go/s | <=512 Go/s | ||
SM GPU | 132 | 132 ? | ||
Cœurs de tenseur GPU | 528 | 528 ? | ||
Architecture GPU | Trémie | Trémie | ||
Capacité de mémoire GPU | 96 Go (physique) <= 96 Go (disponible) | 144 Go (physique) 141 Go (disponible) | ||
Bande passante mémoire GPU | <=4 To/s | 5 To/s | ||
Interface GPU à CPU | 900 Go/s NVLink 4 | 900 Go/s NVLink 4 | ||
PDT | 450W – 1000W | 450W – 1000W | ||
Processus de fabrication | TSMC 4N | TSMC 4N | ||
Interface | Superpuce | Superpuce | ||
Disponible | S2’2023 | Q2’2024 |
Disponibilité de NVIDIA GH200
La plate-forme GH200 Grace Hopper de NVIDIA avec HBM3 est actuellement en production et sera commercialement accessible le mois prochain, selon NVIDIA. La plate-forme GH200 Grace Hopper avec HBM3e, en revanche, est actuellement en cours d’échantillonnage et devrait être disponible au deuxième trimestre 2024.
NVIDIA a souligné que le nouveau GH200 Grace Hopper utilise la même technologie Grace CPU et GH100 GPU que la version précédente, donc aucune révision ou étape supplémentaire n’est requise.
Selon NVIDIA, le GH200 original avec HBM3 et le modèle amélioré avec HBM3E coexisteront sur le marché, ce qui implique que ce dernier serait proposé à un prix supérieur en raison des meilleures performances offertes par la mémoire plus moderne.
NVIDIA a annoncé le nouveau Grands modèles de langage NeMo et BioNemo au CG 2022
La plate-forme Grace Hopper Superchip de nouvelle génération de NVIDIA avec HBM3e est entièrement compatible avec la norme de serveur MGX de NVIDIA, ce qui en fait un remplacement direct des conceptions de serveur existantes.
Crédit d’image en vedette: BolivieInteligente/Unsplash