Série de tailles ND-H100-v5

La machine virtuelle (VM) de la série ND H100 v5 est un nouvel ajout phare à la famille Azure GPU. Cette série a été conçue pour la formation haute performance Deep Learning, et pour les charges de travail d’IA générative et HPC avec scale-up et scale-out étroitement couplées.

La série ND H100 v5 commence avec une seule machine virtuelle et huit GPU NVIDIA H100 Tensor Core. Les déploiements basés sur ND H100 v5 peuvent faire l’objet d’un scale-up jusqu’à des milliers de GPU avec 3,2 Tbits/s de bande passante d’interconnexion par VM. Chaque GPU de la machine virtuelle est fourni avec sa propre connexion NVIDIA Quantum-2 CX7 InfiniBand dédiée et indépendante de la topologie. Ces connexions sont configurées automatiquement entre les machines virtuelles occupant le même groupe de machines virtuelles identiques, et prennent en charge GPU Direct RDMA.

Chaque GPU dispose d’une connectivité NVLINK 4.0 pour la communication au sein de la machine virtuelle, et l’instance a 96 cœurs de processeur Intel Xeon Scalable de 4e génération.

Ces instances offrent d'excellentes performances pour de nombreux outils d'IA, de ML et d'analyse qui prennent en charge l'accélération GPU « prête à l'emploi », tels que TensorFlow, Pytorch, Caffe, RAPIDS et d'autres frameworks. En outre, l’interconnexion InfiniBand avec scale-out prend en charge un grand nombre d’outils IA et HPC existants basés sur les bibliothèques de communication NCCL de NVIDIA pour un clustering facilité des GPU.

Spécifications de l’hôte

Élément Quantité
Compter des unités
Spécifications
ID de la référence SKU, unités de performance, etc.
Processeur 96 processeurs virtuels Intel Xeon (Sapphire Rapids) [x86-64]
Mémoire 1 900 Gio
Stockage local 1 disque 28 000 Gio
Stockage à distance 32disques
Network (Réseau) 8 cartes réseau
Accélérateurs 8 GPU GPU Nvidia H100 (80 Go)

Prise en charge des fonctionnalités

Stockage Premium : pris en charge
Mise en cache de Stockage Premium : prise en charge
Migration dynamique : non prise en charge
Mises à jour avec préservation de la mémoire : non prises en charge
Machines virtuelles de deuxième génération : prises en charge
Machines virtuelles de 1re génération : non prises en charge
Performances réseau accélérées : pris en charge
Disque de système d’exploitation éphémère : pris en charge
Virtualisation imbriquée : non pris en charge
Infiniband : pris en charge

Important

Pour démarrer avec les machines virtuelles ND H100 v5, reportez-vous à Configuration et optimisation de la charge de travail HPC pour les étapes comprenant la configuration du pilote et du réseau. En raison de l’empreinte accrue des E/S de la mémoire GPU, le ND H100 v5 nécessite l’utilisation de VM et d’images de place de marché de génération 2.

Azure prend en charge Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 et SLES 15 pour les machines virtuelles ND H100 v5. Actuellement, les images de machine virtuelle Ubuntu-HPC 20.4/22.04 et AlmaLinux-HPC 8.6/8.7 sont prises en charge.

Il existe des offres d’images de machine virtuelle Linux optimisées et préconfigurées pour les charges de travail HPC/IA avec de nombreux outils et bibliothèques HPC installés ; elles sont donc fortement recommandées.

Pour télécharger une image, accédez à Place de marché Azure.

Tailles des séries

processeurs virtuels (Qty.) et mémoire pour chaque taille

Nom de la taille Processeurs virtuels (Qté.) Mémoire (Go)
Standard_ND96isr_H100_v5 96 1900

Ressources de base des VMs

Autres informations de taille

Liste de toutes les tailles disponibles : Tailles

Calculatrice de prix : Calculatrice de prix

Informations sur les types de disques : Types de disques

Étapes suivantes

Lisez-en davantage sur les Unités de calcul Azure (ACU) pour découvrir comment comparer les performances de calcul entre les références Azure.

Consultez Hôtes Azure Dedicated Host pour connaître les serveurs physiques capables d’héberger une ou plusieurs machines virtuelles attribuées à un abonnement Azure.

Commencez ici pour découvrir comment Superviser les machines virtuelles Azure.