Série de tailles ND-H100-v5
La machine virtuelle (VM) de la série ND H100 v5 est un nouvel ajout phare à la famille Azure GPU. Cette série a été conçue pour la formation haute performance Deep Learning, et pour les charges de travail d’IA générative et HPC avec scale-up et scale-out étroitement couplées.
La série ND H100 v5 commence avec une seule machine virtuelle et huit GPU NVIDIA H100 Tensor Core. Les déploiements basés sur ND H100 v5 peuvent faire l’objet d’un scale-up jusqu’à des milliers de GPU avec 3,2 Tbits/s de bande passante d’interconnexion par VM. Chaque GPU de la machine virtuelle est fourni avec sa propre connexion NVIDIA Quantum-2 CX7 InfiniBand dédiée et indépendante de la topologie. Ces connexions sont configurées automatiquement entre les machines virtuelles occupant le même groupe de machines virtuelles identiques, et prennent en charge GPU Direct RDMA.
Chaque GPU dispose d’une connectivité NVLINK 4.0 pour la communication au sein de la machine virtuelle, et l’instance a 96 cœurs de processeur Intel Xeon Scalable de 4e génération.
Ces instances offrent d'excellentes performances pour de nombreux outils d'IA, de ML et d'analyse qui prennent en charge l'accélération GPU « prête à l'emploi », tels que TensorFlow, Pytorch, Caffe, RAPIDS et d'autres frameworks. En outre, l’interconnexion InfiniBand avec scale-out prend en charge un grand nombre d’outils IA et HPC existants basés sur les bibliothèques de communication NCCL de NVIDIA pour un clustering facilité des GPU.
Spécifications de l’hôte
Élément | Quantité Compter des unités |
Spécifications ID de la référence SKU, unités de performance, etc. |
---|---|---|
Processeur | 96 processeurs virtuels | Intel Xeon (Sapphire Rapids) [x86-64] |
Mémoire | 1 900 Gio | |
Stockage local | 1 disque | 28 000 Gio |
Stockage à distance | 32disques | |
Network (Réseau) | 8 cartes réseau | |
Accélérateurs | 8 GPU | GPU Nvidia H100 (80 Go) |
Prise en charge des fonctionnalités
Stockage Premium : pris en charge
Mise en cache de Stockage Premium : prise en charge
Migration dynamique : non prise en charge
Mises à jour avec préservation de la mémoire : non prises en charge
Machines virtuelles de deuxième génération : prises en charge
Machines virtuelles de 1re génération : non prises en charge
Performances réseau accélérées : pris en charge
Disque de système d’exploitation éphémère : pris en charge
Virtualisation imbriquée : non pris en charge
Infiniband : pris en charge
Important
Pour démarrer avec les machines virtuelles ND H100 v5, reportez-vous à Configuration et optimisation de la charge de travail HPC pour les étapes comprenant la configuration du pilote et du réseau. En raison de l’empreinte accrue des E/S de la mémoire GPU, le ND H100 v5 nécessite l’utilisation de VM et d’images de place de marché de génération 2.
Azure prend en charge Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 et SLES 15 pour les machines virtuelles ND H100 v5. Actuellement, les images de machine virtuelle Ubuntu-HPC 20.4/22.04 et AlmaLinux-HPC 8.6/8.7 sont prises en charge.
Il existe des offres d’images de machine virtuelle Linux optimisées et préconfigurées pour les charges de travail HPC/IA avec de nombreux outils et bibliothèques HPC installés ; elles sont donc fortement recommandées.
Pour télécharger une image, accédez à Place de marché Azure.
Tailles des séries
processeurs virtuels (Qty.) et mémoire pour chaque taille
Nom de la taille | Processeurs virtuels (Qté.) | Mémoire (Go) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Ressources de base des VMs
Autres informations de taille
Liste de toutes les tailles disponibles : Tailles
Calculatrice de prix : Calculatrice de prix
Informations sur les types de disques : Types de disques
Étapes suivantes
Lisez-en davantage sur les Unités de calcul Azure (ACU) pour découvrir comment comparer les performances de calcul entre les références Azure.
Consultez Hôtes Azure Dedicated Host pour connaître les serveurs physiques capables d’héberger une ou plusieurs machines virtuelles attribuées à un abonnement Azure.
Commencez ici pour découvrir comment Superviser les machines virtuelles Azure.