A máquina virtual da série NDv2 é uma nova adição à família de GPUs projetada para as necessidades das cargas de trabalho mais exigentes de IA, aprendizado de máquina, simulação e HPC aceleradas por GPU.
O NDv2 é alimentado por 8 GPUs NVIDIA Tesla V100 conectadas NVLINK, cada uma com 32 GB de memória GPU. Cada VM NDv2 também tem 40 núcleos Intel Xeon Platinum 8168 (Skylake) não HyperThreaded e 672 GiB de memória do sistema.
As instâncias NDv2 oferecem excelente desempenho para cargas de trabalho de HPC e IA utilizando kernels de computação otimizados para GPU CUDA e as muitas ferramentas de IA, ML e análise que suportam aceleração de GPU 'pronta para uso', como TensorFlow, Pytorch, Caffe, RAPIDS e outras estruturas.
Essencialmente, o NDv2 foi criado para cargas de trabalho de scale-up computacionalmente intensas (aproveitamento de 8 GPUs por VM) e scale-out (aproveitamento de várias VMs trabalhando juntas). A série NDv2 agora suporta rede de back-end EDR InfiniBand de 100 Gigabits, semelhante à disponível na série HB de VM HPC, para permitir clustering de alto desempenho para cenários paralelos, incluindo treinamento distribuído para IA e ML. Esta rede de back-end suporta todos os principais protocolos InfiniBand, incluindo aqueles empregados pelas bibliotecas NCCL2 da NVIDIA, permitindo o clustering contínuo de GPUs.
Especificações do anfitrião
Parte
Quantidade Unidades de contagem
Especificações ID de SKU, Unidades de Desempenho, etc.
1 A velocidade do disco temporário geralmente difere entre as operações RR (leitura aleatória) e RW (gravação aleatória). As operações RR são normalmente mais rápidas do que as operações RW. A velocidade RW é geralmente mais lenta do que a velocidade RR em séries, onde apenas o valor da velocidade RR é listado.
A capacidade de armazenamento é apresentada em unidades de GiB ou 1024^3 bytes. Ao comparar discos medidos em GB (1000^3 bytes) com discos medidos em GiB (1024^3), lembre-se de que os números de capacidade fornecidos em GiB podem parecer menores. Por exemplo, 1023 GiB = 1098,4 GB.
O débito do disco é medido em operações de entrada/saída por segundo (IOPS) e MBps, em que MBps = 10^6 bytes/seg.
Para saber como obter o melhor desempenho de armazenamento para suas VMs, consulte Desempenho de máquina virtual e disco.
Informações de armazenamento remoto (não armazenado em cache) para cada tamanho
A capacidade de armazenamento é apresentada em unidades de GiB ou 1024^3 bytes. Ao comparar discos medidos em GB (1000^3 bytes) com discos medidos em GiB (1024^3), lembre-se de que os números de capacidade fornecidos em GiB podem parecer menores. Por exemplo, 1023 GiB = 1098,4 GB.
O débito do disco é medido em operações de entrada/saída por segundo (IOPS) e MBps, em que MBps = 10^6 bytes/seg.
Os discos de dados podem operar nos modos em cache ou não colocado em cache. Para uma operação do disco de dados em cache, o modo de cache do anfitrião está definido como ReadOnly ou ReadWrite. Para uma operação do disco de dados não colocada em cache, o modo de cache do anfitrião está definido como None.
Para saber como obter o melhor desempenho de armazenamento para suas VMs, consulte Desempenho de máquina virtual e disco.
Informações da interface de rede para cada tamanho
A largura de banda de rede esperada é a largura de banda agregada máxima alocada por tipo de VM em todas as NICs, para todos os destinos. Para obter mais informações, consulte Largura de banda da rede da máquina virtual
Os limites máximos não são garantidos. Os limites oferecem orientação para selecionar o tipo de VM certo para o aplicativo pretendido. O desempenho real da rede dependerá de vários fatores, incluindo congestionamento da rede, cargas de aplicativos e configurações de rede. Para obter informações sobre como otimizar a taxa de transferência de rede, consulte Otimizar a taxa de transferência de rede para máquinas virtuais do Azure.
Para alcançar o desempenho de rede esperado no Linux ou Windows, talvez seja necessário selecionar uma versão específica ou otimizar sua VM. Para obter mais informações, consulte Teste de largura de banda/taxa de transferência (NTTTCP).
Informações do acelerador (GPUs, FPGAs, etc.) para cada tamanho