Virtuální počítač s grafickým procesorem (GPU) ve službě Azure Stack Hub

Tento článek popisuje, které modely grafických procesorů (GPU) jsou podporovány v integrovaném systému Služby Azure Stack Hub. Článek obsahuje také pokyny k instalaci ovladačů použitých s grafickými procesory. Podpora GPU ve službě Azure Stack Hub umožňuje řešení, jako je umělá inteligence, trénování, odvozování a vizualizace dat. AMD Xiaomi Instinct MI25 lze použít k podpoře grafických aplikací náročných na grafiku, jako je Autodesk AutoCAD.

Můžete si vybrat ze tří modelů GPU. Jsou dostupné v GPU NVIDIA V100, NVIDIA T4 a AMD MI25. Tyto fyzické GPU odpovídají následujícím typům virtuálních počítačů řady Azure N-Series:

Upozorňující

V této verzi se virtuální počítače GPU nepodporují. Musíte upgradovat na Azure Stack Hub 2005 nebo novější. Kromě toho váš hardware služby Azure Stack Hub musí obsahovat fyzické GPU.

NCv3

Virtuální počítače řady NCv3 využívají GPU NVIDIA Tesla V100. Zákazníci můžou využít tyto aktualizované gpu pro tradiční úlohy PROSTŘEDÍ HPC, jako je modelování nádrží, sekvencování DNA, analýza bílkovin, simulace Monte Carlo a další.

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NC6s_v3 6 112 736 0 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

Virtuální počítače řady NVv4 jsou vybaveny procesory AMD Amd Amd Instinct MI25 GPU. S řadou NVv4 zavádí Azure Stack Hub virtuální počítače s částečnými grafickými procesory. Tuto velikost lze použít pro akcelerované grafické aplikace GPU a virtuální plochy. Virtuální počítače NVv4 aktuálně podporují pouze hostovaný operační systém Windows.

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 0 16 32 8

NCasT4_v3

Velikost Virtuální procesory Paměť: GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NC4as_T4_v3 4 28 0 16 8 4
Standard_NC8as_T4_v3 8 56 0 16 16 8
Standard_NC16as_T4_v3 16 110 0 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

Virtuální počítače řady NC_A100 jsou vybaveny grafickými procesory NVIDIA Ampere A100, které jsou následníkem GPU Tesla V100. Tyto aktualizované GPU můžete využít pro tradiční úlohy PROSTŘEDÍ HPC, jako je modelování nádrží, sekvencování DNA, analýza bílkovin, simulace Monte Carlo a další.

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (GiB) Max. datových disků GPU GiB paměti GPU Maximální počet síťových karet
Standard_NC24ads_A100_v4 24 220 1123 12 0 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

NC_L40S v4

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (GiB) Max. datových disků GPU GiB paměti GPU Maximální počet síťových karet
Standard_NC24ads_L40S_v4 24 220 1123 8 0 80 2
Standard_NC48ads_L40S_v4 48 440 2246 16 2 160 4

Důležité informace o systému GPU

  • GPU musí být jedním z těchto SKU: AMD MI-25, Nvidia V100 (a varianty), Nvidia T4.
  • Počet gpu na server podporovaných (1, 2, 3, 4) Upřednostňované jsou: 1, 2 a 4.
  • Všechny GPU musí být v celé jednotce škálování úplně stejné skladové položky.
  • Všechna množství GPU na server musí být stejná v celé jednotce škálování.
  • Velikost oddílů GPU (pro AMD Mi25) musí být stejná ve všech virtuálních počítačích GPU ve škálovací jednotce.

Plánování kapacity

Plánovač kapacity služby Azure Stack Hub byl aktualizován tak, aby podporoval konfigurace GPU. Je přístupná tady.

Přidání GPU do existující služby Azure Stack Hub

Azure Stack Hub teď podporuje přidání GPU do libovolného existujícího systému. Pokud chcete přidat GPU, spusťte , projděte stop-azurestacksi postup stop-azurestack, přidejte GPU a pak spusťte start-azurestack až do dokončení. Pokud už systém obsahuje GPU, musí být stop-deallocated a restartovat všechny dříve vytvořené virtuální počítače GPU.

Oprava a aktualizace, chování FRU virtuálních počítačů

Virtuální počítače s GPU procházejí výpadky během operací, jako jsou oprava a aktualizace (PnU) a výměna hardwaru (FRU) služby Azure Stack Hub. Následující tabulka popisuje stav virtuálního počítače, jak je pozorováno během těchto aktivit, a ruční akci, kterou můžete udělat, abyste tyto virtuální počítače po operaci zpřístupnily.

Operace PnU – úplná aktualizace, aktualizace OEM FRU
Stav virtuálního počítače Během aktualizace není k dispozici. Dá se zpřístupnit s ručním provozem. Virtuální počítač je po aktualizaci automaticky online. Během FRU není k dispozici. Dá se zpřístupnit s ručním provozem. Po FRU je potřeba virtuální počítač převést zpět.
Ruční operace Pokud je potřeba virtuální počítač zpřístupnit během aktualizace, pokud jsou k dispozici oddíly GPU, můžete virtuální počítač restartovat z portálu kliknutím na tlačítko Restartovat . Virtuální počítač se po aktualizaci automaticky zálohuje. Virtuální počítač není během FRU dostupný. Pokud jsou k dispozici gpu, virtuální počítač se může zastavit a restartovat během FRU. Po dokončení FRU musí stop-deallocated virtuální počítač používat tlačítko Zastavit a pak restartovat pomocí tlačítka Start .

Instalace ovladače hosta

Pro instalaci ovladače je možné použít následující rutiny PowerShellu:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

V závislosti na operačním systému musíte tyto hodnoty nahradit nastavením níže.

AMD MI25

Verze ovladače hosta se musí shodovat s verzí služby Azure Stack Hub bez ohledu na stav připojení. Použití novějších verzí, které nejsou v souladu s verzí služby Azure Stack Hub, může způsobit problémy s použitelností.

Verze služby Azure Stack Hub Ovladač hosta AMD
2206 a novější 21.Q2-1, 20.Q4-1
2108 21.Q2-1, 20.Q4-1
2102 21.Q2-1, 20.Q4-1

Připojeno

Použijte skript PowerShellu v předchozí části s odpovídajícím typem ovladače pro AMD. Článek Instalace ovladačů AMD GPU na virtuální počítače řady N-series s Windows obsahuje pokyny k instalaci ovladače pro AMD Amd Instinct MI25 uvnitř virtuálního počítače s podporou NVv4 GPU-P a postup ověření instalace ovladače.

Odpojeno

Vzhledem k tomu, že rozšíření načítá ovladač z umístění na internetu, virtuální počítač, který je odpojený od externí sítě, k němu nemá přístup. Ovladač si můžete stáhnout z předchozí tabulky a nahrát ho do účtu úložiště v místní síti, která je pro virtuální počítač přístupná.

Přidejte ovladač AMD do účtu úložiště a zadejte adresu URL pro tento účet v Settingssouboru . Tato nastavení se musí použít v rutině Set-AzureRMVMExtension . Příklad:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVIDIA

Ovladače NVIDIA musí být nainstalovány uvnitř virtuálního počítače pro úlohy CUDA nebo GRID pomocí GPU.

Případ použití: grafika/vizualizace GRID

Tento scénář vyžaduje použití ovladačů GRID. Ovladače GRID je možné stáhnout prostřednictvím centra aplikací NVIDIA za předpokladu, že máte požadované licence. Ovladače GRID také před použitím ovladačů GRID na virtuálním počítači vyžadují licenční server GRID s příslušnými licencemi GRID.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Případ použití: compute/CUDA – připojeno

Ovladače CUDA nepotřebují licenční server a nepotřebují upravená nastavení.

Případ použití: compute/CUDA – Odpojeno

Odkazy na ovladače NVIDIA CUDA lze získat pomocí odkazu: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

U nastavení musíte odkazovat na některé adresy URL:

Adresa URL Notes
PUBKEY_URL PUBKEY_URL je veřejný klíč pro úložiště ovladačů Nvidia, nikoli pro virtuální počítač s Linuxem. Slouží k instalaci ovladače pro Ubuntu.
DRIVER_URL DRIVER_URL je adresa URL pro stažení informací o úložišti ovladače Nvidia a přidá se do seznamu úložišť virtuálního počítače s Linuxem.

Přidejte adresy URL do nastavení.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Další kroky