Azure Stack Hub'da grafik işleme birimi (GPU) sanal makinesi (VM)

Bu makalede, Azure Stack Hub tümleşik sisteminde hangi grafik işleme birimi (GPU) modellerinin desteklendiği açıklanmaktadır. Makale ayrıca GPU'larla kullanılan sürücüleri yükleme yönergelerini içerir. Azure Stack Hub'daki GPU desteği yapay zeka, eğitim, çıkarım ve veri görselleştirme gibi çözümler sağlar. AMD Radeon Instinct MI25, Autodesk AutoCAD gibi yoğun grafik kullanan uygulamaları desteklemek için kullanılabilir.

Üç GPU modeli arasından seçim yapabilirsiniz. NVIDIA V100, NVIDIA T4 ve AMD MI25 GPU'larında kullanılabilir. Bu fiziksel GPU'lar aşağıdaki Azure N Serisi sanal makine (VM) türleriyle aşağıdaki gibi hizalanır:

Uyarı

GPU VM'leri bu sürümde desteklenmez. Azure Stack Hub 2005 veya sonraki bir sürümüne yükseltmeniz gerekir. Ayrıca Azure Stack Hub donanımınızın fiziksel GPU'ları olmalıdır.

NCv3

NCv3 serisi VM'ler NVIDIA Tesla V100 GPU'lar tarafından desteklenir. Müşteriler rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilir.

Size Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

NVv4 serisi sanal makineler AMD Radeon Instinct MI25 GPU'ları tarafından desteklenir. NVv4 serisiyle Azure Stack Hub, kısmi GPU'lara sahip sanal makineleri tanıtır. Bu boyut GPU hızlandırılmış grafik uygulamaları ve sanal masaüstleri için kullanılabilir. NVv4 sanal makineleri şu anda yalnızca Windows konuk işletim sistemini desteklemektedir.

Size Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NV4as_v4 4 14 Kategori 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Size Sanal işlemci Bellek: GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

NC_A100 serisi VM'ler Tesla V100 GPU'larının ardılı olan NVIDIA Ampere A100 GPU'lar tarafından desteklenir. Rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilirsiniz.

Size Sanal işlemci Bellek: GiB Geçici depolama (GiB) Maksimum veri diskleri GPU GPU bellek GiB En fazla NIC
Standard_NC24ads_A100_v4 24 220 Kategori 1123 12 1 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

NC_L40S v4

Size Sanal işlemci Bellek: GiB Geçici depolama (GiB) Maksimum veri diskleri GPU GPU bellek GiB En fazla NIC
Standard_NC24ads_L40S_v4 24 220 Kategori 1123 8 1 80 2
Standard_NC48ads_L40S_v4 48 440 2246 16 2 160 4

GPU sistemiyle ilgili dikkat edilmesi gerekenler

  • GPU şu SKU'lardan biri olmalıdır: AMD MI-25, Nvidia V100 (ve çeşitleri), Nvidia T4.
  • Desteklenen sunucu başına GPU sayısı (1, 2, 3, 4). Tercih edilenler: 1, 2 ve 4.
  • Ölçek birimi boyunca tüm GPU'lar tam olarak aynı SKU'ya sahip olmalıdır.
  • Sunucu başına tüm GPU miktarları ölçek birimi boyunca aynı olmalıdır.
  • GPU bölüm boyutu (AMD Mi25 için) ölçek birimindeki tüm GPU VM'lerinde aynı olmalıdır.

Kapasite planlaması

Azure Stack Hub kapasite planlayıcısı, GPU yapılandırmalarını destekleyecek şekilde güncelleştirildi. Buradan erişilebilir.

Mevcut azure stack hub'ına GPU ekleme

Azure Stack Hub artık mevcut herhangi bir sisteme GPU eklemeyi destekliyor. GPU eklemek için komutunu çalıştırın stop-azurestack, yordamında stop-azurestackkomutunu çalıştırın, GPU ekleyin ve ardından tamamlanıncaya kadar komutunu çalıştırın start-azurestack . Sistemde GPU'lar zaten varsa, daha önce oluşturulmuş GPU VM'lerinin yeniden başlatılması stop-deallocated gerekir.

VM'lerin düzeltme eki ve güncelleştirme, FRU davranışı

GPU VM'leri, Azure Stack Hub'ın düzeltme eki ve güncelleştirme (PnU) ve donanım değiştirme (FRU) gibi işlemler sırasında kapalı kalma süresinden geçer. Aşağıdaki tabloda, bu etkinlikler sırasında gözlemlenen VM'nin durumu ve bu VM'leri işlemden sonra kullanılabilir hale getirmek için yapabileceğiniz el ile gerçekleştirilen eylem ele alınmaktadır.

İşlem PnU - Tam Güncelleştirme, OEM güncelleştirmesi FRU
VM durumu Güncelleştirme sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM, güncelleştirme sonrası otomatik olarak çevrimiçidir. FRU sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM'nin FRU'ya geri getirilmesi gerekiyor
El ile işlem Güncelleştirme sırasında VM'nin kullanıma sunulması gerekiyorsa, kullanılabilir GPU bölümleri varsa, Vm portaldan Yeniden Başlat düğmesine tıklanarak yeniden başlatılabilir. VM, güncelleştirme sonrasında otomatik olarak geri gelir. VM, FRU sırasında kullanılamaz. Kullanılabilir GPU'lar varsa, VM FRU sırasında durdurulabilir ve yeniden başlatılabilir. FRU tamamlandıktan sonra VM'nin Durdur düğmesini kullanıyor olması stop-deallocated ve ardından Başlat düğmesi kullanılarak yeniden başlatılması gerekir.

Konuk sürücü yüklemesi

Sürücü yüklemesi için aşağıdaki PowerShell cmdlet'leri kullanılabilir:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Azure Stack Hub GPU VM'nizin işletim sistemine, türüne ve bağlantısına bağlı olarak, bu değerleri aşağıdaki ayarlarla değiştirmeniz gerekir.

AMD MI25

Konuk sürücü sürümü, bağlantı durumundan bağımsız olarak Azure Stack Hub sürümüyle eşleşmelidir. Azure Stack Hub sürümüyle uyumlu olmayan daha yeni sürümlerin kullanılması kullanılabilirlik sorunlarına neden olabilir.

Azure Stack Hub Sürümü AMD Konuk sürücüsü
2206 ve üzeri 21.Q2-1, 20.Q4-1
2108 21.Q2-1, 20.Q4-1
2102 21.Q2-1, 20.Q4-1

Bağlandı

Önceki bölümdeki PowerShell betiğini AMD için uygun sürücü türüyle kullanın. Windows çalıştıran N serisi VM'lere AMD GPU sürücüleri yükleme makalesi, NVv4 GPU-P özellikli VM'nin içinde AMD Radeon Instinct MI25 sürücüsünü yüklemeye ilişkin yönergelerin yanı sıra sürücü yüklemesini doğrulama adımlarını sağlar.

Bağlantı kesildi

Uzantı sürücüyü internet üzerindeki bir konumdan çektiğinden, dış ağ bağlantısı kesilmiş bir VM buna erişemez. Sürücüyü önceki tablodan indirebilir ve yerel ağınızda VM tarafından erişilebilen bir depolama hesabına yükleyebilirsiniz.

AMD sürücüsünü bir depolama hesabına ekleyin ve içinde bu hesabın URL'sini Settingsbelirtin. Bu ayarlar Set-AzureRMVMExtension cmdlet'inde kullanılmalıdır. Örneğin:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVIDIA

GPU kullanılarak CUDA veya GRID iş yükleri için sanal makineye NVIDIA sürücüleri yüklenmelidir.

Kullanım örneği: grafik/görselleştirme KıLAVUZU

Bu senaryo, GRID sürücülerinin kullanılmasını gerektirir. Gerekli lisanslara sahip olmanız koşuluyla GRID sürücüleri NVIDIA Uygulama Merkezi üzerinden indirilebilir. GRID sürücüleri ayrıca, VM'de GRID sürücülerini kullanmadan önce uygun GRID lisanslarına sahip bir GRID lisans sunucusu gerektirir.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Kullanım örneği: işlem/CUDA - Bağlı

CUDA sürücülerinin lisans sunucusuna ve değiştirilmiş ayarlara ihtiyacı yoktur.

Kullanım örneği: işlem/CUDA - Bağlantısı kesildi

NVIDIA CUDA sürücülerine bağlantılar şu bağlantı kullanılarak edinilebilir: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

Ayarlarınız için bazı URL'lere başvurmanız gerekir:

URL Notlar
PUBKEY_URL PUBKEY_URL, Linux VM için değil Nvidia sürücü deposunun ortak anahtarıdır. Ubuntu sürücüsünü yüklemek için kullanılır.
DRIVER_URL DRIVER_URL, Nvidia sürücüsünün depo bilgilerini indirme URL'sidir ve Linux VM'sinin depo listesine eklenir.

URL'leri ayarlarınıza ekleyin.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Sonraki adımlar