Azure Stack Edge Pro GPU'da VM dağıtımı sorunlarını giderme

ŞUNLAR IÇIN GEÇERLIDIR:Pro GPU SKU için Evet Azure Stack Edge Pro - GPUPro 2 SKU için EvetAzure Stack Edge Pro 2Pro R SKU için EvetAzure Stack Edge Pro RMini R SKU için EvetAzure Stack Edge Mini R

Bu makalede, Azure Stack Edge Pro GPU cihazında sanal makineleri dağıtırken karşılaşılan yaygın hataların nasıl giderılacağı açıklanır. Makale, ağ arabirimi ve VM oluşturma sırasında VM sağlama zaman aşımlarına ve sorunlara neden olan en yaygın sorunları araştırmak için rehberlik sağlar.

Vm sağlama hatalarını tanılamak için başarısız sanal makinenin konuk günlüklerini gözden geçirin. VM konuk günlüklerini toplama ve bir Destek paketine ekleme adımları için bkz . Azure Stack Edge Pro'da VM'ler için konuk günlüklerini toplama.

VM dağıtımınızdan önce vm görüntüsünün başarıyla karşıya yüklenmesini engelleyen sorunlar hakkında yönergeler için bkz . Azure Stack Edge Pro GPU'da sanal makine görüntüsü yükleme sorunlarını giderme.

VM sağlama zaman aşımı

Bu bölümde, vm sağlama zaman aşımının en yaygın nedenleri için sorun giderme sağlanır.

VM sağlama zaman aşımına uğradıysa aşağıdaki hatayı görürsünüz:

Azure Stack Edge'de VM sağlama zaman aşımına uğradıktan sonra Azure portalında görüntülenen hatanın ekran görüntüsü.

Vm sağlama zaman aşımlarının en önemli nedenleri aşağıdaki sorunlardır:

VM'ye atanan IP zaten kullanımda

Hata açıklaması: VM'ye zaten kullanımda olan bir statik IP adresi atandı ve VM sağlama başarısız oldu. Bu hata, VM'nin dağıtıldığı alt ağda IP adresi kullanımda olduğunda oluşur. Azure portalı aracılığıyla bir VM dağıttığınızda, işlem cihazınızdaki mevcut bir IP adresini denetler, ancak alt ağınızda da bulunabilecek diğer hizmetlerin veya sanal makinelerin IP adreslerini de denetleyemez.

Önerilen çözüm: Kullanımda olmayan bir statik IP adresi kullanın veya DHCP sunucusu tarafından sağlanan dinamik IP adresini kullanın.

Yinelenen IP adresini denetlemek için:

  • Aynı ağdaki herhangi bir aletten aşağıdaki ping ve Test-NetConnection (tnc) komutlarını çalıştırın:

    ping <IP address>
    tnc <IP address>
    tnc <IP address> -CommonTCPPort “RDP”
    

Yanıt alırsanız, yeni VM'ye atadığınız IP adresi zaten kullanımdadır.

VM görüntüsü doğru hazır değil

Hata açıklaması: Azure Stack Edge Pro GPU cihazında kullanılacak bir VM görüntüsünü hazırlamak için belirli bir iş akışını izlemeniz gerekir. Azure'da bir 1. nesil sanal makine oluşturmanız, VM'yi özelleştirmeniz, VHD'yi genelleştirmeniz ve ardından bu sanal makine için işletim sistemi VHD'sini indirmeniz gerekir. Hazırlanan görüntü, "vhd" dosya adı uzantısına ve sabit türe sahip bir 1. nesil VHD olmalıdır.

Gereksinimlere genel bakış için bkz . Azure Stack Edge Pro GPU cihazı için özel VM görüntüleri oluşturma. VM görüntüsü sorunlarını çözme yönergeleri için bkz . Azure Stack Edge Pro GPU'da sanal makine görüntüsü yükleme sorunlarını giderme.

Önerilen çözüm: VM görüntünüzü hazırlamak için iş akışını tamamlayın. Rehberlik için aşağıdaki makalelerden birine bakın:

Ağ geçidi, DNS sunucusuna konuk VM'den erişilemedi

Hata açıklaması: VM dağıtımı sırasında varsayılan ağ geçidine ve DNS sunucusuna ulaşılamıyorsa, VM sağlama zaman aşımına uğradı ve VM dağıtımı başarısız oluyor.

Önerilen çözüm: Sanal makineden varsayılan ağ geçidine ve DNS sunucusuna ulaşılabildiğini doğrulayın. Ardından VM dağıtımını yineleyin.

Sanal makineden varsayılan ağ geçidine ve DNS sunucusuna ulaşılabildiğini doğrulamak için aşağıdaki adımları uygulayın:

  1. VM’ye bağlanın.

  2. Aşağıdaki komutları çalıştırın:

    ping <default gateway IP address>
    ping <DNS server IP address>
    

    Varsayılan ağ geçidi ve DNS sunucularının IP adreslerini bulmak için cihazınızın yerel kullanıcı arabirimine gidin. İlgilendiğiniz bağlantı noktasını seçin ve ağ ayarlarını görüntüleyin.

    Bağlantı Noktası 2 için Ağ ayarlarının görüntülendiği bir Azure Stack Edge cihazının Ağ sayfasının ekran görüntüsü.

cloud init sorunlar (Linux VM'leri)

Hata açıklaması: cloud init çalışmadı veya çalışırken sorunlar cloud init oluştu. cloud-init , VM ilk kez ön başlatıldığında Linux VM'sini özelleştirmek için kullanılır. Daha fazla bilgi için bkz . Azure'da sanal makineler için cloud-init desteği.

Önerilen çözümler: Çalıştırıldığında cloud init oluşan sorunları bulmak için:

  1. VM’ye bağlanın.

  2. cloud init Aşağıdaki günlük dosyalarındaki hataları denetleyin:

    • /var/log/cloud-init-output.log
    • /var/log/cloud-init.log
    • /var/log/waagent/log

Başarıyla çalışmasını engelleyen cloud init en yaygın sorunlardan bazılarını denetlemek için şu adımları uygulayın:

  1. VM görüntüsünün tabanlı cloud initolduğundan emin olun. Şu komutu çalıştırın:

    cloud-init --version

    Komutun cloud init sürüm numarasını döndürmesi gerekir. Görüntü tabanlı değilse cloud init, komut sürüm bilgilerini döndürmez.

    Seçeneklerle ilgili cloud init yardım almak için aşağıdaki komutu çalıştırın:

    cloud-init --help

  2. Örneğin, veri kaynağı Azure olarak ayarlanmış şekilde başarıyla çalıştırıldığından emin cloud init olun.

    Veri kaynağı Azure olarak ayarlandığında, cloud init günlüklerindeki giriş aşağıdakine benzer görünür.

    Veri Kaynağı Azure olarak ayarlanmış bir VM görüntüsü için cloud-init günlük girişinin çizimi. Tanımlayıcı metin vurgulanır.

    Veri kaynağı Azure olarak ayarlı değilse betiğinizi düzeltmeniz cloud init gerekebilir. Daha fazla bilgi için bkz . Cloud-init'te daha ayrıntılı bilgi.

Sağlama bayrakları yanlış ayarlanmış (Linux VM'leri)

Hata açıklaması: Azure'da Bir Linux VM'yi başarıyla dağıtmak için, görüntüde sağlama devre dışı bırakılmalı ve kullanarak cloud init sağlama etkinleştirilmelidir. Bu değerleri ayarlayan Sağlama bayrakları, standart VM görüntüleri için doğru yapılandırılır. Özel bir VM görüntüsü kullanıyorsanız, bunların doğru olduğundan emin olmanız gerekir.

Önerilen çözüm: /etc/waagent.conf dosyasındaki Sağlama bayraklarının aşağıdaki değerlere sahip olduğundan emin olun:

Özellik Gerekli değer
Sağlamayı etkinleştirme Provisioning.Enabled=n
Sağlamak için cloud-init'i kullanın Provisioning.UseCloudInit=y

SRIOV özellikli sanal anahtara bağlı birincil ağ arabirimi

Hata açıklaması: Tek bir kök G/Ç sanallaştırma (SRIOV) arabirimi etkinleştirilmiş sanal anahtara bağlı birincil ağ arabirimi, ağ trafiğinin Hyper-V'yi atlamasına neden olduğundan ana bilgisayar VM'den DHCP isteklerini alamadı ve bu da sağlama zaman aşımına neden oldu.

Önerilen çözümler:

  • Hızlandırılmış ağı etkinleştirmeden VM birincil ağ arabirimini bir sanal anahtara bağlayın.

  • Azure Stack Edge Pro 1 cihazında, Bağlantı Noktası 1 ile Bağlantı Noktası 4 arasında oluşturulan sanal anahtarlar hızlandırılmış ağı etkinleştirmez. Bağlantı noktası 5 veya Bağlantı Noktası 6'da sanal anahtarlar, hızlandırılmış ağı varsayılan olarak etkinleştirir.

  • Azure Stack Edge Pro 2 cihazında, Bağlantı Noktası 1 veya Bağlantı Noktası 2'de oluşturulan sanal anahtarlar hızlandırılmış ağı etkinleştirmez. Bağlantı Noktası 3 veya Bağlantı Noktası 4'te, sanal anahtarlar hızlandırılmış ağı varsayılan olarak etkinleştirir.

Ağ arabirimi oluşturma sorunları

Bu bölümde, bir VM dağıtımı sırasında ağ arabirimi oluşturma işleminin başarısız olmasına neden olan sorunlar için rehberlik sağlanır.

NIC oluşturma zaman aşımı

Hata açıklaması: VM'de ağ arabirimi oluşturma işlemi izin verilen zaman aşımı süresi içinde tamamlanmadı. Bu hatanın nedeni ortamınızdaki DHCP sunucusu sorunları olabilir.

Ağ arabiriminin başarıyla oluşturulup oluşturulmadığını doğrulamak için şu adımları uygulayın:

  1. Azure portalında cihazınızın Azure Stack Edge kaynağına gidin (Edge Hizmetleri>Sanal makineleri'ne gidin). Ardından Dağıtımlar'ı seçin ve VM dağıtımına gidin.

  2. Ağ arabirimi başarıyla oluşturulmadıysa aşağıdaki hatayı görürsünüz.

    Azure Stack Edge cihazında VM dağıtımı sırasında ağ arabirimi oluşturma işlemi başarısız olduğunda Azure portalında görüntülenen hatanın ekran görüntüsü.

Önerilen çözüm: VM'yi yeniden oluşturun ve statik bir IP adresi atayın.

VM oluşturma sorunları

Bu bölüm, VM oluşturma sırasında oluşan yaygın sorunları kapsar.

VM oluşturma başarısız oluyor

Hata açıklaması: Azure Stack Edge ile 2403'ten önce oluşturulmuş bir Market görüntünüz varsa ve mevcut Market görüntüsünden bir VM oluşturduysanız, Azure Stack Edge 2407 Market görüntüsünün indirme yolunu değiştirdiğinden VM oluşturma işlemi başarısız olur.

Önerilen çözüm: Mevcut Market görüntüsünü silmek ve ardından Azure portalından yeni bir Market görüntüsü oluşturmak için aşağıdaki adımları kullanın.

  1. Azure portalından mevcut Market görüntüsünü silin.

    1. Market görüntüsü için alımı ve BlobDownload alma işini listeleyin. Azure Resource Manager'a bağlanmak için bu adımları kullanın.

      Alma işlerini listelemek için aşağıdaki betiği çalıştırın:

      Aşağıdaki Uri'de abonelik kimliğini belirtin:

      $uri 1 = "https://management.appliance name. DNS etki alanı/abonelikleri/sid/providers/Microsoft.AzureBridge/locations/DBELocal/ingestionJobs/?api-version=2022-03-01"

      Function Get-AzCachedAccessToken() 
      {
      $ErrorActionPreference = 'Stop' 
      $azureRmProfile = [Microsoft.Azure.Commands.Common.Authentication.Abstractions.AzureRmProfileProvider]::Instance.Profile 
      $currentAzureContext = Get-AzContext 
      $profileClient = New-Object Microsoft.Azure.Commands.ResourceManager.Common.RMProfileClient($azureRmProfile) 
      Write-Debug ("Getting access token for tenant" + $currentAzureContext.Subscription.TenantId) 
      $token = $profileClient.AcquireAccessToken($currentAzureContext.Subscription.TenantId) 
      $token.AccessToken 
      } 
      
      $token = Get-AzCachedAccessToken 
      $headers = @{Authorization = "Bearer $token"; "Content-Type" = "application/json" } 
      $v = Invoke-RestMethod -Method Get -Uri $uri1 -Headers $headers 
      v.value
      
    2. Alma işi adını = Marketplace image sku name ve kind = BlobDownloadbulun.

      Örnek: alma işi adı = Ubuntu-18-04 ve tür = BlobDownload.

      Alma işi adını bulmak için örnek söz diziminin ekran görüntüsü.

  2. Alma işi 1. Adım'da bulunursa, alma işini silmek ve görüntüyü silmek için aşağıdaki adımları kullanın. Örneğin, yukarıdaki örnekteki alma işi adı şeklindedir ubuntu-18-04. Ayrıca ve Subscription ID Resource group adı örnekte bulunabilir.

    $uri2 = "https://management.<appliance name>.<DNS domain>/subscriptions/sid/resourceGroups/rgname/providers/Microsoft.AzureBridge/locations/dbelocal/ingestionJobs/<ingestion job name>?api-version=2018-06-01" 
    
    Invoke-RestMethod -Method DELETE -Uri $uri2 -Headers $headers
    
  3. Azure Market yeni vm görüntüsü oluşturma adımlarını izleyin.

VM oluşturmak için yeterli bellek yok

Hata açıklaması: Yetersiz bellek nedeniyle VM oluşturma işlemi başarısız olduğunda aşağıdaki hatayı görürsünüz.

Azure Stack Edge cihazında VM oluşturma işlemi başarısız olduğunda Azure portalında görüntülenen hatanın ekran görüntüsü.

Önerilen çözüm: Cihazdaki kullanılabilir belleği denetleyin ve uygun vm boyutunu seçin. Daha fazla bilgi için bkz . Azure Stack Edge'de desteklenen sanal makine boyutları.

Vm dağıtımı için kullanılabilir bellek çeşitli faktörlerle kısıtlanır:

  • Cihazdaki kullanılabilir bellek miktarı. Daha fazla bilgi için bkz. Azure Stack Edge Pro GPU teknik belirtimlerinde ve Azure Stack Edge Mini R teknik belirtimlerinde işlem ve bellek belirtimleri.

  • Kubernetes etkinse Kubernetes kümesindeki Kubernetes ve uygulamalar için gereken işlem belleği.

  • Hyper-V'deki her sanal makine için ek yük.

Önerilen çözümler:

  • Daha az bellek gerektiren bir VM boyutu kullanın.
  • Yeni VM'yi dağıtmadan önce portaldan kullanılmamış vm'leri durdurun.
  • Artık kullanımda olmayan TÜM VM'leri silin.

GPU VM oluşturmak için yetersiz GPU sayısı

Kubernetes'in etkin olduğu bir GPU cihazına VM dağıtmaya çalışırsanız, kullanılabilir GPU yoktur ve VM sağlama işlemi aşağıdaki hatayla başarısız olur:

Bir Azure Stack Edge cihazında kullanılabilir GPU olmadığından GPU VM oluşturma işlemi başarısız olduğunda Azure portalında görüntülenen hatanın ekran görüntüsü.

Olası nedenler: Vm oluşturulmadan önce Kubernetes etkinleştirilirse, Kubernetes kullanılabilir tüm GPU'ları kullanır ve GPU boyutunda vm oluşturamazsınız. Kullanılabilir GPU sayısı kadar GPU boyutunda VM oluşturabilirsiniz. Azure Stack Edge cihazınız 1 veya 2 GPU ile donatılabilir.

Önerilen çözüm: Kubernetes yapılandırılmış bir 1 GPU veya 2 GPU cihazındaki VM dağıtım seçenekleri için bkz . GPU VM'leri ve Kubernetes.

Sonraki adımlar