Referenční informace ke konfiguraci clusteru Kubernetes pro Azure Machine Learning

Tento článek obsahuje referenční informace pro konfiguraci Kubernetes pomocí služby Azure Machine Learning.

Podporovaná verze a oblast Kubernetes

  • Clustery Kubernetes, které instalují rozšíření Azure Machine Learning, mají okno podpory verzí N-2, které je v souladu se zásadami podpory verzí služby Azure Kubernetes Service (AKS), kde N je nejnovější podverze GA služby Azure Kubernetes Service.

    • Pokud například AKS dnes zavádí verzi 1.20.a, jsou podporovány verze 1.20.a, 1.20.b, 1.19.c, 1.19.d, 1.18.e a 1.18.f.

    • Pokud zákazníci používají nepodporovanou verzi Kubernetes, při žádosti o podporu clusteru se zobrazí výzva k upgradu. Clustery s nepodporovanými verzemi Kubernetes se nevztahují na zásady podpory rozšíření Azure Machine Learning.

  • Dostupnost oblastí rozšíření Azure Machine Learning:

    • Rozšíření Azure Machine Learning je možné nasadit do AKS nebo Kubernetes s podporou Azure Arc v podporovaných oblastech uvedených v podpoře oblastí Kubernetes s podporou Azure Arc.

Když nasadíte rozšíření Azure Machine Learning, některé související služby se nasadí do clusteru Kubernetes pro Azure Machine Learning. Následující tabulka uvádí související služby a jejich využití prostředků v clusteru:

Nasazení nebo démon Replika # Školení Odvozování Žádost o procesor (m) Limit procesoru (m) Žádost o paměť (Mi) Limit paměti (Mi)
metrics-controller-manager 0 10 100 20 300
Operátor Prometheus 0 100 400 128 512
Prométheus 0 100 1000 512 4096
kube-state-metrics 0 10 100 32 256
brána 0 50 500 256 2048
fluent-bit 1 na uzel 10 200 100 300
inference-operator-controller-manager 0 100 1000 128 1024
amlarc-identity-controller 0 200 1000 200 1024
amlarc-identity-proxy 0 200 1000 200 1024
azureml-ingress-nginx-controller 0 100 1000 64 512
azureml-fe-v2 1 (pro účely testování)
nebo
3 (pro účely výroby)
900 2000 800 1200
online nasazení 1 na nasazení Vytvořené uživatelem <user-define> <user-define> <user-define> <user-define>
online nasazení / identita – sajdkárna 1 na nasazení 10 50 100 100
aml-operator 0 20 1020 124 2168
vstup do sopek 0 10 100 64 256
kontroler sopek 0 50 500 128 512
vulkán 0 50 500 128 512

S výjimkou vlastních nasazení/podů jsou celkové minimální požadavky na systémové prostředky následující:

Scénář Povolené odvození Povolené trénování Žádost o procesor (m) Limit procesoru (m) Žádost o paměť (Mi) Limit paměti (Mi) Počet uzlů Doporučená minimální velikost virtuálního počítače Odpovídající skladová položka virtuálního počítače AKS
Pro testování 1780 8300 2440 12296 1 Uzel 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW DS2v2
Pro testování 410 4420 1492 10960 1 Uzel 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW DS2v2
Pro testování 1910 10420 2884 15744 1 Uzel 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW DS3v2
Pro produkční prostředí 3600 12700 4240 15296 3 uzly 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW DS3v2
Pro produkční prostředí 410 4420 1492 10960 1 uzly 8 vCPU, 28GiB Memroy, 25600 IOPs, 6000Mbps BW DS4v2
Pro produkční prostředí 3730 14820 4684 18744 3 uzly 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW DS4v2

Poznámka:

  • Pro účely testování byste měli odkazovat na požadavek na prostředek tp.
  • Pro produkční účely byste měli odkazovat na limit prostředků.

Důležité

Tady je několik dalších aspektů, které je potřeba vzít v úvahu:

  • Pro vyšší šířku pásma sítě a lepší výkon vstupně-výstupních operací disku doporučujeme větší skladovou položku.
  • Pokud používáte cluster AKS, možná budete muset zvážit omezení velikosti image kontejneru v AKS. Další informace najdete v limitu velikosti image kontejneru AKS.

Požadavky pro clustery ARO nebo OCP

Zakázání rozšířeného zabezpečení Linuxu (SELinux)

Datová sada Azure Machine Learning (funkce sady SDK v1 používaná v trénovacích úlohách služby Azure Machine Learning) se na počítačích s povoleným SELinuxem nepodporuje. Proto je potřeba zakázat selinux všechny pracovní procesy, abyste mohli používat datovou sadu Azure Machine Learning.

Privilegované nastavení pro ARO a OCP

Pro nasazení rozšíření Azure Machine Learning v clusteru ARO nebo OCP udělte privilegovaný přístup k účtům služby Azure Machine Learning, spusťte oc edit scc privileged příkaz a do části Uživatelé přidejte následující účty služeb:

  • system:serviceaccount:azure-arc:azure-arc-kube-aad-proxy-sa
  • system:serviceaccount:azureml:{EXTENSION-NAME}-kube-state-metrics
  • system:serviceaccount:azureml:prom-admission
  • system:serviceaccount:azureml:default
  • system:serviceaccount:azureml:prom-operator
  • system:serviceaccount:azureml:load-amlarc-selinux-policy-sa
  • system:serviceaccount:azureml:azureml-fe-v2
  • system:serviceaccount:azureml:prom-prometheus
  • system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
  • system:serviceaccount:azureml:azureml-ingress-nginx
  • system:serviceaccount:azureml:azureml-ingress-nginx-admission

Poznámka:

  • {EXTENSION-NAME}: je název rozšíření zadaný příkazem rozhraní příkazového az k8s-extension create --name řádku.
  • {KUBERNETES-COMPUTE-NAMESPACE}: je obor názvů výpočetních prostředků Kubernetes zadaný při připojování výpočetních prostředků k pracovnímu prostoru Azure Machine Learning. Přeskočte system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default konfiguraci, pokud KUBERNETES-COMPUTE-NAMESPACE je default.

Shromažďované podrobnosti protokolu

Některé protokoly o úlohách Azure Machine Learning v clusteru se shromažďují prostřednictvím komponent rozšíření, jako je stav, metriky, životní cyklus atd. Následující seznam obsahuje všechny shromážděné podrobnosti protokolu, včetně typu shromážděných protokolů a jejich odeslání nebo uložení.

Pod Popis prostředků Podrobné informace o protokolování
amlarc-identity-controller Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity pro koncové body pro ověření ve službě Azure Machine Learning.
amlarc-identity-proxy Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity pro cluster k ověření ve službě Azure Machine Learning.
aml-operator Správa životního cyklu trénovacích úloh Protokoly obsahují stav podu trénovací úlohy Azure Machine Learning v clusteru.
azureml-fe-v2 Front-endová komponenta, která směruje příchozí požadavky na odvození do nasazených služeb. Přístupové protokoly na úrovni žádosti, včetně ID požadavku, času spuštění, kódu odpovědi, podrobností o chybě a doby trvání latence požadavku. Protokoly trasování pro změny metadat služby, stav v pořádku služby atd. pro účely ladění.
brána Brána se používá ke komunikaci a odesílání dat zpět a zpět. Trasování protokolů požadavků ze služeb Azure Machine Learning do clusterů
kontrola stavu -- Protokoly obsahují azureml stav prostředku oboru názvů (rozšíření Azure Machine Learning), abyste mohli diagnostikovat, co znamená, že rozšíření není funkční.
inference-operator-controller-manager Správa životního cyklu koncových bodů odvozování Protokoly obsahují koncový bod odvozování služby Azure Machine Learning a stav podu nasazení v clusteru.
metrics-controller-manager Správa konfigurace pro Prometheus Trasování protokolů pro stav nahrávání trénovacích úloh a odvozování metrik nasazení o využití procesoru a využití paměti.
relay server Přenosový server je potřeba jenom v clusteru připojeném k arc a nebude nainstalován v clusteru AKS. Relay server spolupracuje se službou Azure Relay ke komunikaci s cloudovými službami. Protokoly obsahují informace o úrovni požadavků z Azure Relay.

Úlohy Azure Machine Learning se připojují s vlastním úložištěm dat

Trvalý svazek (PV) a trvalá deklarace identity svazku (PVC) jsou koncepty Kubernetes, které uživatelům umožňují poskytovat a využívat různé prostředky úložiště.

  1. Vytvoření SOUČHODNOTy, například nfs
apiVersion: v1
kind: PersistentVolume
metadata:
  name: nfs-pv 
spec:
  capacity:
    storage: 1Gi 
  accessModes:
    - ReadWriteMany 
  persistentVolumeReclaimPolicy: Retain
  storageClassName: ""
  nfs: 
    path: /share/nfs
    server: 20.98.110.84 
    readOnly: false
  1. Vytvořte PVC ve stejném oboru názvů Kubernetes s úlohami ML. V metadatanástroji Azure Machine Learning musíte přidat popisekml.azure.com/pvc: "true", který bude rozpoznán, a přidat poznámku ml.azure.com/mountpath: <mount path> pro nastavení cesty připojení.
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: nfs-pvc  
  namespace: default
  labels:
    ml.azure.com/pvc: "true"
  annotations:
    ml.azure.com/mountpath: "/mnt/nfs"
spec:
  storageClassName: ""
  accessModes:
  - ReadWriteMany      
  resources:
     requests:
       storage: 1Gi

Důležité

  • Vlastní úložiště dat z PVC podporují pouze příkazová úloha/komponenta, úloha nebo komponenta hyperdrivu a dávkové nasazení. > * Online koncový bod v reálném čase, úloha AutoML a úloha PRS nepodporují vlastní úložiště dat z PVC.
  • Kromě toho se ke svazku připojí jenom pody ve stejném oboru názvů Kubernetes s PVC. Datový vědec má přístup k mount path zadanému v poznámce PVC v úloze. Úloha AutoML a úloha Prs nebudou mít přístup k PVC.

Podporované vady a tolerance služby Azure Machine Learning

Taint a Toleration jsou koncepty Kubernetes, které spolupracují, aby se zajistilo, že pody nejsou naplánované na nevhodné uzly.

Clustery Kubernetes integrované se službou Azure Machine Learning (včetně clusterů AKS a Arc Kubernetes) teď podporují konkrétní tainty a tolerance služby Azure Machine Learning, což uživatelům umožňuje přidávat konkrétní tainty Azure Machine Learning na uzlech vyhrazených pro Azure Machine Learning, aby se úlohy mimo Azure Machine Learning neplánovály na tyto vyhrazené uzly.

Podporujeme pouze umístění taintů specifických pro amlarc na uzly, které jsou definovány takto:

Nakazit Key Hodnota Účinnost Popis
amlarc overall ml.azure.com/amlarc true NoSchedulenebo NoExecutePreferNoSchedule Všechny úlohy Azure Machine Learning, včetně podů služeb systému rozšíření a podů úloh strojového učení, by tento amlarc overall taint tolerovat.
systém amlarc ml.azure.com/amlarc-system true NoSchedulenebo NoExecutePreferNoSchedule Tento taint by toleroval amlarc system pouze pody služeb rozšíření Azure Machine Learning.
Amlarc – úloha ml.azure.com/amlarc-workload true NoSchedulenebo NoExecutePreferNoSchedule Tento taint by toleroval amlarc workload pouze pody úloh strojového učení.
amlarc – skupina prostředků ml.azure.com/resource-group <název skupiny prostředků> NoSchedulenebo NoExecutePreferNoSchedule Tento taint by toleroval amlarc resource group pouze pody úloh strojového učení vytvořené z konkrétní skupiny prostředků.
Pracovní prostor amlarc ml.azure.com/workspace <název pracovního prostoru> NoSchedulenebo NoExecutePreferNoSchedule Tento taint by toleroval amlarc workspace pouze pody úloh strojového učení vytvořené z konkrétního pracovního prostoru.
amlarc compute ml.azure.com/compute <název výpočetních prostředků> NoSchedulenebo NoExecutePreferNoSchedule Tento taint by toleroval amlarc compute pouze pody úloh strojového učení vytvořené s konkrétním cílovým výpočetním objektem.

Tip

  1. V případě služby Azure Kubernetes Service (AKS) můžete postupovat podle příkladu v části Osvědčené postupy pro pokročilé funkce plánovače ve službě Azure Kubernetes Service (AKS), které použijí tainty na fondy uzlů.
  2. U clusterů Arc Kubernetes, jako jsou místní clustery Kubernetes, můžete pomocí kubectl taint příkazu přidat tainty do uzlů. Další příklady najdete v dokumentaci k Kubernetes.

Osvědčené postupy

Podle vašich požadavků na plánování uzlů vyhrazených pro Azure Machine Learning můžete přidat několik taintů specifických pro amlarc a omezit úlohy Azure Machine Learning, které se můžou spouštět na uzlech. Uvádíme osvědčené postupy pro používání taintů amlarc:

  • Pokud chcete zabránit tomu, aby úlohy mimo Azure Machine Learning běžely na vyhrazených uzlech nebo fondech uzlů Azure Machine Learning, stačí do těchto uzlů přidat aml overall taint.
  • Pokud chcete zabránit spuštění podů, které nejsou systémem na vyhrazených uzlech nebo fondech uzlů služby Azure Machine Learning, musíte přidat následující tainty:
    • amlarc overall nakazit
    • amlarc system nakazit
  • Pokud chcete zabránit tomu, aby úlohy bez ml běžely na vyhrazených uzlech nebo fondech uzlů Azure Machine Learning, musíte přidat následující tainty:
    • amlarc overall nakazit
    • amlarc workloads nakazit
  • Pokud chcete zabránit tomu, aby úlohy vytvořené z pracovního prostoru X běžely ve vyhrazených uzlech nebo fondech uzlů Služby Azure Machine Learning, musíte přidat následující tainty:
    • amlarc overall nakazit
    • amlarc resource group (has this <workspace X>) nakazit
    • amlarc <workspace X> nakazit
  • Pokud chcete zabránit spouštění úloh nevytvořených cílovým výpočetním objektem X ve vyhrazených uzlech nebo fondech uzlů služby Azure Machine Learning, musíte přidat následující tainty:
    • amlarc overall nakazit
    • amlarc resource group (has this <workspace X>) nakazit
    • amlarc workspace (has this <compute X>) nakazit
    • amlarc <compute X> nakazit

Integrace dalšího kontroleru příchozího přenosu dat s rozšířením Azure Machine Learning přes HTTP nebo HTTPS

Kromě výchozího nástroje pro odvozování služby Azure Machine Learning pro vyrovnávání zatížení azureml-fe můžete také integrovat další nástroje pro vyrovnávání zatížení s rozšířením Azure Machine Learning přes PROTOKOL HTTP nebo HTTPS.

Tento kurz ukazuje, jak integrovat kontroler příchozího přenosu dat Nginx nebo bránu Aplikace Azure lication.

Požadavky

  • Nasaďte rozšíření Azure Machine Learning pomocí inferenceRouterServiceType=ClusterIP a allowInsecureConnections=True , aby kontroler příchozího přenosu dat Nginx mohl zpracovávat ukončení protokolu TLS sám, místo aby ho předával službě azureml-fe, když je služba zpřístupněná přes HTTPS.
  • K integraci s kontrolerem příchozího přenosu dat Nginx potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat Nginx.
  • Pro integraci se službou Aplikace Azure lication Gateway potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat brány Aplikace Azure lication.
    • Nasazení Greenfieldu: Pokud začínáte úplně od začátku, projděte si tyto pokyny.
    • Nasazení Brownfieldu: Pokud máte existující cluster AKS a Službu Application Gateway, projděte si tyto pokyny.
  • Pokud chcete pro tuto aplikaci použít https, potřebujete certifikát x509 a jeho privátní klíč.

Zveřejnění služeb přes PROTOKOL HTTP

K zveřejnění azureml-fe použijeme následující prostředek příchozího přenosu dat:

# Nginx Ingress Controller example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: azureml-fe
  namespace: azureml
spec:
  ingressClassName: nginx
  rules:
  - http:
      paths:
      - path: /
        backend:
          service:
            name: azureml-fe
            port:
              number: 80
        pathType: Prefix

Tento příchozí přenos dat zpřístupňuje azureml-fe službu a vybrané nasazení jako výchozí back-end kontroleru příchozího přenosu dat Nginx.

# Azure Application Gateway example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: azureml-fe
  namespace: azureml
spec:
  ingressClassName: azure-application-gateway
  rules:
  - http:
      paths:
      - path: /
        backend:
          service:
            name: azureml-fe
            port:
              number: 80
        pathType: Prefix

Tento příchozí přenos dat zpřístupňuje azureml-fe službu a vybrané nasazení jako výchozí back-end služby Application Gateway.

Uložte výše uvedený prostředek příchozího přenosu dat jako ing-azureml-fe.yaml.

  1. Nasazení ing-azureml-fe.yaml spuštěním příkazu:

    kubectl apply -f ing-azureml-fe.yaml
    
  2. Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.

  3. azureml-fe Aplikace by teď měla být dostupná. Můžete to zkontrolovat na adrese:

    • Kontroler příchozího přenosu dat Nginx: veřejná adresa loadbalanceru kontroleru příchozího přenosu dat Nginx
    • Aplikace Azure lication Gateway: veřejná adresa služby Application Gateway.
  4. Vytvořte úlohu odvození a vyvolejte ji.

    Poznámka:

    Před vyvoláním nahraďte IP adresu v scoring_uri veřejnou adresou LoadBalanceru kontroleru příchozího přenosu dat Nginx.

Zveřejnění služeb přes HTTPS

  1. Před nasazením příchozího přenosu dat je potřeba vytvořit tajný klíč Kubernetes pro hostování certifikátu a privátního klíče. Tajný kód Kubernetes můžete vytvořit spuštěním příkazu .

    kubectl create secret tls <ingress-secret-name> -n azureml --key <path-to-key> --cert <path-to-cert>
    
  2. Definujte následující příchozí přenos dat. V příchozím přenosu dat zadejte název tajného kódu v oddílu secretName .

    # Nginx Ingress Controller example
    apiVersion: networking.k8s.io/v1
    kind: Ingress
    metadata:
      name: azureml-fe
      namespace: azureml
    spec:
      ingressClassName: nginx
      tls:
      - hosts:
        - <domain>
        secretName: <ingress-secret-name>
      rules:
      - host: <domain>
        http:
          paths:
          - path: /
            backend:
              service:
                name: azureml-fe
                port:
                  number: 80
            pathType: Prefix
    
    # Azure Application Gateway example
    apiVersion: networking.k8s.io/v1
    kind: Ingress
    metadata:
      name: azureml-fe
      namespace: azureml
    spec:
      ingressClassName: azure-application-gateway
      tls:
      - hosts:
        - <domain>
        secretName: <ingress-secret-name>
      rules:
      - host: <domain>
        http:
          paths:
          - path: /
            backend:
              service:
                name: azureml-fe
                port:
                  number: 80
            pathType: Prefix
    

    Poznámka:

    <ingress-secret-name> Ve výše uvedeném prostředku příchozího přenosu dat nahraďte <domain> doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway a názvem vašeho tajného kódu. Uložte výše uvedený prostředek příchozího přenosu dat do názvu ing-azureml-fe-tls.yamlsouboru .

  3. Nasazení ing-azureml-fe-tls.yaml spuštěním příkazu

    kubectl apply -f ing-azureml-fe-tls.yaml
    
  4. Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.

  5. azureml-fe Aplikace je teď dostupná na https. Můžete to zkontrolovat tak, že navštívíte veřejnou adresu LoadBalanceru kontroleru příchozího přenosu dat Nginx.

  6. Vytvořte úlohu odvození a vyvolejte ji.

    Poznámka:

    Před vyvoláním příkazu nahraďte protokol a IP adresu v scoring_uri https a doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway.

Nasazení rozšíření s využitím šablony ARM

Rozšíření ve spravovaném clusteru je možné nasadit pomocí šablony ARM. Ukázkovou šablonu najdete v deployextension.json s ukázkovým souborem parametrů deployextension.parameters.json

Pokud chcete použít ukázkovou šablonu nasazení, upravte soubor parametrů se správnou hodnotou a spusťte následující příkaz:

az deployment group create --name <ARM deployment name> --resource-group <resource group name> --template-file deployextension.json --parameters deployextension.parameters.json

Další informace o používání šablony ARM najdete v dokumentaci k šabloně ARM.

Poznámka k vydání rozšíření AzuremML

Poznámka:

Nové funkce se vydávají v biweekly kalendáři.

Datum Verze Popis verze
26. zář 2024 1.1.64 Opravili jsme chyby zabezpečení.
21. listopadu 2023 1.1.39 Opravili jsme chyby zabezpečení. Upřesňující chybová zpráva Zvýšená stabilita pro rozhraní API přenosového serveru
1. listopadu 2023 1.1.37 Aktualizace verze envoy roviny dat
11. října 2023 1.1.35 Opravte ohrožený obrázek. Opravy chyb.
Aug 25, 2023 1.1.34 Opravte ohrožený obrázek. Vrátí podrobnější chybu identity. Opravy chyb.
18. července 2023 1.1.29 Přidání chyb nového operátoru identity Opravy chyb.
4. června 2023 1.1.28 Vylepšení automatického škálování pro zpracování více fondů uzlů Opravy chyb.
Duben 18 , 2023 1.1.26 Opravili jsme opravy chyb a chyby zabezpečení.
27. března 2023 1.1.25 Přidání omezení úlohy Azure Machine Learning Rychlé selhání pro trénovací úlohu, když se instalace SSH nezdařila. Snižte interval výstřižku Prometheus na 30s. Zlepšení chybových zpráv pro odvozování Opravte ohrožený obrázek.
7. března 2023 1.1.23 Změňte výchozí typ instance tak, aby používal paměť 2Gi. Aktualizujte konfigurace metrik pro bodování fe, které přidávají 15s scrape_interval. Přidejte specifikaci prostředku pro mdc sidecar. Opravte ohrožený obrázek. Opravy chyb.
14. února 2023 1.1.21 Opravy chyb.
7. února 2023 1.1.19 Zlepšení chybové návratové zprávy pro odvozování Aktualizujte výchozí typ instance tak, aby používal limit paměti 2Gi. Zkontrolujte stav podu, kvótu prostředků, verzi Kubernetes a verzi rozšíření. Opravy chyb
Prosinec 27, 2022 1.1.17 Přesuňte fluent-bit z DaemonSet na sajdkáře. Přidejte podporu MDC. Upřesněte chybové zprávy. Podpora úloh v režimu clusteru (Windows, Linux) Opravy chyb
29. listopadu 2022 1.1.16 Přidejte ověření typu instance podle nového CRD. Odolnost proti podpoře. Zkraťte název SVC. Hodina jádra úlohy Opravy a vylepšení několika chyb
13. zář 2022 1.1.10 Opravy chyb.
Aug 29, 2022 1.1.9 Vylepšená logika kontroly stavu Opravy chyb.
23. června 2022 1.1.6 Opravy chyb.
15. června 2022 1.1.5 Aktualizace trénování pro použití nového běžného modulu runtime ke spouštění úloh Odebrání využití Služby Azure Relay pro rozšíření AKS Odebrání využití služby Service Bus z rozšíření Aktualizované využití kontextu zabezpečení Aktualizace odvození azureml-fe na verzi 2 Aktualizováno tak, aby používala volcano jako plánovač trénovacích úloh. Opravy chyb.
14. října 2021 1.0.37 Podpora připojení svazku PV/PVC v trénovací úloze AMLArc
16. září 2021 1.0.29 Dostupné nové oblasti, WestUS, CentralUS, NorthCentralUS, KoreaCentral. Rozšiřitelnost fronty úloh Podívejte se na podrobnosti o frontě úloh v nástroji Azure Machine Learning Workspace Studio. Automatická vražda politiky. Podpora max_run_duration_seconds v ScriptRunConfig. Systém se pokusí spuštění automaticky zrušit, pokud trvalo déle, než je hodnota nastavení. Vylepšení výkonu u podpory automatického škálování clusteru Nasazení agenta Arc a rozšíření ML z místního registru kontejneru
24. srpna 2021 1.0.28 Typ výpočetní instance je podporován v jazyce YAML úlohy. Přiřaďte spravovanou identitu výpočetním prostředkům AMLArc.
10. srpna 2021 1.0.20 Nová podpora distribuce Kubernetes, K3S – Lightweight Kubernetes Nasaďte rozšíření Azure Machine Learning do clusteru AKS bez připojení přes Azure Arc. Automatizované strojové učení (AutoML) prostřednictvím sady Python SDK Pomocí rozhraní příkazového řádku 2.0 připojte cluster Kubernetes k pracovnímu prostoru Služby Azure Machine Learning. Optimalizace využití prostředků procesoru a paměti komponent rozšíření Azure Machine Learning
2. července 2021 1.0.13 Podpora nových distribucí Kubernetes, OpenShift Kubernetes a GKE (Google Kubernetes Engine). Podpora automatického škálování Pokud cluster Kubernetes spravovaný uživatelem povolí automatické škálování, cluster se automaticky škáluje nebo škáluje podle objemu aktivních spuštění a nasazení. Zlepšení výkonu u spouštěče úloh, které zkracuje dobu provádění úlohy na hodně.