Referenční informace ke konfiguraci clusteru Kubernetes pro Azure Machine Learning
Tento článek obsahuje referenční informace pro konfiguraci Kubernetes pomocí služby Azure Machine Learning.
Podporovaná verze a oblast Kubernetes
Clustery Kubernetes, které instalují rozšíření Azure Machine Learning, mají okno podpory verzí N-2, které je v souladu se zásadami podpory verzí služby Azure Kubernetes Service (AKS), kde N je nejnovější podverze GA služby Azure Kubernetes Service.
Pokud například AKS dnes zavádí verzi 1.20.a, jsou podporovány verze 1.20.a, 1.20.b, 1.19.c, 1.19.d, 1.18.e a 1.18.f.
Pokud zákazníci používají nepodporovanou verzi Kubernetes, při žádosti o podporu clusteru se zobrazí výzva k upgradu. Clustery s nepodporovanými verzemi Kubernetes se nevztahují na zásady podpory rozšíření Azure Machine Learning.
Dostupnost oblastí rozšíření Azure Machine Learning:
- Rozšíření Azure Machine Learning je možné nasadit do AKS nebo Kubernetes s podporou Azure Arc v podporovaných oblastech uvedených v podpoře oblastí Kubernetes s podporou Azure Arc.
Doporučené plánování zdrojů
Když nasadíte rozšíření Azure Machine Learning, některé související služby se nasadí do clusteru Kubernetes pro Azure Machine Learning. Následující tabulka uvádí související služby a jejich využití prostředků v clusteru:
Nasazení nebo démon | Replika # | Školení | Odvozování | Žádost o procesor (m) | Limit procesoru (m) | Žádost o paměť (Mi) | Limit paměti (Mi) |
---|---|---|---|---|---|---|---|
metrics-controller-manager | 0 | ✓ | ✓ | 10 | 100 | 20 | 300 |
Operátor Prometheus | 0 | ✓ | ✓ | 100 | 400 | 128 | 512 |
Prométheus | 0 | ✓ | ✓ | 100 | 1000 | 512 | 4096 |
kube-state-metrics | 0 | ✓ | ✓ | 10 | 100 | 32 | 256 |
brána | 0 | ✓ | ✓ | 50 | 500 | 256 | 2048 |
fluent-bit | 1 na uzel | ✓ | ✓ | 10 | 200 | 100 | 300 |
inference-operator-controller-manager | 0 | ✓ | – | 100 | 1000 | 128 | 1024 |
amlarc-identity-controller | 0 | ✓ | – | 200 | 1000 | 200 | 1024 |
amlarc-identity-proxy | 0 | ✓ | – | 200 | 1000 | 200 | 1024 |
azureml-ingress-nginx-controller | 0 | ✓ | – | 100 | 1000 | 64 | 512 |
azureml-fe-v2 | 1 (pro účely testování) nebo 3 (pro účely výroby) |
✓ | – | 900 | 2000 | 800 | 1200 |
online nasazení | 1 na nasazení | Vytvořené uživatelem | – | <user-define> | <user-define> | <user-define> | <user-define> |
online nasazení / identita – sajdkárna | 1 na nasazení | ✓ | – | 10 | 50 | 100 | 100 |
aml-operator | 0 | – | ✓ | 20 | 1020 | 124 | 2168 |
vstup do sopek | 0 | – | ✓ | 10 | 100 | 64 | 256 |
kontroler sopek | 0 | – | ✓ | 50 | 500 | 128 | 512 |
vulkán | 0 | – | ✓ | 50 | 500 | 128 | 512 |
S výjimkou vlastních nasazení/podů jsou celkové minimální požadavky na systémové prostředky následující:
Scénář | Povolené odvození | Povolené trénování | Žádost o procesor (m) | Limit procesoru (m) | Žádost o paměť (Mi) | Limit paměti (Mi) | Počet uzlů | Doporučená minimální velikost virtuálního počítače | Odpovídající skladová položka virtuálního počítače AKS |
---|---|---|---|---|---|---|---|---|---|
Pro testování | ✓ | – | 1780 | 8300 | 2440 | 12296 | 1 Uzel | 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW | DS2v2 |
Pro testování | – | ✓ | 410 | 4420 | 1492 | 10960 | 1 Uzel | 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW | DS2v2 |
Pro testování | ✓ | ✓ | 1910 | 10420 | 2884 | 15744 | 1 Uzel | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS3v2 |
Pro produkční prostředí | ✓ | – | 3600 | 12700 | 4240 | 15296 | 3 uzly | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS3v2 |
Pro produkční prostředí | – | ✓ | 410 | 4420 | 1492 | 10960 | 1 uzly | 8 vCPU, 28GiB Memroy, 25600 IOPs, 6000Mbps BW | DS4v2 |
Pro produkční prostředí | ✓ | ✓ | 3730 | 14820 | 4684 | 18744 | 3 uzly | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS4v2 |
Poznámka:
- Pro účely testování byste měli odkazovat na požadavek na prostředek tp.
- Pro produkční účely byste měli odkazovat na limit prostředků.
Důležité
Tady je několik dalších aspektů, které je potřeba vzít v úvahu:
- Pro vyšší šířku pásma sítě a lepší výkon vstupně-výstupních operací disku doporučujeme větší skladovou položku.
- Vezměte například DV2/DSv2. Použití velké skladové položky může zkrátit dobu načítání image, aby se zlepšil výkon sítě a úložiště.
- Další informace o rezervaci AKS najdete v rezervaci AKS.
- Pokud používáte cluster AKS, možná budete muset zvážit omezení velikosti image kontejneru v AKS. Další informace najdete v limitu velikosti image kontejneru AKS.
Požadavky pro clustery ARO nebo OCP
Zakázání rozšířeného zabezpečení Linuxu (SELinux)
Datová sada Azure Machine Learning (funkce sady SDK v1 používaná v trénovacích úlohách služby Azure Machine Learning) se na počítačích s povoleným SELinuxem nepodporuje. Proto je potřeba zakázat selinux
všechny pracovní procesy, abyste mohli používat datovou sadu Azure Machine Learning.
Privilegované nastavení pro ARO a OCP
Pro nasazení rozšíření Azure Machine Learning v clusteru ARO nebo OCP udělte privilegovaný přístup k účtům služby Azure Machine Learning, spusťte oc edit scc privileged
příkaz a do části Uživatelé přidejte následující účty služeb:
system:serviceaccount:azure-arc:azure-arc-kube-aad-proxy-sa
system:serviceaccount:azureml:{EXTENSION-NAME}-kube-state-metrics
system:serviceaccount:azureml:prom-admission
system:serviceaccount:azureml:default
system:serviceaccount:azureml:prom-operator
system:serviceaccount:azureml:load-amlarc-selinux-policy-sa
system:serviceaccount:azureml:azureml-fe-v2
system:serviceaccount:azureml:prom-prometheus
system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
system:serviceaccount:azureml:azureml-ingress-nginx
system:serviceaccount:azureml:azureml-ingress-nginx-admission
Poznámka:
{EXTENSION-NAME}
: je název rozšíření zadaný příkazem rozhraní příkazovéhoaz k8s-extension create --name
řádku.{KUBERNETES-COMPUTE-NAMESPACE}
: je obor názvů výpočetních prostředků Kubernetes zadaný při připojování výpočetních prostředků k pracovnímu prostoru Azure Machine Learning. Přeskočtesystem:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
konfiguraci, pokudKUBERNETES-COMPUTE-NAMESPACE
jedefault
.
Shromažďované podrobnosti protokolu
Některé protokoly o úlohách Azure Machine Learning v clusteru se shromažďují prostřednictvím komponent rozšíření, jako je stav, metriky, životní cyklus atd. Následující seznam obsahuje všechny shromážděné podrobnosti protokolu, včetně typu shromážděných protokolů a jejich odeslání nebo uložení.
Pod | Popis prostředků | Podrobné informace o protokolování |
---|---|---|
amlarc-identity-controller | Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity | Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity pro koncové body pro ověření ve službě Azure Machine Learning. |
amlarc-identity-proxy | Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity | Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity pro cluster k ověření ve službě Azure Machine Learning. |
aml-operator | Správa životního cyklu trénovacích úloh | Protokoly obsahují stav podu trénovací úlohy Azure Machine Learning v clusteru. |
azureml-fe-v2 | Front-endová komponenta, která směruje příchozí požadavky na odvození do nasazených služeb. | Přístupové protokoly na úrovni žádosti, včetně ID požadavku, času spuštění, kódu odpovědi, podrobností o chybě a doby trvání latence požadavku. Protokoly trasování pro změny metadat služby, stav v pořádku služby atd. pro účely ladění. |
brána | Brána se používá ke komunikaci a odesílání dat zpět a zpět. | Trasování protokolů požadavků ze služeb Azure Machine Learning do clusterů |
kontrola stavu | -- | Protokoly obsahují azureml stav prostředku oboru názvů (rozšíření Azure Machine Learning), abyste mohli diagnostikovat, co znamená, že rozšíření není funkční. |
inference-operator-controller-manager | Správa životního cyklu koncových bodů odvozování | Protokoly obsahují koncový bod odvozování služby Azure Machine Learning a stav podu nasazení v clusteru. |
metrics-controller-manager | Správa konfigurace pro Prometheus | Trasování protokolů pro stav nahrávání trénovacích úloh a odvozování metrik nasazení o využití procesoru a využití paměti. |
relay server | Přenosový server je potřeba jenom v clusteru připojeném k arc a nebude nainstalován v clusteru AKS. | Relay server spolupracuje se službou Azure Relay ke komunikaci s cloudovými službami. Protokoly obsahují informace o úrovni požadavků z Azure Relay. |
Úlohy Azure Machine Learning se připojují s vlastním úložištěm dat
Trvalý svazek (PV) a trvalá deklarace identity svazku (PVC) jsou koncepty Kubernetes, které uživatelům umožňují poskytovat a využívat různé prostředky úložiště.
- Vytvoření SOUČHODNOTy, například nfs
apiVersion: v1
kind: PersistentVolume
metadata:
name: nfs-pv
spec:
capacity:
storage: 1Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
storageClassName: ""
nfs:
path: /share/nfs
server: 20.98.110.84
readOnly: false
- Vytvořte PVC ve stejném oboru názvů Kubernetes s úlohami ML. V
metadata
nástroji Azure Machine Learning musíte přidat popisekml.azure.com/pvc: "true"
, který bude rozpoznán, a přidat poznámkuml.azure.com/mountpath: <mount path>
pro nastavení cesty připojení.
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: nfs-pvc
namespace: default
labels:
ml.azure.com/pvc: "true"
annotations:
ml.azure.com/mountpath: "/mnt/nfs"
spec:
storageClassName: ""
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
Důležité
- Vlastní úložiště dat z PVC podporují pouze příkazová úloha/komponenta, úloha nebo komponenta hyperdrivu a dávkové nasazení. > * Online koncový bod v reálném čase, úloha AutoML a úloha PRS nepodporují vlastní úložiště dat z PVC.
- Kromě toho se ke svazku připojí jenom pody ve stejném oboru názvů Kubernetes s PVC. Datový vědec má přístup k
mount path
zadanému v poznámce PVC v úloze. Úloha AutoML a úloha Prs nebudou mít přístup k PVC.
Podporované vady a tolerance služby Azure Machine Learning
Taint a Toleration jsou koncepty Kubernetes, které spolupracují, aby se zajistilo, že pody nejsou naplánované na nevhodné uzly.
Clustery Kubernetes integrované se službou Azure Machine Learning (včetně clusterů AKS a Arc Kubernetes) teď podporují konkrétní tainty a tolerance služby Azure Machine Learning, což uživatelům umožňuje přidávat konkrétní tainty Azure Machine Learning na uzlech vyhrazených pro Azure Machine Learning, aby se úlohy mimo Azure Machine Learning neplánovály na tyto vyhrazené uzly.
Podporujeme pouze umístění taintů specifických pro amlarc na uzly, které jsou definovány takto:
Nakazit | Key | Hodnota | Účinnost | Popis |
---|---|---|---|---|
amlarc overall | ml.azure.com/amlarc | true | NoSchedule nebo NoExecute PreferNoSchedule |
Všechny úlohy Azure Machine Learning, včetně podů služeb systému rozšíření a podů úloh strojového učení, by tento amlarc overall taint tolerovat. |
systém amlarc | ml.azure.com/amlarc-system | true | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc system pouze pody služeb rozšíření Azure Machine Learning. |
Amlarc – úloha | ml.azure.com/amlarc-workload | true | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc workload pouze pody úloh strojového učení. |
amlarc – skupina prostředků | ml.azure.com/resource-group | <název skupiny prostředků> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc resource group pouze pody úloh strojového učení vytvořené z konkrétní skupiny prostředků. |
Pracovní prostor amlarc | ml.azure.com/workspace | <název pracovního prostoru> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc workspace pouze pody úloh strojového učení vytvořené z konkrétního pracovního prostoru. |
amlarc compute | ml.azure.com/compute | <název výpočetních prostředků> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc compute pouze pody úloh strojového učení vytvořené s konkrétním cílovým výpočetním objektem. |
Tip
- V případě služby Azure Kubernetes Service (AKS) můžete postupovat podle příkladu v části Osvědčené postupy pro pokročilé funkce plánovače ve službě Azure Kubernetes Service (AKS), které použijí tainty na fondy uzlů.
- U clusterů Arc Kubernetes, jako jsou místní clustery Kubernetes, můžete pomocí
kubectl taint
příkazu přidat tainty do uzlů. Další příklady najdete v dokumentaci k Kubernetes.
Osvědčené postupy
Podle vašich požadavků na plánování uzlů vyhrazených pro Azure Machine Learning můžete přidat několik taintů specifických pro amlarc a omezit úlohy Azure Machine Learning, které se můžou spouštět na uzlech. Uvádíme osvědčené postupy pro používání taintů amlarc:
- Pokud chcete zabránit tomu, aby úlohy mimo Azure Machine Learning běžely na vyhrazených uzlech nebo fondech uzlů Azure Machine Learning, stačí do těchto uzlů přidat
aml overall
taint. - Pokud chcete zabránit spuštění podů, které nejsou systémem na vyhrazených uzlech nebo fondech uzlů služby Azure Machine Learning, musíte přidat následující tainty:
amlarc overall
nakazitamlarc system
nakazit
- Pokud chcete zabránit tomu, aby úlohy bez ml běžely na vyhrazených uzlech nebo fondech uzlů Azure Machine Learning, musíte přidat následující tainty:
amlarc overall
nakazitamlarc workloads
nakazit
- Pokud chcete zabránit tomu, aby úlohy vytvořené z pracovního prostoru X běžely ve vyhrazených uzlech nebo fondech uzlů Služby Azure Machine Learning, musíte přidat následující tainty:
amlarc overall
nakazitamlarc resource group (has this <workspace X>)
nakazitamlarc <workspace X>
nakazit
- Pokud chcete zabránit spouštění úloh nevytvořených cílovým výpočetním objektem X ve vyhrazených uzlech nebo fondech uzlů služby Azure Machine Learning, musíte přidat následující tainty:
amlarc overall
nakazitamlarc resource group (has this <workspace X>)
nakazitamlarc workspace (has this <compute X>)
nakazitamlarc <compute X>
nakazit
Integrace dalšího kontroleru příchozího přenosu dat s rozšířením Azure Machine Learning přes HTTP nebo HTTPS
Kromě výchozího nástroje pro odvozování služby Azure Machine Learning pro vyrovnávání zatížení azureml-fe můžete také integrovat další nástroje pro vyrovnávání zatížení s rozšířením Azure Machine Learning přes PROTOKOL HTTP nebo HTTPS.
Tento kurz ukazuje, jak integrovat kontroler příchozího přenosu dat Nginx nebo bránu Aplikace Azure lication.
Požadavky
- Nasaďte rozšíření Azure Machine Learning pomocí
inferenceRouterServiceType=ClusterIP
aallowInsecureConnections=True
, aby kontroler příchozího přenosu dat Nginx mohl zpracovávat ukončení protokolu TLS sám, místo aby ho předával službě azureml-fe, když je služba zpřístupněná přes HTTPS. - K integraci s kontrolerem příchozího přenosu dat Nginx potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat Nginx.
- Vytvořte základní kontroler: Pokud začínáte úplně od začátku, přečtěte si tyto pokyny.
- Pro integraci se službou Aplikace Azure lication Gateway potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat brány Aplikace Azure lication.
- Pokud chcete pro tuto aplikaci použít https, potřebujete certifikát x509 a jeho privátní klíč.
Zveřejnění služeb přes PROTOKOL HTTP
K zveřejnění azureml-fe použijeme následující prostředek příchozího přenosu dat:
# Nginx Ingress Controller example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: nginx
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
Tento příchozí přenos dat zpřístupňuje azureml-fe
službu a vybrané nasazení jako výchozí back-end kontroleru příchozího přenosu dat Nginx.
# Azure Application Gateway example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: azure-application-gateway
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
Tento příchozí přenos dat zpřístupňuje azureml-fe
službu a vybrané nasazení jako výchozí back-end služby Application Gateway.
Uložte výše uvedený prostředek příchozího přenosu dat jako ing-azureml-fe.yaml
.
Nasazení
ing-azureml-fe.yaml
spuštěním příkazu:kubectl apply -f ing-azureml-fe.yaml
Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.
azureml-fe
Aplikace by teď měla být dostupná. Můžete to zkontrolovat na adrese:- Kontroler příchozího přenosu dat Nginx: veřejná adresa loadbalanceru kontroleru příchozího přenosu dat Nginx
- Aplikace Azure lication Gateway: veřejná adresa služby Application Gateway.
Vytvořte úlohu odvození a vyvolejte ji.
Poznámka:
Před vyvoláním nahraďte IP adresu v scoring_uri veřejnou adresou LoadBalanceru kontroleru příchozího přenosu dat Nginx.
Zveřejnění služeb přes HTTPS
Před nasazením příchozího přenosu dat je potřeba vytvořit tajný klíč Kubernetes pro hostování certifikátu a privátního klíče. Tajný kód Kubernetes můžete vytvořit spuštěním příkazu .
kubectl create secret tls <ingress-secret-name> -n azureml --key <path-to-key> --cert <path-to-cert>
Definujte následující příchozí přenos dat. V příchozím přenosu dat zadejte název tajného kódu v oddílu
secretName
.# Nginx Ingress Controller example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: nginx tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
# Azure Application Gateway example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: azure-application-gateway tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
Poznámka:
<ingress-secret-name>
Ve výše uvedeném prostředku příchozího přenosu dat nahraďte<domain>
doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway a názvem vašeho tajného kódu. Uložte výše uvedený prostředek příchozího přenosu dat do názvuing-azureml-fe-tls.yaml
souboru .Nasazení ing-azureml-fe-tls.yaml spuštěním příkazu
kubectl apply -f ing-azureml-fe-tls.yaml
Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.
azureml-fe
Aplikace je teď dostupná na https. Můžete to zkontrolovat tak, že navštívíte veřejnou adresu LoadBalanceru kontroleru příchozího přenosu dat Nginx.Vytvořte úlohu odvození a vyvolejte ji.
Poznámka:
Před vyvoláním příkazu nahraďte protokol a IP adresu v scoring_uri https a doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway.
Nasazení rozšíření s využitím šablony ARM
Rozšíření ve spravovaném clusteru je možné nasadit pomocí šablony ARM. Ukázkovou šablonu najdete v deployextension.json s ukázkovým souborem parametrů deployextension.parameters.json
Pokud chcete použít ukázkovou šablonu nasazení, upravte soubor parametrů se správnou hodnotou a spusťte následující příkaz:
az deployment group create --name <ARM deployment name> --resource-group <resource group name> --template-file deployextension.json --parameters deployextension.parameters.json
Další informace o používání šablony ARM najdete v dokumentaci k šabloně ARM.
Poznámka k vydání rozšíření AzuremML
Poznámka:
Nové funkce se vydávají v biweekly kalendáři.
Datum | Verze | Popis verze |
---|---|---|
26. zář 2024 | 1.1.64 | Opravili jsme chyby zabezpečení. |
21. listopadu 2023 | 1.1.39 | Opravili jsme chyby zabezpečení. Upřesňující chybová zpráva Zvýšená stabilita pro rozhraní API přenosového serveru |
1. listopadu 2023 | 1.1.37 | Aktualizace verze envoy roviny dat |
11. října 2023 | 1.1.35 | Opravte ohrožený obrázek. Opravy chyb. |
Aug 25, 2023 | 1.1.34 | Opravte ohrožený obrázek. Vrátí podrobnější chybu identity. Opravy chyb. |
18. července 2023 | 1.1.29 | Přidání chyb nového operátoru identity Opravy chyb. |
4. června 2023 | 1.1.28 | Vylepšení automatického škálování pro zpracování více fondů uzlů Opravy chyb. |
Duben 18 , 2023 | 1.1.26 | Opravili jsme opravy chyb a chyby zabezpečení. |
27. března 2023 | 1.1.25 | Přidání omezení úlohy Azure Machine Learning Rychlé selhání pro trénovací úlohu, když se instalace SSH nezdařila. Snižte interval výstřižku Prometheus na 30s. Zlepšení chybových zpráv pro odvozování Opravte ohrožený obrázek. |
7. března 2023 | 1.1.23 | Změňte výchozí typ instance tak, aby používal paměť 2Gi. Aktualizujte konfigurace metrik pro bodování fe, které přidávají 15s scrape_interval. Přidejte specifikaci prostředku pro mdc sidecar. Opravte ohrožený obrázek. Opravy chyb. |
14. února 2023 | 1.1.21 | Opravy chyb. |
7. února 2023 | 1.1.19 | Zlepšení chybové návratové zprávy pro odvozování Aktualizujte výchozí typ instance tak, aby používal limit paměti 2Gi. Zkontrolujte stav podu, kvótu prostředků, verzi Kubernetes a verzi rozšíření. Opravy chyb |
Prosinec 27, 2022 | 1.1.17 | Přesuňte fluent-bit z DaemonSet na sajdkáře. Přidejte podporu MDC. Upřesněte chybové zprávy. Podpora úloh v režimu clusteru (Windows, Linux) Opravy chyb |
29. listopadu 2022 | 1.1.16 | Přidejte ověření typu instance podle nového CRD. Odolnost proti podpoře. Zkraťte název SVC. Hodina jádra úlohy Opravy a vylepšení několika chyb |
13. zář 2022 | 1.1.10 | Opravy chyb. |
Aug 29, 2022 | 1.1.9 | Vylepšená logika kontroly stavu Opravy chyb. |
23. června 2022 | 1.1.6 | Opravy chyb. |
15. června 2022 | 1.1.5 | Aktualizace trénování pro použití nového běžného modulu runtime ke spouštění úloh Odebrání využití Služby Azure Relay pro rozšíření AKS Odebrání využití služby Service Bus z rozšíření Aktualizované využití kontextu zabezpečení Aktualizace odvození azureml-fe na verzi 2 Aktualizováno tak, aby používala volcano jako plánovač trénovacích úloh. Opravy chyb. |
14. října 2021 | 1.0.37 | Podpora připojení svazku PV/PVC v trénovací úloze AMLArc |
16. září 2021 | 1.0.29 | Dostupné nové oblasti, WestUS, CentralUS, NorthCentralUS, KoreaCentral. Rozšiřitelnost fronty úloh Podívejte se na podrobnosti o frontě úloh v nástroji Azure Machine Learning Workspace Studio. Automatická vražda politiky. Podpora max_run_duration_seconds v ScriptRunConfig. Systém se pokusí spuštění automaticky zrušit, pokud trvalo déle, než je hodnota nastavení. Vylepšení výkonu u podpory automatického škálování clusteru Nasazení agenta Arc a rozšíření ML z místního registru kontejneru |
24. srpna 2021 | 1.0.28 | Typ výpočetní instance je podporován v jazyce YAML úlohy. Přiřaďte spravovanou identitu výpočetním prostředkům AMLArc. |
10. srpna 2021 | 1.0.20 | Nová podpora distribuce Kubernetes, K3S – Lightweight Kubernetes Nasaďte rozšíření Azure Machine Learning do clusteru AKS bez připojení přes Azure Arc. Automatizované strojové učení (AutoML) prostřednictvím sady Python SDK Pomocí rozhraní příkazového řádku 2.0 připojte cluster Kubernetes k pracovnímu prostoru Služby Azure Machine Learning. Optimalizace využití prostředků procesoru a paměti komponent rozšíření Azure Machine Learning |
2. července 2021 | 1.0.13 | Podpora nových distribucí Kubernetes, OpenShift Kubernetes a GKE (Google Kubernetes Engine). Podpora automatického škálování Pokud cluster Kubernetes spravovaný uživatelem povolí automatické škálování, cluster se automaticky škáluje nebo škáluje podle objemu aktivních spuštění a nasazení. Zlepšení výkonu u spouštěče úloh, které zkracuje dobu provádění úlohy na hodně. |