Nasazení modelu do clusteru Azure Kubernetes Service s v1

Článek
09/09/2024

Důležité

Tento článek vysvětluje, jak pomocí azure Machine Learning CLI (v1) a sady Azure Machine Learning SDK pro Python (v1) nasadit model. Doporučený přístup pro v2 najdete v tématu Nasazení a určení skóre modelu strojového učení pomocí online koncového bodu.

Naučte se používat Azure Machine Learning k nasazení modelu jako webové služby ve službě Azure Kubernetes Service (AKS). AKS je vhodný pro vysoce škálovaná produkční nasazení. AKS použijte, pokud potřebujete jednu nebo více z následujících možností:

Rychlá doba odezvy
Automatické škálování nasazené služby
Protokolování
Shromažďování dat modelu
Authentication
Ukončení šifrování TLS
Možnosti hardwarové akcelerace , jako jsou GPU a programovatelné hradlové pole (FPGA)

Při nasazování do AKS nasadíte do clusteru AKS, který je připojený k vašemu pracovnímu prostoru. Informace o připojení clusteru AKS k vašemu pracovnímu prostoru najdete v tématu Vytvoření a připojení clusteru Azure Kubernetes Service.

Důležité

Před nasazením do webové služby doporučujeme ladit místně. Další informace najdete v tématu Řešení potíží s místním nasazením modelu.

Poznámka:

Koncové body služby Azure Machine Learning (v2) poskytují vylepšené a jednodušší prostředí pro nasazení. Koncové body podporují scénáře odvození v reálném čase i dávkového odvozu. Koncové body poskytují jednotné rozhraní pro vyvolání a správu nasazení modelu napříč typy výpočetních prostředků. Podívejte se, co jsou koncové body služby Azure Machine Learning?

Požadavky

Pracovní prostor služby Azure Machine Learning. Další informace najdete v tématu Vytvoření pracovního prostoru Azure Machine Learning.
Model strojového učení zaregistrovaný ve vašem pracovním prostoru Pokud nemáte zaregistrovaný model, přečtěte si téma Nasazení modelů strojového učení do Azure.
Rozšíření Azure CLI (v1) pro službu Machine Learning, sadu Azure Machine Learning Python SDK nebo rozšíření Azure Machine Learning Visual Studio Code.

Důležité

Některé příkazy Azure CLI v tomto článku používají azure-cli-mlrozšíření (nebo v1) pro Azure Machine Learning. Podpora rozšíření v1 skončí 30. září 2025. Do tohoto data budete moct nainstalovat a používat rozšíření v1.

Doporučujeme přejít na mlrozšíření (nebo v2) před 30. zářím 2025. Další informace o rozšíření v2 najdete v tématu Rozšíření Azure ML CLI a Python SDK v2.
Fragmenty kódu Pythonu v tomto článku předpokládají, že jsou nastavené následující proměnné:
- ws – Nastavte si pracovní prostor.
- model - Nastavte si zaregistrovaný model.
- inference_config – Nastavte konfiguraci odvozování modelu.
Další informace o nastavenítěchtoch
Fragmenty kódu rozhraní příkazového řádku v tomto článku předpokládají, že jste už vytvořili inferenceconfig.json dokument. Další informace o vytvoření tohoto dokumentu najdete v tématu Nasazení modelů strojového učení do Azure.
Cluster AKS připojený k vašemu pracovnímu prostoru. Další informace najdete v tématu Vytvoření a připojení clusteru Azure Kubernetes Service.
- Pokud chcete nasadit modely do uzlů GPU nebo uzlů FPGA (nebo jakéhokoli konkrétního produktu), musíte vytvořit cluster s konkrétním produktem. Neexistuje žádná podpora pro vytvoření fondu sekundárních uzlů v existujícím clusteru a nasazení modelů ve fondu sekundárních uzlů.

Principy procesů nasazení

Slovo nasazení se používá v Kubernetes i Ve službě Azure Machine Learning. Nasazení má v těchto dvou kontextech různé významy. V Kubernetes je nasazení konkrétní entitou určenou deklarativním souborem YAML. Nasazení Kubernetes má definovaný životní cyklus a konkrétní vztahy s jinými entitami Kubernetes, jako Pods ReplicaSetsjsou a . O Kubernetes se můžete dozvědět z dokumentace a videí na adrese Co je Kubernetes?

Ve službě Azure Machine Learning se nasazení používá obecnějším způsobem zpřístupnění a čištění prostředků projektu. Kroky, které Azure Machine Learning považuje za součást nasazení, jsou:

Zazipování souborů ve složce projektu a ignorování souborů zadaných v souboru .amlignore nebo .gitignore
Vertikální navýšení kapacity výpočetního clusteru (souvisí s Kubernetes)
Sestavení nebo stažení souboru dockerfile do výpočetního uzlu (souvisí s Kubernetes)
1. Systém vypočítá hodnotu hash:
  - Základní image
  - Vlastní kroky Dockeru (viz Nasazení modelu pomocí vlastní základní image Dockeru)
  - Definice conda YAML (viz Vytvoření a použití softwarových prostředí ve službě Azure Machine Learning)
2. Systém použije tuto hodnotu hash jako klíč ve vyhledávání pracovního prostoru Azure Container Registry (ACR).
3. Pokud se nenajde, vyhledá shodu v globální službě ACR.
4. Pokud se nenajde, systém sestaví novou image uloženou v mezipaměti a odešle ji do pracovního prostoru ACR.
Stažení souboru zkomprimovaného projektu do dočasného úložiště na výpočetním uzlu
Rozbalení souboru projektu
Výpočetní uzel, který se spouští python <entry script> <arguments>
Ukládání protokolů, souborů modelu a dalších souborů zapsaných do souboru ./outputs do účtu úložiště přidruženého k pracovnímu prostoru
Vertikální snížení kapacity výpočetních prostředků, včetně odebrání dočasného úložiště (souvisí s Kubernetes)

Směrovač Služby Azure Machine Learning

Front-endová komponenta (azureml-fe), která směruje příchozí požadavky na odvozovací požadavky do nasazených služeb, se podle potřeby automaticky škáluje. Škálování azureml-fe je založené na účelu a velikosti clusteru AKS (počet uzlů). Účel clusteru a uzly se konfigurují při vytváření nebo připojování clusteru AKS. Pro každý cluster existuje jedna služba azureml-fe, která může běžet na několika podech.

Důležité

Pokud používáte cluster nakonfigurovaný jako dev-test, je samoobslužný škálování zakázaný. I u clusterů FastProd/DenseProd je samoobslužné škálování povolené jenom v případě, že telemetrie ukazuje, že je potřeba.
Azure Machine Learning automaticky nenahrá ani neukládá protokoly z žádných kontejnerů, včetně systémových kontejnerů. Pro komplexní ladění se doporučuje povolit Container Insights pro cluster AKS. V případě potřeby tak můžete ukládat, spravovat a sdílet protokoly kontejnerů s týmem AML. Bez toho nemůže AML zaručit podporu problémů souvisejících s azureml-fe.
Maximální datová část požadavku je 100 MB.

Azureml-fe škáluje kapacitu nahoru (svisle), aby používala více jader, a horizontálně (horizontálně) pro použití více podů. Při rozhodování o vertikálním navýšení kapacity se použije doba, kterou trvá směrování příchozích požadavků na odvozování. Pokud tato doba překročí prahovou hodnotu, provede se vertikální navýšení kapacity. Pokud doba směrování příchozích požadavků nadále překračuje prahovou hodnotu, dojde k horizontálnímu navýšení kapacity.

Při vertikálním snížení a snížení kapacity se používá využití procesoru. Pokud je dosažená prahová hodnota využití procesoru, front-end se nejprve škáluje dolů. Pokud využití procesoru klesne na prahovou hodnotu horizontálního snížení kapacity, provede se operace horizontálního snížení kapacity. Vertikální navýšení a navýšení kapacity probíhá pouze v případě, že je k dispozici dostatek prostředků clusteru.

Při vertikálním navýšení nebo snížení kapacity se pody azureml-fe restartují, aby se použily změny procesoru a paměti. Restartování neovlivní odvozování požadavků.

Vysvětlení požadavků na připojení pro cluster AKS pro odvozování

Když Azure Machine Learning vytvoří nebo připojí cluster AKS, nasadí se cluster AKS s jedním z následujících dvou síťových modelů:

Sítě Kubenet: Síťové prostředky se obvykle vytvářejí a konfigurují při nasazení clusteru AKS.
Sítě Azure Container Networking Interface (CNI): Cluster AKS je připojený k existujícímu prostředku a konfiguracím virtuální sítě.

Pro sítě Kubenet se síť vytvoří a správně nakonfiguruje pro službu Azure Machine Learning. V případě sítí CNI musíte porozumět požadavkům na připojení a zajistit překlad DNS a odchozí připojení pro odvozování AKS. K blokování síťového provozu můžete například použít bránu firewall.

Následující diagram znázorňuje požadavky na připojení pro odvozování AKS. Černé šipky představují skutečnou komunikaci a modré šipky představují názvy domén. Možná budete muset přidat položky pro tyto hostitele do brány firewall nebo do vlastního serveru DNS.

Diagram znázorňující požadavky na připojení pro odvozování AKS

Obecné požadavky na připojení AKS najdete v tématu Omezení síťového provozu pomocí služby Azure Firewall v AKS.

Informace o přístupu ke službám Azure Machine Learning za bránou firewall najdete v tématu Konfigurace příchozího a odchozího síťového provozu.

Celkové požadavky na překlad DNS

Překlad DNS v rámci existující virtuální sítě je pod vaší kontrolou. Například brána firewall nebo vlastní server DNS. Následující hostitelé musí být dosažitelní:

Název hostitele	Používá
`<cluster>.hcp.<region>.azmk8s.io`	Server rozhraní API AKS
`mcr.microsoft.com`	Microsoft Container Registry (MCR)
`<ACR name>.azurecr.io`	Vaše služba Azure Container Registry (ACR)
`<account>.table.core.windows.net`	Účet služby Azure Storage (Table Storage)
`<account>.blob.core.windows.net`	Účet služby Azure Storage (Blob Storage)
`api.azureml.ms`	Ověřování Microsoft Entra
`ingest-vienna<region>.kusto.windows.net`	Koncový bod Kusto pro aktualizaci telemetrie
`<leaf-domain-label + auto-generated suffix>.<region>.cloudapp.azure.com`	Název domény koncového bodu, pokud jste automaticky vygenerovali pomocí služby Azure Machine Learning. Pokud jste použili vlastní název domény, tuto položku nepotřebujete.

Požadavky na připojení v chronologickém pořadí

V procesu vytvoření nebo připojení AKS se do clusteru AKS nasadí směrovač Azure Machine Learning (azureml-fe). Aby bylo možné nasadit směrovač Azure Machine Learning, měl by být uzel AKS schopný:

Překlad DNS pro server rozhraní API AKS
Řešení DNS pro MCR za účelem stažení imagí Dockeru pro směrovač Azure Machine Learning
Stažení imagí z MCR, kde se vyžaduje odchozí připojení

Hned po nasazení azureml-fe se pokusí spustit a to vyžaduje:

Překlad DNS pro server rozhraní API AKS
Dotazování serveru rozhraní API AKS za účelem zjištění jiných instancí samotného (jedná se o službu s více pody)
Připojení k jiným instancím samotného

Jakmile se azureml-fe spustí, vyžaduje správné fungování následujícího připojení:

Připojení ke službě Azure Storage a stažení dynamické konfigurace
Přeložte DNS pro ověřovací server Microsoft Entra api.azureml.ms a komunikujte s ním, když nasazená služba používá ověřování Microsoft Entra.
Dotazování serveru rozhraní API AKS za účelem zjišťování nasazených modelů
Komunikace s nasazenými identifikátory POD modelu

V době nasazení modelu by pro úspěšné nasazení modelu měl být uzel AKS schopný:

Překlad DNS pro ACR zákazníka
Stažení obrázků z ACR zákazníka
Překlad DNS pro azure BLOB, kde je uložený model
Stažení modelů z azure BLOB

Jakmile se model nasadí a služba spustí, azureml-fe ho automaticky zjistí pomocí rozhraní API AKS a je připraven k jeho směrování. Musí být schopný komunikovat s modelem POD.

Poznámka:

Pokud nasazený model vyžaduje připojení (například dotazování externí databáze nebo jiné služby REST nebo stažení objektu BLOB), mělo by být pro tyto služby povolené překlad DNS i odchozí komunikace.

Nasazení do AKS

Pokud chcete nasadit model do AKS, vytvořte konfiguraci nasazení, která popisuje potřebné výpočetní prostředky. Například počet jader a paměti. Potřebujete také konfiguraci odvozování, která popisuje prostředí potřebné k hostování modelu a webové služby. Další informace o vytvoření konfigurace odvozování najdete v tématu Postupy a umístění nasazení modelů.

Poznámka:

Počet nasazovaných modelů je omezený na 1 000 modelů na jedno nasazení (na kontejner).

PLATÍ PRO: Python SDK azureml v1

from azureml.core.webservice import AksWebservice, Webservice
from azureml.core.model import Model
from azureml.core.compute import AksCompute

aks_target = AksCompute(ws,"myaks")
# If deploying to a cluster configured for dev/test, ensure that it was created with enough
# cores and memory to handle this deployment configuration. Note that memory is also used by
# things such as dependencies and AML components.
deployment_config = AksWebservice.deploy_configuration(cpu_cores = 1, memory_gb = 1)
service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config, aks_target)
service.wait_for_deployment(show_output = True)
print(service.state)
print(service.get_logs())

Další informace o třídách, metodách a parametrech použitých v tomto příkladu najdete v následujících referenčních dokumentech:

PLATÍ PRO: Rozšíření Azure CLI ml v1

K nasazení pomocí rozhraní příkazového řádku použijte následující příkaz. Nahraďte myaks názvem cílového výpočetního objektu AKS. Nahraďte mymodel:1 názvem a verzí registrovaného modelu. Nahraďte myservice názvem této služby:

az ml model deploy --ct myaks -m mymodel:1 -n myservice --ic inferenceconfig.json --dc deploymentconfig.json

Položky v dokumentu deploymentconfig.json mapují na parametry pro AksWebservice.deploy_configuration. Následující tabulka popisuje mapování mezi entitami v dokumentu JSON a parametry metody:

Entita JSON	Parametr metody	Popis
`computeType`	NA	Cílový výpočetní objekt. Pro AKS musí být `aks`hodnota .
`autoScaler`	NA	Obsahuje elementy konfigurace pro automatické škálování. Podívejte se na tabulku automatického škálování.
`autoscaleEnabled`	`autoscale_enabled`	Určuje, jestli chcete povolit automatické škálování pro webovou službu. Pokud `numReplicas` = `0`, `True`v opačném případě , `False`.
`minReplicas`	`autoscale_min_replicas`	Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí, `1`.
`maxReplicas`	`autoscale_max_replicas`	Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí, `10`.
`refreshPeriodInSeconds`	`autoscale_refresh_seconds`	Jak často se automatické škálování pokusí tuto webovou službu škálovat. Výchozí, `1`.
`targetUtilization`	`autoscale_target_utilization`	Cílové využití (v procentech z 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí, `70`.
`dataCollection`	NA	Obsahuje konfigurační prvky pro shromažďování dat.
`storageEnabled`	`collect_model_data`	Zda povolit shromažďování dat modelu pro webovou službu Výchozí, `False`.
`authEnabled`	`auth_enabled`	Jestli chcete povolit ověřování pomocí klíče pro webovou službu, nebo ne. `authEnabled` Ani `tokenAuthEnabled` nemůže být `True`. Výchozí, `True`.
`tokenAuthEnabled`	`token_auth_enabled`	Jestli chcete povolit ověřování tokenů pro webovou službu, nebo ne. `authEnabled` Ani `tokenAuthEnabled` nemůže být `True`. Výchozí, `False`.
`containerResourceRequirements`	NA	Kontejner pro entity procesoru a paměti.
`cpu`	`cpu_cores`	Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Výchozí hodnoty `0.1`
`memoryInGB`	`memory_gb`	Velikost paměti (v GB) pro přidělení této webové služby. Výchozí `0.5`
`appInsightsEnabled`	`enable_app_insights`	Jestli chcete povolit protokolování Application Insights pro webovou službu. Výchozí, `False`.
`scoringTimeoutMs`	`scoring_timeout_ms`	Časový limit vynucení volání bodování webové služby Výchozí, `60000`.
`maxConcurrentRequestsPerContainer`	`replica_max_concurrent_requests`	Maximální počet souběžných požadavků na uzel pro tuto webovou službu. Výchozí, `1`.
`maxQueueWaitMs`	`max_request_wait_time`	Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách), než se vrátí chyba 503. Výchozí, `500`.
`numReplicas`	`num_replicas`	Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Žádná výchozí hodnota. Pokud tento parametr není nastavený, automatické škálování je ve výchozím nastavení povolené.
`keys`	NA	Obsahuje elementy konfigurace pro klíče.
`primaryKey`	`primary_key`	Primární ověřovací klíč, který se má použít pro tuto webovou službu
`secondaryKey`	`secondary_key`	Sekundární ověřovací klíč, který se má použít pro tuto webovou službu
`gpuCores`	`gpu_cores`	Počet jader GPU (replika na kontejner), které se mají přidělit pro tuto webovou službu. Výchozí hodnota je 1. Podporuje pouze celé číselné hodnoty.
`livenessProbeRequirements`	NA	Obsahuje elementy konfigurace pro požadavky sondy aktivity.
`periodSeconds`	`period_seconds`	Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
`initialDelaySeconds`	`initial_delay_seconds`	Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota 310
`timeoutSeconds`	`timeout_seconds`	Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.
`successThreshold`	`success_threshold`	Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.
`failureThreshold`	`failure_threshold`	Když se pod spustí a sonda aktivity selže, Kubernetes se pokusí `failureThreshold` časy, než se vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.
`namespace`	`namespace`	Obor názvů Kubernetes, do kterého je webová služba nasazená. Až 63 malých alfanumerických znaků ("a"-"z", '0'-'9') a pomlček (-') znaků. První a poslední znaky nesmí být pomlčky.

Následující JSON je ukázková konfigurace nasazení pro použití s rozhraním příkazového řádku:

{
    "computeType": "aks",
    "autoScaler":
    {
        "autoscaleEnabled": true,
        "minReplicas": 1,
        "maxReplicas": 3,
        "refreshPeriodInSeconds": 1,
        "targetUtilization": 70
    },
    "dataCollection":
    {
        "storageEnabled": true
    },
    "authEnabled": true,
    "containerResourceRequirements":
    {
        "cpu": 0.5,
        "memoryInGB": 1.0
    }
}

Další informace najdete v referenčních informacích k nasazení modelu az ml.

Automatické škálování

PLATÍ PRO: Python SDK azureml v1

Komponenta, která zpracovává automatické škálování pro nasazení modelů Azure Machine Learning, je azureml-fe, což je směrovač inteligentních požadavků. Vzhledem k tomu, že všechny požadavky na odvozování procházejí, mají potřebná data k automatickému škálování nasazených modelů.

Důležité

Nepovolujte horizontální automatické škálování podů Kubernetes (HPA) pro nasazení modelů. Tím dojde k tomu, že dvě komponenty automatického škálování vzájemně soupeří. Azureml-fe je navržený tak, aby automaticky škáloval modely nasazené službou Azure Machine Learning, kde HPA musí odhadnout nebo odhadnout využití modelu z obecné metriky, jako je využití procesoru nebo vlastní konfigurace metrik.
Azureml-fe neškáluje počet uzlů v clusteru AKS, protože to může vést k neočekávanému zvýšení nákladů. Místo toho škáluje počet replik modelu v rámci fyzických hranic clusteru. Pokud potřebujete škálovat počet uzlů v clusteru, můžete cluster škálovat ručně nebo nakonfigurovat automatické škálování clusteru AKS.

Automatické škálování je možné řídit nastavením autoscale_target_utilizationa autoscale_min_replicasautoscale_max_replicas pro webovou službu AKS. Následující příklad ukazuje, jak povolit automatické škálování:

aks_config = AksWebservice.deploy_configuration(autoscale_enabled=True, 
                                                autoscale_target_utilization=30,
                                                autoscale_min_replicas=1,
                                                autoscale_max_replicas=4)

Rozhodnutí o vertikálním navýšení nebo snížení kapacity jsou založená na využití aktuálních replik kontejneru. Počet replik, které jsou zaneprázdněné (zpracování požadavku) vydělené celkovým počtem aktuálních replik, je aktuální využití. Pokud toto číslo překročí autoscale_target_utilization, vytvoří se více replik. Pokud je nižší, repliky se zmenší. Ve výchozím nastavení je cílové využití 70 %.

Rozhodnutí o přidání replik jsou dychtivá a rychlá (přibližně 1 sekunda). Rozhodnutí o odebrání replik jsou konzervativní (přibližně 1 minuta).

Požadované repliky můžete vypočítat pomocí následujícího kódu:

from math import ceil
# target requests per second
targetRps = 20
# time to process the request (in seconds)
reqTime = 10
# Maximum requests per container
maxReqPerContainer = 1
# target_utilization. 70% in this example
targetUtilization = .7

concurrentRequests = targetRps * reqTime / targetUtilization

# Number of container replicas
replicas = ceil(concurrentRequests / maxReqPerContainer)

Další informace o nastavení autoscale_target_utilization, autoscale_max_replicasa autoscale_min_replicas, naleznete v AksWebservice modul reference.

Ověřování webové služby

Při nasazování do služby Azure Kubernetes Service je ve výchozím nastavení povolené ověřování na základě klíčů. Můžete také povolit ověřování na základě tokenů. Ověřování na základě tokenů vyžaduje, aby klienti používali účet Microsoft Entra k vyžádání ověřovacího tokenu, který se používá k odesílání požadavků na nasazenou službu.

Pokud chcete zakázat ověřování, nastavte auth_enabled=False parametr při vytváření konfigurace nasazení. Následující příklad zakáže ověřování pomocí sady SDK:

deployment_config = AksWebservice.deploy_configuration(cpu_cores=1, memory_gb=1, auth_enabled=False)

Informace o ověřování z klientské aplikace najdete v tématu Využití modelu Azure Machine Learning nasazeného jako webová služba.

Ověřování pomocí klíčů

Pokud je povolené ověřování pomocí klíče, můžete metodu get_keys použít k načtení primárního a sekundárního ověřovacího klíče:

primary, secondary = service.get_keys()
print(primary)

Důležité

Pokud potřebujete klíč znovu vygenerovat, použijte service.regen_key.

Ověřování pomocí tokenů

Pokud chcete povolit ověřování tokenu token_auth_enabled=True , nastavte parametr při vytváření nebo aktualizaci nasazení. Následující příklad umožňuje ověřování tokenů pomocí sady SDK:

deployment_config = AksWebservice.deploy_configuration(cpu_cores=1, memory_gb=1, token_auth_enabled=True)

Pokud je povolené ověřování tokenů, můžete pomocí get_token metody načíst token JWT a čas vypršení platnosti tokenu:

token, refresh_by = service.get_token()
print(token)

Důležité

Po uplynutí doby tokenu refresh_by musíte požádat o nový token.

Microsoft důrazně doporučuje vytvořit pracovní prostor Azure Machine Learning ve stejné oblasti jako cluster AKS. K ověření pomocí tokenu webová služba zavolá oblast, ve které se vytvoří váš pracovní prostor Azure Machine Learning. Pokud oblast vašeho pracovního prostoru není dostupná, nemůžete načíst token pro webovou službu ani v případě, že je váš cluster v jiné oblasti než váš pracovní prostor. Výsledkem je, že ověřování na základě tokenů je nedostupné, dokud nebude oblast vašeho pracovního prostoru opět dostupná. Čím větší je vzdálenost mezi oblastí clusteru a oblastí vašeho pracovního prostoru, tím déle trvá načtení tokenu.

Pokud chcete načíst token, musíte použít sadu Azure Machine Learning SDK nebo příkaz az ml service get-access-token .

Kontrola ohrožení zabezpečení

Microsoft Defender for Cloud poskytuje jednotnou správu zabezpečení a pokročilou ochranu před hrozbami napříč hybridními cloudovými úlohami. Měli byste povolit, aby Microsoft Defender for Cloud kontrolovala vaše prostředky a dodržovala jeho doporučení. Další informace najdete v tématu Zabezpečení kontejnerů v programu Microsoft Defender pro kontejnery.

Sdílet prostřednictvím

Nasazení modelu do clusteru Azure Kubernetes Service s v1

Požadavky

Principy procesů nasazení

Směrovač Služby Azure Machine Learning

Vysvětlení požadavků na připojení pro cluster AKS pro odvozování

Celkové požadavky na překlad DNS

Požadavky na připojení v chronologickém pořadí

Nasazení do AKS

Automatické škálování

Ověřování webové služby

Ověřování pomocí klíčů

Ověřování pomocí tokenů

Kontrola ohrožení zabezpečení

Váš názor

Další materiály

Sdílet prostřednictvím

Nasazení modelu do clusteru Azure Kubernetes Service s v1

Požadavky

Principy procesů nasazení

Směrovač Služby Azure Machine Learning

Vysvětlení požadavků na připojení pro cluster AKS pro odvozování

Celkové požadavky na překlad DNS

Požadavky na připojení v chronologickém pořadí

Nasazení do AKS

Automatické škálování

Ověřování webové služby

Ověřování pomocí klíčů

Ověřování pomocí tokenů

Kontrola ohrožení zabezpečení

Související obsah

Váš názor

Další materiály