Pracovní prostory Microsoft.MachineLearningServices/ onlineEndpoints/deployments 2022-05-01

Definice prostředku Bicep

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující bicep.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Pro spravovanépoužijte:

  endpointComputeType: 'Managed'

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

  scaleType: 'Default'

Pro cílové využitípoužijte:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Hodnoty vlastností

workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
Jméno Název prostředku

Podívejte se, jak nastavit názvy a typy podřízených prostředků v Bicep.
string (povinné)
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
visačky Značky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
rodič V bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost je potřeba přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek.

Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek.
Symbolický název prostředku typu: onlineEndpoints
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
userAssignedIdentities Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

UserAssignedIdentities

Jméno Popis Hodnota
{přizpůsobená vlastnost} userAssignedIdentity

UserAssignedIdentity

Tento objekt neobsahuje žádné vlastnosti, které se mají nastavit během nasazení. Všechny vlastnosti jsou Jen pro čtení.

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Nastavení typu objektu Kubernetes
spravované (povinné)

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" string (povinné)

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Nastavení typu objektu výchozí
cílové využití (povinné)

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

TargetUtilizationScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

KubernetesOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

Definice prostředku šablony ARM

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující JSON.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-05-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Pro spravovanépoužijte:

  "endpointComputeType": "Managed"

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

  "scaleType": "Default"

Pro cílové využitípoužijte:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Hodnoty vlastností

workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
apiVersion Verze rozhraní API prostředku '2022-05-01'
Jméno Název prostředku

Podívejte se, jak nastavit názvy a typy podřízených prostředků v šablonách JSON ARM.
string (povinné)
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
visačky Značky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
userAssignedIdentities Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

UserAssignedIdentities

Jméno Popis Hodnota
{přizpůsobená vlastnost} userAssignedIdentity

UserAssignedIdentity

Tento objekt neobsahuje žádné vlastnosti, které se mají nastavit během nasazení. Všechny vlastnosti jsou Jen pro čtení.

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Nastavení typu objektu Kubernetes
spravované (povinné)

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" string (povinné)

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Nastavení typu objektu výchozí
cílové využití (povinné)

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

TargetUtilizationScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

KubernetesOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

Definice prostředku Terraformu (poskytovatel AzAPI)

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

  • skupiny prostředků

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující Terraform.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Pro spravovanépoužijte:

  endpointComputeType = "Managed"

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

  scaleType = "Default"

Pro cílové využitípoužijte:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Hodnoty vlastností

workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
Jméno Název prostředku string (povinné)
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
parent_id ID prostředku, který je nadřazený pro tento prostředek. ID prostředku typu: onlineEndpoints
visačky Značky prostředků Slovník názvů a hodnot značek
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
UserAssigned (povinné)
identity_ids Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. Pole ID identit uživatele

UserAssignedIdentities

Jméno Popis Hodnota
{přizpůsobená vlastnost} userAssignedIdentity

UserAssignedIdentity

Tento objekt neobsahuje žádné vlastnosti, které se mají nastavit během nasazení. Všechny vlastnosti jsou Jen pro čtení.

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Nastavení typu objektu Kubernetes
spravované (povinné)

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" string (povinné)

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota
{přizpůsobená vlastnost} řetězec

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Nastavení typu objektu výchozí
cílové využití (povinné)

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

TargetUtilizationScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení "Cílové využití" (povinné)
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

KubernetesOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Free"
"Premium"
"Standardní"