Microsoft.MachineLearningServices 작업 영역/onlineEndpoints/deployments 2023-10-01

Bicep 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Bicep을 추가합니다.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

관리되는경우 다음을 사용합니다.

  endpointComputeType: 'Managed'

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

  scaleType: 'Default'

TargetUtilization경우 다음을 사용합니다.

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

속성 값

workspaces/onlineEndpoints/deployments

이름 묘사
이름 리소스 이름

Bicep자식 리소스의 이름과 형식을 설정하는 방법을 알아보세요.
string(필수)
위치 리소스가 있는 지리적 위치 string(필수)
태그 리소스 태그. 태그 이름 및 값의 사전입니다. 템플릿 태그를 참조하세요.
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
부모 Bicep에서 자식 리소스에 대한 부모 리소스를 지정할 수 있습니다. 자식 리소스가 부모 리소스 외부에서 선언된 경우에만 이 속성을 추가해야 합니다.

자세한 내용은 부모 리소스외부의 자식 리소스 참조하세요.
형식 리소스의 기호 이름: onlineEndpoints
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'(필수)
userAssignedIdentities 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. UserAssignedIdentities

UserAssignedIdentities

이름 묘사
{customized property} UserAssignedIdentity

UserAssignedIdentity

이 개체에는 배포 중에 설정할 속성이 없습니다. 모든 속성은 ReadOnly입니다.

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 '사용 안 함'
'Enabled'
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID 또는 AssetId입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings
endpointComputeType 개체 유형 설정 Kubernetes
관리되는(필수)

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" string(필수)

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사
{customized property} 문자열

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

EndpointDeploymentPropertiesBaseProperties

이름 묘사
{customized property} 문자열

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait (관리되는 온라인 엔드포인트의 경우 사용되지 않음) 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
(이제 네트워킹/큐 지연을 고려하여 request_timeout_ms 늘리기)
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType 개체 유형 설정 기본
TargetUtilization(필수)

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'Default'(필수)

TargetUtilizationScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'TargetUtilization'(필수)
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

KubernetesOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Kubernetes'(필수)
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Managed'(필수)

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. '기본'
'무료'
'프리미엄'
'Standard'

ARM 템플릿 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 JSON을 추가합니다.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

관리되는경우 다음을 사용합니다.

  "endpointComputeType": "Managed"

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

  "scaleType": "Default"

TargetUtilization경우 다음을 사용합니다.

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

속성 값

workspaces/onlineEndpoints/deployments

이름 묘사
리소스 종류 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion 리소스 api 버전 '2023-10-01'
이름 리소스 이름

JSON ARM 템플릿자식 리소스의 이름과 형식을 설정하는 방법을 참조하세요.
string(필수)
위치 리소스가 있는 지리적 위치 string(필수)
태그 리소스 태그. 태그 이름 및 값의 사전입니다. 템플릿 태그를 참조하세요.
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'(필수)
userAssignedIdentities 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. UserAssignedIdentities

UserAssignedIdentities

이름 묘사
{customized property} UserAssignedIdentity

UserAssignedIdentity

이 개체에는 배포 중에 설정할 속성이 없습니다. 모든 속성은 ReadOnly입니다.

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 '사용 안 함'
'Enabled'
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID 또는 AssetId입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings
endpointComputeType 개체 유형 설정 Kubernetes
관리되는(필수)

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" string(필수)

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사
{customized property} 문자열

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

EndpointDeploymentPropertiesBaseProperties

이름 묘사
{customized property} 문자열

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait (관리되는 온라인 엔드포인트의 경우 사용되지 않음) 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
(이제 네트워킹/큐 지연을 고려하여 request_timeout_ms 늘리기)
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType 개체 유형 설정 기본
TargetUtilization(필수)

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'Default'(필수)

TargetUtilizationScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'TargetUtilization'(필수)
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

KubernetesOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Kubernetes'(필수)
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Managed'(필수)

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. '기본'
'무료'
'프리미엄'
'Standard'

Terraform(AzAPI 공급자) 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

  • 리소스 그룹

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Terraform을 추가합니다.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

관리되는경우 다음을 사용합니다.

  endpointComputeType = "Managed"

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

  scaleType = "Default"

TargetUtilization경우 다음을 사용합니다.

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

속성 값

workspaces/onlineEndpoints/deployments

이름 묘사
리소스 종류 "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
이름 리소스 이름 string(필수)
위치 리소스가 있는 지리적 위치 string(필수)
parent_id 이 리소스의 부모인 리소스의 ID입니다. 유형의 리소스에 대한 ID: onlineEndpoints
태그 리소스 태그. 태그 이름 및 값의 사전입니다.
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"(필수)
identity_ids 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. 사용자 ID ID의 배열입니다.

UserAssignedIdentities

이름 묘사
{customized property} UserAssignedIdentity

UserAssignedIdentity

이 개체에는 배포 중에 설정할 속성이 없습니다. 모든 속성은 ReadOnly입니다.

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 "사용 안 함"
"사용"
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID 또는 AssetId입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings
endpointComputeType 개체 유형 설정 Kubernetes
관리되는(필수)

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" string(필수)

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사
{customized property} 문자열

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

EndpointDeploymentPropertiesBaseProperties

이름 묘사
{customized property} 문자열

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait (관리되는 온라인 엔드포인트의 경우 사용되지 않음) 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
(이제 네트워킹/큐 지연을 고려하여 request_timeout_ms 늘리기)
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType 개체 유형 설정 기본
TargetUtilization(필수)

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 "기본값"(필수)

TargetUtilizationScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 "TargetUtilization"(필수)
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

KubernetesOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. "Kubernetes"(필수)
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. "관리"(필수)

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. "기본"
"무료"
"프리미엄"
"표준"