Microsoft.MachineLearningServices 작업 영역/onlineEndpoints/deployments 2021-03-01-preview
Bicep 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Bicep을 추가합니다.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
관리되는경우 다음을 사용합니다.
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
ID경우 다음을 사용합니다.
referenceType: 'Id'
assetId: 'string'
OutputPath경우 다음을 사용합니다.
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
수동경우 다음을 사용합니다.
scaleType: 'Manual'
instanceCount: int
속성 값
workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
이름 | 리소스 이름 Bicep자식 리소스의 이름과 형식을 설정하는 방법을 알아보세요. |
string(필수) |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
태그 | 리소스 태그. | 태그 이름 및 값의 사전입니다. 템플릿 |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
부모 | Bicep에서 자식 리소스에 대한 부모 리소스를 지정할 수 있습니다. 자식 리소스가 부모 리소스 외부에서 선언된 경우에만 이 속성을 추가해야 합니다. 자세한 내용은 부모 리소스외부의 자식 리소스 |
형식 리소스의 기호 이름: onlineEndpoints |
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | resourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
endpointComputeType | 개체 유형 설정 | K8S 관리되는(필수) |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | string(필수) 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | 개체 유형 설정 | dataPath ID OutputPath(필수) |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'DataPath'(필수) |
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'Id'(필수) |
assetId | [필수] 자산의 ARM 리소스 ID입니다. | string(필수) 제약 조건: 패턴 = [a-zA-Z0-9_] |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'OutputPath'(필수) |
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | 개체 유형 설정 |
자동 수동(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Auto'(필수) |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Manual'(필수) |
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'K8S'(필수) |
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
ARM 템플릿 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 JSON을 추가합니다.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
관리되는경우 다음을 사용합니다.
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
ID경우 다음을 사용합니다.
"referenceType": "Id",
"assetId": "string"
OutputPath경우 다음을 사용합니다.
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
수동경우 다음을 사용합니다.
"scaleType": "Manual",
"instanceCount": "int"
속성 값
workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
형 | 리소스 종류 | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | 리소스 api 버전 | '2021-03-01-preview' |
이름 | 리소스 이름 JSON ARM 템플릿 |
string(필수) |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
태그 | 리소스 태그. | 태그 이름 및 값의 사전입니다. 템플릿 |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | resourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
endpointComputeType | 개체 유형 설정 | K8S 관리되는(필수) |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | string(필수) 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | 개체 유형 설정 | dataPath ID OutputPath(필수) |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'DataPath'(필수) |
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'Id'(필수) |
assetId | [필수] 자산의 ARM 리소스 ID입니다. | string(필수) 제약 조건: 패턴 = [a-zA-Z0-9_] |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'OutputPath'(필수) |
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | 개체 유형 설정 |
자동 수동(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Auto'(필수) |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Manual'(필수) |
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'K8S'(필수) |
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
Terraform(AzAPI 공급자) 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Terraform을 추가합니다.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
관리되는경우 다음을 사용합니다.
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
referenceType = "DataPath"
datastoreId = "string"
path = "string"
ID경우 다음을 사용합니다.
referenceType = "Id"
assetId = "string"
OutputPath경우 다음을 사용합니다.
referenceType = "OutputPath"
jobId = "string"
path = "string"
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
수동경우 다음을 사용합니다.
scaleType = "Manual"
instanceCount = int
속성 값
workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
형 | 리소스 종류 | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
이름 | 리소스 이름 | string(필수) |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
parent_id | 이 리소스의 부모인 리소스의 ID입니다. | 유형의 리소스에 대한 ID: onlineEndpoints |
태그 | 리소스 태그. | 태그 이름 및 값의 사전입니다. |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | 사용자 ID ID의 배열입니다. |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|---|---|
{customized property} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
endpointComputeType | 개체 유형 설정 | K8S 관리되는(필수) |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | string(필수) 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | 개체 유형 설정 | dataPath ID OutputPath(필수) |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | "DataPath"(필수) |
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | "Id"(필수) |
assetId | [필수] 자산의 ARM 리소스 ID입니다. | string(필수) 제약 조건: 패턴 = [a-zA-Z0-9_] |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
referenceType | [필수] 자산 참조의 형식을 지정합니다. | "OutputPath"(필수) |
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
{customized property} | 문자열 |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | 개체 유형 설정 |
자동 수동(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | "Auto"(필수) |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | "수동"(필수) |
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | "K8S"(필수) |
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | "관리"(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |