Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2021-03-01-preview
Bicep リソース定義
workspaces/onlineEndpoints/deployments リソースの種類は、次を対象とする操作でデプロイできます。
- リソース グループの - リソース グループのデプロイ コマンド 参照
各 API バージョンで変更されたプロパティの一覧については、変更ログの
リソースの形式
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースを作成するには、次の Bicep をテンプレートに追加します。
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment オブジェクト
endpointComputeType プロパティを設定して、オブジェクトの種類を指定します。
K8Sの場合は、次を使用します。
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
マネージドの場合は、次を使用します。
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
AssetReferenceBase オブジェクト
referenceType プロパティを設定して、オブジェクトの種類を指定します。
DataPathの場合は、次の値を使用します。
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
IDの場合は、次を使用します。
referenceType: 'Id'
assetId: 'string'
OutputPathの場合は、次のコマンドを使用します。
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
OnlineScaleSettings オブジェクト
scaleType プロパティを設定して、オブジェクトの種類を指定します。
自動の場合は、次を使用します。
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
手動の場合は、次のコマンドを使用します。
scaleType: 'Manual'
instanceCount: int
プロパティ値
workspaces/onlineEndpoints/deployments
名前 | 形容 | 価値 |
---|---|---|
名前 | リソース名 Bicepで子リソースの名前と種類 |
string (必須) |
場所 | リソースが存在する地理的な場所 | string (必須) |
タグ | リソース タグ。 | タグ名と値のディクショナリ。 テンプレート の |
種類 | 同じ種類のリソースに対して異なる UX エクスペリエンスをレンダリングするためにポータルやツールなどで使用されるメタデータ。 | 糸 |
親 | Bicep では、子リソースの親リソースを指定できます。 このプロパティを追加する必要があるのは、子リソースが親リソースの外部で宣言されている場合のみです。 詳細については、「親リソースの外部 |
種類のリソースのシンボリック名: onlineEndpoints |
同一性 | リソースに関連付けられているサービス ID。 | ResourceIdentity |
プロパティ | [必須]エンティティの追加の属性。 | OnlineDeployment (必須) |
ResourceIdentity
名前 | 形容 | 価値 |
---|---|---|
種類 | ResourceIdentity の型の値を定義します。 | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | ユーザー割り当て ID のディクショナリ。キーは UAI の ARM リソース ID です。 | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | UserAssignedIdentityMeta の |
UserAssignedIdentityMeta
名前 | 形容 | 価値 |
---|---|---|
clientId | アプリケーション ID とは、Azure AD によって生成される一意の識別子で、初期プロビジョニング時にアプリケーションとサービス プリンシパルに関連付けられます。 | 糸 |
principalId | Azure リソースへのロールベースのアクセスを許可するために使用されるマネージド ID のサービス プリンシパル オブジェクトのオブジェクト ID。 | 糸 |
OnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
appInsightsEnabled | true の場合は、Application Insights のログ記録を有効にします。 | bool |
codeConfiguration | エンドポイントデプロイのコード構成。 | CodeConfiguration |
形容 | エンドポイントのデプロイの説明。 | 糸 |
environmentId | エンドポイントデプロイの環境仕様の ARM リソース ID。 | 糸 |
environmentVariables | デプロイの環境変数の構成。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |
モデル | エンドポイントデプロイのモデル資産への参照。 | AssetReferenceBase |
プロパティ | プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。 | OnlineDeploymentProperties |
requestSettings | オンライン展開スコアリング要求の構成。 | OnlineRequestSettings |
scaleSettings | オンラインデプロイスケーリングの構成。 | OnlineScaleSettings |
endpointComputeType | オブジェクトの種類を設定する |
K8S マネージド (必須) |
CodeConfiguration
名前 | 形容 | 価値 |
---|---|---|
codeId | コード資産の ARM リソース ID。 | 糸 |
scoringScript | [必須]起動時に実行するスクリプト。 例えば。 "score.py" | string (必須) 制約: 最小長 = 1 パターン = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
ProbeSettings
名前 | 形容 | 価値 |
---|---|---|
failureThreshold | 異常な状態を返す前に許可するエラーの数。 | int |
initialDelay | ISO 8601 形式の最初のプローブの前の遅延。 | 糸 |
時代 | ISO 8601 形式のプローブ間の時間の長さ。 | 糸 |
successThreshold | 正常な状態を返す前の成功したプローブの数。 | int |
タイムアウト | ISO 8601 形式のプローブ タイムアウト。 | 糸 |
AssetReferenceBase
名前 | 形容 | 価値 |
---|---|---|
referenceType | オブジェクトの種類を設定する |
DataPath ID OutputPath (必須) |
DataPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'DataPath' (必須) |
datastoreId | 資産が配置されているデータストアの ARM リソース ID。 | 糸 |
パス | データストア内のファイル/ディレクトリのパス。 | 糸 |
IdAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'Id' (必須) |
assetId | [必須]資産の ARM リソース ID。 | string (必須) 制約: パターン = [a-zA-Z0-9_] |
OutputPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'OutputPath' (必須) |
jobId | ジョブの ARM リソース ID。 | 糸 |
パス | ジョブ出力内のファイル/ディレクトリのパス。 | 糸 |
OnlineDeploymentProperties
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
OnlineRequestSettings
名前 | 形容 | 価値 |
---|---|---|
maxConcurrentRequestsPerInstance | このデプロイで一度にキューに登録できる要求の数。 | int |
maxQueueWait | ISO 8601 形式のキューの最大待機時間。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
requestTimeout | ISO 8601 形式の要求タイムアウト。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
OnlineScaleSettings
名前 | 形容 | 価値 |
---|---|---|
maxInstances | このデプロイのインスタンスの最大数。 | int |
minInstances | このデプロイのインスタンスの最小数。 | int |
scaleType | オブジェクトの種類を設定する | 自動 の 手動 (必須) |
AutoScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | 'Auto' (必須) |
pollingInterval | ISO 8691 形式のポーリング間隔。 秒という低い精度の期間のみをサポートします。 | 糸 |
targetUtilizationPercentage | 自動スケーラーのターゲット CPU 使用率。 | int |
ManualScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | 'Manual' (必須) |
instanceCount | このデプロイのインスタンス数を修正しました。 | int |
K8SOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | 'K8S' (必須) |
containerResourceRequirements | オンライン デプロイ内の各コンテナー インスタンスのリソース要件。 | ContainerResourceRequirements |
ContainerResourceRequirements
名前 | 形容 | 価値 |
---|---|---|
cpu | コンテナーで使用される CPU コアの最小量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | コンテナーで使用できる CPU コアの最大量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | コンテナーに公開されている FPGA PCIE デバイスの数。 2 の倍数である必要があります。 | int |
gpu | コンテナー内の GPU コアの数。 | int |
memoryInGB | コンテナーで使用されるメモリの最小量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | コンテナーで使用できるメモリの最大量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | 'Managed' (必須) |
instanceType | コンピューティング インスタンスの種類。 | 糸 |
readinessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |
ARM テンプレート リソース定義
workspaces/onlineEndpoints/deployments リソースの種類は、次を対象とする操作でデプロイできます。
- リソース グループの - リソース グループのデプロイ コマンド 参照
各 API バージョンで変更されたプロパティの一覧については、変更ログの
リソースの形式
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースを作成するには、次の JSON をテンプレートに追加します。
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment オブジェクト
endpointComputeType プロパティを設定して、オブジェクトの種類を指定します。
K8Sの場合は、次を使用します。
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
マネージドの場合は、次を使用します。
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
AssetReferenceBase オブジェクト
referenceType プロパティを設定して、オブジェクトの種類を指定します。
DataPathの場合は、次の値を使用します。
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
IDの場合は、次を使用します。
"referenceType": "Id",
"assetId": "string"
OutputPathの場合は、次のコマンドを使用します。
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
OnlineScaleSettings オブジェクト
scaleType プロパティを設定して、オブジェクトの種類を指定します。
自動の場合は、次を使用します。
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
手動の場合は、次のコマンドを使用します。
"scaleType": "Manual",
"instanceCount": "int"
プロパティ値
workspaces/onlineEndpoints/deployments
名前 | 形容 | 価値 |
---|---|---|
種類 | リソースの種類 | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | リソース API のバージョン | '2021-03-01-preview' |
名前 | リソース名 JSON ARM テンプレートで子リソースの名前と型 |
string (必須) |
場所 | リソースが存在する地理的な場所 | string (必須) |
タグ | リソース タグ。 | タグ名と値のディクショナリ。 テンプレート の |
種類 | 同じ種類のリソースに対して異なる UX エクスペリエンスをレンダリングするためにポータルやツールなどで使用されるメタデータ。 | 糸 |
同一性 | リソースに関連付けられているサービス ID。 | ResourceIdentity |
プロパティ | [必須]エンティティの追加の属性。 | OnlineDeployment (必須) |
ResourceIdentity
名前 | 形容 | 価値 |
---|---|---|
種類 | ResourceIdentity の型の値を定義します。 | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | ユーザー割り当て ID のディクショナリ。キーは UAI の ARM リソース ID です。 | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | UserAssignedIdentityMeta の |
UserAssignedIdentityMeta
名前 | 形容 | 価値 |
---|---|---|
clientId | アプリケーション ID とは、Azure AD によって生成される一意の識別子で、初期プロビジョニング時にアプリケーションとサービス プリンシパルに関連付けられます。 | 糸 |
principalId | Azure リソースへのロールベースのアクセスを許可するために使用されるマネージド ID のサービス プリンシパル オブジェクトのオブジェクト ID。 | 糸 |
OnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
appInsightsEnabled | true の場合は、Application Insights のログ記録を有効にします。 | bool |
codeConfiguration | エンドポイントデプロイのコード構成。 | CodeConfiguration |
形容 | エンドポイントのデプロイの説明。 | 糸 |
environmentId | エンドポイントデプロイの環境仕様の ARM リソース ID。 | 糸 |
environmentVariables | デプロイの環境変数の構成。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |
モデル | エンドポイントデプロイのモデル資産への参照。 | AssetReferenceBase |
プロパティ | プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。 | OnlineDeploymentProperties |
requestSettings | オンライン展開スコアリング要求の構成。 | OnlineRequestSettings |
scaleSettings | オンラインデプロイスケーリングの構成。 | OnlineScaleSettings |
endpointComputeType | オブジェクトの種類を設定する |
K8S マネージド (必須) |
CodeConfiguration
名前 | 形容 | 価値 |
---|---|---|
codeId | コード資産の ARM リソース ID。 | 糸 |
scoringScript | [必須]起動時に実行するスクリプト。 例えば。 "score.py" | string (必須) 制約: 最小長 = 1 パターン = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
ProbeSettings
名前 | 形容 | 価値 |
---|---|---|
failureThreshold | 異常な状態を返す前に許可するエラーの数。 | int |
initialDelay | ISO 8601 形式の最初のプローブの前の遅延。 | 糸 |
時代 | ISO 8601 形式のプローブ間の時間の長さ。 | 糸 |
successThreshold | 正常な状態を返す前の成功したプローブの数。 | int |
タイムアウト | ISO 8601 形式のプローブ タイムアウト。 | 糸 |
AssetReferenceBase
名前 | 形容 | 価値 |
---|---|---|
referenceType | オブジェクトの種類を設定する |
DataPath ID OutputPath (必須) |
DataPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'DataPath' (必須) |
datastoreId | 資産が配置されているデータストアの ARM リソース ID。 | 糸 |
パス | データストア内のファイル/ディレクトリのパス。 | 糸 |
IdAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'Id' (必須) |
assetId | [必須]資産の ARM リソース ID。 | string (必須) 制約: パターン = [a-zA-Z0-9_] |
OutputPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | 'OutputPath' (必須) |
jobId | ジョブの ARM リソース ID。 | 糸 |
パス | ジョブ出力内のファイル/ディレクトリのパス。 | 糸 |
OnlineDeploymentProperties
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
OnlineRequestSettings
名前 | 形容 | 価値 |
---|---|---|
maxConcurrentRequestsPerInstance | このデプロイで一度にキューに登録できる要求の数。 | int |
maxQueueWait | ISO 8601 形式のキューの最大待機時間。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
requestTimeout | ISO 8601 形式の要求タイムアウト。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
OnlineScaleSettings
名前 | 形容 | 価値 |
---|---|---|
maxInstances | このデプロイのインスタンスの最大数。 | int |
minInstances | このデプロイのインスタンスの最小数。 | int |
scaleType | オブジェクトの種類を設定する | 自動 の 手動 (必須) |
AutoScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | 'Auto' (必須) |
pollingInterval | ISO 8691 形式のポーリング間隔。 秒という低い精度の期間のみをサポートします。 | 糸 |
targetUtilizationPercentage | 自動スケーラーのターゲット CPU 使用率。 | int |
ManualScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | 'Manual' (必須) |
instanceCount | このデプロイのインスタンス数を修正しました。 | int |
K8SOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | 'K8S' (必須) |
containerResourceRequirements | オンライン デプロイ内の各コンテナー インスタンスのリソース要件。 | ContainerResourceRequirements |
ContainerResourceRequirements
名前 | 形容 | 価値 |
---|---|---|
cpu | コンテナーで使用される CPU コアの最小量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | コンテナーで使用できる CPU コアの最大量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | コンテナーに公開されている FPGA PCIE デバイスの数。 2 の倍数である必要があります。 | int |
gpu | コンテナー内の GPU コアの数。 | int |
memoryInGB | コンテナーで使用されるメモリの最小量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | コンテナーで使用できるメモリの最大量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | 'Managed' (必須) |
instanceType | コンピューティング インスタンスの種類。 | 糸 |
readinessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |
Terraform (AzAPI プロバイダー) リソース定義
workspaces/onlineEndpoints/deployments リソースの種類は、次を対象とする操作でデプロイできます。
- リソース グループの
各 API バージョンで変更されたプロパティの一覧については、変更ログの
リソースの形式
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースを作成するには、次の Terraform をテンプレートに追加します。
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
OnlineDeployment オブジェクト
endpointComputeType プロパティを設定して、オブジェクトの種類を指定します。
K8Sの場合は、次を使用します。
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
マネージドの場合は、次を使用します。
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
AssetReferenceBase オブジェクト
referenceType プロパティを設定して、オブジェクトの種類を指定します。
DataPathの場合は、次の値を使用します。
referenceType = "DataPath"
datastoreId = "string"
path = "string"
IDの場合は、次を使用します。
referenceType = "Id"
assetId = "string"
OutputPathの場合は、次のコマンドを使用します。
referenceType = "OutputPath"
jobId = "string"
path = "string"
OnlineScaleSettings オブジェクト
scaleType プロパティを設定して、オブジェクトの種類を指定します。
自動の場合は、次を使用します。
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
手動の場合は、次のコマンドを使用します。
scaleType = "Manual"
instanceCount = int
プロパティ値
workspaces/onlineEndpoints/deployments
名前 | 形容 | 価値 |
---|---|---|
種類 | リソースの種類 | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
名前 | リソース名 | string (必須) |
場所 | リソースが存在する地理的な場所 | string (必須) |
parent_id | このリソースの親であるリソースの ID。 | 種類のリソースの ID: onlineEndpoints |
タグ | リソース タグ。 | タグ名と値のディクショナリ。 |
種類 | 同じ種類のリソースに対して異なる UX エクスペリエンスをレンダリングするためにポータルやツールなどで使用されるメタデータ。 | 糸 |
同一性 | リソースに関連付けられているサービス ID。 | ResourceIdentity |
プロパティ | [必須]エンティティの追加の属性。 | OnlineDeployment (必須) |
ResourceIdentity
名前 | 形容 | 価値 |
---|---|---|
種類 | ResourceIdentity の型の値を定義します。 | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | ユーザー割り当て ID のディクショナリ。キーは UAI の ARM リソース ID です。 | ユーザー ID ID の配列。 |
ResourceIdentityUserAssignedIdentities
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | UserAssignedIdentityMeta の |
UserAssignedIdentityMeta
名前 | 形容 | 価値 |
---|---|---|
clientId | アプリケーション ID とは、Azure AD によって生成される一意の識別子で、初期プロビジョニング時にアプリケーションとサービス プリンシパルに関連付けられます。 | 糸 |
principalId | Azure リソースへのロールベースのアクセスを許可するために使用されるマネージド ID のサービス プリンシパル オブジェクトのオブジェクト ID。 | 糸 |
OnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
appInsightsEnabled | true の場合は、Application Insights のログ記録を有効にします。 | bool |
codeConfiguration | エンドポイントデプロイのコード構成。 | CodeConfiguration |
形容 | エンドポイントのデプロイの説明。 | 糸 |
environmentId | エンドポイントデプロイの環境仕様の ARM リソース ID。 | 糸 |
environmentVariables | デプロイの環境変数の構成。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |
モデル | エンドポイントデプロイのモデル資産への参照。 | AssetReferenceBase |
プロパティ | プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。 | OnlineDeploymentProperties |
requestSettings | オンライン展開スコアリング要求の構成。 | OnlineRequestSettings |
scaleSettings | オンラインデプロイスケーリングの構成。 | OnlineScaleSettings |
endpointComputeType | オブジェクトの種類を設定する |
K8S マネージド (必須) |
CodeConfiguration
名前 | 形容 | 価値 |
---|---|---|
codeId | コード資産の ARM リソース ID。 | 糸 |
scoringScript | [必須]起動時に実行するスクリプト。 例えば。 "score.py" | string (必須) 制約: 最小長 = 1 パターン = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
ProbeSettings
名前 | 形容 | 価値 |
---|---|---|
failureThreshold | 異常な状態を返す前に許可するエラーの数。 | int |
initialDelay | ISO 8601 形式の最初のプローブの前の遅延。 | 糸 |
時代 | ISO 8601 形式のプローブ間の時間の長さ。 | 糸 |
successThreshold | 正常な状態を返す前の成功したプローブの数。 | int |
タイムアウト | ISO 8601 形式のプローブ タイムアウト。 | 糸 |
AssetReferenceBase
名前 | 形容 | 価値 |
---|---|---|
referenceType | オブジェクトの種類を設定する |
DataPath ID OutputPath (必須) |
DataPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | "DataPath" (必須) |
datastoreId | 資産が配置されているデータストアの ARM リソース ID。 | 糸 |
パス | データストア内のファイル/ディレクトリのパス。 | 糸 |
IdAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | "Id" (必須) |
assetId | [必須]資産の ARM リソース ID。 | string (必須) 制約: パターン = [a-zA-Z0-9_] |
OutputPathAssetReference
名前 | 形容 | 価値 |
---|---|---|
referenceType | [必須]資産参照の種類を指定します。 | "OutputPath" (必須) |
jobId | ジョブの ARM リソース ID。 | 糸 |
パス | ジョブ出力内のファイル/ディレクトリのパス。 | 糸 |
OnlineDeploymentProperties
名前 | 形容 | 価値 |
---|---|---|
{カスタマイズされたプロパティ} | 糸 |
OnlineRequestSettings
名前 | 形容 | 価値 |
---|---|---|
maxConcurrentRequestsPerInstance | このデプロイで一度にキューに登録できる要求の数。 | int |
maxQueueWait | ISO 8601 形式のキューの最大待機時間。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
requestTimeout | ISO 8601 形式の要求タイムアウト。 ミリ秒単位の有効桁数をサポートします。 | 糸 |
OnlineScaleSettings
名前 | 形容 | 価値 |
---|---|---|
maxInstances | このデプロイのインスタンスの最大数。 | int |
minInstances | このデプロイのインスタンスの最小数。 | int |
scaleType | オブジェクトの種類を設定する | 自動 の 手動 (必須) |
AutoScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | "Auto" (必須) |
pollingInterval | ISO 8691 形式のポーリング間隔。 秒という低い精度の期間のみをサポートします。 | 糸 |
targetUtilizationPercentage | 自動スケーラーのターゲット CPU 使用率。 | int |
ManualScaleSettings
名前 | 形容 | 価値 |
---|---|---|
scaleType | [必須]デプロイ スケーリング アルゴリズムの種類 | "Manual" (必須) |
instanceCount | このデプロイのインスタンス数を修正しました。 | int |
K8SOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | "K8S" (必須) |
containerResourceRequirements | オンライン デプロイ内の各コンテナー インスタンスのリソース要件。 | ContainerResourceRequirements |
ContainerResourceRequirements
名前 | 形容 | 価値 |
---|---|---|
cpu | コンテナーで使用される CPU コアの最小量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | コンテナーで使用できる CPU コアの最大量。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | コンテナーに公開されている FPGA PCIE デバイスの数。 2 の倍数である必要があります。 | int |
gpu | コンテナー内の GPU コアの数。 | int |
memoryInGB | コンテナーで使用されるメモリの最小量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | コンテナーで使用できるメモリの最大量 (GB 単位)。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
名前 | 形容 | 価値 |
---|---|---|
endpointComputeType | [必須]エンドポイントのコンピューティングの種類。 | "マネージド" (必須) |
instanceType | コンピューティング インスタンスの種類。 | 糸 |
readinessProbe | デプロイ コンテナーのライブネス/準備プローブの構成。 | ProbeSettings の |