CLI (v2) esquema YAML de ponto de extremidade online
APLICA-SE A: Azure CLI ml extension v2 (atual)
O esquema JSON de origem pode ser encontrado em https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json para endpoint online gerenciado e em https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para endpoint online do Kubernetes. As diferenças entre o endpoint online gerenciado e o endpoint online do Kubernetes são descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no endpoint online gerenciado.
Nota
A sintaxe YAML detalhada neste documento é baseada no esquema JSON para a versão mais recente da extensão ML CLI v2. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão ML CLI v2. Você pode encontrar os esquemas para versões de extensão mais antigas em https://azuremlschemasprod.azureedge.net/.
Nota
Um exemplo de YAML totalmente especificado para pontos de extremidade on-line gerenciados está disponível para referência
Sintaxe YAML
Chave | Tipo | Description | Valores permitidos | Default value |
---|---|---|---|---|
$schema |
string | O esquema YAML. Se você usar a extensão VS Code do Aprendizado de Máquina do Azure para criar o arquivo YAML, inclusive $schema na parte superior do arquivo permitirá que você invoque o esquema e as completações de recursos. |
||
name |
string | Obrigatório. Nome do ponto de extremidade. Precisa ser exclusivo no nível da região do Azure. As regras de nomenclatura são definidas em limites de ponto final. |
||
description |
string | Descrição do parâmetro de avaliação. | ||
tags |
objeto | Dicionário de tags para o ponto de extremidade. | ||
auth_mode |
string | O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use key para autenticação baseada em chave. Use aml_token para autenticação baseada em token do Azure Machine Learning. Use aad_token para autenticação baseada em token do Microsoft Entra. |
key , aml_token , aad_token |
key |
compute |
string | Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável para implantações de ponto de extremidade em clusters Kubernetes habilitados para Azure Arc (o destino de computação especificado neste campo deve ter type: kubernetes ). Não especifique este campo se estiver fazendo inferência online gerenciada. |
||
identity |
objeto | A configuração de identidade gerenciada para acessar recursos do Azure para provisionamento e inferência de ponto de extremidade. | ||
identity.type |
string | O tipo de identidade gerenciada. Se o tipo for user_assigned , a identity.user_assigned_identities propriedade também deve ser especificada. |
system_assigned , user_assigned |
|
identity.user_assigned_identities |
matriz | Lista de IDs de recursos totalmente qualificados das identidades atribuídas pelo usuário. | ||
traffic |
objeto | O tráfego representa a porcentagem de solicitações a serem atendidas por diferentes implantações. Ele é representado por um dicionário de pares chave-valor, onde as chaves representam o nome da implantação e o valor representa a porcentagem de tráfego para essa implantação. Por exemplo, blue: 90 green: 10 significa que 90% das solicitações são enviadas para a implantação nomeada blue e 10% são enviadas para a implantação green . O tráfego total tem de ser 0 ou somar até 100. Consulte Distribuição segura para pontos de extremidade online para ver a configuração de tráfego em ação. Observação: não é possível definir esse campo durante a criação do ponto de extremidade online, pois as implantações sob esse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego de um ponto de extremidade online depois que as implantações tiverem sido criadas usando, por az ml online-endpoint update exemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10" . |
||
public_network_access |
string | Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando disabled , as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do espaço de trabalho do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados |
enabled , disabled |
enabled |
mirror_traffic |
string | Porcentagem de tráfego ao vivo para espelhar em uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. A porcentagem espelhada de tráfego é copiada e enviada para a implantação especificada para que você possa coletar métricas e registro em log sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros HTTP. Ele é representado por um dicionário com um único par chave-valor, onde a chave representa o nome da implantação e o valor representa a porcentagem de tráfego a ser espelhada para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado. |
Observações
Os az ml online-endpoint
comandos podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.
Exemplos
Exemplos estão disponíveis no repositório GitHub de exemplos. Vários são mostrados abaixo.
YAML: básico
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
YAML: identidade atribuída pelo sistema
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key
YAML: identidade atribuída pelo usuário
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
type: user_assigned
user_assigned_identities:
- resource_id: user_identity_ARM_id_place_holder