CLI (v2) esquema YAML de ponto de extremidade online

APLICA-SE A: Azure CLI ml extension v2 (atual)

O esquema JSON de origem pode ser encontrado em https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json para endpoint online gerenciado e em https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para endpoint online do Kubernetes. As diferenças entre o endpoint online gerenciado e o endpoint online do Kubernetes são descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no endpoint online gerenciado.

Nota

A sintaxe YAML detalhada neste documento é baseada no esquema JSON para a versão mais recente da extensão ML CLI v2. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão ML CLI v2. Você pode encontrar os esquemas para versões de extensão mais antigas em https://azuremlschemasprod.azureedge.net/.

Nota

Um exemplo de YAML totalmente especificado para pontos de extremidade on-line gerenciados está disponível para referência

Sintaxe YAML

Chave Tipo Description Valores permitidos Default value
$schema string O esquema YAML. Se você usar a extensão VS Code do Aprendizado de Máquina do Azure para criar o arquivo YAML, inclusive $schema na parte superior do arquivo permitirá que você invoque o esquema e as completações de recursos.
name string Obrigatório. Nome do ponto de extremidade. Precisa ser exclusivo no nível da região do Azure.

As regras de nomenclatura são definidas em limites de ponto final.
description string Descrição do parâmetro de avaliação.
tags objeto Dicionário de tags para o ponto de extremidade.
auth_mode string O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use key para autenticação baseada em chave. Use aml_token para autenticação baseada em token do Azure Machine Learning. Use aad_token para autenticação baseada em token do Microsoft Entra. key, aml_token, aad_token key
compute string Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável para implantações de ponto de extremidade em clusters Kubernetes habilitados para Azure Arc (o destino de computação especificado neste campo deve ter type: kubernetes). Não especifique este campo se estiver fazendo inferência online gerenciada.
identity objeto A configuração de identidade gerenciada para acessar recursos do Azure para provisionamento e inferência de ponto de extremidade.
identity.type string O tipo de identidade gerenciada. Se o tipo for user_assigned, a identity.user_assigned_identities propriedade também deve ser especificada. system_assigned, user_assigned
identity.user_assigned_identities matriz Lista de IDs de recursos totalmente qualificados das identidades atribuídas pelo usuário.
traffic objeto O tráfego representa a porcentagem de solicitações a serem atendidas por diferentes implantações. Ele é representado por um dicionário de pares chave-valor, onde as chaves representam o nome da implantação e o valor representa a porcentagem de tráfego para essa implantação. Por exemplo, blue: 90 green: 10 significa que 90% das solicitações são enviadas para a implantação nomeada blue e 10% são enviadas para a implantação green. O tráfego total tem de ser 0 ou somar até 100. Consulte Distribuição segura para pontos de extremidade online para ver a configuração de tráfego em ação.

Observação: não é possível definir esse campo durante a criação do ponto de extremidade online, pois as implantações sob esse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego de um ponto de extremidade online depois que as implantações tiverem sido criadas usando, por az ml online-endpoint updateexemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access string Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando disabled, as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do espaço de trabalho do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados enabled, disabled enabled
mirror_traffic string Porcentagem de tráfego ao vivo para espelhar em uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. A porcentagem espelhada de tráfego é copiada e enviada para a implantação especificada para que você possa coletar métricas e registro em log sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros HTTP. Ele é representado por um dicionário com um único par chave-valor, onde a chave representa o nome da implantação e o valor representa a porcentagem de tráfego a ser espelhada para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado.

Observações

Os az ml online-endpoint comandos podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.

Exemplos

Exemplos estão disponíveis no repositório GitHub de exemplos. Vários são mostrados abaixo.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identidade atribuída pelo sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identidade atribuída pelo usuário

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Próximos passos