Vetorizador de catálogo de modelos do Azure AI Studio

Importante

Este vetorizador está em pré-visualização pública sob Termos de Uso Suplementares. A API REST 2024-05-01-Preview suporta esse recurso.

O vetorizador de catálogo de modelos do Azure AI Studio liga-se a um modelo de incorporação que foi implementado através do catálogo de modelos do Azure AI Studio a um ponto de extremidade do Azure Machine Learning. Seus dados são processados na área geográfica onde seu modelo é implantado.

Se você usou vetorização integrada para criar as matrizes vetoriais, o conjunto de habilidades deve incluir uma habilidade AML apontando para o catálogo de modelos no Azure AI Studio.

Parâmetros do vetorizador

Os parâmetros diferenciam maiúsculas de minúsculas. Os parâmetros que você escolhe usar dependem da autenticação que seu ponto de extremidade online AML exige, se houver.

Nome do parâmetro Description
uri (Obrigatório) O URI do ponto de extremidade online AML para o qual a carga JSON é enviada. Somente o esquema de URI https é permitido.
modelName (Obrigatório) O ID do modelo do catálogo de modelos do AI Studio que é implantado no ponto de extremidade fornecido. Atualmente, os valores suportados são
  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Imagem-Texto-Embeddings-ViT-Large-Patch14-336
  • Facebook-DinoV2-Imagem-Embeddings-ViT-Base
  • Facebook-DinoV2-Imagem-Embeddings-ViT-Giant
  • Cohere-embed-v3-inglês
  • Cohere-embed-v3-multilingual
key (Necessário para autenticação de chave) A chave para o ponto de extremidade online AML.
resourceId (Necessário para autenticação de token). A ID de recurso do Azure Resource Manager do ponto de extremidade online da AML. Deve estar no formato subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}.
region (Opcional para autenticação de token). A região em que o ponto de extremidade online AML é implantado. Necessário se a região for diferente da região do serviço de pesquisa.
timeout (Opcional) Quando especificado, indica o tempo limite para o cliente http que faz a chamada de API. Ele deve ser formatado como um valor XSD "dayTimeDuration" (um subconjunto restrito de um valor de duração ISO 8601). Por exemplo, PT60S durante 60 segundos. Se não estiver definido, será escolhido um valor padrão de 30 segundos. O tempo limite pode ser definido para um máximo de 230 segundos e um mínimo de 1 segundo.

Quais parâmetros de autenticação usar

Os parâmetros de autenticação necessários dependem da autenticação que seu ponto de extremidade online AML usa, se houver. Os pontos de extremidade online AML oferecem duas opções de autenticação:

  • Autenticação baseada em chave. Uma chave estática é fornecida para autenticar solicitações de pontuação do vetorizador.
    • Use o uri e os parâmetros chave
  • Autenticação baseada em token. O ponto de extremidade online AML é implantado usando autenticação baseada em token. A identidade gerenciada do serviço Azure AI Search deve ser habilitada. Em seguida, o vetorizador usa a identidade gerenciada do serviço para autenticar no ponto de extremidade online AML, sem a necessidade de chaves estáticas. A identidade deve ser atribuída à função de proprietário ou colaborador.
    • Use o parâmetro resourceId .
    • Se o serviço de pesquisa estiver em uma região diferente do espaço de trabalho AML, use o parâmetro region para definir a região em que o ponto de extremidade online AML foi implantado

Tipos de consulta vetorial suportados

Quais tipos de consulta vetorial são suportados pelo vetorizador de catálogo de modelos do AI Studio depende do modelName que está configurado.

modelName Suporta text consulta Suporta imageUrl consulta Suporta imageBinary consulta
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Imagem-Texto-Embeddings-ViT-Large-Patch14-336 X X X
Facebook-DinoV2-Imagem-Embeddings-ViT-Base X X
Facebook-DinoV2-Imagem-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Dimensões de campo esperadas

As dimensões de campo esperadas para um campo configurado com um vetorizador de catálogo de modelo do AI Studio dependem do modelName que está configurado.

modelName Dimensões esperadas
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Imagem-Texto-Embeddings-ViT-Large-Patch14-336 768
Facebook-DinoV2-Imagem-Embeddings-ViT-Base 768
Facebook-DinoV2-Imagem-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Definição da amostra

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

Consulte também