Vetorizador do catálogo de modelos do Estúdio de IA do Azure

Importante

Este vetorizador está em visualização pública nos Termos de Uso Complementares. A API REST 2024-05-01-Preview dá suporte a esse recurso.

O vetorizador do Catálogo de modelos do Estúdio de IA do Azure se conecta a um modelo de inserção implantado pelo Catálogo de modelos do Estúdio de IA do Azure em um ponto de extremidade do Azure Machine Learning. Seus dados são processados na área geográfica em que o modelo é implantado.

Se você usou a vetorização integrada para criar as matrizes de vetor, o conjunto de habilidades deverá incluir uma habilidade AML apontando para o catálogo de modelos no Azure AI Studio (versão prévia).

Parâmetros do vetorizador

Os parâmetros diferenciam maiúsculas de minúsculas. Os parâmetros que você escolhe usar dependem do tipo de autenticação que seu ponto de extremidade online AML exige, se houver.

Nome do Parâmetro Descrição
uri (Obrigatório) O URI do ponto de extremidade online AML para o qual o conteúdo do JSON é enviado. Somente o esquema do URI https é permitido.
modelName (Obrigatório) A ID do modelo do catálogo de modelos do Estúdio de IA que é implantado no ponto de extremidade fornecido. No momento, os valores com suporte são
  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Necessário para autenticação de chave) A chave para o ponto de extremidade online do AML.
resourceId (Necessário para autenticação de token). A ID de recurso Azure Resource Manager do ponto de extremidade online do AML. Ele deve estar no formato assinaturas/{GUID}/resourceGroups/{nome-do-grupo-de-recursos}/Microsoft. MachineLearningServices/Workspaces/{Workspace-Name}/onlineendpoints/{endpoint_name}.
region (Opcional para autenticação de token). A região o ponto de extremidade online do AML é implantado. É necessário se a região for diferente da região do serviço de pesquisa.
timeout (Opcional) Quando especificado, indica o tempo limite para o cliente http que fez a chamada à API. Ele deve ser formatado como um valor XSD de "dayTimeDuration" (um subconjunto restrito de um valor de duração ISO 8601 ). Por exemplo, PT60S por 60 segundos. Se não for definido, um valor padrão de 30 segundos será escolhido. O tempo limite pode ser definido para um máximo de 230 segundos e um mínimo de 1 segundo.

Quais parâmetros de autenticação usar

Os parâmetros de autenticação necessários dependem da autenticação que seu ponto de extremidade online AML usa, se houver. Os pontos de extremidade online do AML fornecem duas opções de autenticação:

  • Autenticação baseada em chave. Uma chave estática é fornecida para autenticar as solicitações de pontuação do vetorizador.
    • Usar os parâmetros de URI e chave
  • Autenticação baseada em token. O ponto de extremidade online do AML é implantado usando a autenticação baseada em token. A identidade gerenciada do serviço de IA do Azure Search deve estar habilitado. Em seguida, o vetorizador usa a identidade gerenciada do serviço para se autenticar no ponto de extremidade online do AML, sem a necessidade de chaves estáticas. A identidade deve ser atribuída ao proprietário ou à função de colaborador.
    • Use o parâmetro resourceId .
    • Caso o serviço de pesquisa esteja em uma região diferente do espaço de trabalho do AML, use o parâmetro região para definir a região em que o ponto de extremidade online do AML foi implantado

Tipos de consultas vetoriais com suporte

Quais tipos de consulta de vetor têm suporte pelo vetorizador do catálogo de modelos do Estúdio de IA depende do modelName configurado.

modelName Dá suporte à consulta text Dá suporte à consulta imageUrl Dá suporte à consulta imageBinary
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 X X X
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Dimensões de campo esperadas

As dimensões de campo esperadas para um campo configurado com um vetorizador de catálogo de modelos do Estúdio de IA dependem do modelName configurado.

modelName Dimensões esperadas
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 768
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Definição de exemplo

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

Confira também