Vectoriseur du catalogue de modèles Azure AI Studio
Important
Ce vectoriseur est en préversion publique sous conditions d’utilisation supplémentaires. L’API REST 2024-05-01-Preview prend en charge cette fonctionnalité.
Le vectoriseur du catalogue de modèles Azure AI Studio se connecte à un modèle d’incorporation déployé par le catalogue de modèles Azure AI Studio sur un point de terminaison Azure Machine Learning. Vos données sont traitées dans l’emplacement géographique où votre modèle est déployé.
Si vous avez utilisé la vectorisation intégrée pour créer les tableaux de vecteurs, l’ensemble de compétences doit inclure une compétence AML pointant vers le catalogue de modèles dans Azure AI Studio.
Paramètres du vectoriseur
Les paramètres respectent la casse. Les paramètres que vous choisissez d’utiliser dépendent de l’authentification dont votre point de terminaison en ligne AML a besoin, le cas échéant.
Nom du paramètre | Description |
---|---|
uri |
(Obligatoire) L’URI du point de terminaison en ligne AML auquel la charge utile JSON est envoyée. Seul le schéma d’URI https est autorisé. |
modelName |
(Obligatoire) L’ID de modèle du catalogue de modèles AI Studio déployé sur le point de terminaison fourni. Les valeurs actuellement prises en charge sont les suivantes
|
key |
(Requis pour l’authentification par clé) Clé du point de terminaison en ligne AML. |
resourceId |
(Requis pour l’authentification par jeton). ID de ressource Azure Resource Manager du point de terminaison en ligne AML. Il doit être au format subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}. |
region |
(Facultatif pour l’authentification par jeton). La région dans laquelle le point de terminaison en ligne AML est déployé. Nécessaire si la région est différente de celle du service de recherche. |
timeout |
(Facultatif) Si spécifié, indique le délai d’expiration pour le client http qui effectue l’appel d’API. Il doit être formaté en tant que valeur « dayTimeDuration » XSD (un sous-ensemble limité d'une valeur de durée ISO 8601 ). Par exemple, PT60S pour 60 secondes. S’il n’est pas défini, une valeur par défaut de 30 secondes est choisie. Le délai d’expiration peut être défini sur 230 secondes maximum et 1 seconde minimum. |
Quels paramètres d’authentification utiliser
Les paramètres d’authentification requis dépendent de l’authentification utilisée par votre point de terminaison AML en ligne, le cas échéant. Les points de terminaison en ligne AML fournissent deux options d’authentification :
- Authentification basée sur une clé. Une clé statique est fournie pour authentifier les demandes de scoring du vectoriseur.
- Utiliser les paramètres uri et key
- Authentification basée sur un jeton. Le point de terminaison en ligne AML est déployé à l’aide de l’authentification basée sur des jetons. L’identité managée du service Recherche Azure AI doit être activée. Le vectoriseur utilise ensuite l’identité managée du service pour s’authentifier auprès du point de terminaison en ligne AML, sans besoin de clés statiques. L’identité doit avoir le rôle de propriétaire ou de contributeur.
- Utiliser le paramètre resourceId
- Si le service Recherche se trouve dans une autre région que celle de l’espace de travail AML, utilisez le paramètre région pour définir la région dans laquelle le point de terminaison en ligne AML a été déployé
Types de requêtes vectorielles pris en charge
Les types de requêtes vectorielles pris en charge par le vectoriseur du catalogue de modèles AI Studio dépendent de l’élément modelName
configuré.
modelName |
Prend en charge la requête text |
Prend en charge la requête imageUrl |
Prend en charge la requête imageBinary |
---|---|---|---|
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 | X | X | X |
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 | X | X | X |
Facebook-DinoV2-Image-Embeddings-ViT-Base | X | X | |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | X | X | |
Cohere-embed-v3-english | X | ||
Cohere-embed-v3-multilingual | X |
Dimensions attendues du champ
Les dimensions attendues du champ pour un champ configuré avec un vectoriseur du catalogue de modèles AI Studio dépendent de celles modelName
configurées.
modelName |
Dimensions attendues |
---|---|
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 | 512 |
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 | 768 |
Facebook-DinoV2-Image-Embeddings-ViT-Base | 768 |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | 1536 |
Cohere-embed-v3-english | 1 024 |
Cohere-embed-v3-multilingual | 1 024 |
Exemple de définition
"vectorizers": [
{
"name": "my-ai-studio-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
"key": "0000000000000000000000000000000000000",
"timeout": "PT60S",
"modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
"resourceId": null,
"region": null,
},
}
]