Choisir un niveau de service pour la recherche Azure AI
Créer un service de recherche implique entre autres de choisir un niveau tarifaire (ou une référence SKU) qui est fixé pour toute la durée de vie du service. Dans le portail, le niveau est spécifié sur la page Sélectionnez le niveau tarifaire lorsque vous créez le service. Dans PowerShell ou Azure CLI, le niveau est spécifié via le paramètre -Sku
.
Le niveau détermine :
- Nombre maximal d’index et d’autres objets autorisés sur le service
- Taille et la vitesse des partitions (stockage physique)
- Taux facturable, comme un coût mensuel fixe, mais également un coût incrémentiel si vous ajoutez plus de capacité
Dans quelques instances, le niveau que vous choisissez détermine la disponibilité des fonctionnalités Premium.
Les taux de facturation s’affichent dans la page Sélectionner un niveau tarifaire du portail. Vous pouvez consulter la page des prix pour découvrir les tarifs régionaux et passer en revue Prévoir et gérer les coûts pour obtenir plus d’informations sur le modèle de facturation.
Remarque
Les services de recherche créés après le 3 avril 2024 ont des partitions plus grandes et des quotas de vecteurs plus élevés à presque tous les niveaux. Pour plus d’informations, consultez les limites du service.
Descriptions des niveaux
Les niveaux disponibles sont : Gratuit, De base, Standard et À stockage optimisé. Les niveaux Standard et À stockage optimisé sont proposés dans diverses configurations et capacités. La capture d’écran suivante du portail Microsoft Azure indique les niveaux disponibles, après la déduction indiquée sur le portail et dans la page de tarification.
Le niveau Gratuit crée un service de recherche limité pour les projets plus petits, notamment les tutoriels et les exemples de code. En interne, les ressources système sont partagées entre plusieurs abonnés. Vous ne pouvez pas mettre à l'échelle à l’échelle un service gratuit, exécuter des charges de travail importantes et certaines fonctionnalités Premium ne sont pas disponibles. Vous ne pouvez avoir qu’un seul service de recherche gratuit par abonnement Azure. Si le service est inactif pendant une période prolongée, vous pouvez le supprimer pour libérer de la capacité, en particulier si la région est soumise à des contraintes de capacité.
Les niveaux facturables les plus couramment utilisés comprennent :
Basic a la capacité de respecter le contrat de niveau de service (SLA) en prenant en charge trois répliques.
Standard (S1, S2, S3) est la valeur par défaut. Ce niveau vous offre davantage de flexibilité en matière de mise à l’échelle des charges de travail. Vous pouvez mettre à l’échelle à la fois les partitions et les réplicas. Grâce à des ressources dédiées sous votre contrôle, vous pouvez déployer des projets plus volumineux, optimiser les performances et augmenter la capacité.
Certains niveaux sont conçus pour certains types de travaux :
Le niveau Standard 3 High Density (S3 HD) est un mode d’hébergement pour S3, où le matériel sous-jacent est optimisé pour un grand nombre d’index plus petits, qui est destiné aux scénarios d’architecture mutualisée. Le niveau S3 HD présente les mêmes frais à l’unité que S3, mais le matériel est optimisé pour les lectures de fichiers rapides sur un grand nombre d’index plus petits.
Les niveaux À stockage optimisé (L1, L2) offrent une capacité de stockage plus importante et à moindre coût par To que les niveaux Standard. Ces niveaux sont conçus pour les index volumineux qui ne changent pas très souvent. Le principal compromis impliqué par ces niveaux réside dans une latence de requête plus élevée, ce que vous devez valider pour vos exigences applicatives spécifiques.
Des informations complémentaires sur les différents niveaux sont disponibles sur la page de tarification, dans l’article Service limits in Azure AI Search (Limites du service de recherche Azure AI), ainsi que sur la page du portail lorsque vous approvisionnez un service.
Disponibilité des régions par niveau
La liste des régions prises en charge fournit les emplacements où Recherche Azure AI est proposée.
Actuellement, plusieurs régions sont à la capacité des niveaux spécifiques et ne peuvent pas être utilisées pour les nouveaux services de recherche. Si vous utilisez le portail Azure pour créer un service de recherche, le portail exclut toutes les combinaisons de niveau/région qui ne sont pas disponibles.
Région | Niveau désactivé (SKU) en raison d’une surcapacité | Texte de remplacement suggéré |
---|---|---|
USA Est 2 | Essentiel, S1 | USA Centre |
États-Unis - partie centrale méridionale | Tous les niveaux | USA Centre |
US Gov Virginie | Tous les niveaux | US Gov Arizona |
Europe Ouest | Tous les niveaux | Suède Centre/Europe Nord |
USA Ouest 3 | Essentiel, S1 | USA Centre |
Disponibilité des fonctionnalités par niveau
La plupart des fonctionnalités sont disponibles dans tous les niveaux, y compris le niveau gratuit. Dans certains cas, le niveau détermine la disponibilité d’une fonctionnalité. Le tableau suivant décrit les contraintes.
Fonctionnalité | Considérations sur les niveaux |
---|---|
indexeurs | Les indexeurs ne sont pas disponibles sur S3 HD. Les indexeurs ont davantage de limitations sur le niveau gratuit. |
Indexeur executionEnvironment Paramètre de configuration |
La possibilité d’épingler tout le traitement de l’indexeur aux clusters de recherche alloués à votre service de recherche nécessite S2 et versions ultérieures. |
Enrichissement par IA | Fonctionne au niveau Gratuit, mais n’est pas recommandé. |
Identités managées ou approuvées pour l’accès sortant (indexeur) | Non disponibles au niveau Gratuit. |
Clés de chiffrement gérées par le client | Non disponibles au niveau Gratuit. |
Accès au pare-feu IP | Non disponibles au niveau Gratuit. |
Point de terminaison privé (intégration à Azure Private Link) | Pour les connexions entrantes à un service de recherche ; non disponible au niveau Gratuit. Pour les connexions sortantes, par des indexeurs, à d'autres ressources Azure ; non disponible aux niveaux Gratuit et S3 HD. Pour les indexeurs qui utilisent des ensembles de compétences ; non disponible aux niveaux Gratuit, De base, S1 et S3 HD. |
Zones de disponibilité | Non disponibles au niveau Gratuit ou De base. |
Classeur sémantique | Non disponibles au niveau Gratuit. |
Les fonctionnalités gourmandes en ressources risquent de ne pas fonctionner correctement si vous ne leur attribuez pas une capacité suffisante. Par exemple, l’enrichissement par IA implique des qualifications à long terme qui dépassent le délai d’attente sur un service Gratuit, sauf si le jeu de données est restreint.
Limites supérieures
Les niveaux déterminent le stockage maximal du service proprement dit, ainsi que le nombre maximal d’index, d’indexeurs, de sources de données, d’ensembles de compétences et de cartes de synonymes que vous pouvez créer. Pour connaître toutes les limites, consultez Limites de service de recherche Azure AI.
Taille et vitesse de la partition
La tarification par niveau comprend des détails sur le stockage par partition qui va de 15 Go pour le niveau de base, jusqu’à 2 To pour les niveaux de stockage optimisé (L2). D’autres caractéristiques matérielles, telles que la vitesse des opérations, la latence et les taux de transfert, ne sont pas publiées, mais les niveaux conçus pour des architectures de solution spécifiques sont basés sur du matériel qui possède les caractéristiques nécessaires pour prendre en charge ces scénarios. Pour plus d’informations sur les partitions, consultez Estimer et gérer la capacité et Fiabilité dans la recherche Azure AI.
Remarque
Des partitions de capacité plus élevées sont devenues disponibles dans les régions sélectionnées à compter d’avril 2024. Une deuxième vague de partitions de capacité plus élevées publiées en mai 2024. Si vous utilisez un service de recherche plus ancien, envisagez de créer un service de recherche pour bénéficier d’une capacité supérieure au même taux de facturation. Pour plus d’informations, consultez Limites du Service. Pour vérifier l’âge de votre service de recherche, consultez Comment vérifier la date de création du service.
Tarifs de facturation
Les niveaux ont des tarifs de facturation différents, avec des tarifs plus élevés pour les niveaux qui s’exécutent sur du matériel plus onéreux ou qui offrent des fonctionnalités plus coûteuses. Le taux de facturation par niveau est disponible dans les pages de tarification Azure pour la Recherche Azure AI.
Une fois que vous avez créé un service, le tarif de facturation devient à la fois un coût fixe pour faire fonctionner le service 24 h sur 24 et un coût incrémentiel si vous choisissez d’ajouter plus de capacité.
Les services de recherche sont alloués aux ressources de calcul sous la forme de partitions (pour le stockage) et de réplicas (instances du moteur d’interrogation). Au départ, un service est créé avec un de chaque, et le tarif de facturation comprend les deux ressources. Toutefois, si vous mettez à l’échelle la capacité, les coûts augmentent ou diminuent par incréments du tarif facturable.
L'exemple suivant illustre cette situation. Supposons un tarif de facturation hypothétique de 100 USD par mois. Si vous conservez le service de recherche à sa capacité initiale d’une partition et d’un réplica, vous pouvez alors vous attendre à payer la somme de 100 USD à la fin du mois. Toutefois, si vous ajoutez deux réplicas supplémentaires pour obtenir une haute disponibilité, la facture mensuelle s’élève à 300 USD (100 USD pour la première paire réplica-partition, puis 200 USD pour les deux réplicas).
Ce modèle de facturation est basé sur le concept d’application du tarif de facturation au nombre d’unités de recherche (SU) utilisées par un service de recherche. Tous les services sont initialement approvisionnés avec une SU, mais vous pouvez augmenter le nombre de SU en ajoutant des partitions ou des réplicas pour gérer des charges de travail plus volumineuses. Pour plus d’informations, consultez Comment estimer les coûts d’un service de recherche.
Passer à un niveau supérieur ou inférieur
Il n’existe aucune prise en charge intégrée pour passer à un niveau supérieur ou inférieur. Si vous souhaitez passer à un autre niveau, l’approche est la suivante :
Créez un service de recherche au nouveau niveau.
Déployez votre contenu de recherche sur le nouveau service. Suivez cette liste de contrôle pour vous assurer que vous disposez de tout le contenu.
Supprimez l’ancien service de recherche une fois que vous êtes sûr qu’il n’est plus nécessaire.
Pour les index volumineux que vous ne souhaitez pas reconstruire à partir de zéro, envisagez d’utiliser l’échantillon de sauvegarde et de restauration pour les déplacer.
Étapes suivantes
La meilleure façon de choisir un niveau tarifaire est de commencer par le niveau le moins cher, puis de laisser l’expérience et les tests éclairer votre décision de conserver le service ou d’en créer un nouveau à un niveau supérieur. Pour les étapes suivantes, nous vous recommandons de créer un service de recherche à un niveau qui puisse prendre en charge le niveau de test que vous vous proposez de faire, puis de consulter l’aide suivante pour obtenir des recommandations sur l’estimation du coût et de la capacité.