Disponibilité des régions pour les modèles dans les points de terminaison d’API serverless | Azure Machine Learning

Dans cet article, vous allez découvrir quelles régions sont disponibles pour chacun des modèles prenant en charge les déploiements de points de terminaison d’API serverless.

Certains modèles du catalogue de modèles peuvent être déployés en tant qu’API serverless avec facturation avec paiement à l’utilisation. Ce type de déploiement permet de consommer des modèles en tant qu’API sans les héberger sur votre abonnement, tout en conservant la sécurité et la conformité de l’entreprise dont les organisations ont besoin. Cette option de déploiement ne nécessite pas de quota à partir de votre abonnement.

Disponibilité dans les régions

La facturation avec paiement à l’utilisation est disponible uniquement pour les utilisateurs dont l’abonnement Azure appartient à un compte de facturation dans un pays où le fournisseur de modèles a rendu l’offre disponible (consultez « région de disponibilité de l’offre » dans le tableau de la section suivante). Si l’offre est disponible dans la région concernée, l’utilisateur doit disposer d’un hub/projet dans la région Azure où le modèle est disponible pour le déploiement ou le réglage précis, le cas échéant (voir les colonnes « Hub/Région du projet » dans les tableaux suivants).

Modèles Cohere

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
Cohere Command R+ 08-2024 Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Command R 08-2024 Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Command R+ Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Command R Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Rerank 3 - English Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Rerank 3 - Multilingual Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Embed 3 - Anglais Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Cohere Embed 3 - Multilingue Pays gérés par Microsoft
Japon
Qatar
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible

Modèles JAIS

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
JAIS 30B Chat Pays gérés par Microsoft
Égypte
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible

Modèles Meta Llama

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
Llama 2 7B
Llama 2 13B
Llama 2 70B
Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
USA Ouest
USA Ouest 3
USA Ouest 3
Llama 2 7B Chat
Llama 2 7B Chat
Llama 2 70B Chat
Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
USA Ouest
USA Ouest 3
USA Ouest 3
Llama 3 8B Instruct
Llama 3 70B Instruct
Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Llama 3.1 8B Instruct
Llama 3.1 70B Instruct
Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
USA Ouest
USA Ouest 3
USA Ouest 3
Llama 3.1 405B Instruct Pays gérés par Microsoft USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
USA Ouest
USA Ouest 3
Non disponible

Modèles de la famille Microsoft Phi-3

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
Phi-3.5-vision-Instruct Non applicable USA Est 2
Suède Centre
Non disponible
Phi-3.5-MoE-Instruct Non applicable USA Est 2
Suède Centre
Non disponible
Phi-3.5-Mini-Instruct Non applicable USA Est 2
Suède Centre
Non disponible
Phi-3-Mini-4k-Instruct
Phi-3-Mini-128K-Instruct
Non applicable USA Est 2
Suède Centre
USA Est 2
Phi-3-Small-8K-Instruct
Phi-3-Small-128K-Instruct
Non applicable USA Est 2
Suède Centre
Non disponible
Phi-3-Medium-4K-Instruct
Phi-3-Medium-128K-Instruct
Non applicable USA Est 2
Suède Centre
USA Est 2

Modèles Mistral

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
Mistral Nemo Pays gérés par Microsoft
Brésil
Hong Kong (R.A.S.)
Israël
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Mistral Small Pays gérés par Microsoft
Brésil
Hong Kong (R.A.S.)
Israël
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Mistral Large (2402) Pays gérés par Microsoft
Brésil
Hong Kong (R.A.S.)
Israël
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible
Mistral-Large (2407) Pays gérés par Microsoft
Brésil
Hong Kong (R.A.S.)
Israël
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible

Modèles Nixtla

Modèle Région de disponibilité de l’offre Région de déploiement du hub/projet Région hub/projet pour le réglage précis
TimeGEN-1 Pays gérés par Microsoft
Mexique
Israël
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
Suède Centre
USA Ouest
USA Ouest 3
Non disponible

Alternatives à la disponibilité des régions

Si la plupart de votre infrastructure se trouve dans une région particulière et que vous souhaitez tirer parti des modèles disponibles uniquement en tant que points de terminaison d’API serverless, vous pouvez créer un espace de travail sur la région prise en charge, puis consommer le point de terminaison à partir d’une autre région.

Lire Consommer des points de terminaison d’API serverless à partir d’un autre espace de travail pour apprendre à configurer un point de terminaison d’API serverless existant dans un espace de travail différent de celui où il a été déployé.