Aree di disponibilità per i modelli negli endpoint API serverless

In questo articolo, vengono fornite informazioni sulle aree disponibili per ognuno dei modelli che supportano le distribuzioni di endpoint API serverless.

Importante

I modelli in anteprima vengono contrassegnati come anteprima nelle schede del modello nel catalogo dei modelli.

Alcuni modelli nel catalogo modelli possono essere distribuiti come API serverless con la fatturazione di pagamenti in base al consumo. Questo tipo di distribuzione consente di usare i modelli come le API senza ospitarli nella sottoscrizione, mantenendo al contempo la sicurezza e la conformità aziendali necessarie alle organizzazioni. Questa opzione di distribuzione non richiede la quota dalla sottoscrizione.

Aree di disponibilità

La distribuzione con pagamento in base al consumo è disponibile solo per gli utenti la cui sottoscrizione di Azure appartiene a un account di fatturazione in un paese in cui il provider di modelli ha reso disponibile l'offerta (vedere "Area di disponibilità dell'offerta" nella tabella della sezione successiva). Se l'offerta è disponibile nell'area pertinente, l'utente deve avere un hub/progetto nell'area di Azure in cui il modello è disponibile per la distribuzione o l'ottimizzazione, a seconda dei casi (vedere le colonne "Area dell'hub/progetto" nelle tabelle seguenti).

Modelli Cohere

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Comando Cohere R+ 08-2024 Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Comando Cohere R 08-2024 Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Command R+ Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Command R Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Rerank 3 - English Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Rerank 3 - Multilingual Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Embed 3 - Inglese Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Embed 3 - Multilingua Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli JAIS

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
JAIS 30B Chat Paesi gestiti da Microsoft
Egitto
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli Meta Llama

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Llama 2 7B
Llama 2 13B
Llama 2 70B
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 2 7B Chat
Llama 2 70B Chat
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 3 8B Instruct
Llama 3 70B Instruct
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Llama 3.1 8B Instruct
Llama 3.1 70B Instruct
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 3.1 405B Instruct Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli della famiglia Microsoft Phi-3

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Phi-3.5-vision-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3.5-MoE-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3.5-Mini-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3-Mini-4k-Instruct
Phi-3-Mini-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Stati Uniti orientali 2
Phi-3-Small-8K-Instruct
Phi-3-Small-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3-Medium-4K-Instruct
Phi-3-Medium-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Stati Uniti orientali 2

Modelli Mistral

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Mistral Nemo Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Ministral-3B Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral Small Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral Large (2402) Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral-Large (2407) Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli Nixtla

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
TimeGEN-1 Paesi gestiti da Microsoft
Messico
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Alternative alla disponibilità a livello di area

Se la maggior parte dell'infrastruttura si trova in una determinata area e si vogliono sfruttare i modelli disponibili solo come endpoint API serverless, è possibile creare un hub o un progetto nell'area supportata e quindi utilizzare l'endpoint da un'altra area.

Leggere Usare endpoint API serverless da un hub o un progetto diverso per informazioni su come configurare un endpoint API serverless esistente in un hub o un progetto diverso da quello in cui è stato distribuito.