Disponibilità dell'area per i modelli negli endpoint dell'API serverless | Azure Machine Learning

In questo articolo, vengono fornite informazioni sulle aree disponibili per ognuno dei modelli che supportano le distribuzioni di endpoint API serverless.

Alcuni modelli nel catalogo modelli possono essere distribuiti come API serverless con la fatturazione di pagamenti in base al consumo. Questo tipo di distribuzione consente di usare i modelli come le API senza ospitarli nella sottoscrizione, mantenendo al contempo la sicurezza e la conformità aziendali necessarie alle organizzazioni. Questa opzione di distribuzione non richiede la quota dalla sottoscrizione.

Aree di disponibilità

La distribuzione con pagamento in base al consumo è disponibile solo per gli utenti la cui sottoscrizione di Azure appartiene a un account di fatturazione in un paese in cui il provider di modelli ha reso disponibile l'offerta (vedere "Area di disponibilità dell'offerta" nella tabella della sezione successiva). Se l'offerta è disponibile nell'area pertinente, l'utente deve avere un hub/progetto nell'area di Azure in cui il modello è disponibile per la distribuzione o l'ottimizzazione, a seconda dei casi (vedere le colonne "Area dell'hub/progetto" nelle tabelle seguenti).

Modelli Cohere

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Comando Cohere R+ 08-2024 Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Comando Cohere R 08-2024 Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Command R+ Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Command R Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Rerank 3 - English Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Rerank 3 - Multilingual Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Embed 3 - Inglese Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Cohere Embed 3 - Multilingua Paesi gestiti da Microsoft
Giappone
Qatar
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli JAIS

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
JAIS 30B Chat Paesi gestiti da Microsoft
Egitto
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli Meta Llama

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Llama 2 7B
Llama 2 13B
Llama 2 70B
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 2 7B Chat
Llama 2 70B Chat
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 3 8B Instruct
Llama 3 70B Instruct
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Llama 3.1 8B Instruct
Llama 3.1 70B Instruct
Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Stati Uniti occidentali 3
Llama 3.1 405B Instruct Paesi gestiti da Microsoft Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli della famiglia Microsoft Phi-3

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Phi-3.5-vision-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3.5-MoE-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3.5-Mini-Instruct Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3-Mini-4k-Instruct
Phi-3-Mini-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Stati Uniti orientali 2
Phi-3-Small-8K-Instruct
Phi-3-Small-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Non disponibile
Phi-3-Medium-4K-Instruct
Phi-3-Medium-128K-Instruct
Non applicabile Stati Uniti orientali 2
Svezia centrale
Stati Uniti orientali 2

Modelli Mistral

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
Mistral Nemo Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Ministral-3B Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral Small Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral Large (2402) Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile
Mistral-Large (2407) Paesi gestiti da Microsoft
Brasile
RAS di Hong Kong
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Modelli Nixtla

Modello Area di disponibilità dell'offerta Hub/Area del progetto per la distribuzione Area dell'hub/progetto per l'ottimizzazione
TimeGEN-1 Paesi gestiti da Microsoft
Messico
Israele
Stati Uniti orientali
Stati Uniti orientali 2
Stati Uniti centro-settentrionali
Stati Uniti centro-meridionali
Svezia centrale
Stati Uniti occidentali
Stati Uniti occidentali 3
Non disponibile

Alternative alle aree di disponibilità

Se la maggior parte dell'infrastruttura si trova in una determinata area e si vogliono sfruttare i modelli disponibili solo come endpoint API serverless, è possibile creare un'area di lavoro nell'area supportata e quindi usare l'endpoint da un'altra area.

Leggere Usare endpoint API serverless da un'area di lavoro diversa per informazioni su come configurare un endpoint API serverless esistente in un'area di lavoro diversa da quella in cui è stato distribuito.