Criteri di manutenzione dei modelli di intelligenza artificiale generativi

Questo articolo descrive i criteri di manutenzione del modello per le API modello di base con pagamento in base al token e le offerte di training del modello di intelligenza artificiale Mosaic.

Per continuare a supportare i modelli più all'avanguardia, Databricks potrebbe aggiornare i modelli supportati o ritirare i modelli meno recenti per le API del modello di base con pagamento in base al token e le offerte di training del modello di intelligenza artificiale Mosaic.

Criteri di ritiro del modello

I criteri di ritiro seguenti si applicano solo ai modelli di chat e completamento supportati nelle API modello di base con pagamento in base al token e alle offerte di training del modello di intelligenza artificiale Mosaic.

Se un modello è impostato per il ritiro, Databricks esegue i passaggi seguenti per notificare ai clienti:

  • Nella scheda modello viene visualizzato un messaggio di avviso nella pagina Serve dell'area di lavoro di Databricks che indica che il modello è pianificato per il ritiro.
  • Viene visualizzato un messaggio di avviso nel menu a discesa per Il training del modello di intelligenza artificiale mosaico nella scheda Esperimenti che indica che il modello è pianificato per il ritiro.
  • La documentazione applicabile contiene un avviso che indica che il modello è pianificato per il ritiro e la data di inizio del modello non sarà più supportata.

Dopo che i clienti ricevono una notifica sul ritiro imminente del modello, Databricks ritirerà il modello in 3 mesi. Durante questo periodo di tempo, i clienti possono scegliere di eseguire la migrazione a un endpoint di velocità effettiva con provisioning per continuare a usare il modello oltre la data di fine vita.

Per un elenco dei modelli attualmente ritirati e delle date di ritiro pianificate, vedere Modelli ritirati.

Aggiornamenti del modello

Databricks potrebbe distribuire aggiornamenti incrementali ai modelli con pagamento in base al token per offrire ottimizzazioni. Quando un modello viene aggiornato, l'URL dell'endpoint rimane invariato, ma l'ID modello nell'oggetto risposta cambia in modo da riflettere la data dell'aggiornamento. Ad esempio, se un aggiornamento viene fornito a meta-llama/Meta-Llama-3.1-405B il 3/4/2024, il nome del modello nell'oggetto risposta viene aggiornato a meta-llama/Meta-Llama-3.1-405B-030424. Databricks gestisce una cronologia delle versioni degli aggiornamenti a cui è possibile fare riferimento.

Modelli ritirati

Le sezioni seguenti riepilogano i ritiri dei modelli correnti e futuri per le API del modello di base con pagamento in base al token e le offerte di training del modello di intelligenza artificiale Mosaic.

Ritiri del modello di intelligenza artificiale mosaici

La tabella seguente illustra le famiglie di modelli ritirati, le date di ritiro e le famiglie di modelli di sostituzione consigliate da usare per i carichi di lavoro Di training del modello di intelligenza artificiale Mosaic. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.

Famiglia del modello Data di ritiro Famiglia di modelli di sostituzione consigliata
Meta-Llama-3 13 dicembre 2024 Meta-Llama-3.1
Meta-Llama-2 13 dicembre 2024 Meta-Llama-3.1
Code Llama 13 dicembre 2024 Meta-Llama-3.1

Ritiri delle API del modello di base con pagamento in base al token

La tabella seguente illustra i ritiri dei modelli, le date di ritiro e i modelli di sostituzione consigliati da usare per le API modello di base che pagano per token i carichi di lavoro. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.

Importante

Il 23 luglio 2024, Meta-Llama-3.1-70B-Instruct ha sostituito il supporto per meta-Llama-3-70B-Instruct nelle API del modello foundation con pagamento per token.

Modello Data di ritiro Modello di sostituzione consigliato
Meta-Llama-3-70B-Instruct 23 luglio 2024 Meta-Llama-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30 ottobre 2024 Meta-Llama-3.1-70B-Instruct
Istruzioni MPT 7B 30 agosto 2024 Mixtral-8x7B
Istruzioni MPT 30B 30 agosto 2024 Mixtral-8x7B

Se è necessario il supporto a lungo termine per una versione specifica del modello, Databricks consiglia di usare la velocità effettiva con provisioning delle API del modello di base per i carichi di lavoro in uso.