Profili di carico di lavoro in App contenitore di Azure

Un profilo del carico di lavoro determina la quantità di risorse di calcolo e memoria disponibili per le app contenitore distribuite in un ambiente.

I profili sono configurati per soddisfare le diverse esigenze delle applicazioni.

Tipo profilo Descrizione Potenziale utilizzo
Consumo Aggiunto automaticamente a qualsiasi nuovo ambiente. App che non richiedono requisiti hardware specifici
Dedicato (utilizzo generico) Bilanciamento della memoria e delle risorse di calcolo App che richiedono grandi quantità di CPU e/o memoria
Dedicato (ottimizzato per la memoria) Risorse di memoria aumentate App che richiedono l'accesso a dati di grandi dimensioni in memoria, modelli di Machine Learning in memoria o altri requisiti di memoria elevata
Dedicato (GPU abilitato) (anteprima) GPU abilitata con risorse di calcolo e memoria aumentate disponibili nelle aree Stati Uniti occidentali 3 ed Europa settentrionale. App che richiedono GPU

Nota

Quando si usano profili di carico di lavoro abilitati per GPU, assicurarsi che l'applicazione esegua la versione più recente di CUDA.

Il profilo del carico di lavoro Consumo è il profilo predefinito aggiunto a ogni tipo di ambiente profili di carico di lavoro. È possibile aggiungere profili di carico di lavoro dedicati all'ambiente quando lo si crea o dopo averlo creato. Gli ambienti dei profili di carico di lavoro vengono distribuiti separatamente dagli ambienti solo a consumo.

Per ogni profilo del carico di lavoro dedicato nell'ambiente, è possibile:

  • Selezionare il tipo e le dimensioni
  • Distribuire più app nel profilo
  • Usare la scalabilità automatica per aggiungere e rimuovere istanze in base alle esigenze delle app
  • Limitare il ridimensionamento del profilo per controllare meglio i costi

È possibile configurare ognuna delle app da eseguire in uno dei profili di carico di lavoro definiti nell'ambiente App contenitore. Questa configurazione è ideale per la distribuzione di microservizi in cui ogni app può essere eseguita nell'infrastruttura di calcolo appropriata.

Nota

È possibile applicare un profilo di carico di lavoro GPU solo a un ambiente durante la creazione dell'ambiente.

Tipi di profilo

Esistono tipi e dimensioni diversi dei profili di carico di lavoro disponibili in base all'area. Per impostazione predefinita, ogni piano dedicato include un profilo di consumo, ma è anche possibile aggiungere uno dei profili seguenti:

Nome visualizzato Nome vCPU Memoria (GiB) GPU Categoria Allocazione
Consumo Consumo 4 8 - Consumo per replica
D4 dedicato D4 4 16 - Utilizzo generico per nodo
D8 dedicato D8 8 32 - Utilizzo generico per nodo
D16 dedicato D16 16 64 - Utilizzo generico per nodo
D32 dedicato D32 32 128 - Utilizzo generico per nodo
E4 dedicato E4 4 32 - Ottimizzato per la memoria per nodo
E8 dedicato E8 8 64 - Ottimizzato per la memoria per nodo
E16 dedicato E16 16 128 - Ottimizzato per la memoria per nodo
E32 dedicato E32 32 256 - Ottimizzato per la memoria per nodo
NC24-A100 dedicato (anteprima) NC24-A100 24 220 1 Abilitate per la GPU per nodo*
NC48-A100 dedicato (anteprima) NC48-A100 48 440 2 Abilitate per la GPU per nodo*
NC96-A100 dedicato (anteprima) NC96-A100 96 880 4 Abilitate per la GPU per nodo*

* La capacità viene allocata in base al caso. Inviare un ticket di supporto per richiedere la quantità di capacità necessaria per l'applicazione.

Nota

Il comando az containerapp env workload-profile set non è più disponibile per la selezione di un profilo del carico di lavoro. Usare invece az containerapp env workload-profile add o az containerapp env workload-profile update.

Oltre a dimensioni di memoria e core diverse, i profili di carico di lavoro hanno anche limiti di dimensioni delle immagini variabili disponibili. Per altre informazioni sui limiti delle dimensioni delle immagini per le app contenitore, vedere Informazioni di riferimento sull'hardware.

La disponibilità di profili di carico di lavoro diversi varia in base all'area.

Utilizzo di risorse

È possibile vincolare l'utilizzo della memoria e della CPU di ogni app all'interno di un profilo del carico di lavoro ed è possibile eseguire più app all'interno di una singola istanza di un profilo di carico di lavoro. Tuttavia, le risorse totali disponibili per un'app contenitore sono inferiori alle risorse allocate a un profilo. La differenza tra le risorse allocate e le risorse disponibili è la quantità riservata dal runtime di App contenitore.

Scalabilità

Quando la richiesta di nuove app o più repliche di un'app esistente supera le risorse correnti del profilo, è possibile aggiungere istanze del profilo.

Allo stesso tempo, se il numero di repliche necessarie diventa inattivo, le istanze del profilo potrebbero essere rimosse. È possibile controllare i vincoli sul numero minimo e massimo di istanze del profilo.

Azure calcola la fatturazione in gran parte in base al numero di istanze del profilo in esecuzione.

Rete

Quando si usa l'ambiente del profilo del carico di lavoro, sono disponibili funzionalità di rete aggiuntive che proteggono completamente il traffico di rete in ingresso e in uscita (ad esempio le route definite dall'utente). Per altre informazioni sulle funzionalità di rete supportate, vedere Rete nell'ambiente app Azure Container. Per informazioni su come proteggere la rete con App contenitore, vedere la sezione relativa al blocco dell'ambiente dell'app contenitore.

Passaggi successivi