Profili di carico di lavoro in App contenitore di Azure
Un profilo del carico di lavoro determina la quantità di risorse di calcolo e memoria disponibili per le app contenitore distribuite in un ambiente.
I profili sono configurati per soddisfare le diverse esigenze delle applicazioni.
Tipo profilo | Descrizione | Potenziale utilizzo |
---|---|---|
Consumo | Aggiunto automaticamente a qualsiasi nuovo ambiente. | App che non richiedono requisiti hardware specifici |
Dedicato (utilizzo generico) | Bilanciamento della memoria e delle risorse di calcolo | App che richiedono grandi quantità di CPU e/o memoria |
Dedicato (ottimizzato per la memoria) | Risorse di memoria aumentate | App che richiedono l'accesso a dati di grandi dimensioni in memoria, modelli di Machine Learning in memoria o altri requisiti di memoria elevata |
Dedicato (GPU abilitato) (anteprima) | GPU abilitata con risorse di calcolo e memoria aumentate disponibili nelle aree Stati Uniti occidentali 3 ed Europa settentrionale. | App che richiedono GPU |
Nota
Quando si usano profili di carico di lavoro abilitati per GPU, assicurarsi che l'applicazione esegua la versione più recente di CUDA.
Il profilo del carico di lavoro Consumo è il profilo predefinito aggiunto a ogni tipo di ambiente profili di carico di lavoro. È possibile aggiungere profili di carico di lavoro dedicati all'ambiente quando lo si crea o dopo averlo creato. Gli ambienti dei profili di carico di lavoro vengono distribuiti separatamente dagli ambienti solo a consumo.
Per ogni profilo del carico di lavoro dedicato nell'ambiente, è possibile:
- Selezionare il tipo e le dimensioni
- Distribuire più app nel profilo
- Usare la scalabilità automatica per aggiungere e rimuovere istanze in base alle esigenze delle app
- Limitare il ridimensionamento del profilo per controllare meglio i costi
È possibile configurare ognuna delle app da eseguire in uno dei profili di carico di lavoro definiti nell'ambiente App contenitore. Questa configurazione è ideale per la distribuzione di microservizi in cui ogni app può essere eseguita nell'infrastruttura di calcolo appropriata.
Nota
È possibile applicare un profilo di carico di lavoro GPU solo a un ambiente durante la creazione dell'ambiente.
Tipi di profilo
Esistono tipi e dimensioni diversi dei profili di carico di lavoro disponibili in base all'area. Per impostazione predefinita, ogni piano dedicato include un profilo di consumo, ma è anche possibile aggiungere uno dei profili seguenti:
Nome visualizzato | Nome | vCPU | Memoria (GiB) | GPU | Categoria | Allocazione |
---|---|---|---|---|---|---|
Consumo | Consumo | 4 | 8 | - | Consumo | per replica |
D4 dedicato | D4 | 4 | 16 | - | Utilizzo generico | per nodo |
D8 dedicato | D8 | 8 | 32 | - | Utilizzo generico | per nodo |
D16 dedicato | D16 | 16 | 64 | - | Utilizzo generico | per nodo |
D32 dedicato | D32 | 32 | 128 | - | Utilizzo generico | per nodo |
E4 dedicato | E4 | 4 | 32 | - | Ottimizzato per la memoria | per nodo |
E8 dedicato | E8 | 8 | 64 | - | Ottimizzato per la memoria | per nodo |
E16 dedicato | E16 | 16 | 128 | - | Ottimizzato per la memoria | per nodo |
E32 dedicato | E32 | 32 | 256 | - | Ottimizzato per la memoria | per nodo |
NC24-A100 dedicato (anteprima) | NC24-A100 | 24 | 220 | 1 | Abilitate per la GPU | per nodo* |
NC48-A100 dedicato (anteprima) | NC48-A100 | 48 | 440 | 2 | Abilitate per la GPU | per nodo* |
NC96-A100 dedicato (anteprima) | NC96-A100 | 96 | 880 | 4 | Abilitate per la GPU | per nodo* |
* La capacità viene allocata in base al caso. Inviare un ticket di supporto per richiedere la quantità di capacità necessaria per l'applicazione.
Nota
Il comando az containerapp env workload-profile set
non è più disponibile per la selezione di un profilo del carico di lavoro. Usare invece az containerapp env workload-profile add o az containerapp env workload-profile update.
Oltre a dimensioni di memoria e core diverse, i profili di carico di lavoro hanno anche limiti di dimensioni delle immagini variabili disponibili. Per altre informazioni sui limiti delle dimensioni delle immagini per le app contenitore, vedere Informazioni di riferimento sull'hardware.
La disponibilità di profili di carico di lavoro diversi varia in base all'area.
Utilizzo di risorse
È possibile vincolare l'utilizzo della memoria e della CPU di ogni app all'interno di un profilo del carico di lavoro ed è possibile eseguire più app all'interno di una singola istanza di un profilo di carico di lavoro. Tuttavia, le risorse totali disponibili per un'app contenitore sono inferiori alle risorse allocate a un profilo. La differenza tra le risorse allocate e le risorse disponibili è la quantità riservata dal runtime di App contenitore.
Scalabilità
Quando la richiesta di nuove app o più repliche di un'app esistente supera le risorse correnti del profilo, è possibile aggiungere istanze del profilo.
Allo stesso tempo, se il numero di repliche necessarie diventa inattivo, le istanze del profilo potrebbero essere rimosse. È possibile controllare i vincoli sul numero minimo e massimo di istanze del profilo.
Azure calcola la fatturazione in gran parte in base al numero di istanze del profilo in esecuzione.
Rete
Quando si usa l'ambiente del profilo del carico di lavoro, sono disponibili funzionalità di rete aggiuntive che proteggono completamente il traffico di rete in ingresso e in uscita (ad esempio le route definite dall'utente). Per altre informazioni sulle funzionalità di rete supportate, vedere Rete nell'ambiente app Azure Container. Per informazioni su come proteggere la rete con App contenitore, vedere la sezione relativa al blocco dell'ambiente dell'app contenitore.