Ridimensionare i pool di nodi nel servizio Azure Kubernetes

A causa di un numero crescente di distribuzioni o all'esecuzione di un carico di lavoro più grande, è possibile che si voglia modificare il piano del set di scalabilità di macchine virtuali o ridimensionare le istanze del servizio Azure Kubernetes. Tuttavia, in base ai criteri di supporto per il servizio Azure Kubernetes:

I nodi dell'agente del servizio Azure Kubernetes vengono visualizzati nel portale di Azure come normali risorse IaaS di Azure. Tuttavia, queste macchine virtuali vengono distribuite in un gruppo di risorse di Azure personalizzato (in genere preceduto da MC_*). Non è possibile eseguire personalizzazioni dirette a questi nodi usando le API O le risorse IaaS. Tutte le modifiche personalizzate che non vengono eseguite tramite l'API del servizio Azure Kubernetes non verranno mantenute se si esegue un aggiornamento, si cambia il piano o si esegue un riavvio.

Questa mancanza di persistenza si applica anche all'operazione di ridimensionamento, pertanto il ridimensionamento delle istanze del servizio Azure Kubernetes in questo modo non è supportato. In questa guida pratica si apprenderà il metodo consigliato per risolvere questo scenario.

Importante

Questo metodo è specifico per i cluster del servizio Azure Kubernetes basati su set di scalabilità di macchine virtuali. Quando si usano set di disponibilità di macchine virtuali, si è limitati a un solo pool di nodi per ogni cluster.

Risorse di esempio

Si supponga di voler ridimensionare un pool di nodi esistente, denominato nodepool1, dalle dimensioni dello SKU Standard_DS2_v2 a quelle Standard_DS3_v2. Per eseguire questa attività, è necessario creare un nuovo pool di nodi usando Standard_DS3_v2, spostare i carichi di lavoro da nodepool1 al nuovo pool di nodi e rimuovere nodepool1. In questo esempio questo nuovo pool di nodi verrà chiamato mynodepool.

Screenshot della pagina del portale di Azure per il cluster, passare a Impostazioni > Pool di nodi. Viene visualizzato un pool di nodi denominato pool 1.

kubectl get nodes

NAME                                STATUS   ROLES   AGE   VERSION
aks-nodepool1-31721111-vmss000000   Ready    agent   10d   v1.21.9
aks-nodepool1-31721111-vmss000001   Ready    agent   10d   v1.21.9
aks-nodepool1-31721111-vmss000002   Ready    agent   10d   v1.21.9
kubectl get pods -o wide -A

NAMESPACE     NAME                                  READY   STATUS    RESTARTS   AGE     IP           NODE                                NOMINATED NODE   READINESS GATES
default       sampleapp2-74b4b974ff-676sz           1/1     Running   0          93m     10.244.1.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
default       sampleapp2-76b6c4c59b-pfgbh           1/1     Running   0          94m     10.244.1.5   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   azure-ip-masq-agent-4n66k             1/1     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   azure-ip-masq-agent-9p4c8             1/1     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   azure-ip-masq-agent-nb7mx             1/1     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   coredns-845757d86-dtvvs               1/1     Running   0          10d     10.244.0.2   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   coredns-845757d86-x27pp               1/1     Running   0          10d     10.244.2.3   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   coredns-autoscaler-5f85dc856b-nfrmh   1/1     Running   0          10d     10.244.2.4   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   csi-azuredisk-node-9nfzt              3/3     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   csi-azuredisk-node-bblsb              3/3     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   csi-azuredisk-node-tjhj4              3/3     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   csi-azurefile-node-9pcr8              3/3     Running   0          3d10h   10.240.0.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   csi-azurefile-node-bh2pc              3/3     Running   0          3d10h   10.240.0.5   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   csi-azurefile-node-h75gq              3/3     Running   0          3d10h   10.240.0.4   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   konnectivity-agent-6cd55c69cf-ngdlb   1/1     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   konnectivity-agent-6cd55c69cf-rvvqt   1/1     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   kube-proxy-4wzx7                      1/1     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000   <none>           <none>
kube-system   kube-proxy-g5tvr                      1/1     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002   <none>           <none>
kube-system   kube-proxy-mrv54                      1/1     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001   <none>           <none>
kube-system   metrics-server-774f99dbf4-h52hn       1/1     Running   1          3d10h   10.244.1.3   aks-nodepool1-31721111-vmss000002   <none>           <none>

Creare un nuovo pool di nodi con lo SKU desiderato

Usare il comando az aks nodepool add per creare un nuovo pool di nodi denominato mynodepool con tre nodi usando lo SKU della macchina virtuale Standard_DS3_v2:

az aks nodepool add \
    --resource-group myResourceGroup \
    --cluster-name myAKSCluster \
    --name mynodepool \
    --node-count 3 \
    --node-vm-size Standard_DS3_v2 \
    --mode System \
    --no-wait

Nota

Ogni cluster del servizio Azure Kubernetes deve contenere almeno un pool di nodi di sistema con almeno un nodo. Nell'esempio precedente viene usato un --mode di System, poiché si presuppone che il cluster disponga di un solo pool di nodi, richiedendo un pool di nodi System per sostituirlo. La modalità di un pool di nodi può essere aggiornata in qualsiasi momento.

Quando si ridimensiona, assicurarsi di prendere in considerazione altri requisiti e configurare di conseguenza il pool di nodi. Potrebbe essere necessario modificare il comando precedente. Per un elenco completo delle opzioni di configurazione, vedere la pagina di riferimento az aks nodepool add.

Dopo alcuni minuti, il nuovo pool di nodi è stato creato:

Screenshot della pagina del portale di Azure per il cluster, passare a Impostazioni > Pool di nodi. Vengono visualizzati due pool di nodi denominati pool di nodi 1 e pool di nodi personali.

kubectl get nodes

NAME                                 STATUS   ROLES   AGE   VERSION
aks-mynodepool-20823458-vmss000000   Ready    agent   23m   v1.21.9
aks-mynodepool-20823458-vmss000001   Ready    agent   23m   v1.21.9
aks-mynodepool-20823458-vmss000002   Ready    agent   23m   v1.21.9
aks-nodepool1-31721111-vmss000000    Ready    agent   10d   v1.21.9
aks-nodepool1-31721111-vmss000001    Ready    agent   10d   v1.21.9
aks-nodepool1-31721111-vmss000002    Ready    agent   10d   v1.21.9

Blocco dei nodi esistenti

Il blocco contrassegna i nodi specificati come non pianificabili e impedisce l'aggiunta di altri pod ai nodi.

Ottenere prima di tutto i nomi dei nodi che si desidera eseguire con kubectl get nodes. L'output dovrebbe essere simile al seguente:

NAME                                STATUS   ROLES   AGE     VERSION
aks-nodepool1-31721111-vmss000000   Ready    agent   7d21h   v1.21.9
aks-nodepool1-31721111-vmss000001   Ready    agent   7d21h   v1.21.9
aks-nodepool1-31721111-vmss000002   Ready    agent   7d21h   v1.21.9

Successivamente, usando kubectl cordon <node-names>, specificare i nodi desiderati in un elenco separato da spazi:

kubectl cordon aks-nodepool1-31721111-vmss000000 aks-nodepool1-31721111-vmss000001 aks-nodepool1-31721111-vmss000002
node/aks-nodepool1-31721111-vmss000000 cordoned
node/aks-nodepool1-31721111-vmss000001 cordoned
node/aks-nodepool1-31721111-vmss000002 cordoned

Svuotare i nodi esistenti

Importante

Per svuotare correttamente i nodi e rimuovere i pod in esecuzione, assicurarsi che qualsiasi PodDisruptionBudgets (PDB) consenta lo spostamento di almeno una replica pod alla volta. In caso contrario, l'operazione di svuotamento/rimozione avrà esito negativo. Per verificarlo, è possibile eseguire kubectl get pdb -A e verificare che ALLOWED DISRUPTIONS sia almeno uno o superiore.

Lo svuotamento dei nodi causerà la rimozione e la ricreazione dei pod negli altri nodi pianificabili.

Per svuotare i nodi, usare di nuovo kubectl drain <node-names> --ignore-daemonsets --delete-emptydir-data, usando un elenco di nomi di nodi separati da spazi:

Importante

L'uso di --delete-emptydir-data è necessario per rimuovere il coredns creato dal servizio Azure Kubernetes e i pod metrics-server. Se questo flag non viene usato, è previsto un errore. Per altre informazioni, vedere la documentazione su emptydir.

kubectl drain aks-nodepool1-31721111-vmss000000 aks-nodepool1-31721111-vmss000001 aks-nodepool1-31721111-vmss000002 --ignore-daemonsets --delete-emptydir-data

Al termine dell'operazione di svuotamento, tutti i pod diversi da quelli controllati dai set di daemon vengono eseguiti nel nuovo pool di nodi:

kubectl get pods -o wide -A

NAMESPACE     NAME                                  READY   STATUS    RESTARTS   AGE     IP           NODE                                 NOMINATED NODE   READINESS GATES
default       sampleapp2-74b4b974ff-676sz           1/1     Running   0          15m     10.244.4.5   aks-mynodepool-20823458-vmss000002   <none>           <none>
default       sampleapp2-76b6c4c59b-rhmzq           1/1     Running   0          16m     10.244.4.3   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   azure-ip-masq-agent-4n66k             1/1     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002    <none>           <none>
kube-system   azure-ip-masq-agent-9p4c8             1/1     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000    <none>           <none>
kube-system   azure-ip-masq-agent-nb7mx             1/1     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001    <none>           <none>
kube-system   azure-ip-masq-agent-sxn96             1/1     Running   0          49m     10.240.0.9   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   azure-ip-masq-agent-tsq98             1/1     Running   0          49m     10.240.0.8   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   azure-ip-masq-agent-xzrdl             1/1     Running   0          49m     10.240.0.7   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   coredns-845757d86-d2pkc               1/1     Running   0          17m     10.244.3.2   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   coredns-845757d86-f8g9s               1/1     Running   0          17m     10.244.5.2   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   coredns-autoscaler-5f85dc856b-f8xh2   1/1     Running   0          17m     10.244.4.2   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   csi-azuredisk-node-7md2w              3/3     Running   0          49m     10.240.0.7   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   csi-azuredisk-node-9nfzt              3/3     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000    <none>           <none>
kube-system   csi-azuredisk-node-bblsb              3/3     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001    <none>           <none>
kube-system   csi-azuredisk-node-lcmtz              3/3     Running   0          49m     10.240.0.9   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   csi-azuredisk-node-mmncr              3/3     Running   0          49m     10.240.0.8   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   csi-azuredisk-node-tjhj4              3/3     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002    <none>           <none>
kube-system   csi-azurefile-node-29w6z              3/3     Running   0          49m     10.240.0.9   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   csi-azurefile-node-4nrx7              3/3     Running   0          49m     10.240.0.7   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   csi-azurefile-node-9pcr8              3/3     Running   0          3d11h   10.240.0.6   aks-nodepool1-31721111-vmss000002    <none>           <none>
kube-system   csi-azurefile-node-bh2pc              3/3     Running   0          3d11h   10.240.0.5   aks-nodepool1-31721111-vmss000001    <none>           <none>
kube-system   csi-azurefile-node-gqqnv              3/3     Running   0          49m     10.240.0.8   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   csi-azurefile-node-h75gq              3/3     Running   0          3d11h   10.240.0.4   aks-nodepool1-31721111-vmss000000    <none>           <none>
kube-system   konnectivity-agent-6cd55c69cf-2bbp5   1/1     Running   0          17m     10.240.0.7   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   konnectivity-agent-6cd55c69cf-7xzxj   1/1     Running   0          16m     10.240.0.8   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   kube-proxy-4wzx7                      1/1     Running   0          10d     10.240.0.4   aks-nodepool1-31721111-vmss000000    <none>           <none>
kube-system   kube-proxy-7h8r5                      1/1     Running   0          49m     10.240.0.7   aks-mynodepool-20823458-vmss000000   <none>           <none>
kube-system   kube-proxy-g5tvr                      1/1     Running   0          10d     10.240.0.6   aks-nodepool1-31721111-vmss000002    <none>           <none>
kube-system   kube-proxy-mrv54                      1/1     Running   0          10d     10.240.0.5   aks-nodepool1-31721111-vmss000001    <none>           <none>
kube-system   kube-proxy-nqmnj                      1/1     Running   0          49m     10.240.0.9   aks-mynodepool-20823458-vmss000002   <none>           <none>
kube-system   kube-proxy-zn77s                      1/1     Running   0          49m     10.240.0.8   aks-mynodepool-20823458-vmss000001   <none>           <none>
kube-system   metrics-server-774f99dbf4-2x6x8       1/1     Running   0          16m     10.244.4.4   aks-mynodepool-20823458-vmss000002   <none>           <none>

Risoluzione dei problemi

È possibile che venga visualizzato un errore simile al seguente:

Errore durante la rimozione di pods/[podname] -n [spazio dei nomi] (riprova dopo 5s): impossibile rimuovere il pod perché viola il budget di interruzione del pod.

Per impostazione predefinita, il cluster ha AKS_managed budget di interruzione dei pod (ad esempio coredns-pdb o konnectivity-agent) con MinAvailable pari a 1. Se, ad esempio, sono in esecuzione due pod coredns, mentre uno di essi viene ricreato e non è disponibile, l'altro non può essere interessato a causa del budget di interruzione del pod. Questo si risolve dopo la pianificazione e l'esecuzione del pod coredns iniziale, consentendo al secondo pod di essere rimosso e ricreato correttamente.

Suggerimento

Valutare la possibilità di svuotare i nodi uno per uno per un'esperienza di rimozione più fluida ed evitare limitazioni. Per altre informazioni, vedi:

Rimuovere il pool di nodi esistente

Per eliminare il pool di nodi esistente, usare il portale di Azure o il comando az aks nodepool delete:

az aks nodepool delete \
    --resource-group myResourceGroup \
    --cluster-name myAKSCluster \
    --name nodepool1

Al termine, il risultato finale è il cluster del servizio Azure Kubernetes con un singolo pool di nodi con le nuove dimensioni di SKU desiderate e tutte le applicazioni e i pod che eseguono correttamente:

Screenshot della pagina del portale di Azure per il cluster, passare a Impostazioni > Pool di nodi. Viene visualizzato un pool di nodi denominato pool di nodi personale.

kubectl get nodes

NAME                                 STATUS   ROLES   AGE   VERSION
aks-mynodepool-20823458-vmss000000   Ready    agent   63m   v1.21.9
aks-mynodepool-20823458-vmss000001   Ready    agent   63m   v1.21.9
aks-mynodepool-20823458-vmss000002   Ready    agent   63m   v1.21.9

Passaggi successivi

Dopo il ridimensionamento di un pool di nodi tramite il blocco e lo svuotamento, vedere altre informazioni sull’uso di più pool di nodi.