Azure Kubernetes Service (AKS) でのクラスターオートスケーラーの使用

[アーティクル]
08/02/2024

AKS でのアプリケーションの需要に対応するため、ワークロードを実行するノードの数の調整が必要になる場合があります。クラスターオートスケーラーコンポーネントは、リソース制約のためにスケジュールできないクラスター内のポッドを監視します。クラスターオートスケーラーは、問題を検出すると、アプリケーションの需要に合わせてノードプール内のノード数をスケールアップします。また、実行ポッドの不足について定期的にノードがチェックされ、必要に応じてノードの数がスケールダウンされます。

この記事では、オープンソース Kubernetes バージョンに基づく AKS でクラスターオートスケーラーを有効にして管理する方法について説明します。

開始する前に

この記事では、Azure CLI バージョン 2.0.76 以降が必要です。バージョンを確認するには、az --version を実行します。インストールまたはアップグレードする必要がある場合は、Azure CLI のインストールに関するページを参照してください。

AKS クラスターでクラスターオートスケーラーを使用する

重要

クラスターオートスケーラーは、Kubernetes のコンポーネントです。 AKS クラスターは、ノードに仮想マシンスケールセットを使用しますが、スケールセットの自動スケーリングの設定を手動で有効にしたり編集したりしないでください。必要なスケール設定の管理は、Kubernetes クラスターオートスケーラーが行います。詳細については、ノードリソースグループ内の AKS リソースを変更可能かどうかに関するセクションを参照してください。

新しいクラスターでクラスターオートスケーラーを有効にする

az group create コマンドを使用して、リソースグループを作成します。
```
az group create --name myResourceGroup --location eastus
```
az aks create コマンドを使用して AKS クラスターを作成し、--enable-cluster-autoscaler パラメーターを使用して --min-count と --max-count のノードを指定して、クラスターのノードプールでクラスターオートスケーラーを有効にして構成します。次のコマンド例では、仮想マシンスケールセットによってサポートされる 1 つのノードを持つクラスターを作成し、クラスターオートスケーラーを有効にし、最小値を 1 ノード、最大値を 3 ノードに設定しています。
```
az aks create \
--resource-group myResourceGroup \
--name myAKSCluster \
--node-count 1 \
--vm-set-type VirtualMachineScaleSets \
--load-balancer-sku standard \
--enable-cluster-autoscaler \
--min-count 1 \
--max-count 3 \
--generate-ssh-keys
```
このクラスターを作成して、クラスターオートスケーラーの設定を構成するには数分かかります。

既存のクラスター上でクラスター自動スケーラーを有効にする

az aks update コマンドを使用して既存のクラスターを更新し、--enable-cluster-autoscaler パラメーターを使用して --min-count と --max-count のノードを指定して、ノードプールでクラスターオートスケーラーを有効にして構成します。次のコマンド例では、既存の AKS クラスターを更新して、クラスターのノードプール上でクラスターオートスケーラーを有効にし、最小値を 1 ノード、最大値を 3 ノードに設定しています。
```
az aks update \
  --resource-group myResourceGroup \
  --name myAKSCluster \
  --enable-cluster-autoscaler \
  --min-count 1 \
  --max-count 3
```
このクラスターを更新してクラスターオートスケーラーの設定を構成するには、数分かかります。

クラスターでクラスターオートスケーラーを無効にする

az aks update コマンドと --disable-cluster-autoscaler パラメーターを使用して、クラスターオートスケーラーを無効にします。
```
az aks update \
  --resource-group myResourceGroup \
  --name myAKSCluster \
  --disable-cluster-autoscaler
```
クラスターオートスケーラーが無効になってもノードは削除されません。

Note

クラスターオートスケーラーを無効にした後、az aks scale コマンドを使用して、クラスターを手動でスケーリングできます。ポッドの水平オートスケーラーを使っている場合、その機能はクラスターオートスケーラーを無効にしても動作し続けますが、ノードリソースがすべて使用中になると、ポッドをスケジュールできなくなる可能性があります。

クラスターでクラスターオートスケーラーを再度有効にする

az aks update コマンドで --enable-cluster-autoscaler、--min-count、および --max-count のパラメーターを指定することで、既存のクラスター上でクラスターオートスケーラーを再度有効にすることができます。

ノードプールでクラスターオートスケーラーを使用する

複数のノードプールでクラスターオートスケーラーを使用する

複数のノードプールでクラスターオートスケーラーを使用し、個々のノードプールでクラスターオートスケーラーを有効にして、各ノードプールに一意の自動スケーリングルールを渡すことができます。

az aks nodepool update コマンドを使用して、既存のノードプールの設定を更新します。

az aks nodepool update \
  --resource-group myResourceGroup \
  --cluster-name myAKSCluster \
  --name nodepool1 \
  --update-cluster-autoscaler \
  --min-count 1 \
  --max-count 5

ノードプールでクラスターオートスケーラーを無効にする

az aks nodepool update コマンドと --disable-cluster-autoscaler パラメーターを使用して、ノードプールのクラスターオートスケーラーを無効にします。
```
az aks nodepool update \
  --resource-group myResourceGroup \
  --cluster-name myAKSCluster \
  --name nodepool1 \
  --disable-cluster-autoscaler
```

ノードプールでクラスターオートスケーラーを再度有効にする

az aks nodepool update コマンドで --enable-cluster-autoscaler、--min-count、および --max-count のパラメーターを指定することで、ノードプール上でクラスターオートスケーラーを再度有効にすることができます。

Note

複数のゾーンにまたがるノードプールでクラスターオートスケーラーを使用して、ボリュームトポロジスケジュール設定など、ゾーンに関連するスケジュール機能を活用する予定の場合は、ゾーンごとに 1つのノードプールを用意し、オートスケーラープロファイルを使用して --balance-similar-node-groups を有効にすることをお勧めします。これにより、オートスケーラーは正常にスケールアップし、ノードプールのサイズのバランスを維持できます。

クラスターオートスケーラーの設定を更新する

アプリケーション需要の変化に応じて、効率的にスケーリングするためにクラスターオートスケーラーのノード数を調整する必要がある場合があります。

az aks update コマンドを使用してノード数を変更し、--update-cluster-autoscaler パラメーターを使用して、更新したノードの --min-count と --max-count を指定して、クラスターオートスケーラーを更新します。
```
az aks update \
  --resource-group myResourceGroup \
  --name myAKSCluster \
  --update-cluster-autoscaler \
  --min-count 1 \
  --max-count 5
```

Note

スポット削除中である場合や、AKS API から最小カウント値を変更した場合など、外部的な要因によって実際の数が最小値を下回った場合、クラスターオートスケーラーによって最小数が適用されます。

クラスターオートスケーラープロファイルを使用する

クラスター全体のオートスケーラープロファイルで既定値を変更することで、クラスターオートスケーラーの詳細をよりきめ細かに構成できます。たとえばスケールダウンイベントは、ノードの使用率が低い状態で 10 分経過した後に発生します。 15 分ごとに実行されるワークロードがある場合は、15 分または 20 分経過後に使用率が低いノードをスケールダウンするようにオートスケーラープロファイルを変更できます。クラスターオートスケーラーを有効にすると、異なる設定を指定しない限り既定のプロファイルが使用されます。

重要

クラスターオートスケーラープロファイルは、クラスターオートスケーラーを使用するすべてのノードプールに影響を及ぼします。ノードプールごとにオートスケーラープロファイルを設定することはできません。プロファイルを設定すると、クラスターオートスケーラーが有効にされた既存のノードプールでは、すぐにプロファイルの使用が開始されます。

クラスターオートスケーラープロファイルの設定

次の表に、クラスターオートスケーラープロファイルで使用可能な設定を示します。

設定	Description	規定値
`scan-interval`	スケールアップまたはスケールダウンに関してクラスターが再評価される頻度。	10 秒
`scale-down-delay-after-add`	スケールアップ後に、スケールダウンの評価が再開されるまでの時間。	10 分
`scale-down-delay-after-delete`	ノードの削除後に、スケールダウンの評価が再開されるまでの時間。	`scan-interval`
`scale-down-delay-after-failure`	スケールダウンの失敗後に、スケールダウンの評価が再開されるまでの時間。	3 分
`scale-down-unneeded-time`	ノードが不要になってからスケールダウンの対象になるまでの時間。	10 分
`scale-down-unready-time`	準備ができていないノードが不要になってからスケールダウンの対象になるまでの時間。	20 分
`ignore-daemonsets-utilization`	スケールダウンのためにリソース使用率を計算するときに、DaemonSet ポッドを無視するかどうか。	`false`
`daemonset-eviction-for-empty-nodes`	空のノードから DaemonSet ポッドを正常に終了するかどうか。	`false`
`daemonset-eviction-for-occupied-nodes`	空ではないノードから DaemonSet ポッドを正常に終了するかどうか。	`true`
`scale-down-utilization-threshold`	要求されたリソースの合計を容量で割った値として定義される、ノード利用レベル。この場合、ノードはスケールダウンの対象と見なすことができます。	0.5
`max-graceful-termination-sec`	ノードのスケールダウンを試みるときに、クラスターオートスケーラーがポッドの終了を待機する最大秒数。	600 秒
`balance-similar-node-groups`	類似のノードプールを検出し、その間でノード数のバランスを取ります。	`false`
`expander`	スケールアップで使用するノードプール expander の種類。指定できる値は、`most-pods`、`random`、`least-waste`、`priority` です。	`random`
`skip-nodes-with-local-storage`	`true` の場合、EmptyDir や HostPath などのローカルストレージを備えたポッドがあるノードは、クラスターオートスケーラーによって削除されません。	`false`
`skip-nodes-with-system-pods`	`true` の場合、ポッドのあるノードは、クラスターオートスケーラーによって kube-system から削除されません (DaemonSet またはミラーポッドを除く)。	`true`
`max-empty-bulk-delete`	同時に削除できる空ノードの最大数。	10 ノード
`new-pod-scale-up-delay`	バーストまたはバッチスケールなど、Kubernetes スケジューラによってすべてのポッドがスケジュールされる前に CA を動作させたくないシナリオの場合、一定の期間に達する前のスケジュールされていないポッドを無視するように CA に指示できます。	0 秒
`max-total-unready-percentage`	クラスター内の準備が完了していないノードの最大割合。この割合を超えると、CA の動作は停止されます。	45%
`max-node-provision-time`	自動スケーラーがノードがプロビジョニングされるのを待機する最大時間。	約 15 分
`ok-total-unready-count`	max-total-unready-percentage に関係なく、準備が完了していないノードの許可されている数。	3 つのノード

Note

ignore-daemonsets-utilization、daemonset-eviction-for-empty-nodes、daemonset-eviction-for-occupied-nodes パラメーターは、API バージョン 2024-05-01 から一般提供となります。 CLI を使用してこれらのフラグを更新する場合は、バージョン 2.63 以降を使用していることを確認してください。

新しいクラスターに対してクラスターオートスケーラープロファイルを設定する

az aks create コマンドを使用して AKS クラスターを作成し、cluster-autoscaler-profile パラメーターを使用してクラスターオートスケーラープロファイルを設定します。

az aks create \
    --resource-group myResourceGroup \
    --name myAKSCluster \
    --node-count 1 \
    --enable-cluster-autoscaler \
    --min-count 1 \
    --max-count 3 \
    --cluster-autoscaler-profile scan-interval=30s \
    --generate-ssh-keys

既存のクラスターに対してクラスターオートスケーラープロファイルを設定する

az aks update コマンドと cluster-autoscaler-profile パラメーターを使用して、既存のクラスターにクラスターオートスケーラーを設定します。次の例では、スキャン間隔の設定を "30 秒" として構成しています。
```
az aks update \
  --resource-group myResourceGroup \
  --name myAKSCluster \
  --cluster-autoscaler-profile scan-interval=30s
```

積極的なスケールダウン用にクラスターオートスケーラープロファイルを構成する

Note

このような状況ではノードのプロビジョニング時間が長くなる可能性があるため、短い間隔でスケールアウトとスケールインが頻繁に発生するクラスターでは、積極的なスケールダウンは推奨されません。 scale-down-delay-after-add を増やすことで、ノードをより長時間維持し、受信するワークロードを処理できるようになります。

 az aks update \
     --resource-group myResourceGroup \
     --name myAKSCluster \
     --cluster-autoscaler-profile scan-interval=30s,scale-down-delay-after-add=0m,scale-down-delay-after-failure=1m,scale-down-unneeded-time=3m,scale-down-unready-time=3m,max-graceful-termination-sec=30,skip-nodes-with-local-storage=false,max-empty-bulk-delete=1000,max-total-unready-percentage=100,ok-total-unready-count=1000,max-node-provision-time=15m

集中的なワークロード用にクラスターオートスケーラープロファイルを構成する

 az aks update \   
     --resource-group "myResourceGroup" \
     --name myAKSCluster \ 
     --cluster-autoscaler-profile scan-interval=20s,scale-down-delay-after-add=10m,scale-down-delay-after-failure=1m,scale-down-unneeded-time=5m,scale-down-unready-time=5m,max-graceful-termination-sec=30,skip-nodes-with-local-storage=false,max-empty-bulk-delete=100,max-total-unready-percentage=100,ok-total-unready-count=1000,max-node-provision-time=15m

クラスターオートスケーラープロファイルを既定値にリセットする

az aks update コマンドを使用して、クラスターオートスケーラープロファイルをリセットします。
```
az aks update \
  --resource-group myResourceGroup \
  --name myAKSCluster \
  --cluster-autoscaler-profile ""
```

クラスターオートスケーラーのログと状態を取得する

クラスターオートスケーラーからログと状態の更新を取得して、オートスケーラーイベントの診断とデバッグに役立てることができます。 AKS では、ユーザーに代わってクラスターオートスケーラーが管理され、マネージドコントロールプレーンで実行されます。コントロールプレーンノードを有効にして、クラスターオートスケーラーからのログと操作を確認できます。

Azure CLI
Azure Portal

こちらの手順を使用して、Log Analytics にクラスターオートスケーラーのログをプッシュするようにリソースログのルールを設定します。 [ログ] のオプションを選択するときは、確実に cluster-autoscaler のボックスにチェックマークを入れてください。
クラスターの [ログ] セクションを選択します。
Log Analytics に次のサンプルクエリを入力します。
```
AzureDiagnostics
| where Category == "cluster-autoscaler"
```
CLI で、クラスターオートスケーラーのスケールアップがトリガーされないイベントを表示します。
```
kubectl get events --field-selector source=cluster-autoscaler,reason=NotTriggerScaleUp
```
CLI で、クラスターオートスケーラーの警告イベントを表示します。
```
kubectl get events --field-selector source=cluster-autoscaler,type=Warning
```
クラスターオートスケーラーにより、cluster-autoscaler-status という名前の configmap に正常性状態も書き込まれます。これらのログは、次の kubectl コマンドを使用して取得できます。
```
kubectl get configmap -n kube-system cluster-autoscaler-status -o yaml
```

詳細については、「Kubernetes/autoscaler GitHub プロジェクトの FAQ」を参照してください。

クラスター自動スケーラーメトリック

コントロールプレーンメトリック (プレビュー) を有効にすると、Prometheus 用の Azure Monitor マネージドサービスでクラスターオートスケーラーからログと操作を確認できます。

次のステップ

この記事では、AKS ノードの数を自動的にスケーリングする方法について説明します。また、ポッドの水平オートスケーラーを使用して、アプリケーションを実行するポッドの数を自動的に調整することもできます。ポッドの水平オートスケーラーの使用手順については、「AKS でのアプリケーションのスケーリング」を参照してください。

クラスターリソースの使用率を向上させ、他のポッドの CPU とメモリを解放する方法については、Vertical Pod Autoscaler に関するページを参照してください。

次の方法で共有

Azure Kubernetes Service (AKS) でのクラスターオートスケーラーの使用

開始する前に

AKS クラスターでクラスターオートスケーラーを使用する

新しいクラスターでクラスターオートスケーラーを有効にする

既存のクラスター上でクラスター自動スケーラーを有効にする

クラスターでクラスターオートスケーラーを無効にする

クラスターでクラスターオートスケーラーを再度有効にする

ノードプールでクラスターオートスケーラーを使用する

複数のノードプールでクラスターオートスケーラーを使用する

ノードプールでクラスターオートスケーラーを無効にする

ノードプールでクラスターオートスケーラーを再度有効にする

クラスターオートスケーラーの設定を更新する

クラスターオートスケーラープロファイルを使用する

クラスターオートスケーラープロファイルの設定

新しいクラスターに対してクラスターオートスケーラープロファイルを設定する

既存のクラスターに対してクラスターオートスケーラープロファイルを設定する

積極的なスケールダウン用にクラスターオートスケーラープロファイルを構成する

集中的なワークロード用にクラスターオートスケーラープロファイルを構成する

クラスターオートスケーラープロファイルを既定値にリセットする

クラスターオートスケーラーのログと状態を取得する

クラスター自動スケーラーメトリック

次のステップ

その他のリソース

次の方法で共有

Azure Kubernetes Service (AKS) でのクラスター オートスケーラーの使用

開始する前に

AKS クラスターでクラスター オートスケーラーを使用する

新しいクラスターでクラスター オートスケーラーを有効にする

既存のクラスター上でクラスター自動スケーラーを有効にする

クラスターでクラスター オートスケーラーを無効にする

クラスターでクラスター オートスケーラーを再度有効にする

ノード プールでクラスター オートスケーラーを使用する

複数のノード プールでクラスター オートスケーラーを使用する

ノード プールでクラスター オートスケーラーを無効にする

ノード プールでクラスター オートスケーラーを再度有効にする

クラスター オートスケーラーの設定を更新する

クラスター オートスケーラー プロファイルを使用する

クラスター オートスケーラー プロファイルの設定

新しいクラスターに対してクラスター オートスケーラー プロファイルを設定する

既存のクラスターに対してクラスター オートスケーラー プロファイルを設定する

積極的なスケールダウン用にクラスター オートスケーラー プロファイルを構成する

集中的なワークロード用にクラスター オートスケーラー プロファイルを構成する

クラスター オートスケーラー プロファイルを既定値にリセットする

クラスター オートスケーラーのログと状態を取得する

クラスター自動スケーラー メトリック

次のステップ

その他のリソース

Azure Kubernetes Service (AKS) でのクラスターオートスケーラーの使用

AKS クラスターでクラスターオートスケーラーを使用する

新しいクラスターでクラスターオートスケーラーを有効にする

クラスターでクラスターオートスケーラーを無効にする

クラスターでクラスターオートスケーラーを再度有効にする

ノードプールでクラスターオートスケーラーを使用する

複数のノードプールでクラスターオートスケーラーを使用する

ノードプールでクラスターオートスケーラーを無効にする

ノードプールでクラスターオートスケーラーを再度有効にする

クラスターオートスケーラーの設定を更新する

クラスターオートスケーラープロファイルを使用する

クラスターオートスケーラープロファイルの設定

新しいクラスターに対してクラスターオートスケーラープロファイルを設定する

既存のクラスターに対してクラスターオートスケーラープロファイルを設定する

積極的なスケールダウン用にクラスターオートスケーラープロファイルを構成する

集中的なワークロード用にクラスターオートスケーラープロファイルを構成する

クラスターオートスケーラープロファイルを既定値にリセットする

クラスターオートスケーラーのログと状態を取得する

クラスター自動スケーラーメトリック