Azure Stack Hub でのスケール ユニットのノード操作
この記事では、スケール ユニットの状態を確認する方法について説明します。 ユニットのノードは、表示することができます。 電源オン、電源オフ、シャットダウン、ドレイン、再開、修復などのノード アクションを実行できます。 通常、これらのノード アクションは、パーツのフィールド交換時に使用されるほか、ノードの復旧の手段として使用されます。
重要
この記事で説明されているすべてのノード アクションは、一度に 1 つのノードを対象にするようにしてください。
ノードの状態を表示する
管理者ポータルで、スケール ユニットとその関連するノードの状態を表示できます。
スケール ユニットの状態を表示するには、以下のようにします。
[Region management](リージョンの管理) タイルで、リージョン名をクリックします。
左側の [インフラストラクチャ リソース] で、 [スケール ユニット] を選択します。
結果画面で、スケール ユニットを選択します。
左側の [全般] で、 [ノード] を選択します。
次の情報を確認します。
- 個々のノードの一覧。
- 動作状態 (以下の一覧を参照)。
- 電源の状態 (実行中または停止)。
- サーバー モデル。
- ベースボード管理コントローラー (BMC) の IP アドレス。
- コアの合計数。
- メモリの総量。
ノード操作によって、予期されるアラートが管理者ポータルで発生することもあります。
ノードの動作状態
Status | 説明 |
---|---|
実行中 | ノードは、アクティブにスケール ユニットに参加しています。 |
停止済み | ノードは利用不可です。 |
追加中 | ノードは、アクティブにスケール ユニットに追加されています。 |
修復中 | ノードは現在、アクティブに修復されています。 |
メンテナンス | ノードは一時停止され、アクティブなユーザー ワークロードは実行されていません。 |
修復が必要 | ノードの修復を必要とするエラーが検出されました。 |
Azure Stack Hub に [追加中] という状態が表示される
Azure Stack Hub では、ドレイン、再開、修復、シャットダウン、開始などの操作が実行された後に、操作ノードの状態が [追加中] と表示されることがあります。 これは、操作後に、ファブリック リソース プロバイダー ロールのキャッシュが更新されなかった場合に発生する可能性があります。
次の手順を適用する前に、現在進行中の操作がないことを確認してください。 お使いの環境に合わせてエンドポイントを更新します。
PowerShell を開き、Azure Stack Hub 環境を追加します。 これを行うには、お使いのコンピューターに Azure Stack Hub PowerShell がインストールされている必要があります。
Add-AzEnvironment -Name AzureStack -ARMEndpoint https://adminmanagement.local.azurestack.external Connect-AzAccount -Environment AzureStack
次のコマンドを実行して、ファブリック リソース プロバイダー ロールを再起動します。
Restart-AzsInfrastructureRole -Name FabricResourceProvider
影響を受けているスケール ユニット ノードの動作状態が、 [実行中] に変更されたことを確認します。 管理者ポータルまたは次の PowerShell コマンドを使用できます。
Get-AzsScaleUnitNode |ft name,scaleunitnodestatus,powerstate
ノードの動作状態がまだ [追加中] と表示される場合は、続いてサポート インシデントを開いてください。
スケール ユニットのノード操作
スケール ユニットのノードに関する情報を表示しているときに、次のようなノード操作を行うこともできます。
- 開始と停止 (現在の電源状態による)。
- 無効化と再開 (動作状態による)。
- 修復。
- シャットダウン。
ノードの操作状態によって、使用可能なオプションが決まります。
Azure Stack Hub PowerShell モジュールをインストールする必要があります。 これらのコマンドレットは Azs.Fabric.Admin モジュールに存在します。 PowerShell for Azure Stack Hub のインストールまたはインストールの確認については、「PowerShell for Azure Stack Hub をインストールする」を参照してください。
Stop
停止アクションは、ノードをオフにします。 これは、電源ボタンを押した場合と同じです。 オペレーティング システムにシャットダウン信号は送られません。 計画されている停止操作の場合は、最初に必ずシャットダウン操作を行ってください。
この操作は通常、ノードが要求に応答しなくなったときに使用されます。
停止アクションを実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Stop-AzsScaleUnitNode -Location <RegionName> -Name <NodeName>
まれなケースで、停止アクションが機能しない場合には、操作を再試行し、2 度目も失敗するようであれば、代わりに BMC Web インターフェイスを使用してください。
詳細については、「Stop-AzsScaleUnitNode」を参照してください。
[開始]
開始操作は、ノードをオンにします。 これは、電源ボタンを押した場合と同じです。
開始アクションを実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Start-AzsScaleUnitNode -Location <RegionName> -Name <NodeName>
めったにありませんが、開始操作が機能しない場合は、操作を再試行します。 2 回目も失敗した場合は、代わりに BMC Web インターフェイスを使用します。
詳細については、「Start-AzsScaleUnitNode」を参照してください。
ドレイン
ドレイン操作は、すべてのアクティブなワークロードを、その特定のスケール ユニット内の残りのノードに移動します。
この操作は通常、ノード全体の交換などの、パーツの現場交換中に使用されます。
重要
ノードのドレイン操作は、必ず、ユーザーに通知済みの計画されたメンテナンス期間中に行うようにしてください。 状況によっては、アクティブなワークロードが中断されることがあります。
ドレイン アクションを実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Disable-AzsScaleUnitNode -Location <RegionName> -Name <NodeName>
詳細については、「Disable-AzsScaleUnitNode」を参照してください。
Resume
再開アクションは、無効化されたノードを再開し、ワークロードのアクティブな配置対象としてマークします。 ノードで実行されていた以前のワークロードはフェールバックされません。 (ノード上でドレイン操作を使用する場合は、必ず電源をオフにしてください。ノードの電源をオンに戻すと、ワークロード配置に対してアクティブとしてマークされません。準備ができたら、再開アクションを使用してノードをアクティブとしてマークする必要があります。)
再開アクションを実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Enable-AzsScaleUnitNode -Location <RegionName> -Name <NodeName>
詳細については、「Enable-AzsScaleUnitNode」を参照してください。
修復
注意事項
この記事で説明している操作を成功させるには、ファームウェアの平準化が重要です。 この手順を行わないと、システムの不安定化、パフォーマンスの低下、セキュリティ上の脅威、または Azure Stack Hub オートメーションによるオペレーティング システムのデプロイ時に失敗を引き起こす可能性があります。 ハードウェアを交換する場合は、ハードウェア パートナーのドキュメントを必ず参照して、適用されるファームウェアが、Azure Stack Hub 管理者ポータルに表示されている OEM バージョンと一致していることを確認してください。
詳細およびパートナー ドキュメントへのリンクについては、ハードウェア コンポーネントの交換に関する記事を参照してください。
修復アクションは、ノードを修復します。 次のシナリオのいずれかに対してのみ使用します。
- ノードの完全交換 (新しいデータ ディスクあり、またはなし)。
- ハードウェア コンポーネントの障害と交換の後 (フィールド交換可能装置 (FRU) ドキュメントで推奨されている場合)。
重要
ノードまたは個々のハードウェア コンポーネントを置き換える必要がある場合の正確な手順については、OEM ハードウェア ベンダーの FRU ドキュメントを参照してください。 FRU ドキュメントでは、ハードウェア コンポーネントを交換した後、修復操作を実行する必要があるかどうかを指定します。
修復操作を実行する場合、BMC の IP アドレスを指定する必要があります。
修復アクションを実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Repair-AzsScaleUnitNode -Location <RegionName> -Name <NodeName> -BMCIPv4Address <BMCIPv4Address>
Shutdown
シャットダウン操作では最初に、すべてのアクティブなワークロードを、同じスケール ユニット内の残りのノードに移動します。 操作では次に、スケール ユニット ノードを適切にシャットダウンします。
シャットダウンされたノードの開始後は、再開操作を実行する必要があります。 ノードで実行されていた以前のワークロードはフェールバックされません。
シャットダウン操作に失敗する場合は、シャットダウン操作の前にドレイン操作を試行します。
シャットダウン操作を実行するには、管理者特権の PowerShell プロンプトを開き、次のコマンドレットを実行します。
Stop-AzsScaleUnitNode -Location <RegionName> -Name <NodeName> -Shutdown