Azure Stack Edge Pro GPU デバイスでのクラスター監視

適用対象:Yes for Pro GPU SKUAzure Stack Edge Pro - GPUAzure Stack Edge Pro 2

この記事では、クラスター監視の要件、セットアップ、管理など、Azure Stack Edge デバイスでのクラスター監視の概要について説明します。

クラスター クォーラムと監視について

Windows Server フェールオーバー クラスタリングでは、障害が発生した場合に Windows Server クラスターをオンラインの状態で維持するために、クォーラムを維持する必要があります。 Windows Server クラスター内のノードで障害が発生した場合は、残りのノードで、クラスターの過半数がそれらで構成されていてオンラインの状態が維持されることを確認する必要があります。

ただし、過半数の概念は、ノード数が奇数のクラスターにのみ存在します。 クラスター内のノード数が偶数の場合、システムでは投票の総数を奇数にする方法が必要となります。 ここで、クラスター監視の役割が重要になります。 クラスター監視には投票が与えられるため、障害が発生した場合に、(当初はノード数が偶数であった) クラスター内の投票の総数が奇数になります。

クラスター クォーラムの詳細については、クラスター クォーラムの概要に関する記事を参照してください。

Azure Stack Edge のクラスター クォーラムと監視

Windows Server フェールオーバー クラスタリングは、2 ノードの Azure Stack Edge デバイスに実装されます。 クォーラムは、障害が発生した場合にデバイスでオンラインの状態を維持するために、Azure Stack Edge クラスター上で常に維持されます。 ノードの 1 つで障害が発生した場合は、残りのノードの過半数で、クラスターがオンラインの状態で維持されることを確認する必要があります。 過半数の概念は、ノード数が奇数のクラスターにのみ存在します。

2 つのノードを持つ Azure Stack Edge クラスターの場合、1 つのノードで障害が発生すると、クラスター監視によって 3 番目の投票が提供され、クラスターでオンラインの状態が維持されます (クラスターは 2/3 の投票 (過半数) のままであるため)。

Azure Stack Edge でのクラスター監視

2 ノードの Azure Stack Edge クラスターでは、クラスター監視が必要となります。Azure Stack Edge ノードの 1 つで障害が発生した場合に、クラスター監視で 3 番目の投票を行い、クラスターをオンラインの状態で維持するためです (クラスターは 2/3 の投票 (過半数) のままであるため)。 それに対して、両方のデバイス ノードで同時に障害が発生した場合、または最初の Azure Stack Edge ノードで障害が発生した後に 2 番目のノードで障害が発生した場合、過半数の投票は行われず、クラスターはオフラインになります。

このシステムでは、両方の Azure Stack Edge ノードに相互の接続とクラスター監視がある必要があります。 クラスター監視がオフラインになった場合、またはいずれかのデバイス ノードとの接続が失われた場合、1 つの Azure Stack Edge ノードで障害が発生した場合の投票の総数は偶数になります。 この場合、Windows Server フェールオーバー クラスタリングでは、(投票の総数を奇数にするために) 投票を行わないデバイス ノードを任意に選択して、修復を試みます。 この場合、障害が発生した Azure Stack Edge ノードが Azure Stack Edge クラスターで 1 つの投票を獲得したノードであると、過半数の投票は行われず、クラスターはオフラインになります。 これが、1 つのデバイス ノードで障害が発生した場合に Azure Stack Edge クラスターがオフラインになるのを防ぐためには、クラスター監視がオンラインで、両方のデバイス ノードに接続されていることが重要である理由です。

監視の要件

クラスター監視は、クラウドまたはローカルで実行することができます。 それぞれの場合に、監視で満たされている必要がある特定の要件があります。

  • クラウド監視の要件

    • クラスター内の両方のデバイス ノードに、信頼できるインターネット接続がある必要がある。
    • デバイスで HTTPS の既定のポート 443 が開いていることを確認する。クラウド監視では、このポートを使用して Azure BLOB サービスとの送信通信を確立するためです。
  • ローカル監視の要件

    • SMB 2.0 ファイル共有は、オンプレミスに作成されるが、デバイスのノードには作成されない。
    • ファイル共有に少なくとも 5 MB の空き領域が存在する。
    • デバイスからネットワーク経由でファイル共有にアクセスできる。

クラスター監視のセットアップと構成

監視で独立した投票を行うには、デバイス クラスター内の Azure Stack Edge の外部で常にホストされている必要があります。 監視は、次のいずれかの方法でデプロイできます。

  • クラウド監視 - Azure Stack Edge クラスター上の両方のノードが Azure に接続されている場合は、クラウド監視を使用します。 クラウド監視をセットアップするには、クラウドの Azure Storage アカウントを使用し、デバイスのローカル UI を使用して監視を構成します。

    監視の高可用性を実現するために、冗長な接続を使用してクラウド監視をデプロイすることをお勧めします。 詳細については、ローカル UI を使用したクラウド監視のセットアップに関する記事を参照してください。

  • ローカル監視 - 両方のノードが Azure に接続されていない場合、または接続が散発的である場合は、ローカル監視を使用します。 他のマシンおよびファイル共有のある IT 環境の場合は、ファイル共有監視を使用します。 ローカル監視をセットアップするには、デバイスがデプロイされているネットワーク内のローカル サーバーで SMB ファイル共有を使用し、ローカル UI を使用してサーバーへのファイル共有パスを構成します。

    高可用性が実現される方法で監視をデプロイすることをお勧めします。 たとえば、ファイル サーバーが実行されているスイッチを使用して、ファイル共有をホストできます。 詳細については、ローカル UI を使用したローカル監視のセットアップに関する記事を参照してください。

次のステップ