Insights を使用して単一の Azure Stack HCI クラスターを監視する

適用対象: Azure Stack HCI バージョン 22H2

この記事では、Insights を使用して 1 つの Azure Stack HCI クラスターを監視する方法について説明します。 複数の Azure Stack HCI クラスターについては、「 Insights を使用した複数の Azure Stack HCI クラスターの監視を参照してください。

Insights は、Azure Stack HCI クラスターの監視をすぐに開始できる Azure Monitor の機能です。 クラスター、サーバー、仮想マシン、ストレージに関する主要なメトリック、正常性、使用状況の情報を表示できます。

重要

Azure Stack HCI クラスターを登録し、2023 年 11 月より前に Insights を構成した場合、Arc for Servers、VM Insights、Defender for Cloud、Sentinel など、 Azure Monitor Agent (AMA) を使用する特定の機能では、ログとイベント データが正しく収集されない可能性があります。 トラブルシューティングのガイダンスについては、「 2023 年 11 月より前に登録されたクラスターのトラブルシューティング 」セクションを参照してください。

メリット

Insights for Azure Stack HCI には、次の利点があります。

  • Azure によって管理されます。 Insights は Azure によって管理され、Azure portal を介してアクセスされるため、常に最新の状態が確保されます。 データベースや特別なソフトウェアのセットアップは必要ありません。

  • スケーラビリティ。 Insights では、複数のサブスクリプション間で 400 を超えるクラスター情報セットを同時に読み込む機能があります。 クラスター、ドメイン、または物理的な場所に制限はありません。

  • カスタマイズ性:個々のテナントに合わせてアプリケーションをさまざまな方法でカスタマイズできます。 Insight のエクスペリエンスは、Azure Monitor ブック テンプレートに基づいて構築されています。 これにより、ビューとクエリを変更したり、特定の制限に合わせてしきい値を変更または設定したり、これらのカスタマイズをブックに保存したりできます。 その後、ブック内のグラフを Azure ダッシュボードにピン留めできます。

Azure Stack HCI の Insights の構成

Insights を使用するための前提条件と設定は、使用している Azure Stack HCI のバージョンによって異なります。 特定のバージョンの Azure Stack HCI で Insights を使用する方法については、次のいずれかのタブを選択してください。

Azure Stack HCI バージョン 22H2 以降の Insights 機能では AMA が使用されます。AMA は、Azure Stack HCI バージョン 21H2 以前で使用されている従来の Microsoft Monitoring Agent (MMA) と比較して大きな利点を提供します。 これらの利点には、速度の向上、セキュリティの強化、優れたパフォーマンスなどがあります。 新しいノードを AMA にオンボードすることも、既存のノードをレガシ エージェントから AMA に移行することもできます。

AMA で Insights エクスペリエンスを利用するには、Azure Stack HCI システムをバージョン 22H2 以降にアップグレードすることをお勧めします。

Azure Stack HCI バージョン 22H2 の 2023 年 5 月の累積的な更新プログラム以降では、Insights for Azure Stack HCI を使用してオンプレミスの Azure Stack HCI システムを監視できます。

前提条件

Insights for Azure Stack HCI を使用するための前提条件を次に示します。

  • Azure Stack HCI クラスターは、Azure と Arc 対応を使用して登録する必要があります。 2021 年 6 月 15 日以降にクラスターを登録した場合は、既定でそうなっています。 それ以外の場合は、 Azure Arc 統合を有効にする必要があります。

  • クラスターには、Azure Stack HCI バージョン 22H2 と 2023 年 5 月の累積的な更新プログラム以降がインストールされている必要があります。

  • Azure リソースのマネージド ID を有効にする必要があります。 詳細については、「 Enabled 拡張管理を参照してください。

分析情報を有効にする

Insights を有効にすると、便利な正常性メトリックを提供することで、Log Analytics ワークスペースに現在関連付けられているすべての Azure Stack HCI クラスターを監視できます。 Insights は Azure Monitor エージェントをインストールし、Azure Stack HCI クラスターを監視するための data コレクション 規則 (DCR) を構成するのに役立ちます。

Azure portal からこの機能を有効にするには、次の手順のようにします。

  1. Azure portal で、Azure Stack HCI クラスター リソース ページを参照し、クラスターを選択します。 [機能] タブで、[分析情報] を選択します。

    [Insights] タイルを示すスクリーンショット。

  2. Insights ページで、Get Started を選択します。

    [作業の開始] ボタンを示すスクリーンショット。

    Note

    Get Started ボタンは、Azure Stack HCI バージョン 22H2 でのみ使用でき、2023 年 5 月の累積的な更新プログラム以降がインストールされ、マネージド ID が有効になった後にのみ使用できます。 それ以外の場合、このボタンは無効になります。

  3. Insights の構成 ページで、Data コレクション 規則ドロップダウンから既存の DCR を選択します。 DCR は、収集する必要があるイベント ログとパフォーマンス カウンターを指定し、Log Analytics ワークスペースに格納します。 Insights では、既定の DCR がまだ存在しない場合に作成されます。 Insights に対して有効になっている DCR のみが含まれます。

    [Insights の構成] ウィンドウを示すスクリーンショット。

  4. (省略可能)Insights の構成 ページで Create New を選択して、新しい DCR を作成することもできます。

    重要

    独自の DCR を作成しないことを強くお勧めします。 Insights によって作成された DCR には、その操作に必要な特別なデータ ストリームが含まれています。 この DCR を編集して、Windows イベントや Syslog イベントなど、さらに多くのデータを収集できます。 AMA インストールによって作成された DCR には、プレフィックス AzureStackHCI- DCR 名がアタッチされます。

    1. 新しいデータ収集規則 ページで、サブスクリプション、DCR 名、およびデータ収集エンドポイント (DCE) 名を指定します。 DCEs は、構成サービスにアクセスして、Azure Monitor エージェントの関連する DCR をフェッチするために使用されます。 DCE の詳細については、「Azure Monitor の Data コレクション エンドポイントを参照してください。

      Note

      エージェントでプライベート リンクを使用している場合は、DCEs を追加する必要があります。 AMA ネットワーク設定の詳細については、「 Define Azure Monitor Agent のネットワーク設定」を参照してください。

      [データ収集ルール] ウィンドウを示すスクリーンショット。

    2. [確認および作成] ボタンを選択します。

      監視対象外のクラスター用に DCR がまだ作成されていない場合は、パフォーマンス カウンターが有効で、Windows イベント ログ チャネルが有効になっている状態で DCR が作成されます。

  5. DCR 名、イベント ログの数、パフォーマンス カウンター、およびデータが格納されている Log Analytics ワークスペースの名前の概要を含む最終画面を確認します。 [セットアップ] を選択します。

    データ収集ルールのドロップダウン セレクターを示すスクリーンショット。

    設定を選択すると、Extensions ページにリダイレクトされ、エージェントのインストールの状態を確認できます。 Insights を構成すると、クラスターのすべてのノードに AMA が自動的にインストールされます。

  6. Azure Stack HCI クラスター リソース ページに移動し、クラスターを選択します。 Insights が Capabilities タブに Configured と表示されるようになりました。

    [Insights] タイルが [構成済み] であることを示すスクリーンショット。

データ収集ルール

Azure Monitor エージェントを使用してマシンで Insights を有効にする場合は、使用する DCR を指定する必要があります。 DCR の詳細については、「Azure Monitor でのデータ収集規則を参照してください。

オプション 説明
パフォーマンス カウンター オペレーティング システムから収集するデータ パフォーマンス カウンターを指定します。 このオプションは、すべてのコンピューターに必要です。 これらのパフォーマンス カウンターは、Insights ブックの視覚エフェクトを設定するために使用されます。 現在、Insights ブックでは 5 つのパフォーマンス カウンター ( Memory()\Available BytesNetwork Interface()\Bytes Total/secProcessor(_Total)\% Processor TimeRDMA Activity()\RDMA Inbound Bytes/sec、および RDMA Activity()\RDMA Outbound Bytes/sec
イベント ログ チャネル オペレーティング システムから収集する Windows イベント ログを指定します。 このオプションは、すべてのコンピューターに必要です。 Windows イベント ログは、Insights ブックの視覚エフェクトを設定するために使用されます。 現在、データは 2 つの Windows イベント ログ チャネル ( - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Log Analytics ワークスペース データを格納するワークスペース。 Insights を持つワークスペースのみが一覧表示されます。

イベント チャネル

Microsoft-windows-sddc-management/operationalおよびMicrosoft-windows-health/operational Windows イベント チャネルは、Log Analytics ワークスペースの Windows イベント ログに追加されます。

[データ ソースの追加] ウィンドウを示すスクリーンショット。

これらのログを収集することで、Insights は個々のサーバー、ドライブ、ボリューム、および VM の正常性状態を表示します。 既定では、5 つのパフォーマンス カウンターが追加されます。

パフォーマンス カウンター

既定では、次の 5 つのパフォーマンス カウンターが追加されます。

追加されたパフォーマンス カウンターを示すスクリーンショット。

次の表では、監視するパフォーマンス カウンターについて説明します。

パフォーマンス カウンター 説明
Memory(*)\Available Bytes Available Bytes は、プロセスへの割り当てまたはシステム使用にすぐに利用できる物理メモリの量 (バイト単位) です。
Network Interface(*)\Bytes Total/sec 各ネットワーク アダプターが 1 秒あたりに送信および受信したバイト数。フレーム文字も含みます。 Bytes Total/sec は、Bytes Received/sec と Bytes Sent/sec の合計値です。
Processor(_Total)% Processor Time すべてのプロセス スレッドで命令を実行するためにプロセッサを使用した経過時間の割合。
RDMA Activity(*)\RDMA Inbound Bytes/sec ネットワーク アダプターが RDMA 経由で受信したデータの 1 秒あたりの転送速度。
RDMA Activity(*)\RDMA Outbound Bytes/sec ネットワーク アダプターが RDMA 経由で送信したデータの 1 秒あたりの転送速度。

Insights を有効にすると、データの収集に最大 15 分かかることがあります。 プロセスが完了すると、左側のウィンドウの Insights メニューからクラスターの正常性を豊富に視覚化できます。

Insight の視覚化を示すスクリーンショット。

分析情報を無効にする

Insights を無効にするには、次の手順に従います。

  1. [機能] タブで、[分析情報] を選択します。

  2. [分析情報を無効にする] を選択します。

    [分析情報の無効化] ウィンドウを示すスクリーンショット。

Insights 機能を無効にすると、データ収集ルールとクラスターの関連付けが削除され、ヘルス サービスと SDDC 管理ログは収集されなくなりますが、既存のデータは削除されません。 そのデータを削除する場合は、DCR と Log Analytics ワークスペースに移動し、データを手動で削除します。

Insights の更新

[分析情報] タイルには、次の場合に更新が必要なメッセージが表示されます。

  • データ収集規則が変更されました。
  • Windows イベント ログから正常性イベントが削除されます。
  • Log Analytics ワークスペースの 5 つのパフォーマンス カウンターのいずれかが削除されます。

Insights を再度有効にするには、次の手順に従います。

  1. [機能] で [分析情報] タイルを選択します。

  2. [更新] を選択して、視覚化をもう一度表示します。

    Update Insights ウィンドウを示すスクリーンショット。

Microsoft Monitoring Agent からの移行

  1. Microsoft Monitoring Agent (MMA) から Azure Monitoring Agent (AMA) に移行するには、下にスクロールして Insights

    [AMA のインストール] ウィンドウを示すスクリーンショット。

  2. [AMA のインストール; を選択します。Insights の構成 ウィンドウが開きます。

    [データ収集ルール] ウィンドウを示すスクリーンショット。

  3. Enable Insights セクションで前述したように、データ収集ルールを選択または作成します。

移行中は、Azure Monitor エージェントと Microsoft Monitoring Agent 拡張機能の両方を同じコンピューターにインストールできます。 両方のエージェントを実行すると、データの重複やコスト増につながる可能性があります。 マシンに両方のエージェントがインストールされている場合、次のスクリーンショットに示すように、重複データを収集している可能性があることを示す警告が Azure portal に表示されます。

警告

Azure Monitor エージェントと Microsoft Monitoring Agent 拡張機能の両方を使用して 1 台のコンピューターから重複データを収集すると、Log Analytics ワークスペースに重複データを送信する場合のインジェスト コストが増える可能性があります。

データ重複の警告を示すスクリーンショット。

Microsoft Monitoring Agent 拡張機能は、使用しているコンピューターから自分で削除する必要があります。 この手順を実行する前に、コンピューターが Microsoft Monitoring Agent を必要とする他のソリューションに依存していないことを確認します。 MicrosoftMonitoringAgent が Log Analytics ワークスペースにまだ接続されていないことを確認したら、Extensions ページにリダイレクトすることでMicrosoftMonitoringAgentを手動で削除できます。

拡張機能の一覧を示すスクリーンショット。

トラブルシューティング

このセクションでは、Insights for Azure Stack HCI の使用に関する問題を解決するためのガイダンスを提供します。

2023 年 11 月より前に登録されたクラスターのトラブルシューティング

発行。 2023 年 11 月より前に登録されたクラスターでは、Arc for Servers、VM Insights、Container Insights、Defender for Cloud、Sentinel など、AMA on Azure Stack HCI を使用する機能によって、ログとイベント データが正しく収集されない可能性があります。

原因。 2023 年 11 月より前は、クラスター登録によってクラスター ID を使用するように AMA が構成されましたが、AMA on Azure Stack HCI を使用するサービスでは、適切なログ収集のためにクラスター ノードの ID が必要になりました。 この不一致により、これらのサービスからのログの不適切な収集が発生しました。

解決方法。 この問題に対処するために、代わりにサーバー ID を使用するように AMA の HCI クラスター登録を変更しました。 この変更を実装するには、2023 年 11 月より前に登録されているクラスターで次の手順を実行します。

  1. クラスターの登録を修復します。 「 Repair クラスターの登録を参照してください。
  2. AMA を修復します。 AMA の を参照してください
  3. Azure Stack HCI の分析情報を再構成します。 Azure Stack HCI の分析情報の構成を参照してください。

Azure portal の [Insights for Azure Stack HCI] ページでは、AMA 構成の変更が自動的に検出され、ページの上部にバナーが表示され、AMA に依存するサービスを引き続き使用するために必要なアクションを実行するように誘導されます。

Insights を再構成するためのバナーを示すスクリーンショット。

クラスターの登録を修復する

クラスターの登録を修復するには、次の手順に従います。

  1. クラスター ノードに、最新の Az.StackHCI PowerShell モジュールをインストールします。 latestversionを最新のAz.StackHCIバージョン番号に置き換えます。

    Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force 
    
  2. 修復登録コマンドを実行して regkey を削除します。

    Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration 
    
Azure Stack HCI の AMA を修復する

AMA を修復するには、次のいずれかのオプションを選択します。

  • オプション 1: AMA をアンインストールする

    AMA が既に更新されている場合は、アンインストールします。 AMA をアンインストールするには、次の手順に従います。

    1. Azure portal で、Azure Stack HCI クラスターの Extensions ページに移動します。

    2. AzureMonitorWindowsAgent のチェック ボックスをオンにし、Uninstall を選択します。

      AMA をアンインストールする AzureMonitorWindowsAgent を示すスクリーンショット。

  • オプション 2: AMA を更新する

    AMA を更新するには、次の手順に従います。

    1. Azure portal で、Azure Stack HCI クラスターの Extensions ページに移動します。

    2. AzureMonitorWindowsAgent のチェック ボックスをオンにし自動アップグレードを有効にするを選択します (まだ行っていない場合)。

      自動アップグレードを有効にする AzureMonitorWindowsAgent を示すスクリーンショット。

  • オプション 3: AMA を再起動する

    AMA を再起動するには、すべてのクラスター ノードで次の手順に従います。

    1. AMA を無効にするには、次のコマンドを実行します。

      cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number>
      AzureMonitorAgentExtension.exe disable
      
    2. 実行可能ファイルが完了し、すべての AMA プロセスが停止したら、次のコマンドを実行してエージェントを再起動します。

      AzureMonitorAgentExtension.exe enable
      
  • オプション 4: クラスター ノードを再起動する

Azure Stack HCI の分析情報を再構成する

Azure Stack HCI の Insights を再構成するには、次の手順に従います。

  1. 次のスクリーンショットに示すように、Azure Portal の Azure Stack HCI クラスターの [Insights] ページの上部にバナーが表示されます。これは、Insights をもう一度構成し、DCR をクラスター ノードに関連付けるのに役立ちます。 バナーを確認し、 Configure Insights を選択します。

    [分析情報の構成] ボタンを示すスクリーンショット。

  2. DCR を再構成します。 この記事で説明されているように、指示に従って Insights を構成します。 Azure Stack HCI の構成分析情報を参照してください。

    [新しいデータ収集ルール] ページのスクリーンショット。

データが入力されていない空白のブック ページのトラブルシューティング

発行。 次のスクリーンショットに示すように、空白の Workbooks ページにデータが入力されていません。

空白の [ブック] ページのスクリーンショット。

考えられる原因。 この問題には、最近の Insights の構成、2023 年 11 月より前に登録されたクラスターの不完全なトラブルシューティング手順、関連する DCR が正しく構成されていないなど、いくつかの原因が考えられます。

解決方法。 この問題をトラブルシューティングするには、次の手順を順番に実行します。

  1. 最近 Insights を構成した場合は、AMA がデータを収集するまで最大 1 時間待ちます。
  2. 待機した後もデータがまだない場合は、「 2023 年 11 月 前に登録されたクラスターのトラブルシューティング」セクションに記載されているすべての手順を完了していることを確認します。
  3. 関連付けられている DCR の構成を確認します。 「 Data コレクション ルール 」セクションで説明されているように、イベント チャネルとパフォーマンス カウンターが、関連付けられている DCR にデータ ソースとして追加されていることを確認します。
  4. 上記の手順を実行しても問題が解決せず、データが表示されない場合は、カスタマー サポートにお問い合わせください。

詳細なトラブルシューティング ガイダンスについては、「 Azure Monitor エージェントのトラブルシューティング ガイダンスを参照してください。

分析情報の視覚化

分析情報を有効にすると、次の表に、すべてのリソースに関する詳細が示されます。

正常性

クラスターの正常性エラーを提供します。

メトリック 説明 出荷単位
障害 正常性エラーの簡単な説明。 リンクをクリックすると、サイド パネルが開き、詳細が表示されます。 ユニットなし PoolCapacityThresholdExceeded
障害が発生しているリソースの種類 エラーが発生したリソースの種類。 ユニットなし StoragePool
障害が発生しているリソース ID 正常性エラーが発生したリソースの一意の ID。 Unique ID {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
重要度 エラーの重大度は、警告またはクリティカルである可能性があります。 ユニットなし 警告
障害が最初に発生した時刻 サーバーの最終更新時のタイムスタンプ。 日時 2022/4/9、午後 12:15:42

[サーバー]

メトリック 説明 出荷単位
サーバー クラスター内のサーバーの名前。 ユニットなし VM-1
最終更新日 サーバーが最後に更新された日時。 日時 2022/4/9、午後 12:15:42
状態 クラスター内のサーバー リソースの正常性。 正常、警告、クリティカル、またはその他があります Healthy
CPU 使用率 プロセスが CPU を使用した時間の割合。 パーセント 56%
メモリ使用量 サーバー プロセスのメモリ使用量は、カウンター Process\Private Bytes にメモリ マップデータのサイズを加えた値と同じです。 パーセント 16%
論理プロセッサ 論理プロセッサ数 カウント 2
CPU CPU の数。 カウント 2
Uptime マシン (特にコンピューター) が動作している時間。 Timespan 2.609 時間。
サイト サーバーが属するサイトの名前。 サイト名 SiteA
ドメイン名 サーバーが属するローカル ドメイン。 ユニットなし Contoso.local

仮想マシン

クラスター内のすべての仮想マシンの状態を提供します。 VM の状態は、実行中、停止済み、失敗、またはその他 (不明、開始、スナップショット、保存、停止、一時停止、再開、一時停止、中断) のいずれかになります。

メトリック 説明 出荷単位
サーバー サーバーの名前。 ユニットなし Sample-VM-1
最終更新日時 これにより、サーバーが最後に更新された日時が表示されます。 日時 2022/4/9、午後 12:24:02
[Total VMs] (VM の総数) サーバー ノード内の VM の数。 カウント 0 /0 実行中
実行中 サーバー ノードで実行されている VM の数。 カウント 2
Stopped サーバー ノードで停止されている VM の数。 カウント 3
Failed サーバー ノードで失敗している VM の数。 カウント 2
その他 VM が次のいずれかの状態 (不明、開始、スナップショット、保存、停止、一時停止、再開、一時停止、中断) の場合、"その他" と見なされます。 カウント 2

Storage

次の表に、クラスター内のボリュームとドライブの正常性を示します。

メトリック 説明 出荷単位
Volumes ボリュームの名前 ユニットなし ClusterPerformanceHistory
最終更新日 ストレージが最後に更新された日時。 日時 2022/4/14、午後 2:58:55
状態 ボリュームの状態。 正常、警告、クリティカル、またはその他。 Healthy
合計容量 レポート期間中のデバイスの合計容量 (バイト単位)。 バイト 2.5 GB
対応できるキャパシティ レポート期間中の使用可能な容量 (バイト単位)。 バイト 20B
Iops 1 秒あたりの入出力処理。 1 秒あたり 45/s
スループット Application Gateway で処理された 1 秒あたりのバイト数。 バイト/秒 5B/s
Latency I/O 要求の完了にかかる時間。 Second 0.0016 s
回復性 失敗から復旧する容量。 データの可用性を最大化します。 ユニットなし 3 方向ミラー
Deduplication (重複除去) ディスクに格納する必要があるデータの物理バイト数を減らすプロセス。 使用可能か否か はい/いいえ
ファイル システム ファイルシステムの型。 ユニットなし ReFS

Azure Monitor の価格

監視の視覚化を有効にすると、ログは次の場所から収集されます。

  • 正常性管理 (Microsoft-windows-health/operational)。
  • SDDC 管理 (Microsoft-Windows-SDDC-Management/Operational; イベント ID: 3000、3001、3002、3003、3004)。

取り込まれたデータの量と Log Analytics ワークスペースのデータ保持設定に基づいて課金されます。

Azure Monitor は従量課金制であり、課金アカウントごとに毎月最初の 5 GB は無料です。 価格は、使用している Azure のリージョンなど、複数の要因によって異なるため、最新の価格計算については、Azure Monitor 価格計算ツールを使用してください。

次のステップ