事業継続とディザスター リカバリー

障害には、ハードウェア障害、自然災害、またはソフトウェア障害があります。 障害に備え、障害から復旧するプロセスのことを、ディザスター リカバリー (DR) と呼びます。 この記事では、Azure Operator Insights の事業継続とディザスター リカバリー (BCDR) を達成するために、推奨されるプラクティスについて説明します。

BCDR 戦略には、可用性ゾーン冗長とユーザー管理の回復が含まれます。

コントロール プレーン

Azure Operator Insights のコントロール プレーンには、ソフトウェア エラーと可用性ゾーンの障害の両方に対しての回復性があります。 これらの障害モードが、データ製品を作成および管理する機能に影響を与えることはありません。

このコントロール プレーンは、リージョン冗長ではありません。 Azure リージョンが停止している間は、そのリージョンに新しいデータ製品を作成したり、既存のデータ製品をアクセスおよび管理したりすることはできません。 リージョンが停止から復旧したら、既存のデータ製品に再度アクセスして管理できます。

データ プレーン

データ製品には、ソフトウェアまたはハードウェアの障害に対する回復性があります。 たとえば、ソフトウェアのバグが原因でサービスがクラッシュしたり、ハードウェア障害によってエンリッチメント クエリのコンピューティング リソースが失われたりした場合、サービスは自動的に復旧します。 唯一の影響は、新しく取り込まれたデータがデータ製品のストレージ エンドポイントと KQL 消費 URL で利用できるようになるのに、若干の遅延が生じるということです。

ゾーン冗長性

データ製品では、ゾーン冗長はサポートされていません。 可用性ゾーンに障害が発生すると、データ製品のインジェスト、BLOB/DFS、KQL/SQL API はすべて使用できなくなり、またダッシュボードは機能しなくなります。 既に取り込み済みのデータの変換は、一時停止されます。 以前に取り込まれたデータが失われることはありません。 可用性ゾーンが復旧すると、処理は再開されます。

可用性ゾーンの停止中に生成されたデータがどのようになるかは、インジェスト エージェントのビヘイビアーによって異なります。

  • インジェスト エージェントがデータをバッファーしており、可用性ゾーンの復旧時に再送信するのであれば、データは失われません。 Azure Operator Insights では、変換バックログの処理完了に、一定の時間がかかる場合があります。
  • これら以外の場合には、データは失われます。

障害復旧

Azure Operator Insights には、本来、リージョン冗長は備わっていません。 リージョンの停止は、可用性ゾーンの障害と同じ形で、データ製品に影響を与えます。 Microsoft では、Azure リージョン全体の障害を処理することが必要なお客様をサポートするための、推奨事項と機能を用意しています。

ユーザー管理の冗長性

データ製品をアクティブ/アクティブ モードでデプロイすることで、最大限の冗長性を確保できます。 所望のバックアップ Azure リージョンに 2 つ目のデータ製品をデプロイし、両方のデータ製品に同時にデータをフォークするように、インジェスト エージェントを構成します。 バックアップのデータ製品は、プライマリ リージョンでの障害の影響を受けません。 リージョンの停止中は、バックアップのデータ製品をデータ ソースとして使用しているダッシュボードを参照します。 このアーキテクチャでは、ソリューションのコストが 2 倍になります。

代替としては、アクティブ/パッシブ モードを使用することもできます。 バックアップ Azure リージョンに 2 つ目のデータ製品をデプロイし、インジェスト エージェントは、プライマリのデータ製品に送信するように構成します。 リージョンの停止時に、インジェスト エージェントを再構成して、停止状態の間はデータをバックアップのデータ製品に送信するようにします。 このアーキテクチャでは、 (インジェスト エージェントを再構成した時点からの) 停止期間中に作成されたデータへのフル アクセスが提供されますが、停止状態の間は、その前に取り込まれたデータにアクセスできません。 このアーキテクチャでは、2 つ目のデータ製品に対する少額のインフラストラクチャ料金が必要ですが、追加のデータ処理料金は発生しません。