ディザスターリカバリーガイダンス - Azure SQL Managed Instance

[アーティクル]
07/01/2024

Azure SQL Managed Instance は、ミッションクリティカルで 常に利用できるようになっている必要がある さまざまなアプリケーションをサポートするために、業界トップの 99.99% 以上の高可用性を保証しています。また、Azure SQL Managed Instance には、リージョンで障害が発生した場合にディザスターリカバリーを迅速に実行するための、ターンキーのビジネス継続性機能を用意する機能も備わっています。この記事には、アプリケーションのデプロイ前に確認する重要な情報が含まれています。

高可用性を継続的に提供することに努めてはいますが、Azure SQL Managed Instance サービスの障害でデータベースが利用できなくなり、アプリケーションへの影響が出ることがあります。サービスの監視によって、接続エラー、障害、パフォーマンスの問題を広範囲にわたって引き起こす問題が検出されると、ユーザーに逐次情報を提供するために、サービスで自動的に停止が宣言されます。

サービス停止

Azure SQL Managed Instance サービスが停止した場合は、次の場所でその停止に関連する追加の詳細を確認できます。

Azure portal のバナー

サブスクリプションが影響を受けることが確認された場合は、Azure portal の [通知] にサービスに問題があることを知らせる停止アラートが発生します。
[ヘルプとサポート] または [サポートとトラブルシューティング]

[ヘルプとサポート] または [サポートとトラブルシューティング] からサポートチケットを作成すると、リソースに影響を与える問題に関する情報が表示されます。影響の詳細と概要を確認するには、[View outage details] (停止の詳細を確認する) を選択します。アラートは [新しいサポートリクエスト] ページでも確認できます。
サービス正常性

Azure portal の [サービス正常性] ページでは、Azure データセンターの全体的な状態に関する情報を確認できます。 Azure portal の検索バーで「サービス正常性」と検索し、[有効なイベント] カテゴリの [サービスの問題] を確認します。また、[ヘルプ] メニューの任意のリソースの [リソース正常性] ページで、個々のリソースの正常性を確認することもできます。次に示すのは [サービス正常性] ページのサンプルスクリーンショットで、東南アジアでのアクティブなサービスの問題に関する情報が表示されています。
電子メール通知

アラートが設定されている場合、サービスの停止によりサブスクリプションとリソースが影響を受けると、azure-noreply@microsoft.com からメール通知が届きます。メールの本文は一般的に、"アクティビティログアラート ... が Azure サブスクリプション ... のサービスの問題によってトリガーされました" で始まります。サービス正常性のアラートの詳細については、「Azure portal を使用して Azure サービスの通知でアクティビティログアラートを受け取る」を参照してください。

停止中にディザスターリカバリーを開始するタイミング

アプリケーションリソースに影響を与えるサービスの停止が発生した場合は、次の一連のアクションを実施することを検討してください。

Azure チームはできるだけ早くサービスが利用できるようになるように取り組みますが、根本原因によってはしばらくかかることがあります。長いダウンタイムを許容できるアプリケーションの場合は、回復が完了するのを待つだけで済みます。この場合、ユーザーによる操作は必要ありません。 [ヘルプ] メニューの任意のリソースの [リソース正常性] ページで、個々のリソースの正常性を確認します。停止に関する更新情報と最新情報については、[リソース正常性] ページを参照してください。リージョンの回復後に、アプリケーションの可用性が復元されます。
別の Azure リージョンへの復旧には、アプリケーション接続文字列の変更や DNS リダイレクトの使用が必要になる可能性があり、永続的なデータ損失が発生する場合があります。したがって、ディザスターリカバリーは、停止期間がアプリケーションの目標復旧時間 (RTO) に迫っている場合にのみ実行してください。アプリケーションを運用環境にデプロイする際には、アプリケーションの正常性を定期的に監視し、アプリケーション層からデータベースへの接続エラーが長引いている場合にのみ復旧が保証されることを表明する必要があります。ダウンタイムに対するアプリケーションの許容度とビジネス上の責任に応じて、サービスが復旧するまで待つか、ディザスターリカバリーを開始するかどうかを自分で決めることができます。

障害復旧ガイダンス

あるリージョンの Azure SQL Managed Instance の障害が長期間にわたって対処されず、アプリケーションのサービスレベルアグリーメント (SLA) に影響が出ている場合は、次の手順を検討してください。

geo レプリケーションされたセカンダリインスタンスへのフェールオーバー (データ損失なし)

フェールオーバーグループが有効になっている場合は、Azure portal でプライマリおよびセカンダリインスタンスのリソースの状態がオンラインになっていることを確認します。その場合、プライマリインスタンスとセカンダリインスタンスの両方のデータプレーンは正常です。

次を使用して、セカンダリリージョンへのフェールオーバーグループのフェールオーバーを開始します。

Note

フェールオーバーでは、ロールを切り替える前に完全なデータ同期が必要であり、データが失われることはありません。サービスの停止の種類によっては、データが失われないフェールオーバーが成功するという保証はありませんが、最初の復旧オプションとして試してみる価値はあります。

geo レプリケーションされたセカンダリインスタンスへの強制フェールオーバー (データ損失が発生する可能性あり)

フェールオーバーが円滑に完了せずにエラーが発生するか、プライマリデータベースのステータスがオンラインでない 場合、セカンダリリージョンへのデータ損失の可能性を伴う強制フェールオーバーを慎重に検討してください。

強制フェールオーバーを開始するには、次のものを使用します。

Azure portal。ただし、強制フェールオーバーを選択します。

PowerShell。ただし --allow-data-loss を使用します。

Azure CLI。ただし、-AllowDataLoss を使用します。

geo リストア

フェールオーバーグループを有効にしていない場合は、最後の手段として geo リストアを使用して障害から復旧できます。 geo リストアには、geo レプリケートされたバックアップがソースとして使われます。 geo レプリケートされた最新のバックアップから任意の Azure リージョン内の任意のインスタンスでデータベースを復元することができます。障害によってインスタンスまたは全体のリージョンデータセンターにアクセスできない場合でも、geo リストアを要求できます。

Azure CLI、Azure portal、PowerShell、または REST API による geo リストアの詳細については、「geo リストア」をご覧ください。

復旧後のデータベースの構成

geo フェールオーバーまたは geo リストアを使用して停止から復旧する場合は、通常のアプリケーション機能を再開できるように、新しいインスタンスへ接続が正しく構成されていることを確認する必要があります。復旧後のデータベースをすぐ運用できるようにするためのタスクのチェックリストを次に示します。

重要

ディザスターリカバリー戦略の定期的な訓練を実施して、アプリケーションの許容度と、復旧手順のすべての運用面を確認することをお勧めします。アプリケーションインフラストラクチャの他のレイヤーでは、再構成が必要になる場合があります。回復性があるアーキテクチャの手順の詳細については、「高可用性とディザスターリカバリーのチェックリスト」を確認してください。

接続文字列を更新する

geo リストアを使用する場合は、通常のアプリケーション機能を再開できるように、新しいデータベースへの接続を正しく構成する必要があります。復旧後のデータベースは別のインスタンスにあるため、そのサーバーを示すようにアプリケーションの接続文字列を更新する必要があります。接続文字列の変更の詳細については、接続ライブラリの適切な開発言語を参照してください。

フェールオーバーグループを使用して停止から復旧し、アプリケーション接続文字列で読み取り/書き込みリスナーと読み取り専用リスナーを使用している場合、接続は新しいプライマリに自動的にリダイレクトされるため、それ以上の操作は必要ありません。

ファイアウォール規則の構成

セカンダリインスタンス用に構成された NSG とルートテーブルの規則を、プライマリインスタンスで構成されているものと一致させてください。詳細については、「サービス支援サブネット構成」を確認してください。

ログインとデータベースユーザーを構成する

セカンダリインスタンスの master データベースに必要なログインを作成し、該当する場合は、これらのログインに master データベースでの適切なアクセス許可があることを確認します。

テレメトリアラートを設定する

既存のアラートルール設定が更新され、新しいプライマリインスタンスにマップされていることを確認します。データベースのアラートルールの詳細については、「アラート通知の受信」および「サービス正常性を追跡する」を参照してください。

監査を有効にする

プライマリインスタンスで監査が構成されている場合は、セカンダリインスタンスで同じものを適用します。詳細については、「Azure SQL Managed Instance での Azure SQL 監査」をご覧ください。

関連するコンテンツ

詳細については、次を参照してください。

継続性のシナリオ。

自動バックアップ

サービスによって開始されたバックアップからデータベースを復元します。

フェールオーバーグループ。

障害復旧ガイダンス

高可用性とディザスターリカバリーチェックリスト

ゾーン冗長データベース

次の方法で共有

ディザスターリカバリーガイダンス - Azure SQL Managed Instance

サービス停止

停止中にディザスターリカバリーを開始するタイミング

障害復旧ガイダンス

geo レプリケーションされたセカンダリインスタンスへのフェールオーバー (データ損失なし)

geo レプリケーションされたセカンダリインスタンスへの強制フェールオーバー (データ損失が発生する可能性あり)

geo リストア

復旧後のデータベースの構成

接続文字列を更新する

ファイアウォール規則の構成

ログインとデータベースユーザーを構成する

テレメトリアラートを設定する

監査を有効にする

フィードバック

その他のリソース

次の方法で共有

ディザスター リカバリー ガイダンス - Azure SQL Managed Instance

サービス停止

停止中にディザスター リカバリーを開始するタイミング

障害復旧ガイダンス

geo レプリケーションされたセカンダリ インスタンスへのフェールオーバー (データ損失なし)

geo レプリケーションされたセカンダリ インスタンスへの強制フェールオーバー (データ損失が発生する可能性あり)

geo リストア

復旧後のデータベースの構成

接続文字列を更新する

ファイアウォール規則の構成

ログインとデータベース ユーザーを構成する

テレメトリ アラートを設定する

監査を有効にする

関連するコンテンツ

フィードバック

その他のリソース

ディザスターリカバリーガイダンス - Azure SQL Managed Instance

停止中にディザスターリカバリーを開始するタイミング

geo レプリケーションされたセカンダリインスタンスへのフェールオーバー (データ損失なし)

geo レプリケーションされたセカンダリインスタンスへの強制フェールオーバー (データ損失が発生する可能性あり)

ログインとデータベースユーザーを構成する

テレメトリアラートを設定する