Azure でのミッションクリティカルなワークロードに関するデータプラットフォームの考慮事項

[アーティクル]
04/20/2023

効果的なアプリケーションデータプラットフォームの選択は、さらに重要な意思決定領域であり、他の設計領域に大きな影響を与えます。最終的に Azure は、多数のリレーショナル、非リレーショナル、分析データプラットフォームを提供しますが、その機能は大きく異なります。したがって、重要な非機能要件を、一貫性、操作性、コスト、複雑さなどの他の決定要因と共に十分に考慮することが不可欠です。たとえば、複数リージョンの書き込み構成で動作する機能は、グローバルに利用可能なプラットフォームの適合性に重要な影響を及ぼします。

この設計領域はアプリケーション設計で拡張し、最適なデータプラットフォームの選択を通知するための重要な考慮事項と推奨事項を提供します。

重要

この記事は、Azure Well-Architected のミッションクリティカルなワークロードシリーズの一部です。このシリーズに慣れていない場合は、「ミッションクリティカルなワークロードとは何ですか?」から始めることをお勧めします。

ビッグデータの 4 つの V

"ビッグデータの 4 つの V" は、高可用性データプラットフォームの必要な特性と、データを使用してビジネス価値を最大化する方法をより深く理解するためのフレームワークを提供します。したがって、このセクションでは、適切なデータテクノロジを使用してデータプラットフォームを設計するために、概念レベルで Volume (ボリューム)、Velocity (ベロシティ)、Variety (多様性)、Veracity (正確性) の特性を適用する方法について説明します。

Volume (ボリューム): ストレージ容量と階層化の要件を通知するために使用されるデータの量 (データセットのサイズ) です。
Velocity (ベロシティ): バッチまたは連続ストリームとしてデータが処理される速度 (フローの速度) です。
Variety (多様性): データの編成と形式、構造化形式、半構造化形式、非構造化形式のキャプチャで、複数のストアまたは型にわたるデータです。
Veracity (正確性): ガバナンスとデータの品質保証のために考慮されたデータセットの実証とキュレーションが含まれます。つまりデータの精度です。

デザインに関する考慮事項

量

既存のデータ量 (存在する場合) と、事業目標と計画に合わせた予測データの増加率に基づく将来のデータ量。
- データボリュームには、データ自体とインデックス、ログ、テレメトリ、およびその他の適用可能なデータセットが含まれている必要があります。
- 大規模なビジネスクリティカルアプリケーションとミッションクリティカルアプリケーションでは、通常、大量の (GB と TB) を毎日生成して格納します。
- データの拡張に関連して、コストに大きな影響が及ぶ可能性があります。
データボリュームは、ビジネス環境の変化やハウスキープ処理の手順によって変動する可能性があります。
データボリュームは、データプラットフォームのクエリパフォーマンスに大きな影響を与える可能性があります。
データプラットフォームのボリューム制限に達すると、大きな影響を受ける可能性があります。
- ダウンタイムが発生しますか? 発生する場合、どのくらいの期間ですか?
- 軽減手順は何ですか? また軽減策にはアプリケーションの変更が必要ですか?
- データ損失のリスクはありますか?
Time to Live (TTL) などの機能を使用すると、レコードの作成または変更を使用して、ある時間の経過後にレコードを自動的に削除することで、データの増加を管理できます。
- たとえば、Azure Cosmos DB には、組み込みの TTL 機能が用意されています。

ベロシティ

さまざまなアプリケーションコンポーネントからデータが出力される速度と、データのコミットと取得に必要な速度に関するスループット要件は、主要なワークロードシナリオに最適なデータテクノロジを決定するために不可欠です。
- スループット要件の性質は、読み取り負荷や書き込み負荷の高さなど、ワークロードシナリオによって異なります。
  - たとえば、分析ワークロードは通常、大きな読み取りスループットに対応する必要があります。
- 必要なスループットはどれくらいですか? スループットはどのように拡大すると予想されますか?
- 参照負荷レベル下の P50/P99 でのデータ待機時間の要件は何ですか?
高スループットを実現するには、ロック不要の設計、インデックスのチューニング、一貫性ポリシーへの対応などの機能が不可欠です。
- 高スループットの構成を最適化するとトレードオフが発生することを十分に理解しておく必要があります。
- 負荷平準化の永続化とメッセージングパターン (CQRS やイベントソーシングなど) を使用して、スループットをさらに最適化できます。
多くのアプリケーションシナリオで、負荷レベルは自然に変動します。自然のピーク時に、スループットと待機時間を維持しながら、変動する需要を処理するための十分な弾力性が必要です。
- アジャイルスケーラビリティは、容量レベルをオーバープロビジョニングすることなく、可変スループットと負荷レベルを効果的にサポートするための鍵です。
  - 読み取りと書き込みのスループットはどちらも、アプリケーションの要件と負荷に応じてスケーリングする必要があります。
  - 垂直方向と水平方向の両方のスケール操作を適用して、負荷レベルの変化に対応できます。
スループットの低下の影響は、ワークロードのシナリオによって異なる場合があります。
- 接続の中断は発生しますか?
- コントロールプレーンが引き続き動作している間、個々の操作でエラーコードが返されますか?
- データプラットフォームは調整をアクティブにしますか。その場合、どのくらいの期間アクティブになりますか?
アクティブ/アクティブな地理的分散を使用するための基本的なアプリケーション設計の推奨事項では、データの一貫性に関する課題が発生します。
- 完全な ACID トランザクションセマンティクスと従来のロック動作に関しては、一貫性とパフォーマンスの間にトレードオフがあります。
  - 書き込み待機時間を最小限に抑えることは、データの一貫性を犠牲にすることになります。
複数リージョンの書き込み構成では、変更を同期してすべてのレプリカ間でマージする必要があり、必要に応じて競合解決が行われ、パフォーマンスレベルとスケーラビリティに影響する可能性があります。
読み取り専用レプリカ (リージョン内およびリージョン間) を使用すると、ラウンドトリップ待機時間を最小限に抑え、トラフィックを分散してパフォーマンス、スループット、可用性、スケーラビリティを向上させることができます。
キャッシュレイヤーを使用すると、読み取りスループットを向上させ、ユーザーエクスペリエンスとエンドツーエンドのクライアント応答時間を改善することができます。
- データの最新性を最適化するには、キャッシュの有効期限とポリシーを考慮する必要があります。

多様性 (Variety)

データモデル、データ型、データリレーションシップ、および目的のクエリモデルは、データプラットフォームの決定に強く影響します。
- アプリケーションにはリレーショナルデータモデルが必要ですか、それとも変数スキーマまたは非リレーショナルのデータモデルに対応できますか?
- アプリケーションはデータに対しどのようにクエリを実行しますか? また、クエリはリレーショナル結合などのデータベースレイヤーの概念に依存しますか? または、アプリケーションはそのようなセマンティクスを提供しますか?
アプリケーションによって考慮されるデータセットの性質は、画像やビデオなどの非構造化コンテンツから、CSV や Parquet などのより構造化されたファイルまで、さまざまあります。
- 複合アプリケーションワークロードには、通常、個別のデータセットおよび関連する要件があります。
リレーショナルデータプラットフォームまたは非リレーショナルデータプラットフォームに加えて、グラフまたはキー値のデータプラットフォームも、特定のデータワークロードに適している場合があります。
- 一部のテクノロジは、変数スキーマデータモデルに対応しています。この場合、データ項目は意味的に類似していたり、格納やクエリ実行が一緒に行われますが、構造的には異なっています。
マイクロサービスアーキテクチャでは、単一のモノリシックデータストアに依存するのではなく、個別のシナリオ最適化データストアを使用して個々のアプリケーションサービスを構築できます。
- SAGA などの設計パターンを適用して、異なるデータストア間の一貫性と依存関係を管理できます。
  - データベース間直接クエリでは、コロケーション制約が課される場合があります。
- 複数のデータテクノロジを使用すると、包括的なテクノロジを維持するための管理オーバーヘッドが増加します。
各 Azure サービスの機能セットは、言語、SDK、API によって異なります。これは、適用できる構成チューニングのレベルに大きな影響を与える可能性があります。
データモデルと包含されるデータ型との調整を最適化する機能は、データプラットフォームの決定に強く影響します。
- ストアドプロシージャやオブジェクトリレーショナルマッパーなどのクエリレイヤー。
- セキュリティで保護された REST API レイヤーなど、言語に依存しないクエリ機能。
- バックアップや復元などのビジネス継続性の機能。
分析データストアは通常、さまざまな種類のデータ構造の多言語ストレージをサポートしています。
- Apache Spark などの分析ランタイム環境には、多言語データ構造を分析するための統合制限がある場合があります。
企業のコンテキストでは、既存のプロセスとツールの使用、およびスキルの継続性は、データプラットフォームの設計とデータテクノロジの選択に大きな影響を与える可能性があります。

正確性 (Veracity)

アプリケーション内のデータの精度を検証するには、いくつかの要因を考慮する必要があります。また、これらの要因の管理は、データプラットフォームの設計に大きな影響を及ぼす可能性があります。
- データの整合性。
- プラットフォームのセキュリティ機能。
- データガバナンス。
- 変更管理とスキーマの進化。
- データセット間の依存関係。
複数のデータレプリカを持つ分散型アプリケーションでは、CAP と PACELC の定理で示されているように、一貫性と待機時間の間にトレードオフがあります。
- リーダーとライターが明確に分散している場合、アプリケーションは、別のレプリカにあるデータ項目の書き込み (更新) が完了したところと比べて古くても、最速で利用可能なバージョンのデータ項目を返すか、あるいは最新の状態を判断して取得するために追加の待機時間が発生する可能性はあるが最新バージョンのデータ項目を返すかのどちらかを選択する必要があります。
- 一貫性と可用性は、プラットフォームレベルまたは個々のデータ要求レベルで構成できます。
- 別のレプリカの最新の状態を反映していないユーザーに最も近いレプリカからデータを提供する場合、ユーザーエクスペリエンスはどうなりますか? つまり、アプリケーションは古いデータを提供する可能性に対応できますか?
複数リージョンの書き込みコンテキストでは、2 つの個別の書き込みレプリカで同じデータ項目が変更された場合、いずれかの変更をレプリケートする前に、競合が作成され、それを解決する必要があります。
- "最後の書き込みを優先" などの標準化された競合解決ポリシーや、カスタムロジックを使用したカスタム戦略を適用できます。
セキュリティ要件の実装は、スループットやパフォーマンスに悪影響を与える可能性があります。
保存時の暗号化は、必要に応じて、クライアント側の暗号化を使用してアプリケーションレイヤーに実装したり、サーバー側の暗号化を使用してデータレイヤーに実装したりできます。
Azure では、サービスが管理するキー、Key Vault でユーザーが管理するキー、またはユーザーが制御するハードウェア上でユーザーが管理するキーを使用したサーバー側暗号化など、さまざまな暗号化モデルがサポートされています。
- クライアント側の暗号化を使用すると、Key Vault または別のセキュリティで保護された場所でキーを管理できます。
MACsec (IEEE 802.1AE MAC) データリンク暗号化は、Microsoft バックボーンネットワーク上の Azure データセンター間を移動するすべてのトラフィックをセキュリティで保護するために使用されます。
- パケットは送信前にデバイス上で暗号化と復号化が行われ、物理的な "中間者" 攻撃、スヌーピング攻撃、盗聴攻撃を防ぎます。
データプレーンとコントロールプレーンに対する認証と認可。
- データプラットフォームは、アプリケーションアクセスと運用アクセスをどのように認証および認可しますか?
プラットフォームの正常性とデータアクセスの監視による監視。
- 許容される運用境界外の条件に対してアラートはどのように適用されますか?

設計上の推奨事項

量

オーガニック成長に関連する将来のデータ量が、データプラットフォームの機能を超えないようにします。
- ビジネス計画に合わせてデータの増加率を予測し、確定された率を使用して継続的な容量要件を通知します。
- 集計およびデータごとのレコードボリュームをデータプラットフォームの制限と比較します。
- 例外的な状況で制限に達する危険性がある場合は、ダウンタイムとデータ損失を防ぐために、運用上の軽減策を必ず実施します。
スケール制限と予想されるデータ増加率を考慮して、データボリュームを監視し、容量モデルに対して検証します。
- スケール操作がストレージ、パフォーマンス、および一貫性の要件と一致していることを確認します。
- 新しいスケールユニットが導入された場合、基になるデータをレプリケートする必要がある場合があります。レプリケートには時間がかかり、レプリケーションの実行中にパフォーマンスが低下する可能性があります。そのため、可能であれば、これらの操作が重要な営業時間以外に実行されるようにします。
古いデータの削除またはオフロードを容易にするために、使用状況と重要度に基づいてデータセットを分類するアプリケーションデータ層を定義します。
- データセットを "ホット"、"ウォーム"、"コールド" (アーカイブ) の階層に分類することを検討します。
  - たとえば、基本的な参照実装では、Azure Cosmos DB を使用して、アプリケーションによってアクティブに使用される「ホット」データを格納します。一方、Azure Storage は分析目的で "コールド" 操作データに使用されます。
データの増加を最適化し、クエリのパフォーマンスやデータ拡張の管理などのデータ効率を高めるために、ハウスキープ処理の手順を構成します。
- 不要になり、長期的な分析値がないデータの Time-To-Live (TTL) の有効期限を構成します。
  - アプリケーションに悪影響を与えることなく、古いデータを安全にセカンダリストレージに階層化したり、完全に削除したりできることを検証します。
- 重要ではないデータはセカンダリコールドストレージにオフロードし、分析値用として、また監査要件を満たすために保持します。
- データプラットフォームテレメトリと使用状況の統計情報を収集して、DevOps チームがハウスキープ処理要件と "適切なサイズの" データストアを継続的に評価できるようにします。
マイクロサービスアプリケーションの設計に沿って、複数の異なるデータテクノロジを並列で使用し、特定のワークロードシナリオとボリューム要件に合わせて最適化されたデータソリューションを使用することを検討します。
- 拡張によるデータボリュームの管理が困難な可能性がある単一のモノリシックデータストアを作成しないようにします。

ベロシティ

データプラットフォームは、シナリオ最適化データソリューションを使用してパフォーマンスを最大化するために、ワークロードを異なるコンテキストに分離して、高スループットをサポートするように本質的に設計および構成する必要があります。
- 必ず、各データシナリオの読み取りおよび書き込みスループットを、予期しない変動に対する十分な許容範囲で、予想されるロードパターンに従ってスケーリングできるようにします。
- トランザクション操作や分析操作などのさまざまなデータワークロードを個別のパフォーマンスコンテキストに分離します。
CQRS、イベントソーシングパターンを使用するなど、非同期の非ブロッキングメッセージングを使用した負荷レベル。
- 書き込み要求と新しいデータが読み取り可能になったときの間に待機時間が発生する可能性があり、ユーザーエクスペリエンスに影響を与える可能性があります。
  - この影響は、主要なビジネス要件に照らして理解し、許容できるものでなければなりません。
アジャイルスケーラビリティを確保して、可変スループットと負荷レベルに対応します。
- 負荷レベルの変動が激しい場合は、スループットとパフォーマンスが維持されるように、容量レベルのオーバープロビジョニングを検討してください。
- スループットを維持できない場合に複合アプリケーションのワークロードに与える影響をテストして検証します。
負荷レベルの変動に迅速に対応できるように、自動スケール操作を備えた Azure ネイティブデータサービスを優先します。
- サービスの内部しきい値とアプリケーションで設定されたしきい値に基づいて自動スケールを構成します。
- スケーリングは、ビジネス要件と一致する期間で開始および完了する必要があります。
- 手動操作が必要なシナリオの場合、手動操作アクションを実行するのではなく、トリガーできる自動化された運用 'プレイブック' を作成します。
  - 自動トリガーを後続のエンジニアリング投資の一部として適用できるかどうかを検討します。
P50/P99 待機時間の要件に照らしてアプリケーションデータの読み取りと書き込みのスループットを監視し、アプリケーション容量モデルに合わせます。
過剰なスループットは、データプラットフォームまたはアプリケーションレイヤーによって適切に処理され、運用上の表現のために正常性モデルによってキャプチャされる必要があります。
"ホット" データシナリオのキャッシュを実装して、応答時間を最小限に抑えます。
- キャッシュの有効期限とハウスキープ処理に適切なポリシーを適用して、データの急増を回避します。
  - バックアップデータが変更されたときにキャッシュ項目を期限切れにします。
  - キャッシュの有効期限が厳密に Time-To-Live (TTL) に基づいている場合は、古いデータを提供する影響とカスタマーエクスペリエンスを理解する必要があります。

多様性 (Variety)

クラウドと Azure ネイティブの設計の原則に合わせて、運用と管理の複雑さを軽減し、Microsoft の将来のプラットフォーム投資を活用するために、マネージド Azure サービスに優先順位を付けることを強くお勧めします。
疎結合されたマイクロサービスアーキテクチャのアプリケーション設計の原則に合わせて、個々のサービスで個別のデータストアとシナリオ最適化データテクノロジを使用できるようにします。
- 特定のワークロードシナリオでアプリケーションが処理するデータ構造の種類を特定します。
- 単一のモノリシックデータストアへの依存関係を作成しないようにします。
  - データストア間の依存関係が存在する SAGA 設計パターンについて考えてみましょう。
必要な機能が、選択したデータテクノロジで使用可能であることを検証します。
- 必要な言語と SDK の機能がサポートされていることを確認します。すべての言語/SDK ですべての機能が同じ方法で利用できるわけではありません。

正確性 (Veracity)

アプリケーションエンドポイントにデータを近づけることで信頼性、可用性、パフォーマンスを最大限に高めるために、マルチリージョンのデータプラットフォーム設計を採用し、リージョン間でレプリカを分散します。
- リージョン内の Availability Zones (AZ) 間でデータレプリカを分散 (またはゾーン冗長サービスレベルを使用) して、リージョン内の可用性を最大化します。
一貫性要件で可能な場合は、複数リージョンの書き込みデータプラットフォーム設計を使用して、全体的なグローバルな可用性と信頼性を最大化します。
- 2 つの個別の書き込みレプリカで同じデータ項目が変更された場合、いずれかの変更をレプリケートする前に競合を作成する場合は、競合解決のビジネス要件を検討してください。
  - 可能な限り、"最後の変更を優先" などの標準化された競合解決ポリシーを使用します
    - カスタムロジックを使用するカスタム戦略が必要な場合は、カスタムロジックを管理するために CI/CD DevOps プラクティスが適用されていることを確認します。
継続的デリバリープロセス内でのカオステストを通じて、バックアップと復元の機能とフェールオーバー操作をテストおよび検証します。
パフォーマンスベンチマークを実行して、スループットとパフォーマンスの要件が、暗号化などの必要なセキュリティ機能の組み込みによる影響を受けないようにします。
- 継続的デリバリープロセスでは、既知のパフォーマンスベンチマークに対するロードテストを検討してください。
暗号化を適用する場合、管理の複雑さを軽減する方法として、サービスマネージド暗号化キーを使用することを強くお勧めします。
- カスタマーマネージドキーに固有のセキュリティ要件がある場合は、考慮されたすべてのキーの可用性、バックアップ、ローテーションを確保するために、必ず適切なキー管理手順を適用します。

Note

より広範な組織の実装と統合する場合、アプリケーション設計のデータプラットフォームコンポーネントのプロビジョニングと運用にアプリケーション中心のアプローチを適用することが重要です。

具体的には、信頼性を最大限に高めるために、個々のデータプラットフォームコンポーネントが、他のアプリケーションコンポーネントが含まれている可能性のある運用アクションを通じてアプリケーションの正常性に適切に応答することが重要です。たとえば、追加のデータプラットフォームリソースが必要なシナリオでは、容量モデルに従ってデータプラットフォームを他のアプリケーションコンポーネントと共にスケーリングすることが必要になる可能性があります。その場合は、追加のスケールユニットをプロビジョニングする必要があります。データプラットフォームに関連する問題を分離して対処するために、一元化された運用チームに強く依存している場合、このアプローチは最終的に制限を受けることになります。

最終的に、一元化されたデータサービス (中央 IT DBaaS) を使用すると、運用上のボトルネックが発生し、ほとんどコンテキストに依存しない管理エクスペリエンスによって機敏性が大幅に低下するため、ミッションクリティカルまたはビジネスクリティカルなコンテキストでは回避する必要があります。

その他の参照情報

その他のデータプラットフォームガイダンスについては、Azure アプリケーションアーキテクチャガイドを参照してください。

グローバルに分散された複数リージョン書き込みデータストア

アプリケーション設計のグローバルに分散されたアクティブ/アクティブな目標に完全に対応するには、分散型複数リージョン書き込みデータプラットフォームを検討することを強くお勧めします。このプラットフォームでは、書き込み可能な個別のレプリカへの変更が同期され、必要に応じて競合解決が行われ、すべてのレプリカ間でマージされます。

重要

すべてのマイクロサービスで分散型複数リージョン書き込みデータストアが必要となるわけではないため、各ワークロードシナリオのアーキテクチャコンテキストとビジネス要件を考慮する必要があります。

Azure Cosmos DB には、グローバルに分散された高可用性 NoSQL データストアが用意されており、複数リージョンの書き込みと調整可能な一貫性がすぐに利用できます。そのため、このセクションの設計上の考慮事項と推奨事項は、最適な Azure Cosmos DB の使用に焦点を当てます。

設計上の考慮事項

Azure Cosmos DB

Azure Cosmos DB はコンテナー内にデータを格納します。このコンテナーは、インデックス付きの行ベースのトランザクションストアで、ミリ秒単位の応答時間で高速なトランザクションの読み取りと書き込みができるように設計されています。
Azure Cosmos DB では、SQL、Cassandra、MongoDB など、機能セットが異なる複数の異なる API がサポートされています。
- ファーストパーティの Azure Cosmos DB for NoSQL は、最も豊富な機能セットを提供しており、通常は新機能が最初に使用できるようになる API です。
Azure Cosmos DB では、Gateway と Direct の接続モードがサポートされています。Direct では TCP 経由のバックエンド Azure Cosmos DB レプリカノードへの接続が容易になり、少ないネットワークホップ数でパフォーマンスを向上します。Gateway はフロントエンドゲートウェイノードへの HTTPS 接続を提供します。
- Direct モードは、Azure Cosmos DB for NoSQL を使用する場合にのみ使用でき、現在は .NET および Java SDK プラットフォームでのみサポートされています。
Availability Zoneが有効なリージョン内では、Azure Cosmos DB は可用性ゾーン (AZ) の冗長性を提供し、リージョン内のゾーン障害に対する高可用性と回復性をサポートします。
Azure Cosmos DB では、1 つのリージョン内に 4 つのデータレプリカが保持され、Availability Zone (AZ) の冗長性が有効になっている場合、Azure Cosmos DB では、ゾーン障害から保護するために複数の AZ にデータレプリカが配置されます。
- Paxos コンセンサスプロトコルは、リージョン内のレプリカ間でクォーラムを達成するために適用されます。
Azure Cosmos DB アカウントは、1 つのリージョンが使用できなくなるリスクを軽減するために、複数のリージョン間でデータをレプリケートするように簡単に構成できます。
- レプリケーションは、単一リージョンの書き込みまたは複数リージョンの書き込みを使用して構成できます。
  - 単一リージョンの書き込みでは、プライマリ "ハブ" リージョンを使用してすべての書き込みを処理します。この "ハブ" リージョンが使用できなくなった場合は、別のリージョンを書き込み可能として昇格させるためにフェールオーバー操作が発生します。
  - 複数リージョンの書き込みでは、アプリケーションは構成済みのデプロイリージョンに書き込むことができます。これによって、他のすべてのリージョン間で変更がレプリケートされます。あるリージョンが使用できない場合、残りのリージョンが書き込みトラフィックの処理に使用されます。
複数リージョンの書き込み構成では、ライターが複数のリージョンで同じ項目を同時に更新する更新 (挿入、置換、削除) の競合が発生する場合があります。
Azure Cosmos DB には、競合に自動的に対処するために適用できる 2 つの競合解決ポリシーが用意されています。
- 最後の書き込みを優先 (Last Write Wins: LWW) では、システム定義のタイムスタンプ _ts プロパティを競合解決パスとして使用して、時刻同期クロックプロトコルを適用します。競合が発生した場合、競合解決パスの値が最も高い項目が優先され、複数の項目の数値が同じ場合、システムは優先項目を選択して、すべてのリージョンがコミット済みアイテムの同じバージョンに収束できるようにします。
  - 削除の競合では、競合解決パスの値に関係なく、削除されたバージョンは常に挿入または置換の競合よりも優先されます。
  - "最後の書き込みが有効" が、既定の競合解決ポリシーです。
  - Azure Cosmos DB for NoSQL を使用する場合は、競合の解決にカスタムタイムスタンプ定義などのカスタム数値プロパティを使用できます。
- カスタム解決ポリシーを使用すると、アプリケーション定義のセマンティクスで、競合が検出されたときに自動的に呼び出される登録済みのマージストアドプロシージャを使用して競合を調整できます。
  - システムにより、コミットメントプロトコルの一部としてマージプロシージャの実行が 1 回だけとなることが保証されます。
  - カスタム競合解決ポリシーは、Azure Cosmos DB for NoSQL でのみ使用でき、コンテナー作成時にのみ設定できます。
複数リージョンの書き込み構成では、すべての競合解決を実行する単一の Azure Cosmos DB "ハブ" リージョンに依存します。この場合、Paxos コンセンサスプロトコルが適用され、ハブリージョン内のレプリカ間でクォーラムが達成されます。
- プラットフォームは、負荷レベルに対するハブリージョン内の書き込み競合のメッセージバッファーを提供し、一時的な障害への冗長性を提供します。
  - バッファーは、コンセンサスを必要とする数分分の書き込み更新を格納できます。

Azure Cosmos DB プラットフォームの戦略的な方向性は、複数リージョンの書き込み構成での競合解決に対するこの単一リージョンの依存関係を削除することです。2 フェーズの Paxos アプローチを利用して、グローバルレベルおよびリージョン内でクォーラムを達成します。

プライマリ "ハブ" リージョンは、Azure Cosmos DB が構成されている最初のリージョンによって決まります。
- 優先順位の順序は、フェールオーバー目的で追加のサテライトデプロイリージョン用に構成されます。
最適なパフォーマンスと可用性を実現するには、論理パーティションと物理パーティション間のデータモデルとパーティション分割が重要な役割を果たします。
単一の書き込みリージョンでデプロイする場合、すべての読み取りリージョンレプリカを考慮して定義されたフェールオーバー優先度に基づいて自動フェールオーバーを行うように Azure Cosmos DB を構成できます。
Azure Cosmos DB プラットフォームによって提供される RTO は最大 10 - 15 分で、ハブリージョンに影響を与える致命的な災害が発生した場合に、Azure Cosmos DB サービスのリージョンフェールオーバーを実行するための経過時間をキャプチャします。
- この RTO は、競合解決のための単一の "ハブ" リージョンへの依存関係を考えると、複数リージョンの書き込みコンテキストにも関連します。
  - "ハブ" リージョンが使用できなくなった場合、他のリージョンへの書き込みは、メッセージバッファーがいっぱいになった後に失敗します。これは、サービスがフェールオーバーされ、新しいハブリージョンが確立されるまで競合解決を行うことができないためです。

Azure Cosmos DB プラットフォームの戦略的な方向性は、パーティションレベルのフェールオーバーを許可することで RTO を最大 5 分に減らすことです。

回復ポイントの目標 (RPO) と回復時間の目標 (RTO) は一貫性レベルを介して構成でき、データの持続性とスループットの間にトレードオフが発生します。
- Azure Cosmos DB では、複数リージョンの書き込みの緩やかな一貫性レベルに対しては最小 RTO が 0 となり、単一書き込みリージョンの厳密な整合性に対しては RPO が 0 になります。
Azure Cosmos DB では、複数の Azure リージョンが書き込み可能として構成されたデータベースアカウントの読み取りと書き込みの両方の可用性に対して 99.999% の SLA が提供されます。
- SLA は月間アップタイムの割合で表され、100% - 平均エラー率として計算されます。
- 平均エラー率は、請求月の各時間のエラー率の合計を請求月の合計時間数で割った値として定義されます。エラー率は、指定された 1 時間の間隔で失敗した要求の合計数を合計要求数で割った値です。
Azure Cosmos DB では、5 つの一貫性レベルのいずれかで構成されている 1 つの Azure リージョンに範囲指定されたデータベースアカウントのスループット、一貫性、可用性、待機時間に対して 99.99% の SLA が提供されます。
- 99.99% の SLA は、4 つの緩やかな一貫性レベルのいずれかで構成されている複数の Azure リージョンにまたがるデータベースアカウントにも適用されます。
Azure Cosmos DB には、標準と自動スケーリングの 2 種類のスループットをプロビジョニングできます。これは、1 秒あたりの要求ユニット数 (RU/秒) を使用して測定されます。
- 標準スループットでは、指定された RU/秒の値を保証するために必要なリソースが割り当てられます。
  - 標準は、プロビジョニングされたスループットに対して 1 時間ごとに課金されます。
- 自動スケーリングでは最大スループット値が定義され、Azure Cosmos DB はアプリケーションの負荷に応じて、最大スループット値と最大スループット値の最小 10% の間で自動的にスケールアップまたはスケールダウンします。
  - 自動スケーリングでは、消費される最大スループットに対して 1 時間ごとに課金されます。
変数ワークロードで静的にプロビジョニングされたスループットを使用すると、調整エラーが発生し、認識されるアプリケーションの可用性に影響を与える可能性があります。
- 自動スケーリングでは、Azure Cosmos DB を必要に応じてスケールアップできるようにすることで調整エラーから保護します。一方、負荷が減少したときにスケールダウンすることでコスト保護を維持します。
Azure Cosmos DB が複数のリージョンにレプリケートされる場合、プロビジョニングされた要求ユニット (RU) はリージョンごとに課金されます。
複数リージョン書き込み構成と単一リージョン書き込み構成ではコスト差が大きく、多くの場合、マルチマスターの Azure Cosmos DB データプラットフォームのコストが非常に高くなる可能性があります。

単一リージョンの読み取り/書き込み	単一リージョン書き込み - デュアルリージョン読み取り	デュアルリージョンの読み取り/書き込み
1 RU	2 RU	4 RU

単一リージョン書き込みと複数リージョン書き込みの差分は、実際には上記の表に反映されている 1:2 の比率よりも小さくなります。具体的には、単一書き込み構成での書き込み更新に関連するリージョン間のデータ転送料金があります。これは、複数リージョンの書き込み構成と同様に RU コスト内ではキャプチャされません。

使用されたストレージは、特定の時間のデータとインデックスをホストするために消費されたストレージ (GB) の合計量に対して定額として課金されます。
Session は、データが書き込みと同じ順序で受信されるため既定で最も広く使用されている一貫性レベルです。
Azure Cosmos DB では、Microsoft Entra ID または重複する機能を提供する Azure Cosmos DB キーとリソーストークンのいずれかを使用した認証がサポートされています。

Azure Cosmos DB のアクセス機能

キーまたはリソーストークンを使用してリソース管理操作を無効にして、キーとリソーストークンをデータ操作のみに制限し、Microsoft Entra ロールベースのアクセス制御 (RBAC) を使用してきめ細かなリソースアクセス制御を可能にすることができます。
- キーまたはリソーストークンを使用してコントロールプレーンのアクセスを制限すると、Azure Cosmos DB SDK を使用するクライアントのコントロールプレーン操作が無効になります。そのため、十分に評価してテストする必要があります。
- disableKeyBasedMetadataWriteAccess 設定は、ARM テンプレート IaC 定義、または組み込みの Azure Policy を使用して構成できます。
Azure Cosmos DB での Microsoft Entra RBAC のサポートは、アカウントとリソースコントロールプレーンの管理操作に適用されます。
- アプリケーション管理者は、ユーザー、グループ、サービスプリンシパル、またはマネージド ID へのロールの割り当てを作成して、Azure Cosmos DB リソースに対するリソースと操作へのアクセスを許可または拒否できます。
- ロールの割り当てに使用できる組み込み RBAC ロールがいくつかあります。また、カスタム RBAC ロールを使用して、特定の権限の組み合わせを形成することもできます。
  - Cosmos DB アカウント閲覧者は、Azure Cosmos DB リソースへの読み取り専用アクセスが有効になります。
  - DocumentDB アカウント共同作成者は、キーやロールの割り当てを含む Azure Cosmos DB アカウントの管理は可能ですが、データプレーンアクセスは有効になりません。
  - Cosmos DB オペレーターは DocumentDB アカウント共同作成者に似ていますが、キーまたはロールの割り当てを管理する機能は提供されません。
Azure Cosmos DB リソース (アカウント、データベース、コンテナー) は、リソースロックを使用して、不適切な変更や削除から保護できます。
- リソースロックは、アカウント、データベース、またはコンテナーレベルで設定できます。
- リソースに設定されたリソースロックは、すべての子リソースによって継承されます。たとえば、Azure Cosmos DB アカウントに設定されたリソースロックは、アカウント内のすべてのデータベースとコンテナーによって継承されます。
- リソースロックはコントロールプレーン操作にのみ適用され、データの作成、変更、削除などのデータプレーン操作を防ぐことはできません。
- コントロールプレーンのアクセスが disableKeyBasedMetadataWriteAccessで制限されていない場合、クライアントはアカウントキーを使用してコントロールプレーン操作を実行できます。
Azure Cosmos DB 変更フィードは、Azure Cosmos DB コンテナー内のデータに対する変更の時間順フィードを提供します。
- 変更フィードには、ソース Azure Cosmos DB コンテナーへの挿入操作と更新操作のみが含まれます。削除操作は含まれません。
変更フィードを使用すると、アプリケーションで使用されるプライマリコンテナーとは別のデータストアを維持できます。また、ソースコンテナーからの変更フィードによって提供されるターゲットデータストアに対する継続的な更新を行うことができます。
- 変更フィードを使用して、追加のデータプラットフォームの冗長性のために、または後続の分析シナリオのためにセカンダリストアを事前設定できます。
削除操作がソースコンテナー内のデータに定期的に影響を与える場合、変更フィードによって提供されるストアは不正確になり、削除されたデータを反映しなくなります。
- データレコードが変更フィードに含まれるように、論理的な削除パターンを実装できます。
  - データレコードを明示的に削除する代わりに、アイテムが削除されたと見なされることを示すフラグ (IsDeleted など) を設定することでデータレコードを更新します。
  - 変更フィードによって提供されるターゲットデータストアは、削除済みフラグが True に設定されているアイテムを検出して処理する必要があります。論理的に削除されたデータレコードを格納する代わりに、ターゲットストア内の既存のバージョンのデータレコードを削除する必要があります。
- 通常、論理的な削除パターンでは短い Time-To-Live (TTL) が使用され、Azure Cosmos DB は期限切れのデータを自動的に削除しますが、削除済みフラグが True に設定されている変更フィード内に反映された後にのみ削除されます。
  - 変更フィードを通じて削除を伝達しながらも、元の削除の意図を達成します。
Azure Cosmos DB は分析ストアとして構成できます。これは、従来の ETL パイプラインで発生する複雑さと待機時間の課題に対処するために、最適化された分析クエリの列形式を適用します。
Azure Cosmos DB は、パフォーマンスや可用性に影響を与えず、また RU/秒を消費せずに、一定の間隔でデータを自動的にバックアップします。
Azure Cosmos DB は、2 つの異なるバックアップモードに従って構成できます。
- Periodic は、すべてのアカウントの既定のバックアップモードです。バックアップは定期的な間隔で実行され、サポートチームに要求を作成することでデータが復元されます。
  - 既定の定期的なバックアップ保持期間は 8 時間で、既定のバックアップ間隔は 4 時間です。つまり、既定では最新の 2 つのバックアップのみが格納されます。
  - バックアップ間隔と保持期間は、アカウント内で構成できます。
    - 最大保持期間は 1 か月まで延長でき、最小バックアップ間隔は 1 時間に設定できます。
    - バックアップストレージの冗長性を構成するには、Azure の "Cosmos DB アカウント閲覧者ロール" へのロールの割り当てが必要です。
  - 追加コストなしで 2 つのバックアップコピーが可能ですが、それ以上のバックアップでは追加コストが発生します。
  - 既定では、定期的なバックアップは、直接アクセスできない個別の geo 冗長ストレージ (GRS) 内に格納されます。
    - バックアップストレージはプライマリ "ハブ" リージョン内に存在し、基になるストレージレプリケーションを通じてペアのリージョンにレプリケートされます。
    - 基になるバックアップストレージアカウントの冗長性構成は、ゾーン冗長ストレージまたはローカル冗長ストレージに構成できます。
  - お客様が直接復元を実行することはできないため、復元操作の実行にはサポートリクエストが必要です。
    - サポートチケットを開く前に、データ損失イベントから 8 時間以内にバックアップ保持期間を少なくとも 7 日間に増やす必要があります。
  - 復元操作では、データが復旧される新しい Azure Cosmos DB アカウントが作成されます。
    - 既存の Azure Cosmos DB アカウントを復元に使用することはできません
    - 既定では、<Azure_Cosmos_account_original_name>-restored<n> という名前の新しい Azure Cosmos DB アカウントが使用されます。
      - この名前は、元のアカウントが削除された場合に既存の名前を再利用するなどして調整できます。
  - スループットがデータベースレベルでプロビジョニングされている場合、バックアップと復元はデータベースレベルで行われます
    - 復元するコンテナーのサブセットを選択することはできません。
- 継続的バックアップモードにより、過去 30 日以内の任意の時点に復元できます。
  - 復元操作を実行して、1 秒の単位で特定の時点 (PITR) に戻ることができます。
  - 復元操作に使用できる期間は最大 30 日です。
    - リソースのインスタンス化状態に復元することもできます。
  - 継続的バックアップは、Azure Cosmos DB アカウントが存在するすべての Azure リージョン内で実行されます。
    - 継続的バックアップは、Availability Zones をサポートするリージョン内でローカル冗長ストレージ (LRS) またはゾーン冗長ストレージ (ZRS) を使用して、各 Azure Cosmos DB レプリカと同じ Azure リージョン内に格納されます。
  - セルフサービス復元は、Azure portal または ARM テンプレートなどの IaC アーティファクトを使用して実行できます。
  - 継続的バックアップには、いくつかの制限があります。
    - 現在、継続的バックアップモードは、複数リージョンの書き込み構成では使用できません。
    - 現時点では、継続的バックアップ用に構成できるのは、Azure Cosmos DB for NoSQL と Azure Cosmos DB for MongoDB のみです。
    - コンテナーに TTL が構成されている場合、TTL を超えた復元されたデータは即時に削除される可能性があります
  - 復元操作では、ポイントインタイムリストア用の新しい Azure Cosmos DB アカウントが作成されます。
  - 継続的バックアップと復元操作には、追加のストレージコストがかかります。
既存の Azure Cosmos DB アカウントは、定期的バックアップから継続的バックアップに移行できますが、継続的バックアップから定期的バックアップに移行することはできません。移行は一方向であり、元に戻すことはできません。
Azure Cosmos DB の各バックアップは、データ自体と、プロビジョニングされたスループット、インデックス作成ポリシー、デプロイリージョン、コンテナー TTL 設定の構成の詳細で構成されます。
- バックアップには、ファイアウォール設定、仮想ネットワークアクセス制御リスト、プライベートエンドポイント設定、一貫性設定 (アカウントはセッション一貫性で復元されます)、ストアドプロシージャ、トリガー、UDF、または複数リージョン設定は含まれません。
  - 機能と構成設定を再デプロイする責任はお客様にあります。これらは Azure Cosmos DB バックアップ経由で復元されません。
- Azure Synapse Link 分析ストアデータも、Azure Cosmos DB バックアップに含まれません。
定期的な方法と継続的な方法が適していないシナリオでは、カスタムのバックアップと復元の機能を実装できます。
- カスタムアプローチでは、大幅なコストと追加の管理オーバーヘッドが発生することを理解し、慎重に評価する必要があります。
  - データ項目のアカウント、データベース、コンテナーの破損や削除など、一般的な復元シナリオをモデル化する必要があります。
  - バックアップのスプロールを防ぐために、ハウスキープ処理の手順を実装する必要があります。
- Azure Storage または代替データテクノロジ (代替の Azure Cosmos DB コンテナーなど) を使用できます。
  - Azure Storage と Azure Cosmos DB は、Azure Functions や Azure Data Factory などの Azure サービスとのネイティブ統合を提供します。
Azure Cosmos DB のドキュメントには、カスタムバックアップを実装するための 2 つの選択可能なオプションが説明されています。
- Azure Cosmos DB の変更フィードを使用して、別のストレージ機能にデータを書き込みます。
  - Azure 関数または同等のアプリケーションプロセスでは、変更フィードプロセッサを使用して変更フィードにバインドし、項目をストレージに処理します。
- 変更フィードを使用して、継続的または定期的な (バッチ処理された) カスタムバックアップの両方を実装できます。
- Azure Cosmos DB の変更フィードには削除がまだ反映されていないため、ブール型プロパティと TTL を使用して論理的な削除パターンを適用する必要があります。
  - 変更フィードで完全に忠実な更新が提供される場合、このパターンは必要ありません。
- Azure Data Factory Connector for Azure Cosmos DB (Azure Cosmos DB for NoSQL または MongoDB API コネクタ) を使用して、データをコピーします。
  - Azure Data Factory (ADF) では、手動実行とスケジュール、タンブリングウィンドウ、イベントベースのトリガーがサポートされます。
    - Storage と Event Grid の両方がサポートされます。
  - ADF は主に、バッチ指向オーケストレーションによる定期的なカスタムバックアップ実装に適しています。
    - オーケストレーション実行のオーバーヘッドが原因で頻繁にイベントが発生する継続的バックアップの実装には適しません。
  - ADF では、ネットワークセキュリティの高いシナリオで Azure Private Link がサポートされます

Azure Cosmos DB は多くの Azure サービスの設計内で使用されるため、Azure Cosmos DB の大規模なリージョン障害は、そのリージョン内のさまざまな Azure サービスに連鎖的な影響を与えます。特定のサービスに対する正確な影響は、基になるサービス設計で Azure Cosmos DB がどのように使用されているかによって大きく異なります。

設計上の推奨事項

Azure Cosmos DB

要件が許容されるプライマリデータプラットフォームとして Azure Cosmos DB を使用します。
ミッションクリティカルなワークロードシナリオでは、待機時間を短縮し、冗長性を最大限に高めるために、各デプロイリージョン内に書き込みレプリカを使用して Azure Cosmos DB を構成します。
- アプリケーションの負荷、パフォーマンス、およびリージョン RU/秒の使用量を最適化するために、書き込みと読み取りにローカル Azure Cosmos DB レプリカの使用を優先するようにアプリケーションを構成します。
- 複数リージョンの書き込み構成はコストが高くなり、最大限の信頼性を必要とするワークロードシナリオに対してのみ優先順位を付ける必要があります。
重要度の低いワークロードシナリオでは、グローバルに分散された読み取りレプリカによる単一リージョン書き込み構成 (Availability Zones を使用する場合) の使用を優先します。これは、高レベルのデータプラットフォームの信頼性 (読み取り操作では 99.999% SLA、書き込み操作では 99.995% SLA) をより魅力的な価格で提供するためです。
- 読み取りパフォーマンスを最適化するために、ローカルの Azure Cosmos DB 読み取りレプリカを使用するようにアプリケーションを構成します。
複数リージョンの書き込み構成で競合解決が行われ、すべての書き込みが単一リージョンの書き込み構成で実行される最適な "ハブ" デプロイリージョンを選択します。
- 他のデプロイリージョンとの相対的な距離と、プライマリリージョンの選択に関連する待機時間、および Availability Zones のサポートなどの必要な機能を検討してください。
リージョン内のゾーン障害に対する回復性を確保するために、AZ がサポートされているすべてのデプロイリージョンで Availability Zone (AZ) 冗長を使用して Azure Cosmos DB を構成します。
Azure Cosmos DB for NoSQL を使用します。これは、特にパフォーマンスチューニングが関係する最も包括的な機能セットを提供するためです。
- 代替 API は、主に移行または互換性のシナリオで検討する必要があります。
  - 代替 API を使用する場合は、最適な構成とパフォーマンスを確保するために、選択した言語と SDK で必要な機能が使用できることを検証します。
直接接続モードを使用して、バックエンドの Azure Cosmos DB ノードへの直接 TCP 接続によってネットワークパフォーマンスを最適化し、ネットワークの "ホップ" の数を減らします。

Azure Cosmos DB SLA は、失敗した要求数を平均することによって計算されます。これは、99.999% の信頼性レベルのエラー予算と直接一致しない可能性があります。したがって、99.999% SLO 用に設計する場合は、リージョンおよび複数リージョンの Azure Cosmos DB 書き込みを使用できないように計画し、障害が発生した場合に、後続の再生用の永続化されたメッセージキューなどのフォールバックストレージテクノロジを配置することが重要です。

論理パーティションと物理パーティションの両方でパーティション分割戦略を定義し、データモデルに従ってデータ分散を最適化します。
- クロスパーティションクエリを最小化する。
- 最適なパフォーマンスを確保するために、パーティション分割戦略を繰り返しテストして検証します。
最適なパーティションキーを選択します。
- パーティションキーは、コレクション内に作成された後は変更できません。
- パーティションキーは、変更されないプロパティ値である必要があります。
- カーディナリティが高く、使用可能な値の範囲が広いパーティションキーを選択します。
- パーティションキーは、RU 消費量とデータストレージをすべての論理パーティションに均等に分散して、物理パーティション間での均等な RU 消費量と記憶域の分散を確保する必要があります。
- パーティション分割された列に対して読み取りクエリを実行して、RU の消費量と待機時間を短縮します。
インデックス作成はパフォーマンスにも重要であるため、インデックスの除外を使用して RU/秒とストレージの要件を削減します。
- クエリ内でのフィルター処理に必要なフィールドにのみインデックスを付けます。最も使用される述語のインデックスを設計します。
Azure Cosmos DB SDK の組み込みのエラー処理、再試行、およびより広範な信頼性機能を活用します。
- クライアントの SDK 内に再試行ロジックを実装します。
サービスマネージド暗号化キーを使用して、管理の複雑さを軽減します。
- カスタマーマネージドキーに特定のセキュリティ要件がある場合は、バックアップやローテーションなど、適切なキー管理手順が適用されていることを確認します。
組み込みの Azure Policy を適用して、Azure Cosmos DB のキーベースのメタデータ書き込みアクセスを無効にします。
Azure Monitor を有効にして、プロビジョニング済みスループット (RU/秒) などの主要なメトリックと診断ログを収集します。
- Azure Monitor の運用データを、Azure Cosmos DB およびアプリケーション設計内の他のグローバルリソース専用の Log Analytics ワークスペースにルーティングします。
- Azure Monitor メトリックを使用して、アプリケーションのトラフィックパターンが自動スケーリングに適しているかどうかを判断します。
アプリケーショントラフィックパターンを評価して、プロビジョニングされたスループットの種類に最適なオプションを選択します。
- ワークロードの需要を自動的に平準化するために、プロビジョニングされたスループットを自動スケーリングすることを検討してください。
Microsoft の Azure Cosmos DB に関するパフォーマンスのヒントを評価し、クライアント側とサーバー側の構成を最適化して待機時間とスループットを向上させます。
コンピューティングプラットフォームとして AKS を使用する場合: クエリ集中型ワークロードの場合は、高速ネットワークが有効になっている AKS ノード SKU を選択して、待機時間と CPU ジッターを減らします。
単一書き込みリージョンのデプロイの場合は、自動フェールオーバー用に Azure Cosmos DB を構成することを強くお勧めします。
Azure Cosmos DB に更新プログラムを書き込むシステムフロー内で、非同期の非ブロッキングメッセージングを使用して負荷レベルを設定します。
- コマンドクエリ責務分離やイベントソーシングなどのパターンを検討してください。
継続的バックアップ用に Azure Cosmos DB アカウントを構成して、過去 30 日間の復旧ポイントを細かく取得します。
- 包含データまたは Azure Cosmos DB アカウントが削除または破損しているシナリオで、Azure Cosmos DB バックアップを使用することを検討してください。
- 絶対に必要な場合を除き、カスタムバックアップアプローチの使用は避けてください。
標準的なビジネス継続性運用の準備の一環として、非運用のリソースとデータで復旧手順を実践することを強くお勧めします。
IaC アーティファクトを定義して、Azure Cosmos DB バックアップ復元の構成設定と機能を再確立します。
Azure Cosmos DB のバックアップと復旧に関する Azure セキュリティベースライン制御ガイダンスを評価して適用します。
複数リージョンの可用性を必要とする分析ワークロードの場合は、最適化された分析クエリに列形式を適用する Azure Cosmos DB 分析ストアを使用します。

リレーショナルデータテクノロジ

高度なリレーショナルデータモデルまたは既存のリレーショナルテクノロジへの依存関係があるシナリオでは、複数リージョンの書き込み構成での Azure Cosmos DB の使用が直接適用されない場合があります。そのような場合は、アプリケーションデザインの複数リージョンのアクティブ/アクティブの目標を維持するように、使用されるリレーショナルテクノロジを設計および構成することが重要です。

Azure には、MySQL、PostgreSQL、MariaDB などの一般的な OSS リレーショナルソリューション用の Azure SQL Database や Azure Database など、多くのマネージドリレーショナルデータプラットフォームが用意されています。そのため、このセクションの設計上の考慮事項と推奨事項は、信頼性とグローバル可用性を最大限に高めるために、Azure SQL Database と Azure Database OSS フレーバーの最適な使用に焦点を当てています。

設計上の考慮事項

リレーショナルデータテクノロジは読み取り操作を簡単にスケーリングするように構成できますが、通常、書き込みでは単一のプライマリインスタンスを通過するように制限されます。これにより、スケーラビリティとパフォーマンスに大きな制約が発生します。
シャーディングを適用して、複数の同一の構造化データベース間にデータと処理を分散し、データベースを水平方向にパーティション分割してプラットフォームの制約を回避できます。
- たとえば、シャーディングは多くの場合、テナントのグループを個別のデータプラットフォームコンストラクトに分離するために、マルチテナント SaaS プラットフォームで適用されます。

Azure SQL Database

Azure SQL Database には、最新の安定したバージョンの SQL Server データベースエンジンと基になるオペレーティングシステムで常に実行されているフルマネージドデータベースエンジンが用意されています。
- パフォーマンスチューニング、脅威の監視、脆弱性評価などのインテリジェントな機能を提供します。
Azure SQL Database では、リージョンの高可用性とターンキー geo レプリケーションが組み込まれており、Azure リージョン間で読み取りレプリカを分散できます。
- geo レプリケーションでは、セカンダリデータベースのレプリカは、フェールオーバーが開始されるまで読み取り専用のままになります。
- 同じリージョンまたは異なるリージョンでは、最大 4 つのセカンダリがサポートされます。
- セカンダリレプリカを読み取り専用クエリアクセスに使用して、読み取りパフォーマンスを最適化することもできます。
- フェールオーバーは手動で開始する必要がありますが、自動化された操作手順でラップできます。
Azure SQL Database には、自動フェールオーバーグループが用意されています。これにより、データベースがセカンダリサーバーにレプリケートされ、障害が発生した場合に透過的なフェールオーバーが可能になります。
- 自動フェールオーバーグループでサポートされている geo レプリケーションでは、グループ内のすべてのデータベースが、別のリージョンの 1 つのセカンダリサーバーまたはインスタンスにのみレプリケートされます。
- 自動フェールオーバーグループは現在、Hyperscale サービスレベルではサポートされていません。
- セカンダリデータベースを使用して、読み取りトラフィックをオフロードできます。
Premium または Business Critical サービスレベルのデータベースレプリカは、追加コストなしで Availability Zones 間に分散できます。
- また、コントロールリングは、3 つのゲートウェイリング (GW) として複数のゾーンにまたがって複製されます。
  - 特定のゲートウェイリングへのルーティングは Azure Traffic Manager によって制御されます。
- Business Critical レベルを使用している場合、ゾーン冗長構成は Gen5 コンピューティングハードウェアが選択されている場合のみ利用できます。
Azure SQL Database では、すべてのサービスレベルでベースライン 99.99% の可用性 SLA が提供されますが、Availability Zones をサポートしているリージョンでは、Business Critical レベルまたは Premium レベルに対して 99.995% の SLA が提供されます。
- ゾーン冗長デプロイ用に構成されていない Azure SQL Database Business Critical レベルまたは Premium レベルの可用性 SLA は 99.99% です。
geo レプリケーションを使用して構成すると、Azure SQL Database Business Critical レベルでは、デプロイされた時間の 100% に対して 30 秒の復旧時間目標 (RTO) が提供されます。
geo レプリケーションを使用して構成すると、Azure SQL Database Business Critical レベルの回復ポイントの目標 (RPO) は、デプロイされた時間の 100% に対して 5 秒です。
Azure SQL Database Hyperscale レベルは、少なくとも 2 つのレプリカで構成されている場合、可用性 SLA は 99.99% です。
Azure SQL Database に関連付けられているコンピューティングコストは、予約割引を使用して削減できます。
- DTU ベースのデータベースに予約容量を適用することはできません。
ポイントインタイムリストアを使用して、データベースと包含データを以前の時点に返すことができます。
geo リストアを使用して、geo 冗長バックアップからデータベースを復旧できます。

Azure Database for PostgreSQL

Azure Database For PostgreSQL は、次の 3 つの異なるデプロイオプションで提供されています。
- 単一サーバー、SLA 99.99%
- Availability Zoneの冗長性を提供するフレキシブルサーバー、SLA 99.99%
- Hyperscale (Citus)、高可用性モードが有効になっている場合は SLA 99.95%。
Hyperscale (Citus) は、アプリケーションを変更することなくシャーディングを通じて動的なスケーラビリティを提供します。
- 複数の PostgreSQL サーバー間でテーブル行を分散させるのは、Hyperscale (Citus) でスケーラブルなクエリを実行するための主な手法です。
- 複数のノードを使用することにより、従来のデータベースよりも多くのデータを集合的に保持することができます。また、ワーカー CPU を並列で使用してコストを最適化できる場合も多くあります。
自動スケーリングは、トラフィックパターンの変化に応じて弾力性を確保するために、Runbook Automation を使用して構成できます。
フレキシブルサーバーは、サーバーを停止/起動する機能と、継続的なコンピューティング容量を必要としないワークロードに適したバースト可能なコンピューティングレベルを通じて、非運用ワークロードのコスト効率を実現します。
プロビジョニングされたサーバーストレージ全体の 100% までのバックアップストレージに対しては、追加料金がかかりません。
- バックアップストレージの超過使用分については、使用された GB/月に応じて課金されます。
Azure Database for PostgreSQL に関連付けられているコンピューティングコストは、単一サーバー予約割引または Hyperscale (Citus) 予約割引を使用して削減できます。

設計上の推奨事項

プラットフォームの制約の移動、スケーラビリティと可用性の最大化、障害の分離に役立てるために、アプリケーションとデータのさまざまなコンテキストに基づいてリレーショナルデータベースをパーティション分割するシャーディングを検討します。
- この推奨事項は、アプリケーションの設計で 3 つ以上の Azure リージョンが考慮される場合に特に一般的です。これは、リレーショナルテクノロジの制約によって、グローバルに分散されたデータプラットフォームが大幅に妨げられる可能性があるためです。
- シャーディングはすべてのアプリケーションシナリオに適しているわけではないため、状況に即した評価が必要です。
Azure プラットフォームでの成熟度と幅広い信頼性機能のために、リレーショナル要件が存在する Azure SQL Database を優先的に使用します。

Azure SQL Database

重要な回復性機能へのアクセスなど、信頼性と可用性を最大限に高めるために、Business-Critical サービスレベルを使用します。
仮想コアベースの消費モデルを使用すると、ワークロードのボリュームとスループットの要件に合わせて、コンピューティングリソースとストレージリソースを個別に選択できます。
- コンピューティングリソースとストレージリソースの要件を通知するために、定義済みの容量モデルが適用されていることを確認します。
  - 潜在的なコストの最適化を提供するには予約容量を検討してください。
ゾーン冗長デプロイモデルを構成して、同じリージョン内の Business Critical データベースレプリカを Availability Zones に分散させます。
アクティブ geo レプリケーションを使用して、すべてのデプロイリージョン内に読み取り可能なレプリカをデプロイします (最大 4 つ)。
自動フェールオーバーグループを使用して、セカンダリリージョンに透過的なフェールオーバーを提供し、geo レプリケーションを適用して、読み取り最適化とデータベース冗長性のために追加のデプロイリージョンへのレプリケーションを提供します。
- 2 つのデプロイリージョンのみに制限されているアプリケーションシナリオの場合、自動フェールオーバーグループを優先的に使用する必要があります。
自動フェールオーバーグループ内のプライマリとセカンダリに影響を与える障害が発生した場合は、アプリケーション正常性モデルに合わせたアラートに基づく自動運用トリガーを検討し、geo レプリケートされたインスタンスへのフェールオーバーを実行します。

重要

4 つを超えるデプロイリージョンを検討しているアプリケーションでは、Azure Cosmos DB などの複数リージョンの書き込みテクノロジをサポートするために、アプリケーションスコープのシャーディングまたはアプリケーションのリファクタリングを真剣に検討する必要があります。ただし、これがアプリケーションワークロードシナリオ内で実現できない場合は、単一の地理内のリージョンを geo レプリケートされたインスタンスを含むプライマリ状態に昇格することで、読み取りアクセスをより均等に分散することをお勧めします。

読み取りパフォーマンスを最適化するために、読み取りクエリのレプリカインスタンスにクエリを実行するようにアプリケーションを構成します。
Azure Monitor と Azure SQL Analytics を使用して、信頼性インシデントの検出に関する Azure SQL DB の凖リアルタイムの運用分析情報を取得します。
Azure Monitor を使用して、すべてのデータベースの使用状況を評価し、適切なサイズに設定されているかどうかを判断します。
- 適切なデータプラットフォームの動作を検証するために、必ず CD パイプラインで代表的な負荷レベルでのロードテストが考慮されるようにします。
監視とアラートを使用して必要に応じて自動化された運用アクションを推進することで、データベースコンポーネントの正常性メトリックを計算して、ビジネス要件とリソース使用率に関連する正常性を観察します。
- サービスの低下が発生したときに迅速なアクションを実行できるように、主要なクエリパフォーマンスメトリックが組み込まれていることを確認します。
Query Performance Insights および Microsoft が提供する一般的なパフォーマンスに関する推奨事項を使用して、クエリ、テーブル、およびデータベースを最適化します。
SDK を使用して再試行ロジックを実装し、Azure SQL Database の接続に影響する一時的なエラーを軽減します。
保存時の暗号化にサーバー側の Transparent Data Encryption (TDE) を適用する場合は、サービスマネージドキーの使用を優先します。
- カスタマーマネージドキーまたはクライアント側の (AlwaysEncrypted) 暗号化が必要な場合は、バックアップと自動ローテーション機能を使用して、キーに適切な回復性があることを確認します。
重大な構成エラーから復旧するための運用プレイブックとしてポイントインタイムリストアを使用することを検討してください。

Azure Database for PostgreSQL

フレキシブルサーバーは、Availability Zoneをサポートしているため、ビジネスクリティカルなワークロードに使用することをお勧めします。
ビジネスクリティカルなワークロードに Hyperscale (Citus) を使用する場合は、99.95% の SLA 保証を受けるために高可用性モードを有効にします。
Hyperscale (Citus) サーバー構成を使用して、複数のノード間の可用性を最大化します。
アプリケーションの容量モデルを定義して、データプラットフォーム内のコンピューティングリソースとストレージリソースの要件を通知します。
- 潜在的なコストの最適化を提供するには、Hyperscale (Citus) 予約割引を検討してください。

ホット層データのキャッシュ

メモリ内キャッシュレイヤーを適用して、読み取りスループットを大幅に向上させ、ホット層のデータシナリオでエンドツーエンドのクライアント応答時間を向上させることで、データプラットフォームを強化できます。

Azure には、データプラットフォームの読み取りアクセスを抽象化および最適化するために配置された Azure Cache for Redis を使用して、キーデータ構造をキャッシュするための適用可能な機能を備えた複数のサービスが用意されています。そのため、このセクションでは、読み取りパフォーマンスとデータアクセスの持続性を高める必要があるシナリオでの Azure Cache for Redis の最適な使用に焦点を当てます。

デザインに関する考慮事項

キャッシュレイヤーでは、基になるデータテクノロジに影響を与える障害が発生した場合でも、キャッシュレイヤーを介してアプリケーションデータスナップショットに引き続きアクセスできるため、データアクセスの持続性を高めることができます。
特定のワークロードシナリオでは、メモリ内キャッシュをアプリケーションプラットフォーム自体に実装できます。

Azure Cache for Redis

Redis Cache は、オープンソースの NoSQL キー値のメモリ内ストレージシステムです。
Enterprise および Enterprise Flash レベルは、geo レプリケーションを使用して、あるリージョン内の Availability Zones 間や異なる Azure リージョン間でアクティブ/アクティブ構成でデプロイできます。
- 少なくとも 3 つの Azure リージョンと各リージョンで 3 つ以上の Availability Zones 間にデプロイされ、すべてのキャッシュインスタンスに対してアクティブ geo レプリケーションが有効になっている場合、Azure Cache for Redis では、1 つのリージョンキャッシュエンドポイントへの接続に対して 99.999% の SLA が提供されます。
- 1 つの Azure リージョン内の 3 つの Availability Zones 間にデプロイすると、99.99% の接続 SLA が提供されます。
Enterprise Flash レベルは、RAM とフラッシュの不揮発性メモリストレージの組み合わせで実行され、これによって若干のパフォーマンス低下が発生する一方で、クラスタリングによって最大 13TB という非常に大きなキャッシュ・サイズが可能になります。
geo レプリケーションでは、キャッシュインスタンスに関連する直接コストに加えて、リージョン間のデータ転送の料金も適用されます。
スケジュールされた更新プログラム機能には、基になる VM オペレーティングシステムに適用される Azure の更新プログラムは含まれません。
データが新しいインスタンスに移行されている間は、スケールアウト操作中に CPU 使用率が増加します。

設計上の推奨事項

読み取りスループットを向上させ、応答時間を向上させるために、"ホット" データシナリオ用に最適化されたキャッシュレイヤーを検討します。
キャッシュの有効期限とハウスキーピングに適切なポリシーを適用して、データの急増を回避します。
- バッキングデータが変更された場合にキャッシュ項目を期限切れにすることを検討します。

Azure Cache for Redis

Premium または Enterprise SKU を使用して、信頼性とパフォーマンスを最大化します。
- データボリュームが非常に大きいシナリオの場合、Enterprise Flash レベルを検討する必要があります。
- パッシブ geo レプリケーションのみが必要なシナリオの場合、Premium レベルも検討できます。
考慮されるすべてのデプロイリージョンにわたって、アクティブな構成で geo レプリケーションを使用してレプリカインスタンスをデプロイします。
レプリカインスタンスが、検討された各 Azure リージョン内の Availability Zones 全体にデプロイされていることを確認します。
Azure Monitor を使用して Azure Cache for Redis を評価します。
- リージョンキャッシュコンポーネントの正常性スコアを計算して、ビジネス要件とリソース使用率に対する正常性を確認します。
- 高い CPU 使用率、高いメモリ使用率、高いサーバー負荷、削除されたキーなどの主要なメトリックを監視してアラートを設定し、キャッシュをスケーリングするタイミングを把握します。
再試行ロジック、タイムアウトを実装し、Redis 接続マルチプレクサーのシングルトン実装を使用して、接続の回復性を最適化します。
Redis Server の更新プログラムがキャッシュに適用される日時を指定するようにスケジュールされた更新プログラムを構成します。

分析シナリオ

ミッションクリティカルなアプリケーションでは、包含されるデータフローから追加の価値を引き出す手段として分析シナリオを検討することがますます一般的になっています。したがって、アプリケーションと運用 (AIOps) 分析シナリオは、信頼性の高いデータプラットフォームの重要な側面を形成します。

分析ワークロードとトランザクションワークロードでは、それぞれのコンテキスト内で許容可能なパフォーマンスを実現するために、さまざまなデータプラットフォームの機能と最適化が必要です。

説明	分析	トランザクション
ユースケース	非常に大量のデータ ("ビッグデータ") の分析	大量の個々のトランザクションの処理
最適化の対象	多くのレコードに対するクエリと集計の読み取り	少数のレコードに対する凖リアルタイムの作成/読み取り/更新/削除 (CRUD) クエリ
主な特性	- レコードのデータソースからの統合 - 列ベースのストレージ - 分散ストレージ - 並列処理 - 非正規化 - 低コンカレンシーの読み取りと書き込み - 圧縮によるストレージボリュームの最適化	- アプリケーションのレコードのデータソース - 行ベースのストレージ - 連続ストレージ - 対称処理 - 正規化 - 高コンカレンシーの読み取りと書き込み、インデックスの更新 - メモリ内ストレージを使用した高速なデータアクセスの最適化

Azure Synapse は、Azure Cosmos DB などの Azure サービスとの組み込み統合を使用して、リレーショナルデータと非リレーショナルデータを Spark テクノロジと組み合わせてビッグデータ分析を容易にするエンタープライズ分析プラットフォームを提供します。そのため、このセクションの設計上の考慮事項と推奨事項は、分析シナリオに最適な Azure Synapse と Azure Cosmos DB の使用に焦点を当てます。

デザインに関する考慮事項

従来、大規模な分析シナリオは、後続の分析クエリ用に最適化された別のデータプラットフォームにデータを抽出することによって容易に実行できるようになります。
- 抽出、変換、読み込み (ETL) パイプラインは、データを抽出するために使用され、スループットが消費され、トランザクションワークロードのパフォーマンスに影響します。
- ETL パイプラインの実行頻度を下げスループットとパフォーマンスへの影響を減らすと、分析データが最新の状態ではなくなります。
- ETL パイプラインの開発とメンテナンスのオーバーヘッドは、データ変換の複雑化に伴って増加します。
  - たとえば、ソースデータが頻繁に変更または削除される場合、ETL パイプラインでは、追加/バージョン管理アプローチ、ダンプと再読み込み、または分析データに対するインプレース変更によって、分析クエリのターゲットデータにおけるそれらの変更を考慮する必要があります。これらの各アプローチは、インデックスの再作成や更新など、派生的な影響を与えます。

Azure Cosmos DB

Azure Cosmos DB トランザクションデータに対して実行される分析クエリは、通常、大量のデータをパーティション間で集計するため、大量の要求ユニット (RU) スループットを消費します。これは、周囲のトランザクションワークロードのパフォーマンスに影響を与える可能性があります。
Azure Cosmos DB 分析ストアは、スキーマ化され完全に分離された列指向のデータストアを提供します。これにより、Azure Synapse から Azure Cosmos DB データに対する大規模な分析を Azure Cosmos DB トランザクションワークロードに影響を与えることなく実現できます。
- Azure Cosmos DB コンテナーが分析ストアとして有効になっている場合、コンテナー内の運用データから新しい列ストアが内部的に作成されます。この列ストアは、そのコンテナーに対する行指向のトランザクションストアとは別に保持されます。
- 運用データに対する作成、更新、削除の操作は分析ストアに自動的に同期されるため、変更フィードや ETL 処理は必要ありません。
- 運用データから分析ストアへのデータ同期では、コンテナーまたはデータベースにプロビジョニングされたスループット要求ユニット (RUs) は使用されません。トランザクションワークロードへのパフォーマンスの影響はありません。分析ストアでは、Azure Cosmos DB データベースまたはコンテナーに追加の RUs を割り当てる必要はありません。
- 自動同期は、運用データの変更が分析ストアに自動的に同期されるプロセスです。自動同期の待機時間は、通常、2 分未満です。
  - 自動同期の待機時間は、共有スループットと多数のコンテナーを持つデータベースの場合、最大 5 分です。
  - 自動同期が完了するとすぐに、Azure Synapse から最新のデータに対しクエリを実行できます。
- 分析ストアストレージでは、消費量ベースの価格モデルが使用されます。このモデルでは、データの量と読み取りと書き込みの操作数に対して課金されます。分析ストアの価格は、トランザクションストアの価格とは別です。
Azure Synapse Link を使用すると、Azure Cosmos DB 分析ストアに対し Azure Synapse から直接クエリを実行できます。これにより、Synapse からの ETL なしのハイブリッドトランザクション分析処理 (HTAP) が可能になるため、Azure Cosmos DB データに対し Synapse の他の分析ワークロードと共に凖リアルタイムでクエリを実行できます。
Azure Cosmos DB 分析ストアは、既定ではパーティション分割されません。
- 特定のクエリシナリオでは、クエリ述語で頻繁に使用されるキーを使用して分析ストアデータを分割することで、パフォーマンスが向上します。
- パーティション分割は、Synapse Link を使用して Spark ノートブックを実行する Azure Synapse のジョブによってトリガーされます。このジョブは、Azure Cosmos DB 分析ストアからデータを読み込み、Synapse ワークスペースのプライマリストレージアカウントの Synapse パーティションストアに書き込みます。
Azure Synapse Analytics SQL サーバーレスプールでは、自動的に更新されたビューまたは SELECT / OPENROWSET コマンドを使用して分析ストアに対してクエリを実行できます。
Azure Synapse Analytics Spark プールでは、自動的に更新された Spark テーブルまたは spark.read コマンドを使用して分析ストアに対してクエリを実行できます。
また、Spark を使用して Azure Cosmos DB 分析ストアから専用の Synapse SQL プールにデータをコピーして、プロビジョニングされた Azure Synapse SQL プールリソースを使用できるようにすることもできます。
Azure Cosmos DB 分析ストアのデータには、Azure Synapse Spark を使用してクエリを実行できます。
- Spark ノートブックを使用すると、Spark データフレームを組み合わせて、Azure Cosmos DB 分析データを集計して他のデータセットと変換したり、変換されたデータを他のストアに書き込んだり、AIOps Machine Learning モデルをトレーニングしたりするなどの他の高度な Synapse Spark 機能を使用できます。

Azure Cosmos DB 分析列ストア

Azure Cosmos DB の変更フィードを使用して、分析シナリオ用に別のセカンダリデータストアを維持することもできます。

Azure Synapse

Azure Synapse は、SQL データウェアハウス、Spark ビッグデータ、Data Explorer などの分析機能を組み合わせてログ分析と時系列分析を行います。
- Azure Synapse では、リンクされたサービスを使用して、Azure Storage などの他のサービスへの接続を定義します。
- データは、サポートされているソースから Copy アクティビティを使用して Synapse Analytics に取り込むことができます。これにより、ソースデータストアに影響を与えることなく Synapse でデータ分析が可能になりますが、データ転送による時間、コスト、待機時間のオーバーヘッドが増加します。
- また、サポートされている外部ストアのデータにインプレースでクエリを実行できるため、データインジェストや移動のオーバーヘッドを回避できます。 Data Lake Gen2 を使用した Azure Storage は Synapse でサポートされているストアであり、Log Analytics のエクスポートされたデータには Synapse Spark を介してクエリを実行できます。
Azure Synapse Studio では、インジェストタスクとクエリタスクが統合されます。
- Azure Cosmos DB 分析ストアデータや Log Analytics エクスポートデータなどのソースデータは、ビジネスインテリジェンスやその他の集計された分析ユースケースをサポートするためにクエリ実行と処理が行われます。

Azure Synapse Analytics

設計上の推奨事項

トランザクションパフォーマンスを維持するために、必ず分析ワークロードがトランザクションアプリケーションワークロードに影響を与えないようにします。

アプリケーション分析

Azure Synapse Link と Azure Cosmos DB 分析ストアを使用して、最適化されたデータストアを作成して Azure Cosmos DB の運用データに対して分析を実行します。これはトランザクションのパフォーマンスに影響しません。
- Azure Cosmos DB アカウントで Azure Synapse Link を有効にします。
- 分析ストアに対して有効になっているコンテナーを作成するか、既存の分析ストア用コンテナーを有効にします。
- Azure Synapse ワークスペースを Azure Cosmos DB 分析ストアに接続して、Azure Synapse の分析ワークロードで Azure Cosmos DB データのクエリを実行できるようにします。読み取り専用の Azure Cosmos DB キーを持つ接続文字列を使用します。
Azure Cosmos DB 変更フィードを使用して分析データストアを維持するのではなく、Azure Synapse Link を使用して Azure Cosmos DB 分析ストアを優先します。
- Azure Cosmos DB 変更フィードは、非常に単純な分析シナリオに適している場合があります。

AIOps と運用分析

リソースからの運用データが送信されるソース Azure Storage アカウントごとに、リンクされたサービスとデータセットを含む単一の Azure Synapse ワークスペースを作成します。
専用の Azure Storage アカウントを作成し、それをワークスペースプライマリストレージアカウントとして使用して、Synapse ワークスペースカタログのデータとメタデータを格納します。 Azure Data Lake Gen2 を有効にするために、階層型名前空間を使用して構成します。
- ソース分析データと Synapse ワークスペースのデータとメタデータの分離を維持します。
  - 運用データが送信されるリージョンまたはグローバルの Azure Storage アカウントは使用しないでください。

次のステップ

ネットワークに関する考慮事項を確認します。

ネットワークと接続

次の方法で共有

Azure でのミッションクリティカルなワークロードに関するデータプラットフォームの考慮事項

ビッグデータの 4 つの V

デザインに関する考慮事項

設計上の推奨事項

その他の参照情報

グローバルに分散された複数リージョン書き込みデータストア

設計上の考慮事項

設計上の推奨事項

リレーショナルデータテクノロジ

設計上の考慮事項

設計上の推奨事項

ホット層データのキャッシュ

デザインに関する考慮事項

設計上の推奨事項

分析シナリオ

デザインに関する考慮事項

設計上の推奨事項

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Azure でのミッション クリティカルなワークロードに関するデータ プラットフォームの考慮事項

ビッグ データの 4 つの V

デザインに関する考慮事項

設計上の推奨事項

その他の参照情報

グローバルに分散された複数リージョン書き込みデータストア

設計上の考慮事項

設計上の推奨事項

リレーショナル データ テクノロジ

設計上の考慮事項

設計上の推奨事項

ホット層データのキャッシュ

デザインに関する考慮事項

設計上の推奨事項

分析シナリオ

デザインに関する考慮事項

設計上の推奨事項

次のステップ

フィードバック

フィードバック

その他のリソース

Azure でのミッションクリティカルなワークロードに関するデータプラットフォームの考慮事項

ビッグデータの 4 つの V

リレーショナルデータテクノロジ