Azure Cosmos DB: ETL なしの分析のユース ケース

適用対象: NoSQL MongoDB Gremlin

Azure Cosmos DB には、運用データに対する ETL なしの準リアルタイム分析用に、さまざまな分析オプションが用意されています。 次のオプションを使用して、Azure Cosmos DB データ上の分析を有効にすることができます。

  • Microsoft Fabric での Azure Cosmos DB のミラーリング
  • Azure Synapse Link for Azure Cosmos DB

これらのオプションの詳細については、「Azure Cosmos DB データの分析と BI」を参照してください。

重要

Microsoft Fabric での Azure Cosmos DB のミラーリングが、NoSql API のプレビューで利用できるようになりました。 この機能により、Azure Synapse Link のすべての機能が提供され、分析パフォーマンスが向上し、データ資産と Fabric OneLake の統合および Delta Parquet 形式を使用した OneLake 内のデータへのアクセスができるようになります。 Azure Synapse Link を検討している場合は、ミラーリングを試して、組織への全体的な適合性を評価することをお勧めします。 ミラーリングを開始するには、こちらをクリックしてください。

ETL なしの、準リアルタイム分析により、ビジネスのさまざまな可能性を開くことができます。 3 つのサンプル シナリオを次に示します。

  • サプライ チェーンの分析、予測、およびレポート作成
  • リアルタイム パーソナル化
  • IOT シナリオでの予測メンテナンス、異常検出

サプライ チェーンの分析、予測、およびレポート作成

サプライ チェーン運用にビッグ データ分析を組み込むと、注文から配送までのサイクルの時間が短縮され、サプライ チェーンが効率化されることが調査研究によってわかっています。

製造元は、従来のエンタープライズ リソース プランニング (ERP) およびサプライ チェーン管理 (SCM) のシステムの制約を解消するために、クラウド ネイティブのテクノロジに乗り換えています。 サプライ チェーンで 1 分あたりに生成されるオペレーション データ (注文、出荷、トランザクションのデータ) の量の増大に伴い、製造元にはオペレーション データベースが必要になります。 このオペレーション データベースは、データ量に対処できるように拡張する必要があります。また、時代を先取りするために、リアルタイムのコンテキスト インテリジェンスのレベルに到達するように分析プラットフォームに拡張する必要があります。

次のアーキテクチャは、サプライ チェーン分析において、クラウドネイティブの運用データベースとして Azure Cosmos DB を使用することの影響力を示しています。

サプライ チェーンにおける Azure Cosmos DB のリアルタイム分析のダイアグラム。

前のアーキテクチャに基づいて、次のユース ケースを実現できます。

  • 予測パイプラインの準備とトレーニング: 機械学習による変換を使って、サプライ チェーン全体のオペレーショナル データに関する分析情報を生成します。 これにより、在庫および運用コストを削減でき、顧客の注文から配送までの時間を短縮できます。

ミラーリングと Synapse Link を使用すると、手動の ETL プロセスを使用せずに、Azure Cosmos DB 内で変化する運用データを分析できます。 これらのオファリングにより、追加のコスト、待機時間、運用上の複雑さを省けます。 これらにより、データ エンジニアやデータ サイエンティストは、堅牢な予測パイプラインを構築できるようになります。

  • Microsoft Fabric または Azure Synapse Analytics 内の Apache Spark プールとのネイティブ統合を使用して、Azure Cosmos DB から運用データにクエリを実行します。 複雑な Data Engineering を行わずに、対話型のノートブックまたはスケジュール済みのリモート ジョブでデータのクエリを実行できます。

  • Microsoft Fabric または Azure Synapse Analytics 内で Spark ML アルゴリズムと Azure Machine Learning (AML) 統合を使用して、Machine Learning (ML) モデルを構築します。

  • 準リアルタイムの運用スコアリングのために、モデル推論後の結果を Azure Cosmos DB に書き戻します。

  • 運用レポート: サプライ チェーン チームは、リアルタイムの正確なオペレーション データに関する柔軟なカスタム レポートを必要とします。 これらのレポートは、サプライ チェーンの有効性、収益性、および生産性のスナップショット ビューを取得するために必要です。 これにより、データ アナリストおよび他の重要な関係者は、絶えずビジネスを見直して、運用コストを削減するために調整する領域を特定できます。

Azure Cosmos DB のミラーリングと Synapse Link を使用すると、豊富なビジネス インテリジェンス (BI)/レポート シナリオを実現できるようになります。

  • T-SQL 言語の完全な表現力を備えたネイティブ統合を使用して、Azure Cosmos DB から運用データにクエリを実行します。

  • Microsoft Fabric または Azure Synapse Analytics 内に統合された Power BI を使用して、Azure Cosmos DB 経由で自動更新 BI ダッシュボードをモデル化して公開します。

次に、Azure Cosmos DB へのバッチおよびストリーミング データのデータ統合に関するガイダンスを示します。

  • バッチ データの統合とオーケストレーション: サプライ チェーンが複雑になると、サプライ チェーン データ プラットフォームをさまざまなデータ ソースや形式と統合することが必要になります。 Microsoft Fabric と Azure Synapse には、Azure Data Factory と同じデータ統合エンジンとエクスペリエンスが組み込まれています。 この統合により、データ エンジニアは、別のオーケストレーション エンジンを使用せずに高度なデータ パイプラインを作成できます。

  • ストリーミング データの統合と処理: 産業用 IoT ("フロアからストア" まで資産を追跡するセンサー、コネクテッド ロジスティクス フリートなど) の成長により、ストリーミング方式で生成されるリアルタイム データは爆発的に増えています。分析情報を生成するために、これらのデータを、従来の動きの遅いデータと統合する必要があります。 Azure Stream Analytics は、幅広いシナリオを使用した Azure でのストリーミング ETL と処理のための推奨サービスです。 Azure Stream Analytics は、ネイティブ データ シンクとして Azure Cosmos DB をサポートしています。

リアルタイム パーソナル化

小売業者は、現在、顧客と企業の両方の需要を満たす、セキュリティで保護されたスケーラブルな eコマース ソリューションを構築する必要があります。 これらの eコマース ソリューションで、カスタマイズされた製品やオファーによって顧客を引き込み、取引を迅速かつ安全に処理し、フルフィルメントと顧客サービスに集中する必要があります。 最新の Synapse Link for Azure Cosmos DB と共に Azure Cosmos DB を使用することで、小売業者は、顧客向けにパーソナル化されたレコメンデーションをリアルタイムで生成できます。 次のアーキテクチャに示すように、小売業者は、低待機時間と調整可能な整合性の設定を使用して、ただちに分析情報を入手できます。

リアルタイム パーソナル化での Azure Cosmos DB のダイアグラム。

  • 予測パイプラインの準備とトレーニング: Fabric または Synapse Spark と機械学習モデルを使用して、事業単位または顧客セグメント全体の運用データに関する分析情報を生成できます。 これは、対象の顧客セグメントへのパーソナライズされた配信、予測的なエンドユーザー エクスペリエンス、エンドユーザーの要件に合わせたターゲット マーケティングに活用されます。 )

IOT 予測メンテナンス

産業用 IOT のイノベーションによって、機械装置のダウンタイムが大幅に削減され、業界のすべての分野で全体的な効率が向上しています。 このようなイノベーションの 1 つは、クラウドのエッジ部分にある機械装置の予測メンテナンス分析です。

IoT 予測メンテナンスにおいて、クラウド ネイティブ HTAP 機能を使用するアーキテクチャを次に示します。

IoT 予測メンテナンスにおける Azure Cosmos DB のダイアグラム。

  • 予測パイプラインの準備とトレーニング: IoT デバイス センサーからの過去のオペレーショナル データを使って、異常検出などの予測モデルをトレーニングできます。 これらの異常検出は、リアルタイム監視のためにエッジ部分に再びデプロイされます。 このような好循環によって、予測モデルを継続的に再トレーニングできます。

  • 運用レポート: デジタル ツイン イニシアティブの成長により、企業は多数のセンサーから大量のオペレーション データを収集し、各マシンのデジタル コピーを作成しています。 このデータは、最新のホット データに加えて、履歴データの傾向を把握する BI のニーズを可能にします。