はじめに
大規模データ分析ソリューションは、ビジネス インテリジェンス (BI) をサポートするために使われる従来のデータ ウェアハウスと、ファイルや外部ソースからのデータを統合するために使われる "データ レイクハウス" の手法を組み合わせたものです。 従来のデータ ウェアハウス ソリューションでは、通常、多次元モデルのクエリと構築に最適化されたスキーマを使って、トランザクション データ ストアからリレーショナル データベースにデータがコピーされます。 一方、データ レイクハウス ソリューションは、複数の形式になっている大量のデータで使われます。データは、バッチで読み込まれるか、リアルタイム ストリームで取り込まれ、"データ レイク" に格納された後、Apache Spark などの分散処理エンジンを使って処理されます。
学習の目的
このモジュールでは、次の方法について学習します。
- 大規模データ分析ソリューションの一般的な要素を特定する
- データ インジェスト パイプラインの主な機能について説明する
- 分析データ ストアの一般的な種類を特定する
- Azure のサービスとしてのプラットフォーム (PaaS) 分析サービスを特定する
- Azure Synapse Analytics をプロビジョニングし、それを使用してデータの取り込み、処理、クエリを実行する
- Microsoft Fabric の機能について説明する - データ分析用のサービスとしてのソフトウェア (SaaS) ソリューション
- Microsoft Fabric を使ってデータを取り込んで分析する