サービスとしてのプラットフォーム (PaaS) ソリューションの詳細を確認する

完了

Azure には、大規模な分析ストアを実装するために使用できる主な "サービスとしてのプラットフォーム" (PaaS) サービスが 3 つ用意されています。

Screenshot of Azure Synapse Analytics logo.Azure Synapse Analytics は、大規模なデータ分析のための統合されたエンド ツー エンドのソリューションです。 複数のテクノロジと機能を統合して、スケーラブルなハイ パフォーマンスの SQL Server ベース リレーショナル データ ウェアハウスに備わるデータの整合性と信頼性に、データ レイクとオープンソース Apache Spark の柔軟性を組み合わせることができます。 また、Azure Synapse Data Explorer プールを使用したログおよびテレメトリ分析のネイティブ サポートと、データ インジェストと変換のための組み込みデータ パイプラインも含まれています。 すべての Azure Synapse Analytics サービスは、Azure Synapse Studio と呼ばれる単一の対話型ユーザー インターフェイスを使用して管理できます。これには、Spark コードとマークダウン コンテンツを組み合わせることができる対話型ノートブックを作成する機能が含まれます。 Synapse Analytics は、Azure で単一の統合された分析ソリューションを作成する場合に最適な選択肢です。

Screenshot of Azure Databricks logo.Azure Databricks は、よく使われる Databricks プラットフォームの Azure による実装です。 Databricks は Apache Spark 上に構築された包括的なデータ分析ソリューションであり、ネイティブの SQL 機能のほか、データ分析とデータ サイエンスのためのワークロード用に最適化された Spark クラスターを提供します。 Databricks には、システムを管理し、データを対話型ノートブックで探索できる対話型ユーザー インターフェイスが用意されています。 Azure Databricks は複数のクラウド プラットフォームで一般的に使用されているため、プラットフォームで既存の専門知識を使用する場合や、マルチクラウド環境で運用する必要がある場合、クラウド移植可能なソリューションをサポートする必要がある場合は、分析ストアとしての使用を検討することをお勧めします。

Screenshot of Azure HDInsight logo.Azure HDInsight は、オープンソース データ分析クラスターの種類を複数サポートする Azure サービスです。 Azure Synapse Analytics や Azure Databricks ほどユーザー フレンドリではありませんが、分析ソリューションが複数のオープンソース フレームワークに依存している場合、または既存のオンプレミス Hadoop ベース ソリューションをクラウドに移行する必要がある場合には、適したオプションになります。

Note

これらの各サービスは、データのクエリを実行できるスキーマとインターフェイスを提供するという意味で、分析データ "ストア" として考えることができます。 ただし、多くの場合、データは実際にはデータ レイクに格納され、サービスはデータの "処理" とクエリの実行に使用されます。 一部のソリューションでは、これらのサービスを組み合わせて使用している場合もあります。 "抽出、読み込み、変換" (ELT) インジェスト プロセスにおいては、データ レイクにデータをコピーした後、これらのサービスのどれかを使用してデータを変換し、別のサービスを使用してクエリを実行する場合があります。 たとえば、パイプラインの場合、HDInsight で実行されている MapReduce ジョブまたは Azure Databricks で実行されているノートブックを使用して、データ レイク内の大量のデータを処理し、Azure Synapse Analytics で SQL プール内のテーブルに読み込むことがあります。