Databricks を使用したデータエンジニアリング

[アーティクル]
11/02/2024

Databricks には、データサイエンティスト、エンジニア、アナリスト間のコラボレーションのための堅牢な環境を含む、豊富なデータエンジニアリング機能のセットが用意されています。中央には、データをおよびtransformパイプラインがあります。最も効率的なパイプラインの簡単なエンジニアリングを可能にするために、Databricks は構造化ストリーミングテーブルとデルタライブテーブルを提供します。「Azure Databricks でのストリーミングデルタライブテーブルとはを参照してください。

Structured Streaming と Delta Live Tables によって提供されるデータの増分ストリーム処理がデータパイプラインに最適なオプションである理由の概要については、「なぜ増分ストリーム処理?を参照してください。

その他のデータエンジニアリングリソース

Databricks には、多くの追加シナリオでデータエンジニアリングタスク用の機能が用意されています。

Databricks ノートブックはコラボレーションに人気のあるツールです。
Databricks ジョブを使用してワークフローをスケジュールおよび調整します。
機械学習ソリューション設計する場合は Databricks Mosaic AI を参照してください。

Note

主に SQL クエリと BI ツールを使用する場合は、 Databricks SQLを参照してください。

チュートリアルの概要と入門用の informaton については、「 Azure Databricks の概要と Azure Databricks とはを参照してください。

Name	使用目的
Delta Live Tables	Databricks Delta Live Tables を使用してインジェストと変換用のデータパイプラインを構築する方法について説明します。
構造化ストリーミング	Databricks での構造化ストリーミングを利用した、ストリーミング、増分、リアルタイムのワークロードについて説明します。

次の方法で共有

Databricks を使用したデータエンジニアリング

その他のデータエンジニアリングリソース

フィードバック

その他のリソース

次の方法で共有

Databricks を使用したデータ エンジニアリング

その他のデータ エンジニアリング リソース

フィードバック

その他のリソース

Databricks を使用したデータエンジニアリング

その他のデータエンジニアリングリソース