Azure Databricks ワークロードを特定する

3 分

Azure Databricks には、Machine Learning と大規模言語モデル (LLM)、Data Science、Data Engineering、BI とデータウェアハウス、ストリーミング処理など、さまざまなワークロード向けの機能が用意されています。

データサイエンスとデータエンジニアリング

このワークロードは、複雑なデータ処理タスクで共同作業を行う必要があるデータサイエンティストやエンジニア向けに設計されています。データレイクハウスでのビッグデータ処理用に Apache Spark と統合された環境を提供し、Python、R、Scala、SQL などの複数の言語をサポートします。このプラットフォームにより、データの探索、視覚化、およびデータパイプラインの開発が容易になります。

Machine Learning

Azure Databricks の Machine Learning ワークロードは、大規模な機械学習モデルの構築、トレーニング、デプロイに最適化されています。これには、実験、再現性、デプロイなど、ML ライフサイクルを管理するためのオープンソースプラットフォームである MLflow が含まれています。また、TensorFlow、PyTorch、Scikit-learn などのさまざまな ML フレームワークもサポートされているため、さまざまな ML タスクに対応できます。

SQL

SQL ワークロードは、主に SQL を介してデータを操作するデータアナリスト向けです。 Azure Databricks 内でデータを直接分析して視覚化するための、使いやすい SQL エディター、ダッシュボード、自動視覚化ツールが用意されています。このワークロードは、クイックアドホッククエリを実行したり、大規模なデータセットからレポートを作成したりするのに最適です。

続行

データ サイエンスとデータ エンジニアリング

Machine Learning

SQL

フィードバック

データサイエンスとデータエンジニアリング