Azure Databricks を使用して機械学習ソリューションを実装する

ラーニングパス
8 モジュール

中級

データサイエンティスト

Azure Databricks

Azure Databricks は、データ分析と機械学習のためのクラウド規模のプラットフォームです。データサイエンティストと機械学習エンジニアは、Azure Databricks を使用して大規模な機械学習ソリューションを実装できます。

前提条件

このラーニングパスでは、Python と Scikit-Learn、PyTorch、TensorFlow などの一般的なオープンソースフレームワークを使用して、データの探索や機械学習モデルのトレーニングを行った経験があることを前提としています。このラーニングパスを開始する前に、「機械学習モデルを作成する」のラーニングパスを完了することを検討してください。

このラーニングパス内のモジュール

Azure Databricks を探索する

Azure Databricks は、Apache Spark を使用したデータ分析のためのスケーラブルなプラットフォームを提供するクラウドサービスです。

Azure Databricks で Apache Spark を使用する

Azure Databricks は Apache Spark 上に構築されており、データエンジニアやアナリストは Spark ジョブを実行して、大規模なデータの変換、分析、視覚化を行うことができます。

Azure Databricks で機械学習モデルをトレーニングする

機械学習には、データを使用した予測モデルのトレーニングが伴います。 Azure Databricks は、モデルのトレーニングに使用できる、一般的に使用される複数の機械学習フレームワークをサポートしています。

Azure Databricks で MLflow を使用する

MLflow は、Azure Databricks でネイティブにサポートされている機械学習ライフサイクルを管理するためのオープンソースプラットフォームです。

Azure Databricks でハイパーパラメーターを調整する

ハイパーパラメーターのチューニングは、機械学習に不可欠な部分です。 Azure Databricks では、Hyperopt ライブラリを使用してハイパーパラメーターを自動的に最適化できます。

Azure Databricks で AutoML を使用する

Azure Databricks の AutoML を使うと、データに対して効果的な機械学習モデルを構築するプロセスが簡素化されます。

Azure Databricks でディープラーニングモデルを管理する

ディープラーニングでは、ニューラルネットワークを使用することで、複雑な予測、コンピュータービジョン、自然言語処理、およびその他の AI ワークロードに対応できるように、非常に効果的に機械学習モデルをトレーニングします。

運用環境の機械学習モデルをAzure Databricks で管理する

機械学習により、データドリブンの意思決定と自動化が可能になりますが、リアルタイムの分析情報を得るためにモデルを運用環境にデプロイすることは困難です。 Azure Databricks には、機械学習モデルを大規模に構築し、トレーニングし、デプロイするための統合プラットフォームが用意されているので、このプロセスを簡略化し、データ科学者とエンジニア間のコラボレーションを促進することができます。

Azure Databricks を使用して機械学習ソリューションを実装する

前提条件

このラーニング パス内のモジュール

このラーニングパス内のモジュール