モデル トレーニングの例

このセクションには、多くの一般的なオープンソース ライブラリを使用して、Azure Databricks で機械学習モデルをトレーニングする方法を示す例があります。

また、 Mosaic AutoML を使用して、モデル トレーニング用のデータセットを自動的に準備し、scikit-learn や XGBoost などのオープンソース ライブラリを使用して一連の試用版を実行し、試用版の実行ごとにソース コードを含む Python ノートブックを作成して、コードを確認、再現、変更することもできます。

機械学習の例

Package ノートブック 機能
scikit-learn 機械学習のチュートリアル Unity カタログ、分類モデル、MLflow、Hyperopt および MLflow を使用したハイパーパラメーターの自動チューニング
scikit-learn エンド ツー エンドの例 Unity カタログ、分類モデル、MLflow、Hyperopt および MLflow、XGBoost を使用したハイパーパラメーターの自動チューニング
MLlib MLlib の例 二項分類、デシジョン ツリー、GBT 回帰、構造化ストリーミング、カスタム トランスフォーマー
xgboost XGBoost の例 Python、PySpark、Scala、単一ノードワークロード、分散トレーニング

ハイパーパラメーター チューニングの例

Azure Databricks でのハイパーパラメーターのチューニングに関する一般的な情報については、「ハイパーパラメーターの調整」を参照してください。

Package ノートブック 機能
Optuna Optuna の概要 Optuna、分散された Optuna、Scikit-learn、MLflow
Hyperopt 分散 hyperopt 分散 hyperopt、scikit-learn、MLflow
Hyperopt モデルの比較 分散 hyperopt を使用して、ハイパーパラメーター空間でさまざまなモデルの種類を同時に検索します
Hyperopt 分散トレーニングのアルゴリズムと hyperopt Hyperopt、MLlib
Hyperopt Hyperopt のベスト プラクティス さまざまなサイズのデータセットでのベスト プラクティス