AI モデルおよび ML モデルをトレーニングする
このセクションでは、Mosaic AI で機械学習モデルおよび AI モデルをトレーニングする方法について説明します。
Mosaic AutoML
Mosaic AutoML は、最適なアルゴリズムとハイパーパラメーター構成を自動的に見つけることで、データセットに機械学習を適用するプロセスを簡略化します。 AutoML では、Python API と同様にロー コードの UI が用意されています。
Mosaic AI モデル トレーニング
Databricks の Mosaic AI モデル トレーニング (旧称 Foundation Model Training) では、独自のデータを使用して大規模言語モデル (LLM) をカスタマイズできます。 このプロセスでは、既存の基盤モデルのトレーニングを微調整することで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、コンピューティング リソースを大幅に削減します。 主な特徴は次のとおりです。
- 監視付き微調整: 構造化されたプロンプト応答データでトレーニングすることで、モデルを新しいタスクに適応させます。
- 継続的な事前トレーニング: 追加のテキスト データを使用してモデルを強化し、新しい知識を追加したり、特定のドメインに焦点を当てたりします。
- チャット補完: チャット ログでモデルをトレーニングし、会話能力を向上させます。
オープン ソース ライブラリの例
Optuna と Hyperopt を使用したハイパーパラメーター調整の例など、さまざまなオープンソース機械学習ライブラリから機械学習トレーニングの例を参照してください。
ディープ ラーニング
Azure Databricks でディープ ラーニング モデルを開発して微調整できるよう、分散ディープ ラーニング トレーニングの例とベスト プラクティスを参照してください。
レコメンダー
Azure Databricks でディープ ラーニング ベースのレコメンデーション モデルをトレーニングする方法について説明します。 ディープ ラーニング モデルでは、従来のレコメンデーション モデルよりも質の高い結果を得られるほか、スケーリングによってより多くのデータに対応できます。