Mosaic AI モデル トレーニングの UI を使用してトレーニングの実行を作成する

重要

この機能は、次のリージョンでパブリック プレビュー段階です: centraluseastuseastus2northcentraluswestus

この記事では、Mosaic AI モデル トレーニング (旧称 Foundation Model Training) の UI を使ってトレーニングの実行を作成および構成する方法について説明します。 API を使って実行を作成することもできます。 手順については、「Mosaic AI Model Training API を使用してトレーニングの実行を作成する」を参照してください。

要件

要件」を参照してください。

UI を使用してトレーニングの実行を作成する

UI を使ったトレーニングの実行の作成は、次の手順のようにして行います。

  1. 左側のサイドバーで、[実験] をクリックします。

  2. [Mosaic AI モデル トレーニング] カードで、[Mosaic AI モデル実験の作成] をクリックします。

    基盤モデル実験フォーム

  3. [Mosaic AI モデル トレーニング] フォームが開きます。 アスタリスクが付いている項目は必須です。 選んでから、[トレーニングの開始] をクリックします。

    [種類]: 実行するタスクを選びます。

    タスク 説明
    命令の微調整 プロンプトと応答の入力による基盤モデルのトレーニングを続けて、特定のタスク向けにモデルを最適化します。
    継続的な事前トレーニング 基盤モデルのトレーニングを続けて、ドメイン固有の知識を与えます。
    チャット入力候補 チャット ログによる基盤モデルのトレーニングを続けて、Q&A または会話アプリケーション向けに最適化します。

    [基盤モデルの選択]: チューニングまたはトレーニングの対象のモデルを選びます。 サポートされているモデルの一覧については、「サポートされているモデル」をご覧ください。

    [トレーニング データ]: [参照] をクリックして Unity Catalog でテーブルを選ぶか、Hugging Face データセットの完全な URL を入力します。 データ サイズの推奨については、「モデル トレーニングに推奨されるデータ サイズ」をご覧ください。

    Unity Catalog でテーブルを選ぶ場合は、テーブルの読み取りに使うコンピューティングも選ぶ必要があります。

    [登録する場所]: ドロップダウン メニューから Unity Catalog のカタログとスキーマを選びます。 この場所にトレーニング済みモデルが保存されます。

    [モデル名]: モデルは、指定したカタログとスキーマにこの名前で保存されます。 このフィールドには既定の名前が表示され、必要に応じて変更できます。

    [詳細なオプション]: さらにカスタマイズするには、評価、ハイパーパラメーターのチューニング、または既存の独自モデルからのトレーニングについてのオプション設定を構成できます。

    設定 説明
    トレーニング期間 エポック数 (10ep など) またはトークン数 (1000000tok など) で指定したトレーニング実行の継続期間。 既定値は 1ep です。
    Learning rate (学習率) モデル トレーニングの学習率。 既定値は 5e-7 です。 オプティマイザーは DecoupledLionW で、ベータ値は 0.99 および 0.95、重み減衰はありません。 学習率スケジューラは LinearWithWarmupSchedule で、ウォームアップはトレーニング期間全体の 2%、最終的な学習率の乗数は 0 です。
    コンテキストの長さ データ サンプルの最大シーケンス長。 この設定より長いデータは切り詰められます。 既定値は、選んだモデルによって異なります。
    評価データ [参照] をクリックして Unity Catalog でテーブルを選ぶか、Hugging Face データセットの完全な URL を入力します。 このフィールドを空白のままにすると、評価は実行されません。
    モデル評価プロンプト モデルの評価に使うオプションのプロンプトを入力します。
    実験名 既定では、実行ごとに自動的に生成された新しい名前が割り当てられます。 必要に応じて、カスタム名を入力するか、ドロップダウン リストから既存の実験を選択できます。
    カスタムの重み 既定では、トレーニングは、選んだモデルの元の重みを使って開始されます。 Composer チェックポイントのカスタムの重みを使って始めるには、チェックポイントの値が含まれる Unity Catalog テーブルへのパスを入力します。

次のステップ

トレーニングの実行が完了した後、MLflow でメトリックを確認し、推論のためにモデルをデプロイできます。 「チュートリアル: Mosaic AI モデル トレーニングの実行を作成してデプロイする」の手順 5 から 7 を参照してください。

データの準備、トレーニング実行の構成のファインチューニング、デプロイの手順を示す手順ファインチューニングの例については、「手順ファインチューニング: 固有表現認識」デモ ノートブックを参照してください。