Databricks での生成 AI アプリの構築の概要
Databricks は、GenAI アプリケーションを構築、デプロイ、管理するための包括的なプラットフォームを提供します。 この記事では、Databricks での GenAI アプリケーションの開発に関連する重要なコンポーネントとプロセスについて説明します。
Foundation Model Training
Databricks の Foundation Model Training では、独自のデータを使用して大規模言語モデル (LLM) をカスタマイズできます。 このプロセスでは、既存の基盤モデルのトレーニングを微調整することで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、コンピューティング リソースを大幅に削減します。 主な特徴は次のとおりです。
- 監視付き微調整: 構造化されたプロンプト応答データでトレーニングすることで、モデルを新しいタスクに適応させます。
- 継続的な事前トレーニング: 追加のテキスト データを使用してモデルを強化し、新しい知識を追加したり、特定のドメインに焦点を当てたりします。
- チャット補完: チャット ログでモデルをトレーニングし、会話能力を向上させます。
外部モデルの統合
Databricks では、外部モデルの統合がサポートされているため、Databricks の外部でホストされているサードパーティ モデルを利用できます。 これにより、組織内でのさまざまな LLM プロバイダー (OpenAI や Anthropic など) の使用と管理が効率化されます。
Mosaic AI エージェント フレームワーク
エージェント フレームワークは、開発者が取得拡張生成 (RAG) アプリケーションなどの運用品質のエージェントを構築、デプロイ、評価するのに役立つように設計された、Databricks 上の一連のツールで構成されます。
高品質のエージェントを構築するには、エージェント システムをテストおよび検証するための堅牢な評価ツールセットが必要です。 Mosaic AI エージェント評価は、人間のフィードバック、グランド トゥルース、応答と要求ログ、LLM ジャッジのフィードバック、チェーン トレースなどをキャプチャして実装するためのプラットフォームを提供します。