Databricks での生成 AI アプリの構築の概要

Databricks は、GenAI アプリケーションを構築、デプロイ、管理するための包括的なプラットフォームを提供します。 この記事では、Databricks での GenAI アプリケーションの開発に関連する重要なコンポーネントとプロセスについて説明します。

Foundation Model Training

Databricks の Foundation Model Training では、独自のデータを使用して大規模言語モデル (LLM) をカスタマイズできます。 このプロセスでは、既存の基盤モデルのトレーニングを微調整することで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、コンピューティング リソースを大幅に削減します。 主な特徴は次のとおりです。

  • 監視付き微調整: 構造化されたプロンプト応答データでトレーニングすることで、モデルを新しいタスクに適応させます。
  • 継続的な事前トレーニング: 追加のテキスト データを使用してモデルを強化し、新しい知識を追加したり、特定のドメインに焦点を当てたりします。
  • チャット補完: チャット ログでモデルをトレーニングし、会話能力を向上させます。

外部モデルの統合

Databricks では、外部モデルの統合がサポートされているため、Databricks の外部でホストされているサードパーティ モデルを利用できます。 これにより、組織内でのさまざまな LLM プロバイダー (OpenAI や Anthropic など) の使用と管理が効率化されます。

Mosaic AI エージェント フレームワーク

エージェント フレームワークは、開発者が取得拡張生成 (RAG) アプリケーションなどの運用品質のエージェントを構築、デプロイ、評価するのに役立つように設計された、Databricks 上の一連のツールで構成されます。

高品質のエージェントを構築するには、エージェント システムをテストおよび検証するための堅牢な評価ツールセットが必要です。 Mosaic AI エージェント評価は、人間のフィードバック、グランド トゥルース、応答と要求ログ、LLM ジャッジのフィードバック、チェーン トレースなどをキャプチャして実装するためのプラットフォームを提供します。

その他のリソース

Mosaic AI Model Serving の外部モデル