Azure Machine Learning プロンプト フローでベクター インデックスを作成する方法 (プレビュー)

Azure Machine Learning を使用すると、ベクター インデックスをマシン上のファイル/フォルダー、クラウド ストレージ内の場所、Azure Machine Learning データ資産、Git リポジトリ、または SQL データベースから作成できます。 現在、Azure Machine Learning では、.txt、.md、.pdf、.xls、.docx の各ファイルを処理できます。 新しいインデックスを作成する代わりに、既存の Azure AI Search (旧称 Cognitive Search) インデックスを再利用することもできます。

ベクター インデックスを作成すると、Azure Machine Learning はデータをチャンクし、埋め込みを作成し、埋め込みを Faiss インデックスまたはAzure AI Search インデックスに保存します。 さらに、Azure Machine Learning によって以下が作成されます。

  • データ ソースのテスト データ。

  • 作成したベクター インデックスを使用するサンプル プロンプト フロー。 サンプル プロンプト フローの機能は次のとおりです:

    • 自動的に生成されたプロンプトバリアント。
    • 生成されたテスト データを使用した各プロンプト バリアントの評価。
    • 実行する最適なバリアントを選択するのに役立つ、各プロンプトバリアントに対するメトリック。

    このサンプルを使用して、プロンプトの開発を続けることができます。

重要

現在、この機能はパブリック プレビュー段階にあります。 このプレビュー バージョンはサービス レベル アグリーメントなしで提供されており、運用環境のワークロードに使用することは推奨されません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。

詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

前提条件

  • Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、無料アカウントを作成してください。

  • Azure OpenAI サービスへのアクセス。

  • Azure Machine Learning ワークスペースで有効になっているプロンプト フロー。 Azure Machine Learning ワークスペースでは、[プレビュー機能の管理] パネルで [プロンプト フローを使用した AI ソリューションのビルド] をオンにすることで、プロンプト フローを有効にすることができます。

Machine Learning Studio を使用してベクトル インデックスを作成する

  1. 左側のメニューで [プロンプト フロー] を選択します。

    左側のメニューのプロンプトフローの場所を示すスクリーンショット。

  2. [ベクター インデックス] タブを選択します。

    ベクトルインデックスのタブが表示されたスクリーンショット。

  3. [作成] を選択します

  4. ベクトル インデックスを作成するためのフォームが開いたら、ベクトル インデックスの名前を指定します。

    ベクトルインデックスを作成するための基本設定を示すスクリーンショット。

  5. データ ソースの種類を選択する

  6. 選択した種類に基づいて、ソースの場所の詳細を指定します。 次に、 [次へ] を選択します。

  7. ベクター インデックスの詳細を確認し、[作成] ボタンを選択します。

  8. 表示される概要ページで、ベクトル インデックスの作成状態を追跡および表示できます。 データの大きさによっては、処理に時間がかかる場合があります。

ベクトル インデックスをプロンプト フローに追加する

ベクター インデックスを作成したら、それをプロンプト フローに、プロンプト フロー キャンバスから追加できます。

  1. 既存のプロンプト フローを開きます

  2. プロンプト フロー デザイナーの上部メニューで、[その他のツール] を選択し、[インデックス参照] を選びます。

    使用可能なツールのリストを示すスクリーンショット。

    インデックス参照ツールがキャンバスに追加されます。 ツールがすぐに表示されない場合は、キャンバスの下部までスクロールしてください。

    ベクター インデックス参照ツールを示すスクリーンショット。

  3. [mlindex_content] 値ボックスを選択し、インデックスを選びます。 ツールによってチュートリアルの "ベクター インデックスを作成する" セクションで作成されたインデックスが検出されるはずです。 必要なすべての情報を入力した後、[保存] を選択して生成ドロワーを閉じます。

  4. インデックスに対して実行する queries と query_types を入力します。

    この場合に入力できるプレーン文字列は、例えば How to use SDK V2?'. Here is an example of an embedding as an input: ${embed_the_question.output}' です。 プレーン文字列を渡すことは、ベクター インデックスが、これを作成したワークスペースで使用されている場合にのみ機能します。

サポートされるファイルの種類

ベクター インデックス ジョブを作成するためのサポートされているファイルの種類: .txt.md.html.htm.py.pdf.ppt.pptx.doc.docx.xls.xlsx。 その他のファイルの種類は、作成時に無視されます。

次のステップ

プロンプト フロー サンプルを使用した RAG の概要 (プレビュー)

Azure Machine Learning でベクター ストアを使用する (プレビュー)