Azure AI Studio のプレイグラウンドでモデルをテストする

完了

プレイグラウンドは、Azure AI Studio の便利なインターフェイスであり、独自のクライアント アプリケーションを開発することなく、デプロイされるモデルを実験するために使用できます。 Azure AI Studio には、パラメーター チューニング オプションが異なる複数のプレイグラウンドが用意されています。

Completions プレイグラウンド

Completions プレイグラウンドを利用すると、テキスト入力、テキスト出力インターフェイスを介してデプロイされたモデルを呼び出し、パラメーターを調整できます。 [デプロイ] でモデルのデプロイ名を選ぶ必要があります。 場合によっては、提供されている例を使って作業を開始した後、独自のプロンプトを入力できます。

Completions プレイグラウンドのパラメーター

モデルのパフォーマンスを変更するために調整できる多くのパラメーターがあります。

  • 温度: ランダム性を制御します。 温度を下げることは、モデルが生成する反復的で決定的な応答が増えることを意味します。 温度を上げると、予期しない応答や独創的な応答が増えます。 温度または Top P を調整してみてください。ただし、両方を調整しないでください。
  • 最大長 (トークン数): モデルの応答あたりのトークン数に制限を設定します。 API では、プロンプト (システム メッセージ、例、メッセージ履歴、ユーザー クエリを含む) とモデルの応答の間で共有される最大 4000 個のトークンがサポートされます。 1 つのトークンは一般的な英語テキストの約 4 文字です。
  • 停止シーケンス: 文やリストの終わりなど、目的のポイントで応答を停止します。 モデルが応答でそれ以上トークンを生成するのを停止するシーケンスを最大 4 つ指定します。 返されるテキストに停止シーケンスは含まれません。
  • 上位の確率 (上位 P): 温度と同様に、これはランダム性を制御しますが、使用する方法が異なります。 Top P を下げると、モデルのトークンの選択が、可能性が高いトークンに絞り込まれます。 Top P を上げると、モデルは可能性の高いトークンと低いトークンの両方から選択できます。 温度または Top P を調整してみてください。ただし、両方を調整しないでください。
  • 頻度ペナルティ: それまでにテキストに出現した頻度に基づいて、トークンを比例的に繰り返す可能性を減らします。 これにより、応答でまったく同じテキストが繰り返される可能性が低下します。
  • プレゼンス ペナルティ: それまでにテキストに出現したトークンを繰り返す可能性を減らします。 これにより、応答に新しいトピックが導入される可能性が高くなります。
  • 応答前テキスト: ユーザーの入力の後とモデルの応答の前にテキストを挿入します。 これは、モデルが応答するための準備に役立ちます。
  • 応答後テキスト: 会話をモデル化する場合のように、モデルで生成した応答の後にテキストを挿入して、さらにユーザー入力を促します。

Chat プレイグラウンド

Chat プレイグラウンドは、会話入力、メッセージ出力インターフェイスに基づいています。 システム メッセージでセッションを初期化し、チャット コンテキストを設定できます。

チャットプレイグラウンドでは、"少数ショットの例" を追加できます。 "少数ショット" という用語は、モデルが何を行う必要があるかを学習するのに役立ついくつかの例を提供することを指します。 例を提供しないことを意味するゼロショットと対照的なものと考えることができます。

"アシスタントのセットアップ" では、ユーザーが入力するかもしれない内容と、アシスタントが応答すべき内容の、少数ショットの例を提供できます。 アシスタントは、システム メッセージでユーザーが定義したトーン、ルール、形式について、ユーザーがここに含めた応答を模倣しようとします。

Azure AI Studio ポータルのチャット プレイグラウンドのスクリーンショット。

チャット プレイグラウンドのパラメーター

Chat プレイグラウンドには、Completions プレイグラウンドと同様に、モデルの動作をカスタマイズするためのパラメーターも含まれています。 Chat プレイグラウンドでは、Completions プレイグラウンドでは利用 "できない" その他のパラメーターもサポートされています。 具体的な内容は次のとおりです。

  • 最大応答: モデルの応答あたりのトークン数に制限を設定します。 API では、プロンプト (システム メッセージ、例、メッセージ履歴、ユーザー クエリを含む) とモデルの応答の間で共有される最大 4000 個のトークンがサポートされます。 1 つのトークンは一般的な英語テキストの約 4 文字です。
  • 含める過去のメッセージ数: 新しい API 要求ごとに含める過去のメッセージの数を選択します。 過去のメッセージを含めると、新しいユーザー クエリのモデル コンテキストを提供するのに役立ちます。 この数を 10 に設定すると、5 つのユーザー クエリと 5 つのシステム応答が含まれます。

[Current token count] (現在のトークン数) は、チャット プレイグラウンドから表示できます。 API 呼び出しの料金はトークンによって決まり、最大応答トークンの制限を設定できるため、会話入力が最大応答トークン数を超えないように、現在のトークン数に注意する必要があります。