Azure AI Studio のプレイグラウンドでモデルをテストする

4 分

プレイグラウンドは、Azure AI Studio の便利なインターフェイスであり、独自のクライアントアプリケーションを開発することなく、デプロイされるモデルを実験するために使用できます。 Azure AI Studio には、パラメーターチューニングオプションが異なる複数のプレイグラウンドが用意されています。

Completions プレイグラウンド

Completions プレイグラウンドを利用すると、テキスト入力、テキスト出力インターフェイスを介してデプロイされたモデルを呼び出し、パラメーターを調整できます。 [デプロイ] でモデルのデプロイ名を選ぶ必要があります。場合によっては、提供されている例を使って作業を開始した後、独自のプロンプトを入力できます。

Completions プレイグラウンドのパラメーター

モデルのパフォーマンスを変更するために調整できる多くのパラメーターがあります。

温度: ランダム性を制御します。温度を下げることは、モデルが生成する反復的で決定的な応答が増えることを意味します。温度を上げると、予期しない応答や独創的な応答が増えます。温度または Top P を調整してみてください。ただし、両方を調整しないでください。
最大長 (トークン数): モデルの応答あたりのトークン数に制限を設定します。 API では、プロンプト (システムメッセージ、例、メッセージ履歴、ユーザークエリを含む) とモデルの応答の間で共有される最大 4000 個のトークンがサポートされます。 1 つのトークンは一般的な英語テキストの約 4 文字です。
停止シーケンス: 文やリストの終わりなど、目的のポイントで応答を停止します。モデルが応答でそれ以上トークンを生成するのを停止するシーケンスを最大 4 つ指定します。返されるテキストに停止シーケンスは含まれません。
上位の確率 (上位 P): 温度と同様に、これはランダム性を制御しますが、使用する方法が異なります。 Top P を下げると、モデルのトークンの選択が、可能性が高いトークンに絞り込まれます。 Top P を上げると、モデルは可能性の高いトークンと低いトークンの両方から選択できます。温度または Top P を調整してみてください。ただし、両方を調整しないでください。
頻度ペナルティ: それまでにテキストに出現した頻度に基づいて、トークンを比例的に繰り返す可能性を減らします。これにより、応答でまったく同じテキストが繰り返される可能性が低下します。
プレゼンスペナルティ: それまでにテキストに出現したトークンを繰り返す可能性を減らします。これにより、応答に新しいトピックが導入される可能性が高くなります。
応答前テキスト: ユーザーの入力の後とモデルの応答の前にテキストを挿入します。これは、モデルが応答するための準備に役立ちます。
応答後テキスト: 会話をモデル化する場合のように、モデルで生成した応答の後にテキストを挿入して、さらにユーザー入力を促します。

Chat プレイグラウンド

Chat プレイグラウンドは、会話入力、メッセージ出力インターフェイスに基づいています。システムメッセージでセッションを初期化し、チャットコンテキストを設定できます。

チャットプレイグラウンドでは、"少数ショットの例" を追加できます。 "少数ショット" という用語は、モデルが何を行う必要があるかを学習するのに役立ついくつかの例を提供することを指します。例を提供しないことを意味するゼロショットと対照的なものと考えることができます。

"アシスタントのセットアップ" では、ユーザーが入力するかもしれない内容と、アシスタントが応答すべき内容の、少数ショットの例を提供できます。アシスタントは、システムメッセージでユーザーが定義したトーン、ルール、形式について、ユーザーがここに含めた応答を模倣しようとします。

Azure AI Studio ポータルのチャットプレイグラウンドのスクリーンショット。

チャットプレイグラウンドのパラメーター

Chat プレイグラウンドには、Completions プレイグラウンドと同様に、モデルの動作をカスタマイズするためのパラメーターも含まれています。 Chat プレイグラウンドでは、Completions プレイグラウンドでは利用 "できない" その他のパラメーターもサポートされています。具体的な内容は次のとおりです。

最大応答: モデルの応答あたりのトークン数に制限を設定します。 API では、プロンプト (システムメッセージ、例、メッセージ履歴、ユーザークエリを含む) とモデルの応答の間で共有される最大 4000 個のトークンがサポートされます。 1 つのトークンは一般的な英語テキストの約 4 文字です。
含める過去のメッセージ数: 新しい API 要求ごとに含める過去のメッセージの数を選択します。過去のメッセージを含めると、新しいユーザークエリのモデルコンテキストを提供するのに役立ちます。この数を 10 に設定すると、5 つのユーザークエリと 5 つのシステム応答が含まれます。

[Current token count] (現在のトークン数) は、チャットプレイグラウンドから表示できます。 API 呼び出しの料金はトークンによって決まり、最大応答トークンの制限を設定できるため、会話入力が最大応答トークン数を超えないように、現在のトークン数に注意する必要があります。

続行

Completions プレイグラウンド

Completions プレイグラウンドのパラメーター

Chat プレイグラウンド

チャット プレイグラウンドのパラメーター

フィードバック

チャットプレイグラウンドのパラメーター