多言語プロジェクト

会話言語を理解すると、一度に複数の言語にプロジェクトを簡単に拡張できます。 プロジェクトで複数の言語を有効にすると、言語固有の発話とシノニムをプロジェクトに追加できます。 意図とエンティティの多言語予測を取得できます。

多言語の目的と学習済みのエンティティ コンポーネント

プロジェクトで複数の言語を有効にすると、プロジェクトを主に 1 つの言語でトレーニングし、その後すぐに他の言語で予測を取得できます。

たとえば、英語の発話を使用してプロジェクト全体をトレーニングし、フランス語、ドイツ語、標準中国語、日本語、韓国語などでクエリを実行できます。 会話言語の理解により、多言語テクノロジを使用してモデルをトレーニングすることで、プロジェクトを複数の言語に簡単に拡張できます。

特定の言語が他の言語と同じように実行されていないことを確認するたびに、その言語の発話をプロジェクトに追加できます。 Language Studio の [タグ発話] ページで、追加する発話の言語を選択できます。 その言語の例をモデルに導入すると、その言語のより多くの構文を学び、より良い予測をするようになります。

すべての言語で同じ数の発話を追加することは求められていません。 プロジェクトの大部分を 1 つの言語で構築し、パフォーマンスが良くないと思われる言語でのみ、いくつかの発話を追加するようにします。 主に英語であるプロジェクトを作成し、フランス語、ドイツ語、スペイン語でのテストを開始したときに、ドイツ語のパフォーマンスが他の 2 つの言語ほど良くないことがわかる場合があります。 その場合は、元の英語の例の 5% をドイツ語で追加し、新しいモデルをトレーニングし、ドイツ語でもう一度テストを行うことを検討してください。 ドイツ語のクエリで、より良い結果が得られます。 追加する発話が多いほど、結果が改善される可能性が高くなります。

別の言語でデータを追加することで他の言語に悪影響を及ぼすことはないはずです。

複数の言語でのコンポーネントの一覧と事前構築

複数の言語が有効になっているプロジェクトでは、すべてのリスト キーに対して "言語ごと" にシノニムを指定できます。 プロジェクトに対してクエリを実行する言語によっては、その言語のシノニムを持つリスト コンポーネントの一致のみが取得されます。 プロジェクトに対してクエリを実行するときに、要求本文に言語を指定できます。

"query": "{query}"
"language": "{language code}"

言語を指定しない場合は、プロジェクトの既定の言語にフォールバックします。 さまざまな言語コードの一覧については、言語サポートに関するページを参照してください。

あらかじめ構築されたコンポーネントは似ており、特定の言語で使用できる事前構築済みのコンポーネントの予測を取得することが想定されます。 要求の言語によって、どのコンポーネントの予測が試行されるかも決まります。 事前に構築された各コンポーネントの言語サポートについては、「サポートされている事前構築済みエンティティ コンポーネント」を参照してください。