MicrosoftLanguageTokenizer interface
言語固有のルールを使用してテキストが分割されます。
- Extends
プロパティ
is |
トークナイザーの使用方法を示す値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。 |
language | 使用する言語。 既定値は英語です。 |
max |
トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは最大トークン長セットに基づいて分割されます。 既定値は 255 です。 |
odatatype | ポリモーフィック識別子。このオブジェクトに使用できるさまざまな型を指定します。 |
継承されたプロパティ
name | トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 |
プロパティの詳細
isSearchTokenizer
トークナイザーの使用方法を示す値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。
isSearchTokenizer?: boolean
プロパティ値
boolean
language
maxTokenLength
トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは最大トークン長セットに基づいて分割されます。 既定値は 255 です。
maxTokenLength?: number
プロパティ値
number
odatatype
ポリモーフィック識別子。このオブジェクトに使用できるさまざまな型を指定します。
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
プロパティ値
"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
継承されたプロパティの詳細
name
トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。
name: string
プロパティ値
string