ClassicTokenizer interface

ほとんどのヨーロッパ言語ドキュメントの処理に適した文法ベースのトークナイザー。このトークナイザーは、Apache Lucene を使用して実装されます。

プロパティ

maxTokenLength	トークンの最大長。既定値は 255 です。最大長より長いトークンは分割されます。使用できる最大トークン長は 300 文字です。
odatatype	ポリモーフィック判別器。このオブジェクトで使用できるさまざまな型を指定します。

name	トークナイザーの名前。アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

トークンの最大長。既定値は 255 です。最大長より長いトークンは分割されます。使用できる最大トークン長は 300 文字です。

maxTokenLength?: number

number

ポリモーフィック判別器。このオブジェクトで使用できるさまざまな型を指定します。

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

"#Microsoft.Azure.Search.ClassicTokenizer"

トークナイザーの名前。アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

name: string

string

BaseLexicalTokenizer.name から継承