PatternAnalyzer interface

正規表現のパターンを使用してテキストを用語に柔軟に分割します。 このアナライザーは、Apache Lucene を使用して実装されます。

プロパティ

flags

正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。

lowerCaseTerms

用語を小文字にするかどうかを示す値。 既定値は true です。 既定値: true。

name

アナライザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

odatatype

ポリモーフィック識別子

pattern

トークンの区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: \W+

stopwords

ストップワードの一覧。

プロパティの詳細

flags

正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

プロパティ値

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

用語を小文字にするかどうかを示す値。 既定値は true です。 既定値: true。

lowerCaseTerms?: boolean

プロパティ値

boolean

name

アナライザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

name: string

プロパティ値

string

odatatype

ポリモーフィック識別子

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

プロパティ値

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

トークンの区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: \W+

pattern?: string

プロパティ値

string

stopwords

ストップワードの一覧。

stopwords?: string[]

プロパティ値

string[]