PatternAnalyzer interface

Elastycznie oddziela tekst na terminy za pomocą wzorca wyrażenia regularnego. Ten analizator jest implementowany przy użyciu platformy Apache Lucene.

Właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true.

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

odatatype

Dyskryminujące polimorficzne

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

stopwords

Lista stopwords.

Szczegóły właściwości

flags

Flagi wyrażeń regularnych. Możliwe wartości obejmują: "CANON_EQ", "CASE_INSENSITIVE", "KOMENTARZE", "DOTALL", "LITERAŁ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Wartość właściwości

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Wartość wskazująca, czy terminy powinny być małe litery. Wartość domyślna to „true”. Wartość domyślna: true.

lowerCaseTerms?: boolean

Wartość właściwości

boolean

name

Nazwa analizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się tylko znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

odatatype

Dyskryminujące polimorficzne

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Wartość właściwości

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Wzorzec wyrażenia regularnego odpowiadający separatorom tokenów. Wartość domyślna to wyrażenie zgodne z co najmniej jednym znakiem odstępu. Wartość domyślna: \W+.

pattern?: string

Wartość właściwości

string

stopwords

Lista stopwords.

stopwords?: string[]

Wartość właściwości

string[]