NGramTokenizer interface

Tokenizuje vstup na n-gramy dané velikosti. Tento tokenizátor se implementuje pomocí Apache Lucene.

Extends

Vlastnosti

maxGram

Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300.

minGram

Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram.

odatatype

Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt

tokenChars

Třídy znaků, které se mají uchovávat v tokenech.

Zděděné vlastnosti

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

Podrobnosti vlastnosti

maxGram

Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300.

maxGram?: number

Hodnota vlastnosti

number

minGram

Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram.

minGram?: number

Hodnota vlastnosti

number

odatatype

Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Třídy znaků, které se mají uchovávat v tokenech.

tokenChars?: TokenCharacterKind[]

Hodnota vlastnosti

Podrobnosti zděděných vlastností

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.

name: string

Hodnota vlastnosti

string

Zděděno zBaseLexicalTokenizer.name