NGramTokenizer interface
Tokenizuje vstup na n-gramy dané velikosti. Tento tokenizátor se implementuje pomocí Apache Lucene.
- Extends
Vlastnosti
max |
Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300. |
min |
Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram. |
odatatype | Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt |
token |
Třídy znaků, které se mají uchovávat v tokenech. |
Zděděné vlastnosti
name | Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků. |
Podrobnosti vlastnosti
maxGram
Maximální délka n-gramu. Výchozí hodnota je 2. Maximum je 300.
maxGram?: number
Hodnota vlastnosti
number
minGram
Minimální délka n-gramu. Výchozí hodnota je 1. Maximum je 300. Musí být menší než hodnota maxGram.
minGram?: number
Hodnota vlastnosti
number
odatatype
Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt
odatatype: "#Microsoft.Azure.Search.NGramTokenizer"
Hodnota vlastnosti
"#Microsoft.Azure.Search.NGramTokenizer"
tokenChars
Třídy znaků, které se mají uchovávat v tokenech.
tokenChars?: TokenCharacterKind[]
Hodnota vlastnosti
Podrobnosti zděděných vlastností
name
Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno zBaseLexicalTokenizer.name