MicrosoftLanguageStemmingTokenizer interface
Rozdělí text pomocí pravidel specifických pro konkrétní jazyk a zmenšuje slova na jejich základní tvary.
- Extends
Vlastnosti
is |
Hodnota označující způsob použití tokenizátoru. Nastavte na hodnotu true, pokud se použije jako tokenizátor vyhledávání, a na hodnotu false, pokud se použije jako tokenizátor indexování. Výchozí hodnota je false. |
language | Jazyk, který se má použít. Výchozí hodnota je angličtina. |
max |
Maximální délka tokenu. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků. Tokeny delší než 300 znaků se nejprve rozdělí na tokeny o délce 300 a pak se každý z těchto tokenů rozdělí na základě nastavené maximální délky tokenu. Výchozí hodnota je 255. |
odatatype | Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt |
Zděděné vlastnosti
name | Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků. |
Podrobnosti vlastnosti
isSearchTokenizer
Hodnota označující způsob použití tokenizátoru. Nastavte na hodnotu true, pokud se použije jako tokenizátor vyhledávání, a na hodnotu false, pokud se použije jako tokenizátor indexování. Výchozí hodnota je false.
isSearchTokenizer?: boolean
Hodnota vlastnosti
boolean
language
Jazyk, který se má použít. Výchozí hodnota je angličtina.
language?: MicrosoftStemmingTokenizerLanguage
Hodnota vlastnosti
maxTokenLength
Maximální délka tokenu. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků. Tokeny delší než 300 znaků se nejprve rozdělí na tokeny o délce 300 a pak se každý z těchto tokenů rozdělí na základě nastavené maximální délky tokenu. Výchozí hodnota je 255.
maxTokenLength?: number
Hodnota vlastnosti
number
odatatype
Polymorfní diskriminátor, který určuje, jaké typy může být tento objekt
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Hodnota vlastnosti
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Podrobnosti zděděných vlastností
name
Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit pouze alfanumerickými znaky a je omezený na 128 znaků.
name: string
Hodnota vlastnosti
string
Zděděno zBaseLexicalTokenizer.name