MicrosoftLanguageStemmingTokenizer interface

Referens

Paket:: @azure/search-documents

Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.

Extends: BaseLexicalTokenizer

Egenskaper

isSearchTokenizer	Ett värde som anger hur tokeniseraren används. Ställ in på sant om det används som söktokeniserare och ställ in på falskt om det används som indexeringstokeniserare. Standardvärdet är false.
language	Språket som ska användas. Standardvärdet är engelska.
maxTokenLength	Maximal tokenlängd. Token som är längre än den maximala längden delas. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255.
odatatype	Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

Ärvda egenskaper

name	Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

Egenskapsinformation

isSearchTokenizer

Ett värde som anger hur tokeniseraren används. Ställ in på sant om det används som söktokeniserare och ställ in på falskt om det används som indexeringstokeniserare. Standardvärdet är false.

isSearchTokenizer?: boolean

Egenskapsvärde

boolean

language

Språket som ska användas. Standardvärdet är engelska.

language?: MicrosoftStemmingTokenizerLanguage

Egenskapsvärde

MicrosoftStemmingTokenizerLanguage

maxTokenLength

Maximal tokenlängd. Token som är längre än den maximala längden delas. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255.

maxTokenLength?: number

Egenskapsvärde

number

odatatype

Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Egenskapsvärde

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Information om ärvda egenskaper

name

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

name: string

Egenskapsvärde

string

Ärvd frånBaseLexicalTokenizer.name

Dela via

MicrosoftLanguageStemmingTokenizer interface

Egenskaper

Ärvda egenskaper

Egenskapsinformation

isSearchTokenizer

Egenskapsvärde

language

Egenskapsvärde

maxTokenLength

Egenskapsvärde

odatatype

Egenskapsvärde

Information om ärvda egenskaper

name

Egenskapsvärde

Ytterligare resurser