MicrosoftLanguageStemmingTokenizer interface
Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.
- Extends
Egenskaper
is |
Ett värde som anger hur tokeniseraren används. Ställ in på sant om det används som söktokeniserare och ställ in på falskt om det används som indexeringstokeniserare. Standardvärdet är false. |
language | Språket som ska användas. Standardvärdet är engelska. |
max |
Maximal tokenlängd. Token som är längre än den maximala längden delas. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255. |
odatatype | Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara |
Ärvda egenskaper
name | Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
Egenskapsinformation
isSearchTokenizer
Ett värde som anger hur tokeniseraren används. Ställ in på sant om det används som söktokeniserare och ställ in på falskt om det används som indexeringstokeniserare. Standardvärdet är false.
isSearchTokenizer?: boolean
Egenskapsvärde
boolean
language
Språket som ska användas. Standardvärdet är engelska.
language?: MicrosoftStemmingTokenizerLanguage
Egenskapsvärde
maxTokenLength
Maximal tokenlängd. Token som är längre än den maximala längden delas. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255.
maxTokenLength?: number
Egenskapsvärde
number
odatatype
Polymorfisk diskriminering, som anger de olika typerna som det här objektet kan vara
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Egenskapsvärde
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Information om ärvda egenskaper
name
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.
name: string
Egenskapsvärde
string
Ärvd frånBaseLexicalTokenizer.name