MicrosoftLanguageTokenizer interface

Dile özgü kuralları kullanarak metni böler.

Extends

Özellikler

isSearchTokenizer

Belirteç oluşturucunun nasıl kullanıldığını gösteren değer. Arama belirteci olarak kullanılıyorsa true olarak, dizin belirteç oluşturucu olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false’tur.

language

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

Devralınan Özellikler

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

Özellik Ayrıntıları

isSearchTokenizer

Belirteç oluşturucunun nasıl kullanıldığını gösteren değer. Arama belirteci olarak kullanılıyorsa true olarak, dizin belirteç oluşturucu olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false’tur.

isSearchTokenizer?: boolean

Özellik Değeri

boolean

language

Kullanılacak dil. Varsayılan değer İngilizce'dir.

language?: MicrosoftTokenizerLanguage

Özellik Değeri

maxTokenLength

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

maxTokenLength?: number

Özellik Değeri

number

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

Özellik Değeri

"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

Devralınan Özellik Detayları

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

name: string

Özellik Değeri

string

BaseLexicalTokenizer.name Devralındı