Indexes - Analyze

Çözümleyicinin metni belirteçlere nasıl böler olduğunu gösterir.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-07-01

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Arama hizmetinin uç nokta URL'si.

indexName
path True

string

Çözümleyicinin testine yönelik dizinin adı.

api-version
query True

string

İstemci Api Sürümü.

İstek Başlığı

Name Gerekli Tür Description
x-ms-client-request-id

string

uuid

Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name Gerekli Tür Description
text True

string

Belirteçlere bölünecek metin.

analyzer

LexicalAnalyzerName

Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

charFilters

CharFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenFilters

TokenFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenizer

LexicalTokenizerName

Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

Yanıtlar

Name Tür Description
200 OK

AnalyzeResult

Other Status Codes

ErrorResponse

Hata yanıtı.

Örnekler

SearchServiceIndexAnalyze

Örnek isteği

POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-07-01

{
  "text": "Text to analyze",
  "analyzer": "standard.lucene"
}

Örnek yanıt

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Tanımlar

Name Description
AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

ErrorDetail

Hata ayrıntısı.

ErrorResponse

Hata yanıtı

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler.

Name Tür Description
endOffset

integer

Giriş metnindeki belirtecin son karakterinin dizini.

position

integer

Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak, bazı belirteçler birbiriyle eş anlamlıysa, aynı konuma sahip olabilir.

startOffset

integer

Giriş metnindeki belirtecin ilk karakterinin dizini.

token

string

Çözümleyici tarafından döndürülen belirteç.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

Name Tür Description
analyzer

LexicalAnalyzerName

Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

charFilters

CharFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

text

string

Belirteçlere bölünecek metin.

tokenFilters

TokenFilterName[]

Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.

tokenizer

LexicalTokenizerName

Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

Name Tür Description
tokens

AnalyzedTokenInfo[]

İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name Tür Description
html_strip

string

HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

Name Tür Description
info

object

Ek bilgiler.

type

string

Ek bilgi türü.

ErrorDetail

Hata ayrıntısı.

Name Tür Description
additionalInfo

ErrorAdditionalInfo[]

Hata ek bilgileri.

code

string

Hata kodu.

details

ErrorDetail[]

Hata ayrıntıları.

message

string

Hata iletisi.

target

string

Hata hedefi.

ErrorResponse

Hata yanıtı

Name Tür Description
error

ErrorDetail

Hata nesnesi.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name Tür Description
ar.lucene

string

Arapça için Lucene çözümleyicisi.

ar.microsoft

string

Arapça için Microsoft çözümleyicisi.

bg.lucene

string

Bulgarca için Lucene çözümleyicisi.

bg.microsoft

string

Bulgarca için Microsoft çözümleyicisi.

bn.microsoft

string

Bangla için Microsoft çözümleyicisi.

ca.lucene

string

Catalan için Lucene çözümleyicisi.

ca.microsoft

string

Katalalan için Microsoft çözümleyicisi.

cs.lucene

string

Çekçe için Lucene çözümleyicisi.

cs.microsoft

string

Çekçe için Microsoft çözümleyicisi.

da.lucene

string

Danca için Lucene çözümleyicisi.

da.microsoft

string

Danca için Microsoft çözümleyicisi.

de.lucene

string

Almanca için Lucene çözümleyicisi.

de.microsoft

string

Almanca için Microsoft çözümleyicisi.

el.lucene

string

Yunanca için Lucene çözümleyicisi.

el.microsoft

string

Yunanca için Microsoft çözümleyicisi.

en.lucene

string

İngilizce için Lucene çözümleyicisi.

en.microsoft

string

İngilizce için Microsoft çözümleyicisi.

es.lucene

string

İspanyolca için Lucene çözümleyicisi.

es.microsoft

string

İspanyolca için Microsoft çözümleyicisi.

et.microsoft

string

Estonca için Microsoft çözümleyicisi.

eu.lucene

string

Bask için Lucene çözümleyicisi.

fa.lucene

string

Farsça için Lucene çözümleyicisi.

fi.lucene

string

Fince için Lucene çözümleyicisi.

fi.microsoft

string

Fince için Microsoft çözümleyicisi.

fr.lucene

string

Fransızca için Lucene çözümleyicisi.

fr.microsoft

string

Fransızca için Microsoft çözümleyicisi.

ga.lucene

string

lucene çözümleyicisi İrlandalı.

gl.lucene

string

Galiçyalı için Lucene analizörü.

gu.microsoft

string

Gujarati için Microsoft çözümleyicisi.

he.microsoft

string

İbranice için Microsoft çözümleyicisi.

hi.lucene

string

Hintçe için Lucene çözümleyicisi.

hi.microsoft

string

Hintçe için Microsoft çözümleyicisi.

hr.microsoft

string

Hırvat dili için Microsoft çözümleyicisi.

hu.lucene

string

Macarca için Lucene çözümleyicisi.

hu.microsoft

string

Macarca için Microsoft çözümleyicisi.

hy.lucene

string

Ermeni için Lucene çözümleyicisi.

id.lucene

string

Endonezya dili için Lucene çözümleyicisi.

id.microsoft

string

Endonezya dili (Bahasa) için Microsoft çözümleyicisi.

is.microsoft

string

İzlanda dili için Microsoft çözümleyicisi.

it.lucene

string

İtalyanca için Lucene çözümleyicisi.

it.microsoft

string

İtalyanca için Microsoft çözümleyicisi.

ja.lucene

string

Japonca için Lucene çözümleyicisi.

ja.microsoft

string

Japonca için Microsoft çözümleyicisi.

keyword

string

Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

string

Kannada için Microsoft çözümleyicisi.

ko.lucene

string

Korece için Lucene çözümleyicisi.

ko.microsoft

string

Korece için Microsoft çözümleyicisi.

lt.microsoft

string

Litvanca için Microsoft çözümleyicisi.

lv.lucene

string

Lucene çözümleyicisi Letonyalı.

lv.microsoft

string

Letonca için Microsoft çözümleyicisi.

ml.microsoft

string

Malayalam için Microsoft çözümleyicisi.

mr.microsoft

string

Marathi için Microsoft çözümleyicisi.

ms.microsoft

string

Malay dili için Microsoft çözümleyicisi (Latin).

nb.microsoft

string

Norveççe (Bokmål) için Microsoft analyzer.

nl.lucene

string

Felemenkçe için Lucene çözümleyicisi.

nl.microsoft

string

Felemenkçe için Microsoft çözümleyicisi.

no.lucene

string

Norveç dili için Lucene çözümleyicisi.

pa.microsoft

string

Pencap dili için Microsoft çözümleyicisi.

pattern

string

Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

string

Lehçe için Lucene çözümleyicisi.

pl.microsoft

string

Lehçe için Microsoft çözümleyicisi.

pt-BR.lucene

string

Portekizce (Brezilya) için Lucene çözümleyicisi.

pt-BR.microsoft

string

Portekizce (Brezilya) için Microsoft çözümleyicisi.

pt-PT.lucene

string

Portekizce (Portekiz) için Lucene çözümleyicisi.

pt-PT.microsoft

string

Portekizce (Portekiz) için Microsoft çözümleyicisi.

ro.lucene

string

Rumence için Lucene çözümleyicisi.

ro.microsoft

string

Romence için Microsoft çözümleyicisi.

ru.lucene

string

Rus için Lucene çözümleyicisi.

ru.microsoft

string

Rusça için Microsoft çözümleyicisi.

simple

string

Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

string

Slovakça için Microsoft çözümleyicisi.

sl.microsoft

string

Slovence için Microsoft çözümleyicisi.

sr-cyrillic.microsoft

string

Sırp (Kiril) için Microsoft analyzer.

sr-latin.microsoft

string

Sırplık için Microsoft çözümleyicisi (Latin).

standard.lucene

string

Standart Lucene çözümleyicisi.

standardasciifolding.lucene

string

Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://video2.skills-academy.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

string

Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

string

İsveççe için Lucene çözümleyicisi.

sv.microsoft

string

İsveççe için Microsoft çözümleyicisi.

ta.microsoft

string

Tamil için Microsoft çözümleyicisi.

te.microsoft

string

Telugu için Microsoft çözümleyicisi.

th.lucene

string

Tay dili için Lucene çözümleyicisi.

th.microsoft

string

Tay dili için Microsoft çözümleyicisi.

tr.lucene

string

Türkçe için Lucene çözümleyicisi.

tr.microsoft

string

Türkçe için Microsoft çözümleyicisi.

uk.microsoft

string

Ukrayna dili için Microsoft çözümleyicisi.

ur.microsoft

string

Urduca için Microsoft çözümleyicisi.

vi.microsoft

string

Vietnam dili için Microsoft çözümleyicisi.

whitespace

string

Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

string

Çince için Lucene çözümleyicisi (Basitleştirilmiş).

zh-Hans.microsoft

string

Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.

zh-Hant.lucene

string

Çince (Geleneksel) için Lucene çözümleyicisi.

zh-Hant.microsoft

string

Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name Tür Description
classic

string

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

string

Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

string

Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

string

Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

string

Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

string

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

microsoft_language_tokenizer

string

Dile özgü kuralları kullanarak metni böler.

nGram

string

Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

string

Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

string

Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

string

Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

string

Url'leri ve e-postaları tek bir belirteç olarak belirteçler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

string

Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name Tür Description
apostrophe

string

Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) siler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

string

Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

string

İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

string

Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

string

CJK genişlik farklarını normalleştirir. Fullwidth ASCII değişkenlerini eşdeğer temel Latinceye, yarım genişlikli Katakana değişkenlerini de eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

string

İngilizce sahiplik ve noktaları kısaltmalardan kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

string

Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

string

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

string

İlanları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

string

Almanca karakterleri, German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

string

Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçe metinleri normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

string

Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

string

Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

string

İngilizce için yüksek performanslı kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

string

Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

string

Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

string

Belirteç metnini küçük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

string

Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

string

Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

string

Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

string

Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer

reverse

string

Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

string

åÅäæÄÆ->a ve öÖøØ->o İskandinav karakterlerini katlar. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

string

Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

string

Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

string

Snowball tarafından oluşturulan kök ayırıcı kullanarak sözcüklerin köklerini oluşturan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

string

Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

string

Dile özgü gövde filtresi. Bkz. https://video2.skills-academy.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

string

Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

string

Belirteçlerden öndeki ve sondaki boşlukları kırpılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

string

Terimleri belirli bir uzunlukta kısaltın. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

string

Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

string

Belirteç metnini büyük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

string

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.