Indexes - Analyze

Başvuru

Hizmet:: Search Service

API Sürümü:: 2024-07-01

Çözümleyicinin metni belirteçlere nasıl böler olduğunu gösterir.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-07-01

URI Parametreleri

Name	İçinde	Gerekli	Tür	Description
endpoint	path	True	string	Arama hizmetinin uç nokta URL'si.
indexName	path	True	string	Çözümleyicinin testine yönelik dizinin adı.
api-version	query	True	string	İstemci Api Sürümü.

İstek Başlığı

Name	Gerekli	Tür	Description
x-ms-client-request-id		string uuid	Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name	Gerekli	Tür	Description
text	True	string	Belirteçlere bölünecek metin.
analyzer		LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.
charFilters		CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenFilters		TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenizer		LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

Yanıtlar

Name	Tür	Description
200 OK	AnalyzeResult
Other Status Codes	ErrorResponse	Hata yanıtı.

Örnekler

SearchServiceIndexAnalyze

Örnek isteği

HTTP

POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-07-01

{
  "text": "Text to analyze",
  "analyzer": "standard.lucene"
}

Örnek yanıt

Durum kodu:: 200

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Tanımlar

Name	Description
AnalyzedTokenInfo	Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler.
AnalyzeRequest	Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.
AnalyzeResult	Bir çözümleyicinin metin üzerinde test edilmesi sonucu.
CharFilterName	Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
ErrorAdditionalInfo	Kaynak yönetimi hatası ek bilgileri.
ErrorDetail	Hata ayrıntısı.
ErrorResponse	Hata yanıtı
LexicalAnalyzerName	Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
LexicalTokenizerName	Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
TokenFilterName	Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler.

Name	Tür	Description
endOffset	integer	Giriş metnindeki belirtecin son karakterinin dizini.
position	integer	Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak, bazı belirteçler birbiriyle eş anlamlıysa, aynı konuma sahip olabilir.
startOffset	integer	Giriş metnindeki belirtecin ilk karakterinin dizini.
token	string	Çözümleyici tarafından döndürülen belirteç.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

Name	Tür	Description
analyzer	LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.
charFilters	CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
text	string	Belirteçlere bölünecek metin.
tokenFilters	TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir.
tokenizer	LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

Name	Tür	Description
tokens	AnalyzedTokenInfo[]	İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name	Tür	Description
html_strip	string	HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

Name	Tür	Description
info	object	Ek bilgiler.
type	string	Ek bilgi türü.

ErrorDetail

Hata ayrıntısı.

Name	Tür	Description
additionalInfo	ErrorAdditionalInfo[]	Hata ek bilgileri.
code	string	Hata kodu.
details	ErrorDetail[]	Hata ayrıntıları.
message	string	Hata iletisi.
target	string	Hata hedefi.

ErrorResponse

Hata yanıtı

Name	Tür	Description
error	ErrorDetail	Hata nesnesi.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name	Tür	Description
ar.lucene	string	Arapça için Lucene çözümleyicisi.
ar.microsoft	string	Arapça için Microsoft çözümleyicisi.
bg.lucene	string	Bulgarca için Lucene çözümleyicisi.
bg.microsoft	string	Bulgarca için Microsoft çözümleyicisi.
bn.microsoft	string	Bangla için Microsoft çözümleyicisi.
ca.lucene	string	Catalan için Lucene çözümleyicisi.
ca.microsoft	string	Katalalan için Microsoft çözümleyicisi.
cs.lucene	string	Çekçe için Lucene çözümleyicisi.
cs.microsoft	string	Çekçe için Microsoft çözümleyicisi.
da.lucene	string	Danca için Lucene çözümleyicisi.
da.microsoft	string	Danca için Microsoft çözümleyicisi.
de.lucene	string	Almanca için Lucene çözümleyicisi.
de.microsoft	string	Almanca için Microsoft çözümleyicisi.
el.lucene	string	Yunanca için Lucene çözümleyicisi.
el.microsoft	string	Yunanca için Microsoft çözümleyicisi.
en.lucene	string	İngilizce için Lucene çözümleyicisi.
en.microsoft	string	İngilizce için Microsoft çözümleyicisi.
es.lucene	string	İspanyolca için Lucene çözümleyicisi.
es.microsoft	string	İspanyolca için Microsoft çözümleyicisi.
et.microsoft	string	Estonca için Microsoft çözümleyicisi.
eu.lucene	string	Bask için Lucene çözümleyicisi.
fa.lucene	string	Farsça için Lucene çözümleyicisi.
fi.lucene	string	Fince için Lucene çözümleyicisi.
fi.microsoft	string	Fince için Microsoft çözümleyicisi.
fr.lucene	string	Fransızca için Lucene çözümleyicisi.
fr.microsoft	string	Fransızca için Microsoft çözümleyicisi.
ga.lucene	string	lucene çözümleyicisi İrlandalı.
gl.lucene	string	Galiçyalı için Lucene analizörü.
gu.microsoft	string	Gujarati için Microsoft çözümleyicisi.
he.microsoft	string	İbranice için Microsoft çözümleyicisi.
hi.lucene	string	Hintçe için Lucene çözümleyicisi.
hi.microsoft	string	Hintçe için Microsoft çözümleyicisi.
hr.microsoft	string	Hırvat dili için Microsoft çözümleyicisi.
hu.lucene	string	Macarca için Lucene çözümleyicisi.
hu.microsoft	string	Macarca için Microsoft çözümleyicisi.
hy.lucene	string	Ermeni için Lucene çözümleyicisi.
id.lucene	string	Endonezya dili için Lucene çözümleyicisi.
id.microsoft	string	Endonezya dili (Bahasa) için Microsoft çözümleyicisi.
is.microsoft	string	İzlanda dili için Microsoft çözümleyicisi.
it.lucene	string	İtalyanca için Lucene çözümleyicisi.
it.microsoft	string	İtalyanca için Microsoft çözümleyicisi.
ja.lucene	string	Japonca için Lucene çözümleyicisi.
ja.microsoft	string	Japonca için Microsoft çözümleyicisi.
keyword	string	Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	string	Kannada için Microsoft çözümleyicisi.
ko.lucene	string	Korece için Lucene çözümleyicisi.
ko.microsoft	string	Korece için Microsoft çözümleyicisi.
lt.microsoft	string	Litvanca için Microsoft çözümleyicisi.
lv.lucene	string	Lucene çözümleyicisi Letonyalı.
lv.microsoft	string	Letonca için Microsoft çözümleyicisi.
ml.microsoft	string	Malayalam için Microsoft çözümleyicisi.
mr.microsoft	string	Marathi için Microsoft çözümleyicisi.
ms.microsoft	string	Malay dili için Microsoft çözümleyicisi (Latin).
nb.microsoft	string	Norveççe (Bokmål) için Microsoft analyzer.
nl.lucene	string	Felemenkçe için Lucene çözümleyicisi.
nl.microsoft	string	Felemenkçe için Microsoft çözümleyicisi.
no.lucene	string	Norveç dili için Lucene çözümleyicisi.
pa.microsoft	string	Pencap dili için Microsoft çözümleyicisi.
pattern	string	Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	string	Lehçe için Lucene çözümleyicisi.
pl.microsoft	string	Lehçe için Microsoft çözümleyicisi.
pt-BR.lucene	string	Portekizce (Brezilya) için Lucene çözümleyicisi.
pt-BR.microsoft	string	Portekizce (Brezilya) için Microsoft çözümleyicisi.
pt-PT.lucene	string	Portekizce (Portekiz) için Lucene çözümleyicisi.
pt-PT.microsoft	string	Portekizce (Portekiz) için Microsoft çözümleyicisi.
ro.lucene	string	Rumence için Lucene çözümleyicisi.
ro.microsoft	string	Romence için Microsoft çözümleyicisi.
ru.lucene	string	Rus için Lucene çözümleyicisi.
ru.microsoft	string	Rusça için Microsoft çözümleyicisi.
simple	string	Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	string	Slovakça için Microsoft çözümleyicisi.
sl.microsoft	string	Slovence için Microsoft çözümleyicisi.
sr-cyrillic.microsoft	string	Sırp (Kiril) için Microsoft analyzer.
sr-latin.microsoft	string	Sırplık için Microsoft çözümleyicisi (Latin).
standard.lucene	string	Standart Lucene çözümleyicisi.
standardasciifolding.lucene	string	Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://video2.skills-academy.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	string	Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	string	İsveççe için Lucene çözümleyicisi.
sv.microsoft	string	İsveççe için Microsoft çözümleyicisi.
ta.microsoft	string	Tamil için Microsoft çözümleyicisi.
te.microsoft	string	Telugu için Microsoft çözümleyicisi.
th.lucene	string	Tay dili için Lucene çözümleyicisi.
th.microsoft	string	Tay dili için Microsoft çözümleyicisi.
tr.lucene	string	Türkçe için Lucene çözümleyicisi.
tr.microsoft	string	Türkçe için Microsoft çözümleyicisi.
uk.microsoft	string	Ukrayna dili için Microsoft çözümleyicisi.
ur.microsoft	string	Urduca için Microsoft çözümleyicisi.
vi.microsoft	string	Vietnam dili için Microsoft çözümleyicisi.
whitespace	string	Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	string	Çince için Lucene çözümleyicisi (Basitleştirilmiş).
zh-Hans.microsoft	string	Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.
zh-Hant.lucene	string	Çince (Geleneksel) için Lucene çözümleyicisi.
zh-Hant.microsoft	string	Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name	Tür	Description
classic	string	Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	string	Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	string	Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	string	Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	string	Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	string	Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.
microsoft_language_tokenizer	string	Dile özgü kuralları kullanarak metni böler.
nGram	string	Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	string	Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	string	Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	string	Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	string	Url'leri ve e-postaları tek bir belirteç olarak belirteçler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	string	Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name	Tür	Description
apostrophe	string	Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) siler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	string	Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	string	İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	string	Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	string	CJK genişlik farklarını normalleştirir. Fullwidth ASCII değişkenlerini eşdeğer temel Latinceye, yarım genişlikli Katakana değişkenlerini de eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	string	İngilizce sahiplik ve noktaları kısaltmalardan kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	string	Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	string	Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	string	İlanları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	string	Almanca karakterleri, German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	string	Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçe metinleri normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	string	Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	string	Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	string	İngilizce için yüksek performanslı kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	string	Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	string	Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	string	Belirteç metnini küçük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2	string	Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	string	Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	string	Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	string	Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer
reverse	string	Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	string	åÅäæÄÆ->a ve öÖøØ->o İskandinav karakterlerini katlar. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	string	Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	string	Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	string	Snowball tarafından oluşturulan kök ayırıcı kullanarak sözcüklerin köklerini oluşturan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	string	Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	string	Dile özgü gövde filtresi. Bkz. https://video2.skills-academy.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	string	Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	string	Belirteçlerden öndeki ve sondaki boşlukları kırpılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	string	Terimleri belirli bir uzunlukta kısaltın. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	string	Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	string	Belirteç metnini büyük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	string	Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.

Aracılığıyla paylaş