Indexes - Analyze
Çözümleyicinin metni belirteçlere nasıl böler olduğunu gösterir.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-07-01
URI Parametreleri
Name | İçinde | Gerekli | Tür | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Arama hizmetinin uç nokta URL'si. |
index
|
path | True |
string |
Çözümleyicinin testine yönelik dizinin adı. |
api-version
|
query | True |
string |
İstemci Api Sürümü. |
İstek Başlığı
Name | Gerekli | Tür | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği. |
İstek Gövdesi
Name | Gerekli | Tür | Description |
---|---|---|---|
text | True |
string |
Belirteçlere bölünecek metin. |
analyzer |
Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar. |
||
charFilters |
Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir. |
||
tokenFilters |
Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir. |
||
tokenizer |
Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar. |
Yanıtlar
Name | Tür | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hata yanıtı. |
Örnekler
SearchServiceIndexAnalyze
Örnek isteği
POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-07-01
{
"text": "Text to analyze",
"analyzer": "standard.lucene"
}
Örnek yanıt
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Tanımlar
Name | Description |
---|---|
Analyzed |
Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler. |
Analyze |
Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir. |
Analyze |
Bir çözümleyicinin metin üzerinde test edilmesi sonucu. |
Char |
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar. |
Error |
Kaynak yönetimi hatası ek bilgileri. |
Error |
Hata ayrıntısı. |
Error |
Hata yanıtı |
Lexical |
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar. |
Lexical |
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar. |
Token |
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar. |
AnalyzedTokenInfo
Çözümleyici tarafından döndürülen belirteç hakkındaki bilgiler.
Name | Tür | Description |
---|---|---|
endOffset |
integer |
Giriş metnindeki belirtecin son karakterinin dizini. |
position |
integer |
Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak, bazı belirteçler birbiriyle eş anlamlıysa, aynı konuma sahip olabilir. |
startOffset |
integer |
Giriş metnindeki belirtecin ilk karakterinin dizini. |
token |
string |
Çözümleyici tarafından döndürülen belirteç. |
AnalyzeRequest
Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.
Name | Tür | Description |
---|---|---|
analyzer |
Verilen metni kesmek için kullanılacak çözümleyicinin adı. Bu parametre belirtilmezse, bunun yerine bir belirteç oluşturucu belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar. |
|
charFilters |
Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir. |
|
text |
string |
Belirteçlere bölünecek metin. |
tokenFilters |
Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. Bu parametre yalnızca belirteç oluşturucu parametresi kullanılırken ayarlanabilir. |
|
tokenizer |
Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. Bu parametre belirtilmezse, bunun yerine bir çözümleyici belirtmeniz gerekir. Belirteç oluşturucu ve çözümleyici parametreleri birbirini dışlar. |
AnalyzeResult
Bir çözümleyicinin metin üzerinde test edilmesi sonucu.
Name | Tür | Description |
---|---|---|
tokens |
İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi. |
CharFilterName
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
html_strip |
string |
HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
ErrorAdditionalInfo
Kaynak yönetimi hatası ek bilgileri.
Name | Tür | Description |
---|---|---|
info |
object |
Ek bilgiler. |
type |
string |
Ek bilgi türü. |
ErrorDetail
Hata ayrıntısı.
Name | Tür | Description |
---|---|---|
additionalInfo |
Hata ek bilgileri. |
|
code |
string |
Hata kodu. |
details |
Hata ayrıntıları. |
|
message |
string |
Hata iletisi. |
target |
string |
Hata hedefi. |
ErrorResponse
Hata yanıtı
Name | Tür | Description |
---|---|---|
error |
Hata nesnesi. |
LexicalAnalyzerName
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
ar.lucene |
string |
Arapça için Lucene çözümleyicisi. |
ar.microsoft |
string |
Arapça için Microsoft çözümleyicisi. |
bg.lucene |
string |
Bulgarca için Lucene çözümleyicisi. |
bg.microsoft |
string |
Bulgarca için Microsoft çözümleyicisi. |
bn.microsoft |
string |
Bangla için Microsoft çözümleyicisi. |
ca.lucene |
string |
Catalan için Lucene çözümleyicisi. |
ca.microsoft |
string |
Katalalan için Microsoft çözümleyicisi. |
cs.lucene |
string |
Çekçe için Lucene çözümleyicisi. |
cs.microsoft |
string |
Çekçe için Microsoft çözümleyicisi. |
da.lucene |
string |
Danca için Lucene çözümleyicisi. |
da.microsoft |
string |
Danca için Microsoft çözümleyicisi. |
de.lucene |
string |
Almanca için Lucene çözümleyicisi. |
de.microsoft |
string |
Almanca için Microsoft çözümleyicisi. |
el.lucene |
string |
Yunanca için Lucene çözümleyicisi. |
el.microsoft |
string |
Yunanca için Microsoft çözümleyicisi. |
en.lucene |
string |
İngilizce için Lucene çözümleyicisi. |
en.microsoft |
string |
İngilizce için Microsoft çözümleyicisi. |
es.lucene |
string |
İspanyolca için Lucene çözümleyicisi. |
es.microsoft |
string |
İspanyolca için Microsoft çözümleyicisi. |
et.microsoft |
string |
Estonca için Microsoft çözümleyicisi. |
eu.lucene |
string |
Bask için Lucene çözümleyicisi. |
fa.lucene |
string |
Farsça için Lucene çözümleyicisi. |
fi.lucene |
string |
Fince için Lucene çözümleyicisi. |
fi.microsoft |
string |
Fince için Microsoft çözümleyicisi. |
fr.lucene |
string |
Fransızca için Lucene çözümleyicisi. |
fr.microsoft |
string |
Fransızca için Microsoft çözümleyicisi. |
ga.lucene |
string |
lucene çözümleyicisi İrlandalı. |
gl.lucene |
string |
Galiçyalı için Lucene analizörü. |
gu.microsoft |
string |
Gujarati için Microsoft çözümleyicisi. |
he.microsoft |
string |
İbranice için Microsoft çözümleyicisi. |
hi.lucene |
string |
Hintçe için Lucene çözümleyicisi. |
hi.microsoft |
string |
Hintçe için Microsoft çözümleyicisi. |
hr.microsoft |
string |
Hırvat dili için Microsoft çözümleyicisi. |
hu.lucene |
string |
Macarca için Lucene çözümleyicisi. |
hu.microsoft |
string |
Macarca için Microsoft çözümleyicisi. |
hy.lucene |
string |
Ermeni için Lucene çözümleyicisi. |
id.lucene |
string |
Endonezya dili için Lucene çözümleyicisi. |
id.microsoft |
string |
Endonezya dili (Bahasa) için Microsoft çözümleyicisi. |
is.microsoft |
string |
İzlanda dili için Microsoft çözümleyicisi. |
it.lucene |
string |
İtalyanca için Lucene çözümleyicisi. |
it.microsoft |
string |
İtalyanca için Microsoft çözümleyicisi. |
ja.lucene |
string |
Japonca için Lucene çözümleyicisi. |
ja.microsoft |
string |
Japonca için Microsoft çözümleyicisi. |
keyword |
string |
Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
Kannada için Microsoft çözümleyicisi. |
ko.lucene |
string |
Korece için Lucene çözümleyicisi. |
ko.microsoft |
string |
Korece için Microsoft çözümleyicisi. |
lt.microsoft |
string |
Litvanca için Microsoft çözümleyicisi. |
lv.lucene |
string |
Lucene çözümleyicisi Letonyalı. |
lv.microsoft |
string |
Letonca için Microsoft çözümleyicisi. |
ml.microsoft |
string |
Malayalam için Microsoft çözümleyicisi. |
mr.microsoft |
string |
Marathi için Microsoft çözümleyicisi. |
ms.microsoft |
string |
Malay dili için Microsoft çözümleyicisi (Latin). |
nb.microsoft |
string |
Norveççe (Bokmål) için Microsoft analyzer. |
nl.lucene |
string |
Felemenkçe için Lucene çözümleyicisi. |
nl.microsoft |
string |
Felemenkçe için Microsoft çözümleyicisi. |
no.lucene |
string |
Norveç dili için Lucene çözümleyicisi. |
pa.microsoft |
string |
Pencap dili için Microsoft çözümleyicisi. |
pattern |
string |
Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lehçe için Lucene çözümleyicisi. |
pl.microsoft |
string |
Lehçe için Microsoft çözümleyicisi. |
pt-BR.lucene |
string |
Portekizce (Brezilya) için Lucene çözümleyicisi. |
pt-BR.microsoft |
string |
Portekizce (Brezilya) için Microsoft çözümleyicisi. |
pt-PT.lucene |
string |
Portekizce (Portekiz) için Lucene çözümleyicisi. |
pt-PT.microsoft |
string |
Portekizce (Portekiz) için Microsoft çözümleyicisi. |
ro.lucene |
string |
Rumence için Lucene çözümleyicisi. |
ro.microsoft |
string |
Romence için Microsoft çözümleyicisi. |
ru.lucene |
string |
Rus için Lucene çözümleyicisi. |
ru.microsoft |
string |
Rusça için Microsoft çözümleyicisi. |
simple |
string |
Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Slovakça için Microsoft çözümleyicisi. |
sl.microsoft |
string |
Slovence için Microsoft çözümleyicisi. |
sr-cyrillic.microsoft |
string |
Sırp (Kiril) için Microsoft analyzer. |
sr-latin.microsoft |
string |
Sırplık için Microsoft çözümleyicisi (Latin). |
standard.lucene |
string |
Standart Lucene çözümleyicisi. |
standardasciifolding.lucene |
string |
Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://video2.skills-academy.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
İsveççe için Lucene çözümleyicisi. |
sv.microsoft |
string |
İsveççe için Microsoft çözümleyicisi. |
ta.microsoft |
string |
Tamil için Microsoft çözümleyicisi. |
te.microsoft |
string |
Telugu için Microsoft çözümleyicisi. |
th.lucene |
string |
Tay dili için Lucene çözümleyicisi. |
th.microsoft |
string |
Tay dili için Microsoft çözümleyicisi. |
tr.lucene |
string |
Türkçe için Lucene çözümleyicisi. |
tr.microsoft |
string |
Türkçe için Microsoft çözümleyicisi. |
uk.microsoft |
string |
Ukrayna dili için Microsoft çözümleyicisi. |
ur.microsoft |
string |
Urduca için Microsoft çözümleyicisi. |
vi.microsoft |
string |
Vietnam dili için Microsoft çözümleyicisi. |
whitespace |
string |
Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Çince için Lucene çözümleyicisi (Basitleştirilmiş). |
zh-Hans.microsoft |
string |
Çince (Basitleştirilmiş) için Microsoft çözümleyicisi. |
zh-Hant.lucene |
string |
Çince (Geleneksel) için Lucene çözümleyicisi. |
zh-Hant.microsoft |
string |
Çince (Geleneksel) için Microsoft çözümleyicisi. |
LexicalTokenizerName
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
TokenFilterName
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.