Limity usług w usłudze Azure AI Search

Artykuł
09/01/2024

Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od tego, czy tworzysz usługę Azure AI Search w warstwach cenowych Bezpłatna, Podstawowa, Standardowa czy Zoptymalizowana pod kątem magazynu.

Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.
Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę, ale udostępnia infrastrukturę sieciową innym dzierżawcom.
Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie zapewnia funkcji indeksatora, a pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.
Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Zoptymalizowane pod kątem magazynu są dostępne na dwóch poziomach: L1 i L2.

Limity subskrypcji

Można utworzyć wiele rozliczanych usług wyszukiwania (podstawowa i wyższa) do maksymalnej liczby usług dozwolonych w każdej warstwie. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.

Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.

Zasób	Bezpłatna ¹	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Maksymalna liczba usług	1	16	16	8	6	6	6	6
Maksymalna liczba jednostek wyszukiwania (SU)²	Nie dotyczy	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB.

² Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replika lub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji jednostek jednostki organizacyjnej, zobacz Szacowanie pojemności usługi wyszukiwania i zarządzanie nią.

Limity usługi

usługa wyszukiwania limity magazynu, partycji i replik różnią się w zależności od daty utworzenia usługi, a wyższe limity dla nowszych usług w obsługiwanych regionach. Limity różnią się w zależności od daty utworzenia usługi:

Przed 3 kwietnia 2024 r.
Od kwietnia do maja 2024 r. (Basic, S1, S2, S3, S3 HD)
Po 17 maja 2024 r. (L1 i L2)

Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.

Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług mających co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w umowie SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.

Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.

Przed 3 kwietnia 2024 r.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Umowa dotycząca poziomu usług (SLA)	Nie.	Tak	Tak	Tak	Tak	Tak	Tak	Tak
Magazyn (rozmiar partycji)	50 MB	2 GB	25 GB	100 GB	200 GB	200 GB	1 TB	2 TB
Partycje	Nie dotyczy	1	12	12	12	3	12	12
Repliki	Nie dotyczy	3	12	12	12	12	12	12

Po 3 kwietnia 2024 r.

Warstwa Podstawowa obsługuje trzy partycje i trzy repliki dla łącznie dziewięciu jednostek wyszukiwania (SU). Ma również większe partycje.
S1, S2, S3 i S3 HD mają większe partycje, począwszy od 3–7 razy więcej, w zależności od warstwy.
Większa pojemność jest ograniczona do nowych usług wyszukiwania w obsługiwanych regionach. Obecnie nie ma uaktualnienia w miejscu.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Umowa dotycząca poziomu usług (SLA)	Nie.	Tak	Tak	Tak	Tak	Tak	Tak	Tak
Magazyn (rozmiar partycji)	50 MB	15 GB	160 GB	512 GB	1 TB	1 TB	1 TB	2 TB
Partycje	Nie dotyczy	3	12	12	12	3	12	12
Repliki	Nie dotyczy	3	12	12	12	12	12	12

Po 17 maja 2024 r.

L1 i L2 mają więcej magazynu partycji i mocy obliczeniowej.
Większa pojemność jest ograniczona do nowych usług wyszukiwania w obsługiwanych regionach. Obecnie nie ma uaktualnienia w miejscu.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Umowa dotycząca poziomu usług (SLA)	Nie.	Tak	Tak	Tak	Tak	Tak	Tak	Tak
Magazyn (rozmiar partycji)	50 MB	15 GB	160 GB	512 GB	1 TB	1 TB	2 TB	4 TB
Partycje	Nie dotyczy	3	12	12	12	3	12	12
Repliki	Nie dotyczy	3	12	12	12	12	12	12

Obsługiwane regiony z wyższymi limitami magazynu

Aby uzyskać dodatkowy magazyn, usługi muszą znajdować się w jednym z następujących regionów. Obejrzyj ogłoszenia w artykule Co nowego w usłudze Azure AI Search , aby uzyskać rozszerzenie do innych regionów.

Dostępne od 17 maja 2024 r.

Kraj	Regiony zapewniające dodatkową pojemność na partycję
Szwajcaria	Szwajcaria Zachodnia
Republika Południowej Afryki	Republika Południowej Afryki Północnej
Niemcy	Niemcy Północne, Niemcy Zachodnio-środkowe
Azure Government	Texas, Arizona, Wirginia
Chiny	Chiny Północne 3, Chiny Wschodnie 3

Dostępne od 3 kwietnia 2024 r.

Kraj	Regiony zapewniające dodatkową pojemność na partycję
Stany Zjednoczone	Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA
Zjednoczone Królestwo	Południowe Zjednoczone Królestwo, Zachodnie Zjednoczone Królestwo
Zjednoczone Emiraty Arabskie (ZEA)	Zjednoczone Emiraty Arabskie Na Północ
Szwajcaria	Szwajcaria Północna
Szwecja	Szwecja Środkowa
Republika Południowej Afryki	Republika Południowej Afryki Północnej
Polska	Polska Środkowa
Norwegia	Norwegia Wschodnia
Korea Południowa	Korea Środkowa, Korea Południowa
Japonia	Japonia Wschodnia, Japonia Zachodnia
Włochy	Włochy Północne
Indie	Indie Środkowe, Jio Indie Zachodnie
Francja	Francja Środkowa
Europa	Europa Północna
Kanada	Kanada Środkowa, Kanada Wschodnia
Bazil	Brazylia Południowa
Azja i Pacyfik	Azja Wschodnia, Azja Południowo-Wschodnia
Australia	Australia Wschodnia, Australia Południowo-Wschodnia

Limity indeksów

Zasób	Bezpłatna	Podstawowa ¹	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Maksymalna liczba indeksów	3	5 lub 15	50	200	200	1000 na partycję lub 3000 na usługę	10	10
Maksymalna liczba prostych pól na indeks ²	1000	100	1000	1000	1000	1000	1000	1000
Maksymalne wymiary na pole wektora	4098	4098	4098	4098	4098	4098	4098	4098
Maksymalna liczba złożonych kolekcji na indeks	40	40	40	40	40	40	40	40
Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument ³	3000	3000	3000	3000	3000	3000	3000	3000
Maksymalna głębokość pól złożonych	10	10	10	10	10	10	10	10
Maksymalna liczba sugestorów na indeks	1	1	1	1	1	1	1	1
Maksymalna liczba profilów oceniania na indeks	100	100	100	100	100	100	100	100
Maksymalna liczba funkcji na profil	8	8	8	8	8	8	8	8
Maksymalny rozmiar indeksu ⁴	Brak	NIE DOTYCZY	Brak	1,88 TB	2,34 TB	100 GB	Brak	Brak

¹ Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.

² Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone pola podrzędne w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.

³ Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument hotelowy z złożoną kolekcją Rooms każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie. Ten limit został wprowadzony w api-version=2019-05-06 systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.

⁴ W większości warstw maksymalny rozmiar indeksu jest dostępny w usłudze wyszukiwania. W przypadku S2, S3 i S3 HD maksymalny rozmiar dowolnego indeksu to liczba podana w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.

W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.

Limity dokumentów

W usługach wyszukiwania Basic, S1, S2, S3, L1 i L2 można mieć około 24 miliardów dokumentów na indeks. W przypadku usługi S3 HD limit wynosi 2 miliardy dokumentów na indeks. Każde wystąpienie złożonej kolekcji jest liczone jako oddzielny dokument pod względem tych limitów.

Limity rozmiaru dokumentu na wywołanie interfejsu API

Maksymalny rozmiar dokumentu podczas wywoływania interfejsu API indeksowania wynosi około 16 megabajtów.

Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru treści żądania interfejsu API indeksowania. Ponieważ można przekazać partię wielu dokumentów do interfejsu API indeksowania jednocześnie, limit rozmiaru jest realistycznie zależny od liczby dokumentów w partii. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.

Podczas szacowania rozmiaru dokumentu należy wziąć pod uwagę tylko te pola, które dodają wartość do scenariuszy wyszukiwania, i wykluczyć wszystkie pola źródłowe, które nie mają celu w zapytaniach, które mają być uruchamiane.

Limity rozmiaru indeksu wektorowego

Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną dla wyszukiwania wektorowego dla warstwy usługi (lub SKU).

Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest trudnym limitem, który gwarantuje, że usługa pozostaje w dobrej kondycji, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowoduje niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub skalowanie w górę w partycjach.

W tabeli opisano limit przydziału rozmiaru indeksu wektorowego na partycję w różnych warstwach usług. Kontekst obejmuje następujące elementy:

Partycjonuj limity magazynu dla każdej warstwy powtórzone tutaj w kontekście.
Ilość każdej partycji (w GB) dostępna dla indeksów wektorów (tworzonych podczas dodawania pól wektorowych do indeksu).
Przybliżona liczba osadzonych (wartości zmiennoprzecinkowych) na partycję.

Użyj statystyk usługi GET, aby pobrać limit przydziału rozmiaru indeksu wektorowego lub przejrzeć stronę Indeksy lub kartę Użycie w witrynie Azure Portal.

Limity wektorów różnią się w zależności od daty i warstwy tworzenia usługi. Aby sprawdzić wiek usługi wyszukiwania i dowiedzieć się więcej o indeksach wektorów, zobacz Vector index size and staying under limits (Rozmiar indeksu wektora i pozostawanie w granicach).

Limity wektorów dla usług utworzonych po 17 maja 2024 r.

Najwyższe limity wektorów są dostępne w usługach wyszukiwania utworzonych po 17 maja 2024 r. w obsługiwanym regionie.

Warstwa	Limit przydziału magazynu (GB)	Przydział wektorów na partycję (GB)
Podstawowy	15	5
S1	160	35
S2	512	150
S3	1,024	300
L1	2048	150
L2	4,096	300

Limity wektorów dla usług utworzonych między 3 kwietnia 2024 r. a 17 maja 2024 r.

Następujące limity wektorów są dostępne w usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. w obsługiwanym regionie.

Warstwa	Limit przydziału magazynu (GB)	Przydział wektorów na partycję (GB)
Podstawowy	15	5
S1	160	35
S2	350	100
S3	700	200
L1	1000	12
L2	2000	36

Zauważ, że limity L1 i L2 pozostają niezmienione w 3 kwietnia.

Limity wektorów dla usług utworzonych między 1 lipca 2023 r. a 3 kwietnia 2024 r.

Następujące limity stosowane do nowych usług utworzonych między 1 a 3 kwietnia 2024 r., z wyjątkiem następujących regionów, które mają pierwotne limity od 1 lipca 2023 r.:

Niemcy Środkowo-Zachodnie
Indie Zachodnie
Katar Środkowy

Wszystkie inne regiony mają następujące limity:

Warstwa	Limit przydziału magazynu (GB)	Przydział wektorów na partycję (GB)
Podstawowy	2	1
S1	25	3
S2	100	12
S3	200	36
L1	1000	12
L2	2000	36

Limity wektorów dla usług utworzonych przed 1 lipca 2023 r.

Warstwa	Limit przydziału magazynu (GB)	Przydział wektorów na partycję (GB)
Podstawowy	2	0.5
S1	25	1
S2	100	6
S3	200	12
L1	1000	12
L2	2000	36

Limity indeksatora

Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Harmonogram śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może odebrać miejsce, w którym ostatnio zostało przerwane przy następnym zaplanowanym uruchomieniu.

Zasób	Bezpłatna ¹	Podstawowa ²	S1	S2	S3	S3 HD ³	L1	L2
Maksymalna liczba indeksatorów	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalna liczba źródeł danych	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalna liczba zestawów ^{umiejętności 4}	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalne obciążenie indeksowania na wywołanie	10 000 dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Nie dotyczy	Brak ograniczeń	Brak ograniczeń
Minimalny harmonogram	5 min	5 min	5 min	5 min	5 min	5 min	5 min	5 min
Maksymalny czas ^{działania 5}	1–3 minuty	2 lub 24 godziny	2 lub 24 godziny	2 lub 24 godziny	2 lub 24 godziny	Nie dotyczy	2 lub 24 godziny	2 lub 24 godziny
Maksymalny czas wykonywania indeksatorów z zestawem ^{umiejętności 6}	3–10 minut	2 godziny	2 godziny	2 godziny	2 godziny	Nie dotyczy	2 godziny	2 godziny
Indeksator obiektów blob: maksymalny rozmiar obiektu blob, MB	16	16	128	256	256	Nie dotyczy	256	256
Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob	32,000	64,000	4 miliony	8 mln	16 milionów	Nie dotyczy	4 miliony	4 miliony

¹ Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, które wywołuje usługi Azure AI, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania (porada: możesz zresetować indeksator, aby zresetować jego liczbę).

² Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.

³ Usługi S3 HD nie obejmują obsługi indeksatora.

⁴ Maksymalnie 30 umiejętności na zestaw umiejętności.

⁵ Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Limit 24-godzinny pochodzi ze starszej implementacji indeksatora. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, w przypadku zadań indeksowania, które nie mogą zostać zakończone w ciągu dwóch godzin, należy umieścić indeksator w harmonogramie 2-godzinnym. Po zakończeniu pierwszego interwału 2-godzinnego indeksator pobiera miejsce, w którym został przerwany podczas uruchamiania następnego 2-godzinnego interwału.

⁶ Wykonywanie zestawu umiejętności, a w szczególności analiza obrazów jest intensywnie obciążane obliczeniami i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Czas wykonywania tych obciążeń jest krótszy, dzięki czemu inne zadania w kolejce mają większą możliwość uruchomienia.

Uwaga

Jak określono w limitach indeksów, indeksatory będą również wymuszać górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ogólnie dostępnej, która obsługuje typy złożone (2019-05-06). Oznacza to, że jeśli indeksator został utworzony z wcześniejszą wersją interfejsu API, nie będzie podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06 interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.

Limity zasobów udostępnionego łącza prywatnego

Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Obsługa indeksatora prywatnego punktu końcowego	Nie.	Tak	Tak	Tak	Tak	Nie	Tak	Tak
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawem^{umiejętności 1}	Nie	Nie.	Nie.	Tak	Tak	Nie	Tak	Tak
Maksymalna liczba prywatnych punktów końcowych	Nie dotyczy	10 lub 30	100	400	400	Nie dotyczy	20	20
Maksymalna liczba unikatowych typów^{zasobów 2}	Nie dotyczy	100	7	15	15	Nie dotyczy	4	4

¹ Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania.

² Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.

Limity synonimów

Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3-HD	L1	L2
Maksymalna liczba map synonimów	3	3	5	10	20	20	10	10
Maksymalna liczba reguł na mapę	5000	20000	20000	20000	20000	20000	20000	20000

Limity aliasów indeksu

Maksymalna liczba aliasów indeksu różni się w zależności od warstwy. We wszystkich warstwach maksymalna liczba aliasów jest dwukrotnie liczbą dozwolonych indeksów.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3-HD	L1	L2
Maksymalna liczba aliasów	6	10 lub 30	100	400	400	2000 na partycję lub 6000 na usługę	20	20

Limity danych (wzbogacanie sztucznej inteligencji)

Potok wzbogacania sztucznej inteligencji, który wykonuje wywołania zasobu języka AI platformy Azure na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych podlega limitom danych. Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj umiejętności Dzielenie tekstu.

Limity ograniczania przepustowości

Żądania interfejsu API są ograniczane, ponieważ system zbliża się do szczytowej pojemności. Ograniczanie działa inaczej dla różnych interfejsów API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) i indeksowanie interfejsów API są dynamicznie ograniczane na podstawie obciążenia usługi. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.

Statyczne limity żądań szybkości dla operacji związanych z indeksem:

Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania

Statyczne limity żądań szybkości dla operacji związanych z usługą:

Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania

L2 reranking przy użyciu semantycznego rerankera ma oczekiwany wolumin:

Maksymalnie 10 współbieżnych zapytań na replikę. Jeśli przewidujesz spójne wymagania dotyczące przepływności w pobliżu, na poziomie lub wyższym niż na tym poziomie, utwórz bilet pomocy technicznej, abyśmy mogli aprowizować obciążenie.

Limity żądań interfejsu API

Maksymalnie 16 MB na żądanie ¹
Maksymalna długość adresu URL 8 KB
Maksymalnie 1000 dokumentów na partię przekazywania, scalania lub usuwania indeksu
Maksymalnie 32 pola w klauzuli $orderby
Maksymalnie 100 000 znaków w klauzuli wyszukiwania
Maksymalna liczba klauzul ( search w wyrażeniach oddzielonych znakami AND lub OR) wynosi 1024
Maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu w formacie UTF-8
Maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych
Wyszukiwanie symboli wieloznacznych i wyszukiwanie wyrażeń regularnych jest ograniczone do maksymalnie 1000 stanów podczas przetwarzania przez lucene.

¹ W usłudze Azure AI Search treść żądania podlega górnemu limitowi 16 MB, nakładając praktyczny limit zawartości poszczególnych pól lub kolekcji, które nie są w inny sposób ograniczone przez limity teoretyczne (zobacz Obsługiwane typy danych, aby uzyskać więcej informacji na temat kompozycji i ograniczeń pól).

Istnieją limity rozmiaru i kompozycji zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.

Limity odpowiedzi interfejsu API

Maksymalnie 1000 dokumentów zwracanych na stronę wyników wyszukiwania
Maksymalna liczba sugestii zwróconych na żądanie interfejsu API sugerowanego: 100

Limity kluczy interfejsu API

Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy analizatorów. Klucze administratora są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.

Maksymalnie 2 klucze administracyjne na usługę
Maksymalnie 50 kluczy zapytań na usługę

Udostępnij za pośrednictwem