Limity usług w usłudze Azure AI Search
Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od tego, czy tworzysz usługę Azure AI Search w warstwach cenowych Bezpłatna, Podstawowa, Standardowa czy Zoptymalizowana pod kątem magazynu.
Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.
Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę, ale udostępnia infrastrukturę sieciową innym dzierżawcom.
Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie zapewnia funkcji indeksatora, a pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.
Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Zoptymalizowane pod kątem magazynu są dostępne na dwóch poziomach: L1 i L2.
Limity subskrypcji
Można utworzyć wiele rozliczanych usług wyszukiwania (podstawowa i wyższa) do maksymalnej liczby usług dozwolonych w każdej warstwie. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.
Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.
Zasób | Bezpłatna 1 | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba usług | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maksymalna liczba jednostek wyszukiwania (SU)2 | Nie dotyczy | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB.
2 Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replika lub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji jednostek jednostki organizacyjnej, zobacz Szacowanie pojemności usługi wyszukiwania i zarządzanie nią.
Limity usługi
usługa wyszukiwania limity magazynu, partycji i replik różnią się w zależności od daty utworzenia usługi, a wyższe limity dla nowszych usług w obsługiwanych regionach. Limity różnią się w zależności od daty utworzenia usługi:
- Przed 3 kwietnia 2024 r.
- Od kwietnia do maja 2024 r. (Basic, S1, S2, S3, S3 HD)
- Po 17 maja 2024 r. (L1 i L2)
Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.
Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług mających co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w umowie SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.
Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.
Przed 3 kwietnia 2024 r.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Umowa dotycząca poziomu usług (SLA) | Nie. | Tak | Tak | Tak | Tak | Tak | Tak | Tak |
Magazyn (rozmiar partycji) | 50 MB | 2 GB | 25 GB | 100 GB | 200 GB | 200 GB | 1 TB | 2 TB |
Partycje | Nie dotyczy | 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliki | Nie dotyczy | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
Po 3 kwietnia 2024 r.
- Warstwa Podstawowa obsługuje trzy partycje i trzy repliki dla łącznie dziewięciu jednostek wyszukiwania (SU). Ma również większe partycje.
- S1, S2, S3 i S3 HD mają większe partycje, począwszy od 3–7 razy więcej, w zależności od warstwy.
- Większa pojemność jest ograniczona do nowych usług wyszukiwania w obsługiwanych regionach. Obecnie nie ma uaktualnienia w miejscu.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Umowa dotycząca poziomu usług (SLA) | Nie. | Tak | Tak | Tak | Tak | Tak | Tak | Tak |
Magazyn (rozmiar partycji) | 50 MB | 15 GB | 160 GB | 512 GB | 1 TB | 1 TB | 1 TB | 2 TB |
Partycje | Nie dotyczy | 3 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliki | Nie dotyczy | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
Po 17 maja 2024 r.
- L1 i L2 mają więcej magazynu partycji i mocy obliczeniowej.
- Większa pojemność jest ograniczona do nowych usług wyszukiwania w obsługiwanych regionach. Obecnie nie ma uaktualnienia w miejscu.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Umowa dotycząca poziomu usług (SLA) | Nie. | Tak | Tak | Tak | Tak | Tak | Tak | Tak |
Magazyn (rozmiar partycji) | 50 MB | 15 GB | 160 GB | 512 GB | 1 TB | 1 TB | 2 TB | 4 TB |
Partycje | Nie dotyczy | 3 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliki | Nie dotyczy | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
Obsługiwane regiony z wyższymi limitami magazynu
Aby uzyskać dodatkowy magazyn, usługi muszą znajdować się w jednym z następujących regionów. Obejrzyj ogłoszenia w artykule Co nowego w usłudze Azure AI Search , aby uzyskać rozszerzenie do innych regionów.
Dostępne od 17 maja 2024 r.
Kraj | Regiony zapewniające dodatkową pojemność na partycję |
---|---|
Szwajcaria | Szwajcaria Zachodnia |
Republika Południowej Afryki | Republika Południowej Afryki Północnej |
Niemcy | Niemcy Północne, Niemcy Zachodnio-środkowe |
Azure Government | Texas, Arizona, Wirginia |
Chiny | Chiny Północne 3, Chiny Wschodnie 3 |
Dostępne od 3 kwietnia 2024 r.
Kraj | Regiony zapewniające dodatkową pojemność na partycję |
---|---|
Stany Zjednoczone | Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA |
Zjednoczone Królestwo | Południowe Zjednoczone Królestwo, Zachodnie Zjednoczone Królestwo |
Zjednoczone Emiraty Arabskie (ZEA) | Zjednoczone Emiraty Arabskie Na Północ |
Szwajcaria | Szwajcaria Północna |
Szwecja | Szwecja Środkowa |
Republika Południowej Afryki | Republika Południowej Afryki Północnej |
Polska | Polska Środkowa |
Norwegia | Norwegia Wschodnia |
Korea Południowa | Korea Środkowa, Korea Południowa |
Japonia | Japonia Wschodnia, Japonia Zachodnia |
Włochy | Włochy Północne |
Indie | Indie Środkowe, Jio Indie Zachodnie |
Francja | Francja Środkowa |
Europa | Europa Północna |
Kanada | Kanada Środkowa, Kanada Wschodnia |
Bazil | Brazylia Południowa |
Azja i Pacyfik | Azja Wschodnia, Azja Południowo-Wschodnia |
Australia | Australia Wschodnia, Australia Południowo-Wschodnia |
Limity indeksów
Zasób | Bezpłatna | Podstawowa 1 | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba indeksów | 3 | 5 lub 15 | 50 | 200 | 200 | 1000 na partycję lub 3000 na usługę | 10 | 10 |
Maksymalna liczba prostych pól na indeks 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Maksymalne wymiary na pole wektora | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Maksymalna liczba złożonych kolekcji na indeks | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maksymalna głębokość pól złożonych | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maksymalna liczba sugestorów na indeks | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maksymalna liczba profilów oceniania na indeks | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maksymalna liczba funkcji na profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Maksymalny rozmiar indeksu 4 | Brak | NIE DOTYCZY | Brak | 1,88 TB | 2,34 TB | 100 GB | Brak | Brak |
1 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.
2 Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone pola podrzędne w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.
3 Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument hotelowy z złożoną kolekcją Rooms każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie. Ten limit został wprowadzony w api-version=2019-05-06
systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.
4 W większości warstw maksymalny rozmiar indeksu jest dostępny w usłudze wyszukiwania. W przypadku S2, S3 i S3 HD maksymalny rozmiar dowolnego indeksu to liczba podana w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.
W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.
Limity dokumentów
W usługach wyszukiwania Basic, S1, S2, S3, L1 i L2 można mieć około 24 miliardów dokumentów na indeks. W przypadku usługi S3 HD limit wynosi 2 miliardy dokumentów na indeks. Każde wystąpienie złożonej kolekcji jest liczone jako oddzielny dokument pod względem tych limitów.
Limity rozmiaru dokumentu na wywołanie interfejsu API
Maksymalny rozmiar dokumentu podczas wywoływania interfejsu API indeksowania wynosi około 16 megabajtów.
Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru treści żądania interfejsu API indeksowania. Ponieważ można przekazać partię wielu dokumentów do interfejsu API indeksowania jednocześnie, limit rozmiaru jest realistycznie zależny od liczby dokumentów w partii. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.
Podczas szacowania rozmiaru dokumentu należy wziąć pod uwagę tylko te pola, które dodają wartość do scenariuszy wyszukiwania, i wykluczyć wszystkie pola źródłowe, które nie mają celu w zapytaniach, które mają być uruchamiane.
Limity rozmiaru indeksu wektorowego
Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną dla wyszukiwania wektorowego dla warstwy usługi (lub SKU
).
Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest trudnym limitem, który gwarantuje, że usługa pozostaje w dobrej kondycji, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowoduje niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub skalowanie w górę w partycjach.
W tabeli opisano limit przydziału rozmiaru indeksu wektorowego na partycję w różnych warstwach usług. Kontekst obejmuje następujące elementy:
- Partycjonuj limity magazynu dla każdej warstwy powtórzone tutaj w kontekście.
- Ilość każdej partycji (w GB) dostępna dla indeksów wektorów (tworzonych podczas dodawania pól wektorowych do indeksu).
- Przybliżona liczba osadzonych (wartości zmiennoprzecinkowych) na partycję.
Użyj statystyk usługi GET, aby pobrać limit przydziału rozmiaru indeksu wektorowego lub przejrzeć stronę Indeksy lub kartę Użycie w witrynie Azure Portal.
Limity wektorów różnią się w zależności od daty i warstwy tworzenia usługi. Aby sprawdzić wiek usługi wyszukiwania i dowiedzieć się więcej o indeksach wektorów, zobacz Vector index size and staying under limits (Rozmiar indeksu wektora i pozostawanie w granicach).
Limity wektorów dla usług utworzonych po 17 maja 2024 r.
Najwyższe limity wektorów są dostępne w usługach wyszukiwania utworzonych po 17 maja 2024 r. w obsługiwanym regionie.
Warstwa | Limit przydziału magazynu (GB) | Przydział wektorów na partycję (GB) |
---|---|---|
Podstawowy | 15 | 5 |
S1 | 160 | 35 |
S2 | 512 | 150 |
S3 | 1,024 | 300 |
L1 | 2048 | 150 |
L2 | 4,096 | 300 |
Limity wektorów dla usług utworzonych między 3 kwietnia 2024 r. a 17 maja 2024 r.
Następujące limity wektorów są dostępne w usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. w obsługiwanym regionie.
Warstwa | Limit przydziału magazynu (GB) | Przydział wektorów na partycję (GB) |
---|---|---|
Podstawowy | 15 | 5 |
S1 | 160 | 35 |
S2 | 350 | 100 |
S3 | 700 | 200 |
L1 | 1000 | 12 |
L2 | 2000 | 36 |
Zauważ, że limity L1 i L2 pozostają niezmienione w 3 kwietnia.
Limity wektorów dla usług utworzonych między 1 lipca 2023 r. a 3 kwietnia 2024 r.
Następujące limity stosowane do nowych usług utworzonych między 1 a 3 kwietnia 2024 r., z wyjątkiem następujących regionów, które mają pierwotne limity od 1 lipca 2023 r.:
- Niemcy Środkowo-Zachodnie
- Indie Zachodnie
- Katar Środkowy
Wszystkie inne regiony mają następujące limity:
Warstwa | Limit przydziału magazynu (GB) | Przydział wektorów na partycję (GB) |
---|---|---|
Podstawowy | 2 | 1 |
S1 | 25 | 3 |
S2 | 100 | 12 |
S3 | 200 | 36 |
L1 | 1000 | 12 |
L2 | 2000 | 36 |
Limity wektorów dla usług utworzonych przed 1 lipca 2023 r.
Warstwa | Limit przydziału magazynu (GB) | Przydział wektorów na partycję (GB) |
---|---|---|
Podstawowy | 2 | 0.5 |
S1 | 25 | 1 |
S2 | 100 | 6 |
S3 | 200 | 12 |
L1 | 1000 | 12 |
L2 | 2000 | 36 |
Limity indeksatora
Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Harmonogram śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może odebrać miejsce, w którym ostatnio zostało przerwane przy następnym zaplanowanym uruchomieniu.
Zasób | Bezpłatna 1 | Podstawowa 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba indeksatorów | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalna liczba źródeł danych | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalna liczba zestawów umiejętności 4 | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalne obciążenie indeksowania na wywołanie | 10 000 dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Nie dotyczy | Brak ograniczeń | Brak ograniczeń |
Minimalny harmonogram | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min |
Maksymalny czas działania 5 | 1–3 minuty | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | Nie dotyczy | 2 lub 24 godziny | 2 lub 24 godziny |
Maksymalny czas wykonywania indeksatorów z zestawem umiejętności 6 | 3–10 minut | 2 godziny | 2 godziny | 2 godziny | 2 godziny | Nie dotyczy | 2 godziny | 2 godziny |
Indeksator obiektów blob: maksymalny rozmiar obiektu blob, MB | 16 | 16 | 128 | 256 | 256 | Nie dotyczy | 256 | 256 |
Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob | 32,000 | 64,000 | 4 miliony | 8 mln | 16 milionów | Nie dotyczy | 4 miliony | 4 miliony |
1 Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, które wywołuje usługi Azure AI, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania (porada: możesz zresetować indeksator, aby zresetować jego liczbę).
2 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.
3 Usługi S3 HD nie obejmują obsługi indeksatora.
4 Maksymalnie 30 umiejętności na zestaw umiejętności.
5 Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Limit 24-godzinny pochodzi ze starszej implementacji indeksatora. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, w przypadku zadań indeksowania, które nie mogą zostać zakończone w ciągu dwóch godzin, należy umieścić indeksator w harmonogramie 2-godzinnym. Po zakończeniu pierwszego interwału 2-godzinnego indeksator pobiera miejsce, w którym został przerwany podczas uruchamiania następnego 2-godzinnego interwału.
6 Wykonywanie zestawu umiejętności, a w szczególności analiza obrazów jest intensywnie obciążane obliczeniami i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Czas wykonywania tych obciążeń jest krótszy, dzięki czemu inne zadania w kolejce mają większą możliwość uruchomienia.
Uwaga
Jak określono w limitach indeksów, indeksatory będą również wymuszać górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ogólnie dostępnej, która obsługuje typy złożone (2019-05-06
). Oznacza to, że jeśli indeksator został utworzony z wcześniejszą wersją interfejsu API, nie będzie podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06
interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.
Limity zasobów udostępnionego łącza prywatnego
Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Obsługa indeksatora prywatnego punktu końcowego | Nie. | Tak | Tak | Tak | Tak | Nie | Tak | Tak |
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawemumiejętności 1 | Nie | Nie. | Nie. | Tak | Tak | Nie | Tak | Tak |
Maksymalna liczba prywatnych punktów końcowych | Nie dotyczy | 10 lub 30 | 100 | 400 | 400 | Nie dotyczy | 20 | 20 |
Maksymalna liczba unikatowych typówzasobów 2 | Nie dotyczy | 100 | 7 | 15 | 15 | Nie dotyczy | 4 | 4 |
1 Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania.
2 Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId
wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.
Limity synonimów
Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba map synonimów | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maksymalna liczba reguł na mapę | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limity aliasów indeksu
Maksymalna liczba aliasów indeksu różni się w zależności od warstwy. We wszystkich warstwach maksymalna liczba aliasów jest dwukrotnie liczbą dozwolonych indeksów.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba aliasów | 6 | 10 lub 30 | 100 | 400 | 400 | 2000 na partycję lub 6000 na usługę | 20 | 20 |
Limity danych (wzbogacanie sztucznej inteligencji)
Potok wzbogacania sztucznej inteligencji, który wykonuje wywołania zasobu języka AI platformy Azure na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych podlega limitom danych. Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Length
wartość . Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj umiejętności Dzielenie tekstu.
Limity ograniczania przepustowości
Żądania interfejsu API są ograniczane, ponieważ system zbliża się do szczytowej pojemności. Ograniczanie działa inaczej dla różnych interfejsów API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) i indeksowanie interfejsów API są dynamicznie ograniczane na podstawie obciążenia usługi. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.
Statyczne limity żądań szybkości dla operacji związanych z indeksem:
- Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
- Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
- Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
- Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
- Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania
Statyczne limity żądań szybkości dla operacji związanych z usługą:
- Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania
L2 reranking przy użyciu semantycznego rerankera ma oczekiwany wolumin:
- Maksymalnie 10 współbieżnych zapytań na replikę. Jeśli przewidujesz spójne wymagania dotyczące przepływności w pobliżu, na poziomie lub wyższym niż na tym poziomie, utwórz bilet pomocy technicznej, abyśmy mogli aprowizować obciążenie.
Limity żądań interfejsu API
- Maksymalnie 16 MB na żądanie 1
- Maksymalna długość adresu URL 8 KB
- Maksymalnie 1000 dokumentów na partię przekazywania, scalania lub usuwania indeksu
- Maksymalnie 32 pola w klauzuli $orderby
- Maksymalnie 100 000 znaków w klauzuli wyszukiwania
- Maksymalna liczba klauzul (
search
w wyrażeniach oddzielonych znakami AND lub OR) wynosi 1024 - Maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu w formacie UTF-8
- Maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych
- Wyszukiwanie symboli wieloznacznych i wyszukiwanie wyrażeń regularnych jest ograniczone do maksymalnie 1000 stanów podczas przetwarzania przez lucene.
1 W usłudze Azure AI Search treść żądania podlega górnemu limitowi 16 MB, nakładając praktyczny limit zawartości poszczególnych pól lub kolekcji, które nie są w inny sposób ograniczone przez limity teoretyczne (zobacz Obsługiwane typy danych, aby uzyskać więcej informacji na temat kompozycji i ograniczeń pól).
Istnieją limity rozmiaru i kompozycji zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.
Limity odpowiedzi interfejsu API
- Maksymalnie 1000 dokumentów zwracanych na stronę wyników wyszukiwania
- Maksymalna liczba sugestii zwróconych na żądanie interfejsu API sugerowanego: 100
Limity kluczy interfejsu API
Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy analizatorów. Klucze administratora są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.
- Maksymalnie 2 klucze administracyjne na usługę
- Maksymalnie 50 kluczy zapytań na usługę