Grenzwerte für den Azure KI Search-Dienst

Artikel
09/24/2024

Die Grenzwerte für Speicher, Workloads und Mengen von Indizes und anderen Objekten hängen davon ab, ob die Erstellung von Azure KI Search im Tarif Free, Basic, Standard oder Storage Optimized erfolgt.

Free ist ein mehrinstanzenfähiger, gemeinsam genutzter Dienst, der Teil Ihres Azure-Abonnements ist.
Basic bietet dedizierte Computeressourcen für Produktionsworkloads mit geringerem Umfang, teilen sich jedoch bestimmte Netzwerkinfrastruktur mit anderen Mandanten.
Standard wird auf dedizierten Computern ausgeführt. Sie bieten höhere Speicher- und Verarbeitungskapazität auf jeder Ebene. Standard ist in vier Ebenen verfügbar: S1, S2, S3 und S3 HD. S3 High Density (S3 HD) ist für Mehrinstanzenfähigkeit und große Mengen von kleinen Indizes (3.000 Indizes pro Dienst) konzipiert. S3 HD bietet kein Indexerfeature, und die Datenerfassung muss APIs nutzen, die Daten aus der Quelle an den Index übermitteln.
Storage Optimized wird auf dedizierten Computern mit mehr Gesamtspeicher, Speicherbandbreite und Arbeitsspeicher als Standard ausgeführt. Dieser Tarif ist für große Indizes konzipiert, die nur langsam geändert werden. „Storage Optimized“ gibt es auf zwei Ebenen: L1 und L2.

Grenzwerte für Abonnements

Sie können mehrere abrechenbare Suchdienste (Basic und höher) bis zur maximalen Anzahl zulässiger Dienste in den einzelnen Tarifen erstellen. Beispielsweise können Sie im selben Abonnement bis zu 16 Dienste im Basic-Tarif und weitere 16 Dienste im S1-Tarif erstellen. Weitere Informationen zu Tarifen finden Sie unter Auswählen eines Tarifs (oder einer SKU) für Azure KI-Suche.

Die Obergrenze für die maximale Anzahl von Diensten kann auf Anfrage angehoben werden. Senden Sie eine Supportanfrage, wenn Sie in einem Abonnement weitere Dienste benötigen.

Ressource	Free ¹	Basic	S1	S2	S3	S3 HD	L1	L2
Maximale Anzahl von Diensten	1	16	16	8	6	6	6	6
Maximale Anzahl der Sucheinheiten (Search Units, SU)²	N/V	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Sie können einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Der Free-Tarif basiert auf einer Infrastruktur, die gemeinsam mit anderen Kund*innen genutzt wird. Da die Hardware nicht dediziert ist, wird das Hochskalieren nicht unterstützt, und der Speicher ist auf 50 MB beschränkt.

² Sucheinheiten (SU) sind Abrechnungseinheiten, die entweder als Replikat oder Partition zugeordnet werden. Sie benötigen beide. Weitere Informationen zu SU-Kombinationen finden Sie unter Schätzen und Verwalten der Kapazität eines Suchdiensts.

Diensteinschränkungen

In der folgenden Tabelle werden SLA sowie Partitions- und Replikatanzahl auf Dienstebene behandelt.

Resource	Kostenlos	Basic	S1	S2	S3	S3 HD	L1	L2
Vereinbarung zum Servicelevel (SLA)	No	Ja	Ja	Ja	Ja	Ja	Ja	Ja
Partitionen	N/V	3 ¹	12	12	12	3	12	12
Replikate	–	3	12	12	12	12	12	12

¹ Der Basic-Tarif unterstützt drei Partitionen und drei Replikate für insgesamt neun Sucheinheiten (Search Units, SU) bei neuen Suchdiensten, die nach dem 3. April 2024 erstellt wurden. Ältere Basic-Dienste sind auf eine Partition und drei Replikate beschränkt.

Ein Suchdienst unterliegt einem maximalen Speichergrenzwert (Partitionsgröße multipliziert mit der Anzahl der Partitionen) oder einem harten Grenzwert für die maximale Anzahl von Indizes oder Indexer, je nachdem, welcher Wert zuerst erreicht wird.

Vereinbarungen auf Serviceebene (Service Level Agreements, SLAs) gelten für abrechnende Dienste mit mindestens zwei Replikaten für Abfrageworkloads oder drei oder mehr Replikate für Abfrage- und Indizierungsworkloads. Die Anzahl der Partitionen wird für eine SLA nicht berücksichtigt. Weitere Informationen finden Sie unter Zuverlässigkeit in Azure KI Search.

Kostenlose Dienste verfügen nicht über feste Partitionen oder Replikate, und sie teilen Ressourcen für andere Abonnenten.

Partitionsspeicher (GB)

Die Speichergrenzwerte pro Dienst variieren abhängig von zwei Faktoren: Datum der Diensterstellung und Region. Für neuere Dienste gelten in den meisten unterstützten Regionen höhere Grenzwerte.

Die Tabelle zeigt den Verlauf von Speicherkontingenterhöhungen in GB im Laufe der Zeit. Im April 2024 wurden in den Regionen, die in den Fußnoten aufgeführt sind, höhere Kapazitätspartitionen online geschaltet. Die höhere Kapazität ist auf neue Suchdienste beschränkt. Derzeit steht kein direktes Upgrade zur Verfügung.

Diensterstellungsdatum	Grundlegend	S1	S2	S3/HD	L1	L2
Vor dem 3. April 2024	2	25	100	200	1\.024	2\.048
3. April 2024 bis 17. Mai 2024 ¹	15	160	512	1.024	1\.024	2\.048
Nach dem 17. Mai 2024 ²	15	160	512	1\.024	2.048	4.096

¹ Speicher mit höherer Kapazität für Basic, S1, S2, S3 in diesen Regionen. Nord-, Mittel- und Südamerika: Brasilien, Süden, Kanada, Mitte, Kanada, Osten, USA, Osten, USA, Osten 2,USA, Mitte, USA, Norden-Mitte, USA, Süden-Mitte, USA, Westen, USA, Westen 2, USA, Westen 3, USA, Westen-Mitte. Europa: Frankreich, Mitte. Italien, Norden, Europa, Norden, Norwegen, Osten, Polen, Mitte, Schweiz, Norden, Schweden, Mitte, Vereinigtes Königreich, Süden, Vereinigtes Königreich, Westen. Naher Osten: VAE, Norden Afrika: Südafrika, Norden Asien-Pazifik: Australien, Osten, Australien, Südosten, Indien, Mitte, Jio Indien, Westen, Asien, Osten, Asien, Südosten, Japan, Osten, Japan, Westen, Südkorea, Mitte, Südkorea, Süden.

² Speicher mit höherer Kapazität für L1 und L2. Mehr Regionen bieten höhere Kapazität unter den einzelnen abzurechnenden Tarifen. Europa: Deutschland, Norden, Deutschland, Westen-Mitte, Schweiz, Westen. Azure Government: Texas, Arizona, Virginia. Afrika: Südafrika, Norden. Asien-Pazifik: China, Norden 3, China, Osten 3.

In einigen wenigen Regionen wird noch ältere Infrastruktur verwendet, für die die Grenzwerte vom 3. April gelten. Überprüfen Sie vor dem Erstellen eines neuen Diensts die unterstützten Regionen, um sicherzustellen, dass die Region Ihrer Wahl die zusätzliche Kapazität bietet.

Indexgrenzwerte

Resource	Kostenlos	Basic: ¹	S1	S2	S3	S3 HD	L1	L2
Maximale Anzahl von Indizes	3	5 oder 15	50	200	200	1000 pro Partition oder 3000 pro Dienst	10	10
Maximale Anzahl der einfachen Felder pro Index ²	1.000	100	1000	1000	1000	1000	1000	1000
Maximale Dimensionen pro Vektorfeld	4098	4098	4098	4098	4098	4098	4098	4098
Maximale Anzahl der komplexen Sammlungen pro Index	40	40	40	40	40	40	40	40
Maximale Anzahl der Elemente in allen komplexen Sammlungen pro Dokument ³	3000	3000	3000	3000	3000	3000	3000	3000
Maximale Tiefe der komplexen Felder	10	10	10	10	10	10	10	10
Maximale Anzahl von Vorschlägen pro Index	1	1	1	1	1	1	1	1
Maximale Anzahl von Bewertungsprofilen pro Index	100	100	100	100	100	100	100	100
Maximale Anzahl von Funktionen pro Profil	8	8	8	8	8	8	8	8
Maximale Indexgröße ⁴	–	–	–	1,88 TB*	2,34 TB*	100 GB	–	–

¹ Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indizes. Der Basic-Tarif ist der einzige Tarif mit einem unteren Grenzwert von 100 Feldern pro Index.

² Die Obergrenze für Felder umfasst Felder der ersten Ebene und geschachtelte Unterfelder in einer komplexen Sammlung. Wenn ein Index beispielsweise 15 Felder enthält und über zwei komplexe Sammlungen mit jeweils fünf Unterfeldern verfügt, beträgt die Feldanzahl Ihres Index 25. Indizes mit sehr vielen Feldern können langsam sein. Beschränken Sie Felder und Attribute auf die benötigten Felder, und führen Sie Indizierungs- und Abfragetests durch, um sicherzustellen, dass die Leistung akzeptabel ist.

³ Es gilt Obergrenze für Elemente, da eine hohe Anzahl von diesen Elementen den für Ihren Index erforderlichen Speicherplatz erheblich erhöht. Ein Element einer komplexen Sammlung ist als Member dieser Sammlung definiert. Angenommen, es gibt ein Hotel-Dokument mit einer komplexen Sammlung „Rooms“, dann wird jedes Zimmer in der Sammlung „Rooms“ als ein Element angesehen. Bei einer Indizierung kann die Indizierungs-Engine maximal 3,000 Elemente sicher im gesamten Dokument verarbeiten. Dieser Grenzwert wurde in api-version=2019-05-06 eingeführt und gilt nur für komplexe Sammlungen, nicht für Zeichenfolgensammlungen oder komplexe Felder.

⁴ Auf den meisten Ebenen ist die maximale Indexgröße alle verfügbaren Speicher für Ihren Suchdienst. Bei S2, S3 und S3 HD ist die maximale Größe eines indexes die in der Tabelle angegebene Zahl. Gilt für Suchdienste, die nach dem 3. April 2024 erstellt wurden.

Wenn Ihr Dienst in einem leistungsfähigeren Cluster bereitgestellt wird, kann es zu Abweichungen bei den maximalen Grenzwerten kommen. Die hier gezeigten Grenzwerte stellen den kleinsten gemeinsamen Nenner dar. Indizes, die gemäß den oben genannten Spezifikationen erstellt wurden, können über äquivalente Dienstebenen hinweg in jede Region portiert werden.

Dokumentgrenzwerte

Die maximale Anzahl von Dokumenten pro Index beträgt:

24 Milliarden bei den Suchdiensten der Dienstebenen „Basic“, „S1“, „S2“, „S3“, „L1“ und „L2“
2 Milliarden bei „S3 HD“

Jede Instanz einer komplexen Sammlung zählt für diesen Grenzwert als separates Dokument.

Die maximale Dokumentgröße beim Aufrufen einer Index-API beträgt etwa 16 MB.

Die Dokumentgröße ist tatsächlich eine Begrenzung der Größe des Anforderungstexts der Index-API. Da Sie einen Batch von mehreren Dokumenten auf einmal an die Index-API übergeben können, hängt die realistische maximale Größe davon ab, wie viele Dokumente im Batch vorhanden sind. Für einen Batch mit einem einzelnen Dokument beträgt die maximale Dokumentgröße 16 MB von JSON.

Denken Sie bei der Schätzung der Dokumentgröße daran, nur die Felder zu berücksichtigen, die einen Mehrwert für Ihre Suchszenarien darstellen, und schließen Sie alle Quellfelder aus, die in den von Ihnen geplanten Abfragen keinen Zweck erfüllen.

Größenbeschränkungen für Vektorindizes

Wenn Sie Dokumente mit Vektorfeldern indizieren, erstellt Azure KI-Suche interne Vektorindizes unter Verwendung der von Ihnen angegebenen Algorithmusparameter. Die Größe dieser Vektorindizes wird durch den Speicher eingeschränkt, der für die Vektorsuche Ihrer Dienstebene (oder SKU) reserviert ist. Anleitungen zum Verwalten und Maximieren des Vektorspeichers finden Sie unter Vektorindexgröße und Einhalten von Grenzwerten.

Vektorgrenzwerte variieren je nach:

Höhere Vektorgrenzwerte ab April 2024 gelten für neue Suchdienste in Regionen mit der zusätzlichen Kapazität (dies sind die meisten).

Die folgende Tabelle zeigt den Verlauf von Vektorkontingenterhöhungen in GB im Laufe der Zeit. Das Kontingent gilt pro Partition. Wenn Sie also einen neuen Dienst der Ebene „Standard“ (S1) auf sechs Partitionen skalieren, beträgt das Gesamtvektorkontingent 35 multipliziert mit 6.

Diensterstellungsdatum	Grundlegend	S1	S2	S3/HD	L1	L2
Vor dem 1. Juli 2023 ¹	0.5	1	6	12	12	36
1. Juli 2023 bis 3. April 2024 ²	1	3	12	36	12	36
3. April 2024 bis 17. Mai 2024 ³	5	35	150	300	12	36
Nach dem 17. Mai 2024 ⁴	5	35	150	300	150	300

¹ Anfängliche Vektorgrenzwerte während der frühen Vorschau

² Vektorgrenzwerte während des späteren Vorschauzeitraums. Drei Regionen verfügten nicht über die höheren Grenzwerte: „Deutschland, Westen-Mitte“, „Indien, Westen“ und „Katar, Mitte“.

³ Höheres Vektorkontingent basierend auf den größeren Partitionen für unterstützte Dienstebenen und Regionen.

⁴ Höheres Vektorkontingent für weitere Ebenen und Regionen basierend auf Aktualisierungen der Partitionsgrößen

Der Dienst erzwingt ein Vektorindexgrößenkontingent für jede Partition in Ihrem Suchdienst. Jede zusätzliche Partition erhöht das verfügbare Kontingent für die Vektorindexgröße. Dieses Kontingent ist eine feste Grenze, um sicherzustellen, dass Ihr Dienst fehlerfrei bleibt, was bedeutet, dass weitere Indizierungsversuche, nachdem der Grenzwert überschritten wurde, scheitern. Sie können die Indizierung fortsetzen, nachdem Sie etwas von dem Kontingent freigegeben haben, indem Sie entweder einige Vektordokumente löschen oder Partitionen hochskalieren.

Wichtig

Höhere Vektorgrenzwerte sind an größere Partitionen gebunden. Für Regionen, die ältere Infrastrukturen verwendet, gelten die Grenzwerte von Juli bis April. In der Liste der Regionen finden Sie den Status für Partitionsspeichergrenzwerte.

Indexergrenzwerte

Es gibt eine maximale Ausführungsdauer, um den Dienst als Ganzes ausgewogen und stabil zu gestalten, aber größere Datensätze benötigen möglicherweise mehr Indizierungszeit, als das Maximum zulässt. Wenn ein Indizierungsauftrag nicht innerhalb der maximal zulässigen Zeit abgeschlossen werden kann, versuchen Sie, den Auftrag nach einem Zeitplan auszuführen. Der Planer verfolgt den Indizierungsstatus. Wenn ein geplanter Indizierungsauftrag aus irgendeinem Grund unterbrochen wird, kann der Indexer den Auftrag bei der nächsten geplanten Ausführung an der Stelle fortsetzen, an der er unterbrochen wurde.

Resource	Free ¹	Basic ²	S1	S2	S3	S3 HD ³	L1	L2
Maximale Anzahl von Indexern	3	5 oder 15	50	200	200	Nicht zutreffend	10	10
Maximale Datenquellen	3	5 oder 15	50	200	200	Nicht zutreffend	10	10
Maximale Qualifikationsgruppen ⁴	3	5 oder 15	50	200	200	Nicht zutreffend	10	10
Maximale Indizierungslast pro Aufruf	10.000 Dokumente	Nur durch maximale Dokumentanzahl beschränkt	Nur durch maximale Dokumentanzahl beschränkt	Nur durch maximale Dokumentanzahl beschränkt	Nur durch maximale Dokumentanzahl beschränkt	Nicht zutreffend	Keine Begrenzung	Keine Begrenzung
Minimaler Zeitplan	5 Minuten	5 Minuten	5 Minuten	5 Minuten	5 Minuten	5 Minuten	5 Minuten	5 Minuten
Maximale Ausführungsdauer ⁵	1–3 Minuten	2 oder 24 Stunden	2 oder 24 Stunden	2 oder 24 Stunden	2 oder 24 Stunden	Nicht zutreffend	2 oder 24 Stunden	2 oder 24 Stunden
Maximale Laufzeit für Indexer mit einem Skillset ⁶	3 bis 10 Minuten	2 Stunden	2 Stunden	2 Stunden	2 Stunden	Nicht zutreffend	2 Stunden	2 Stunden
Blobindexer: maximale Blobgröße, MB	16	16	128	256	256	Nicht zutreffend	256	256
Blobindexer: maximale Anzahl der Zeichen des aus einem Blob extrahierten Inhalts	32.000	64.000	4 Millionen	8 Millionen	16 Millionen	Nicht zutreffend	4 Millionen	4 Millionen

¹ Die maximale Indexerausführungszeit bei Diensten im Free-Tarif beträgt drei Minuten für Blobquellen und eine Minute für alle anderen Datenquellen. Indizierungsaufruf erfolgt einmal alle 180 Sekunden. Für eine KI-Indizierung, die Azure KI Services aufruft, gilt bei den kostenlosen Diensten ein Limit von 20 kostenlosen Transaktionen pro Indexer pro Tag. Dabei ist eine Transaktion als ein Dokument definiert, das die Anreicherungspipeline erfolgreich durchläuft (Tipp: Sie können einen Indexer zurücksetzen, um seinen Zähler zurückzusetzen).

² Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indexer, Datenquellen und Qualifikationsgruppen.

³ S3 HD-Dienste bieten keine Indexerunterstützung.

⁴ Maximal 30 Fähigkeiten pro Qualifikationsgruppe.

⁵ Hinweis zur maximalen Dauer von zwei oder 24 Stunden für Indexer: Ein Maximum von zwei Stunden ist am gängigsten und sollte als Planungsgrundlage verwendet werden. Der Grenzwert von 24 Stunden stammt aus einer älteren Indexerimplementierung. Wenn bei Ihnen ungeplante Indexer vorhanden sind, die 24 Stunden lang kontinuierlich ausgeführt werden, liegt das daran, dass diese Indexer nicht zur neueren Infrastruktur migriert werden konnten. Faustregel: Legen Sie für Indizierungsaufträge, die nicht innerhalb von zwei Stunden abgeschlossen werden können, einen zweistündigen Zeitplan für den Indexer fest. Nach Abschluss des ersten zweistündigen Intervalls setzt der Indexer seine Arbeit zu Beginn des nächsten zweistündigen Intervalls an der Stelle fort, an der er aufgehört hat.

⁶ Die Skillset-Ausführung und insbesondere die Bildanalyse sind rechenintensive Vorgänge, die unverhältnismäßig große Mengen der verfügbaren Rechenleistung beanspruchen. Die Laufzeit für diese Workloads ist kürzer, damit andere Aufträge in der Warteschlange bessere Chancen haben, ausgeführt zu werden.

Hinweis

Wie unter Indexgrenzwerte beschrieben, erzwingen Indexer die Obergrenze von 3.000 Elementen auch für alle komplexen Sammlungen pro Dokument – ab der neuesten allgemein verfügbaren API-Version, die komplexe Typen (2019-05-06) unterstützt. Dies bedeutet, dass dieser Grenzwert für Sie nicht gilt, wenn Sie Ihren Indexer mit einer früheren API-Version erstellt haben. Zur Sicherstellung der maximalen Kompatibilität wird ein Indexer, der mit einer früheren API-Version erstellt und dann mit API-Version 2019-05-06 oder höher aktualisiert wurde, trotzdem von der Begrenzung ausgenommen. Kunden sollten sich dieser negativen Auswirkungen, die wie oben erwähnt mit der Verwendung sehr komplexer Sammlungen verbunden sind, bewusst sein. Wir empfehlen Ihnen dringend, für die Erstellung aller neuen Indexer die neueste allgemein verfügbare API-Version zu nutzen.

Beschränkungen für freigegebene Private Link-Ressourcen

Indexer haben über private Endpunkte, die über die API für freigegebene Private Link-Ressourcen verwaltet werden, Zugriff auf Azure-Ressourcen. In diesem Abschnitt werden die Grenzwerte für diese Funktion beschrieben.

Resource	Kostenlos	Basic	S1	S2	S3	S3 HD	L1	L2
Unterstützung für den Indexer des privaten Endpunkts	Nein	Ja	Ja	Ja	Ja	Keine	Ja	Ja
Unterstützung für private Endpunkte für Indexer mit einem Skillset¹	Nein	Nr.	Nein	Ja	Ja	Keine	Ja	Ja
Maximale Anzahl privater Endpunkte	Nicht zutreffend	10 oder 30	100	400	400	Nicht zutreffend	20	20
Maximale Anzahl unterschiedlicher Ressourcentypen²	Nicht zutreffend	4	7	15	15	Nicht zutreffend	4	4

¹ Die KI-Anreicherung und die Bildanalyse sind rechenintensive Vorgänge, die unverhältnismäßig große Mengen der verfügbaren Verarbeitungskapazität verbrauchen. Aus diesem Grund sind private Verbindungen in niedrigeren Tarifen deaktiviert, um die Leistung und Stabilität des eigentlichen Suchdiensts zu gewährleisten.

² Die Anzahl der unterschiedlichen Ressourcentypen wird als die Anzahl der eindeutigen groupId-Werte berechnet, die in allen freigegebenen Private Link-Ressourcen für einen bestimmten Dienst verwendet werden. Der Status der jeweiligen Ressource spielt dabei keine Rolle.

Synonymlimits

Die maximale Anzahl der Synonymzuordnungen variiert je nach Tarif. Jede Regel kann bis zu 20 Erweiterungen aufweisen. Als Erweiterungen werden gleichwertige Begriffe bezeichnet. Beispielsweise würde für „Katze“, die Zuordnung von „Kätzchen“, „Kater“ und „Felis“ (die Gattung der Katzen) als drei Erweiterungen gezählt werden.

Resource	Kostenlos	Basic	S1	S2	S3	S3-HD	L1	L2
Maximale Synonymzuordnungen	3	3	5	10	20	20	10	10
Maximale Anzahl von Regeln pro Zuordnung	5000	20000	20000	20000	20000	20000	20000	20000

Indexaliasgrenzwerte

Die maximale Anzahl von Indexaliasen unterscheidet sich je nach Tarif. In allen Tarifen ist die maximale Anzahl von Aliasen doppelt so hoch wie die maximal zulässige Anzahl von Indizes.

Resource	Kostenlos	Basic	S1	S2	S3	S3-HD	L1	L2
Maximale Anzahl von Aliasen	6	10 oder 30	100	400	400	2000 pro Partition oder 6000 pro Dienst	20	20

Datengrenzwerte (KI-Anreicherung)

Für eine KI-Anreicherungspipeline, die Aufrufe zur Entitätserkennung, Entitätsverknüpfung, Schlüsselbegriffserkennung, Stimmungsanalyse, Sprachenerkennung und Erkennung personenbezogener Daten an eine Azure KI Language-Ressource sendet, gelten Datengrenzwerte. Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an das Stimmungsanalysetool senden, verwenden Sie den Skill „Text teilen“.

Drosselungsgrenzen

API-Anforderungen werden gedrosselt, wenn das System sich der Spitzenkapazität nähert. Die Drosselung verhält sich für verschiedene APIs unterschiedlich. Abfrage-APIs (Suchen/Vorschlagen/AutoVervollständigen) und Indizierungs-APIs drosseln dynamisch basierend auf der Last des Diensts. Index-APIs und Dienstvorgangs-APIs verfügen über statische Grenzwerte für Anforderungsraten.

Statische Grenzwerte für Anforderungsraten für Indexvorgänge:

Indizes auflisten (GET /indexes): 3 pro Sekunde pro Sucheinheit
Index abrufen (GET /indexes/myindex): 10 pro Sekunde pro Sucheinheit
Index erstellen (POST /Indizes): 12 pro Minute pro Sucheinheit
Index erstellen oder aktualisieren (PUT /indexes/myindex): 6 pro Sekunde pro Sucheinheit
Index löschen (DELETE /indexes/myindex): 12 pro Minute pro Sucheinheit

Statische Grenzwerte für Anforderungsraten für Vorgänge in Bezug auf einen Dienst:

Dienststatistiken (GET /servicestats): 4 pro Sekunde pro Sucheinheit

Die erneute L2-Rangfolge mit dem semantischen Sortierer hat ein erwartetes Volumen:

Bis zu 10 gleichzeitige Abfragen pro Replikat. Wenn Sie konsistente Durchsatzanforderungen nahe, bei oder höher als diese Ebene erwarten, erstellen Sie bitte ein Supportticket, damit wir für Ihren Workload ermöglichen können.

API-Anforderungsgrenzwerte

Maximal 16 MB pro Anforderung ¹
Maximale URL-Länge von 8 KB
Maximal 1.000 Dokumente pro Batch von Hochlade-, Zusammenführungs- oder Löschvorgängen für Indizes
Maximal 32 Felder in $orderby-Klausel
Maximal 100.000 Zeichen in einer Suchklausel
Die maximale Anzahl von Klauseln in search (durch AND oder OR getrennte Ausdrücke) beträgt 1.024.
Maximale Suchbegriffgröße ist 32.766 Byte (32 KB minus 2 Bytes) von UTF-8-codiertem Text
Die maximale Suchbegriffgröße beträgt 1.000 Zeichen für die Präfixsuche und die Suche von regulären Ausdrücken
Die Platzhaltersuche und die Suche nach regulären Ausdrücken sind bei der Verarbeitung durch Lucene auf maximal 1,000 Zustände beschränkt.

¹ In Azure KI Search darf der Inhalt einer Anforderung nicht größer als 16 MB sein. Dies beschränkt möglicherweise den Inhalt einzelner Felder oder Sammlungen, für die keine anderen theoretischen Beschränkungen gelten. (Weitere Informationen zur Feldzusammensetzung und den Beschränkungen finden Sie unter Unterstützte Datentypen).

Die Abfragegröße und -zusammensetzung sind begrenzt, da unbegrenzte Abfragen Ihren Suchdienst destabilisieren können. In der Regel werden solche Abfragen programmgesteuert erstellt. Wenn Ihre Anwendung programmgesteuert Suchabfragen generiert, sollten Sie durch den Entwurf sicherstellen, dass sie keine Abfragen von unbegrenzter Größe erzeugt.

API-Antwortengrenzwerte

Maximale Rückgabe von 1.000 Dokumenten pro Seite mit Suchergebnissen
Maximale Rückgabe von 100 Vorschlägen pro Anforderung der Vorschlags-API

API-Schlüsselgrenzwerte

API-Schlüssel werden für die Dienstauthentifizierung verwendet. Es gibt zwei Arten. Administratorschlüssel werden im Anforderungsheader angegeben und gewähren vollständigen Lese-und Schreibzugriff für den Dienst. Abfrageschlüssel sind schreibgeschützt, die in der URL angegeben und normalerweise an Clientanwendungen verteilt werden.

Maximal 2 Administratorschlüssel pro Dienst
Maximal 50 Abfrageschlüssel pro Dienst

Freigeben über