Migrieren Sie zu v3.x des Read OCR Containers

Wenn Sie Version 2 des Azure KI Vision Read OCR-Containers verwenden, erfahren Sie in diesem Artikel, wie Sie Ihre Anwendung auf Version 3.x des Containers aktualisieren können.

API-Änderungen

Der Container Read v3.2 verwendet Version 3 der Azure KI Vision API und verfügt über die folgenden Endpunkte:

  • /vision/v3.2/read/analyzeResults/{operationId}
  • /vision/v3.2/read/analyze
  • /vision/v3.2/read/syncAnalyze

In der Anleitung (Führungslinie) zur Migration der Azure KI Vision v3 REST API finden Sie ausführliche Informationen zur Aktualisierung Ihrer Anwendungen für die Nutzung der Version 3 der Read API. Synchrone Vorgänge werden nur in Containern unterstützt.

Konfigurationsänderungen

  • ReadEngineConfig:ResultExpirationPeriod wird nicht mehr unterstützt. Der Read OCR-Container verfügt über einen integrierten Cron-Auftrag, der die einer Anforderung zugeordneten Ergebnisse und Metadaten nach 48 Stunden entfernt.
  • Cache:Redis:Configuration wird nicht mehr unterstützt. Der Cache wird in den Containern der Version 3.x nicht verwendet, sodass sie ihn nicht festlegen müssen.

Speicheranforderungen

Die Anforderungen und Empfehlungen basieren auf Benchmarks mit einer einzelnen Anforderung pro Sekunde, wobei ein 523 KB großes Bild eines gescannten Geschäftsbriefs mit 29 Zeilen und insgesamt 803 Zeichen verwendet wird. In der folgenden Tabelle werden die minimalen und empfohlenen Zuordnungen von Ressourcen für jeden OCR-Container für das Lesen beschrieben:

Container Minimum Empfohlen
Lesen Sie 3.2 30.04.2022 4 Kerne, 8 GB Arbeitsspeicher 8 Kerne, 16 GB Arbeitsspeicher

Jeder Kern muss eine Geschwindigkeit von mindestens 2,6 GHz aufweisen.

Kern und Arbeitsspeicher entsprechen den Einstellungen --cpus und --memory, die von Docker als Bestandteil des run-Befehls verwendet werden.

Speicherimplementierungen

Hinweis

MongoDB wird in 3.x-Versionen des Containers nicht mehr unterstützt. Stattdessen unterstützen die Container Azure Storage-und Offlinedateisysteme.

Implementierung Erforderliche Laufzeitargumente
Dateiebene (Standard) Keine Laufzeitargumente erforderlich. Das /share-Verzeichnis wird verwendet.
Azure Blob Storage:ObjectStore:AzureBlob:ConnectionString={AzureStorageConnectionString}

Warteschlangenimplementierungen

In v3.x des Containers wird RabbitMQ derzeit nicht unterstützt. Folgende Unterstützungsimplementierungen werden unterstützt:

Implementierung Laufzeitargumente Beabsichtigte Verwendung
In-Memory (Standard) Keine Laufzeitargumente erforderlich. Entwickeln und Testen
Azure-Warteschlangen Queue:Azure:ConnectionString={AzureStorageConnectionString} Produktion
RabbitMQ Nicht verfügbar Produktion

Zum Erreichen zusätzlicher Redundanz verwendet der Read v3.x-Container einen Zeitgeber für Sichtbarkeit, um sicherzustellen, dass Anforderungen bei einem Setup mit mehreren Containern auch bei einem Absturz erfolgreich verarbeitet werden können.

Legen Sie den Zeitgeber mit Queue:Azure:QueueVisibilityTimeoutInMilliseconds fest, was die Zeit angibt, in der eine Nachricht nicht sichtbar ist, wenn sie von einem anderen Worker verarbeitet wird. Um redundante Verarbeitung von Seiten zu vermeiden, empfehlen wir, den Timeoutzeitraum auf 120 Sekunden festzulegen. Der Standardwert ist 30 Sekunden.

Standardwert Empfohlener Wert
30.000 120000

Nächste Schritte