Model sprawdzania banku analizy dokumentów

Model sprawdzania banku analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania danych z amerykańskich oświadczeń bankowych. Interfejs API analizuje drukowane kontrole; wyodrębnia kluczowe informacje i zwraca ustrukturyzowaną reprezentację danych JSON.

Funkcja version Model ID
Sprawdzanie modelu • wersja 4.0:2024-07-31 (wersja zapoznawcza) prebuilt-check.us

Sprawdzanie wyodrębniania danych

Sprawdzanie to bezpieczny sposób na przeniesienie kwoty z konta płatnika na konto odbiorcy. Firmy używają czeku, aby zapłacić swoim dostawcom jako podpisany dokument, aby poinstruować bank za płatność. Zobacz, w jaki sposób dane, w tym szczegóły sprawdzania, szczegóły konta, kwota, notatka, są wyodrębniane z zestawienia bankowego USA. Potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Document Intelligence Studio

Uwaga

Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0.

  1. Na stronie głównej programu Document Intelligence Studio wybierz pozycję Sprawdź.

  2. Możesz przeanalizować przykładowe sprawdzanie lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Wymagania dotyczące danych wejściowych

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, , BMPPNG, , TIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Przeczytaj
    Układ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi 8 punktowemu na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.

Obsługiwane języki i ustawienia regionalne

Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą stronę Pomocy technicznej języka.

Wyodrębnianie pól

Pole Typ Opis Przykład
PayerName string Nazwa płatnika (szuflada) Jane Doe
PayerAddress address Adres płatnika (szuflada) 123 Main St., Redmond, Waszyngton, 98052
PayTo string Nazwa płatnika John Smith
CheckDate date Data zapisania sprawdzania 2023-04-01
NumberAmount number Wielkość sprawdzania zapisanego w postaci liczbowej 150.00
WordAmount number Ilość czeku zapisanego w postaci litery sto pięćdziesiąt i 00/100
BankName string Nazwa banku Contoso Bank
Memo string Krótka notatka opisująca płatność April Rent Payment
MICR object Linia rozpoznawania znaków pisma magnetycznego (MICR) ⑈0740⑈ ⑆123456789⑆ 1001001234⑈
MICR.RoutingNumber string Numer routingu banku ⑆123456789⑆
MICR.AccountNumber string Numer konta 1001001234⑈
MICR.CheckNumber string Numer kontrolny ⑈0740⑈

Obsługiwane ustawienia regionalne

Wersja prebuilt-check.us 2024-07-31-preview obsługuje ustawienia regionalne en-us .

Następne kroki