Model dokumentacji bankowej analizy dokumentów

Model oświadczenia bankowego analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania danych z amerykańskich oświadczeń bankowych. Interfejs API analizuje drukowane wyciągi bankowe; wyodrębnia kluczowe informacje, takie jak numer konta, szczegóły banku, szczegóły zestawienia, szczegóły transakcji i opłaty; funkcja zwraca ustrukturyzowaną reprezentację danych JSON.

Funkcja version Model ID
Model zestawienia bankowego • wersja 4.0:2024-07-31 (wersja zapoznawcza) prebuilt-bankStatement.us

Wyodrębnianie danych z zestawienia bankowego

Wyciąg bankowy pomaga przejrzeć działania konta w określonym przedziale czasu. Jest to oficjalne oświadczenie, które pomaga wykrywać oszustwa, śledzić wydatki, błędy księgowe i rejestrować działania okresu. Zobacz, jak dane są wyodrębniane przy użyciu prebuilt-bankStatement.us modelu. Potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

    Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Document Intelligence Studio

  1. Na stronie głównej Document Intelligence Studio wybierz pozycję wyciągi bankowe.

  2. Możesz przeanalizować przykładową instrukcję bankową lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Wymagania dotyczące danych wejściowych

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, , BMPPNG, , TIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Przeczytaj
    Układ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi 8 punktowemu na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.

Obsługiwane języki i ustawienia regionalne

Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą stronę Pomocy technicznej języka.

Wyodrębnianie pól

Pole Typ Opis Przykład
AccountNumber string Numer konta na rachunku bankowym 987-654-3210
AccountType string Typ konta na rachunku bankowym Sprawdzanie
BankAddress address Wymieniony adres banku 123 Main St., Redmond, Waszyngton 98052
BankName string Nazwa banku na liście Contoso Bank
AccountHolderAddress address Adres właściciela konta 456 Main St., Redmond, Waszyngton 98052
AccountHolderName string Imię i nazwisko właściciela konta JAN KOWALSKI
EndingBalance number Zakończenie salda na rachunku bankowym 1488,03 USD
BeginningBalance number Rozpoczęcie salda na rachunku bankowym 1488,03 USD
StatementStartDate date Data rozpoczęcia zestawienia bankowego 1 lipca 2017 r.
StatementEndDate date Data zakończenia zestawienia bankowego 31 lipca 2017 r.
TotalServiceFees number Łączne opłaty za usługi 0,00 USD
Transactions array Wyodrębniony element wiersza transakcji 07/17
Transfer online z sprawdzenia... 6609 Transaction#: 6373187418
1500,00 USD
Transactions.* object
Transactions.*.Date date Data transakcji 07/17
Transactions.*.Description string Opis transakcji Transfer online z sprawdzenia... 6609 Transaction#: 6373187418
Transactions.*.CheckNumber string Sprawdzanie liczby transakcji 6609
Transactions.*.DepositAmount number Kwota depozytu w transakcji 1500,00 USD
Transactions.*.WithdrawalAmount number Kwota wypłaty w transakcji 1500,00 USD

Obsługiwane ustawienia regionalne

Wersja prebuilt-bankStatement.us 2027-07-31-preview obsługuje ustawienia regionalne en-us.

Następne kroki