Model dokumentacji bankowej analizy dokumentów
Model oświadczenia bankowego analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania danych z amerykańskich oświadczeń bankowych. Interfejs API analizuje drukowane wyciągi bankowe; wyodrębnia kluczowe informacje, takie jak numer konta, szczegóły banku, szczegóły zestawienia, szczegóły transakcji i opłaty; funkcja zwraca ustrukturyzowaną reprezentację danych JSON.
Funkcja | version | Model ID |
---|---|---|
Model zestawienia bankowego | • wersja 4.0:2024-07-31 (wersja zapoznawcza) | prebuilt-bankStatement.us |
Wyodrębnianie danych z zestawienia bankowego
Wyciąg bankowy pomaga przejrzeć działania konta w określonym przedziale czasu. Jest to oficjalne oświadczenie, które pomaga wykrywać oszustwa, śledzić wydatki, błędy księgowe i rejestrować działania okresu. Zobacz, jak dane są wyodrębniane przy użyciu prebuilt-bankStatement.us
modelu. Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Document Intelligence Studio wybierz pozycję wyciągi bankowe.
Możesz przeanalizować przykładową instrukcję bankową lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Wymagania dotyczące danych wejściowych
Obsługiwane formaty plików:
Model PDF Obraz: JPEG/JPG
, ,BMP
PNG
, ,TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i
4
MB za bezpłatną (F0).Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi
8
punktowemu na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i
1
GB dla modelu neuronowego.W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1
GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi2
GB z maksymalnie 10 000 stron.
Obsługiwane języki i ustawienia regionalne
Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą stronę Pomocy technicznej języka.
Wyodrębnianie pól
Pole | Typ | Opis | Przykład |
---|---|---|---|
AccountNumber |
string |
Numer konta na rachunku bankowym | 987-654-3210 |
AccountType |
string |
Typ konta na rachunku bankowym | Sprawdzanie |
BankAddress |
address |
Wymieniony adres banku | 123 Main St., Redmond, Waszyngton 98052 |
BankName |
string |
Nazwa banku na liście | Contoso Bank |
AccountHolderAddress |
address |
Adres właściciela konta | 456 Main St., Redmond, Waszyngton 98052 |
AccountHolderName |
string |
Imię i nazwisko właściciela konta | JAN KOWALSKI |
EndingBalance |
number |
Zakończenie salda na rachunku bankowym | 1488,03 USD |
BeginningBalance |
number |
Rozpoczęcie salda na rachunku bankowym | 1488,03 USD |
StatementStartDate |
date |
Data rozpoczęcia zestawienia bankowego | 1 lipca 2017 r. |
StatementEndDate |
date |
Data zakończenia zestawienia bankowego | 31 lipca 2017 r. |
TotalServiceFees |
number |
Łączne opłaty za usługi | 0,00 USD |
Transactions |
array |
Wyodrębniony element wiersza transakcji | 07/17 Transfer online z sprawdzenia... 6609 Transaction#: 6373187418 1500,00 USD |
Transactions.* |
object |
||
Transactions.*.Date |
date |
Data transakcji | 07/17 |
Transactions.*.Description |
string |
Opis transakcji | Transfer online z sprawdzenia... 6609 Transaction#: 6373187418 |
Transactions.*.CheckNumber |
string |
Sprawdzanie liczby transakcji | 6609 |
Transactions.*.DepositAmount |
number |
Kwota depozytu w transakcji | 1500,00 USD |
Transactions.*.WithdrawalAmount |
number |
Kwota wypłaty w transakcji | 1500,00 USD |
Obsługiwane ustawienia regionalne
Wersja prebuilt-bankStatement.us 2027-07-31-preview obsługuje ustawienia regionalne en-us.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.