Model certyfikatu małżeństwa analizy dokumentów
Ta zawartość dotyczy: wersja 4.0 (wersja zapoznawcza)
Model certyfikatu małżeństwa analizy dokumentów korzysta z zaawansowanych funkcji optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól z certyfikatów małżeństwa. Certyfikaty małżeństwa mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu; wyodrębnia kluczowe informacje, takie jak nazwiska małżonków, data wydania i miejsce małżeństwa; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.
Automatyczne przetwarzanie certyfikatu małżeństwa
Zautomatyzowane przetwarzanie certyfikatów małżeńskich to proces wyodrębniania pól kluczy z certyfikatów małżeńskich. W przeszłości proces analizy certyfikatu małżeństwa jest uzyskiwany ręcznie, a zatem bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z certyfikatów małżeńskich jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji certyfikatu małżeństwa.
Opcje programowania
Analiza dokumentów w wersji 4.0 (2024-07-31-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Wymagania dotyczące danych wejściowych
Obsługiwane formaty plików:
Model PDF Obraz: JPEG/JPG
, ,BMP
PNG
, ,TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i
4
MB za bezpłatną (F0).Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi
8
punktowemu na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i
1
GB dla modelu neuronowego.W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1
GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi2
GB z maksymalnie 10 000 stron.
Wypróbowanie wyodrębniania danych dokumentu certyfikatu małżeństwa
Aby zobaczyć, jak działa wyodrębnianie danych dla usługi kart certyfikatu małżeństwa, potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Document Intelligence Studio wybierz pozycję Certyfikat małżeństwa.
Możesz przeanalizować przykładowe certyfikaty małżeństwa lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Obsługiwane języki i ustawienia regionalne
Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.
Wyodrębnianie pól
Poniżej przedstawiono pola wyodrębnione z certyfikatu małżeństwa w odpowiedzi wyjściowej JSON.
Nazwisko | Pisz | Opis | Przykładowe dane wyjściowe |
---|---|---|---|
Spouse1FirstName |
String | Imię małżonka 1 | Wesley |
Spouse1MiddleName |
String | Drugie imię współmałżonka 1 | M. |
Spouse1LastName |
String | Nazwisko małżonka 1 | Perry |
Spouse1Age |
Integer | Wiek małżonka 1 | 26 |
Spouse1BirthDate |
Data | Data urodzenia małżonka 1 | 16 listopada 1997 r. |
Spouse1Address |
Adres | Adres małżonka 1 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | Miejsce urodzenia małżonka 1 | Michigan |
Spouse2FirstName |
String | Imię małżonka 2 | Beth |
Spouse2MiddleName |
String | Drugie imię współmałżonka 2 | R. |
Spouse2LastName |
String | Nazwisko małżonka 2 | Murarz |
Spouse2Age |
Integer | Współmałżonek 2 wieku | 23 |
Spouse2BirthDate |
Data | Data urodzenia małżonka 2 | 22 lipca 2000 r. |
Spouse2Address |
Adres | Adres małżonka 2 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | Miejsce urodzenia małżonka 2 | Wisconsin |
DocumentNumber |
String | Numer dokumentu | 01976/202 |
IssueDate |
Data | Data wystawienia certyfikatu | 10 października 2023 r. |
IssuePlace |
String | Miejsce wystawiania certyfikatu | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
Data | Data małżeństwa | 10 października 2023 r. |
MarriagePlace |
String | Miejsce małżeństwa | 105 Coal Street, Galloway, Wisconsin 54432 |
Pary klucz-wartość certyfikatu małżeństwa i wyodrębnione elementy wiersza znajdują się w documentResults
sekcji danych wyjściowych JSON.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.