Model wycinków analizy dokumentów

Model wycinkowy analizy dokumentów łączy zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania danych wynagrodzeń i zarobków z poślizgów płacowych. Interfejs API analizuje dokumenty i pliki z informacjami dotyczącymi listy płac; Wyodrębnia kluczowe informacje i zwraca ustrukturyzowaną reprezentację danych JSON.

Funkcja version Model ID
Model wycinków płatności • wersja 4.0:2024-07-31 (wersja zapoznawcza) prebuilt-payStub.us

Wypróbuj wyodrębnianie danych wycinków płatności

Wycinki płac są niezbędnymi dokumentami wydanymi przez pracodawców pracownikom, dostarczając zarobki, potrącenia i informacje o płacy netto za określony okres płacowy. Zobacz, jak dane są wyodrębniane przy użyciu prebuilt-payStub.us modelu. Potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

    Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Document Intelligence Studio

  1. Na stronie głównej usługi Document Intelligence Studio wybierz pozycję payStub.

  2. Możesz przeanalizować przykładowy wycinkę płatności lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

Wymagania dotyczące danych wejściowych

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, , BMPPNG, , TIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Przeczytaj
    Układ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi 8 punktowemu na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1 GB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1 GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi 2 GB z maksymalnie 10 000 stron.

Obsługiwane języki i ustawienia regionalne

Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą stronę Pomocy technicznej języka.

Wyodrębnianie pól

Nazwisko Pisz Opis Standardowe dane wyjściowe
EmployeeAddress address Adres pracownika 123 Maple Street, Springfield, IL, 62701
EmployeeName string Nazwisko pracownika John A. Doe
EmployeeSSN string Numer ubezpieczenia społecznego pracownika 123-45-6789
EmployerAddress address Adres pracodawcy 456 Oak Avenue, Metropolis, NY, 10101
EmployerName string Wymienione nazwisko pracodawcy Contoso Corporation
PayDate date Data wypłaty wynagrodzenia 26 lutego 2020 r.
PayPeriodStartDate date Data rozpoczęcia okresu płatności 19 lutego 2020 r.
PayPeriodEndDate date Data zakończenia okresu płatności 25 lutego 2020 r.
CurrentPeriodGrossPay number Wynagrodzenie brutto bieżącego okresu 744,10 USD
YearToDateGrossPay number Roczna płaca brutto 2744,10 USD
CurrentPeriodTaxes number Podatki bieżącego okresu 410,10 USD
YearToDateTaxes number Podatki od początku roku 855,90 USD
CurrentPeriodDeductions number Odliczenia bieżącego okresu 410,10 USD
YearToDateDeductions number Odliczenia od roku do daty 855,90 USD
CurrentPeriodNetPay number Wynagrodzenie netto bieżącego okresu 744,10 USD
YearToDateNetPay number Roczna płatność netto 2744,10 USD

Obsługiwane ustawienia regionalne

Program prebuilt-payStub.us w wersji 2027-07-31-preview obsługuje ustawienia regionalne en-us .

Następne kroki