Document Intelligence 給与明細モデル

Document Intelligence 給与明細モデルでは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルの組み合わせにより、給与明細書が分析されて、報酬や収益に関するデータが抽出されます。 API により、給与に関する情報が含まれる文書やファイルを分析し、重要な情報を抽出して、構造化された JSON データ表現を返します。

機能 version モデル ID
給与明細モデル • v4.0:2024-07-31 (プレビュー) prebuilt-payStub.us

給与明細データの抽出を試行する

給与明細は、従業員に対して雇用主が発行する重要な文書であり、特定の支払い期間における収益、控除、および純支払い額に関する情報が記載されています。 prebuilt-payStub.us モデルを使用してデータを抽出する方法について説明します。 以下のリソースが必要です。

  • Azure サブスクリプション — 無料で作成することができます

  • Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (F0) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。

    Azure portal のキーとエンドポイントの場所のスクリーンショット。

Document Intelligence Studio

  1. Document Intelligence Studio ホーム ページで、[payStub] を選択します。

  2. サンプルの給与明細を分析したり、ご自身のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

入力の要件

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読み込み
    Layout ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。

サポートされている言語とロケール

以下を参照して、サポートされている言語の完全なリストについては、 言語サポートの ページ をご覧ください。

フィールドの抽出

名前 種類 説明 標準化された出力
EmployeeAddress address 従業員の住所 123 Maple Street, Springfield, IL, 62701
EmployeeName string 従業員の氏名 John A. Doe
EmployeeSSN string 従業員の社会保障番号 123-45-6789
EmployerAddress address 雇用主の住所 456 Oak Avenue, Metropolis, NY, 10101
EmployerName string 雇用主の名前一覧 Contoso Corporation
PayDate date 給与支払日 2020 年 2 月 26 日
PayPeriodStartDate date 支払期間の開始日 2020 年 2 月 19 日
PayPeriodEndDate date 支払期間の終了日 2020 年 2 月 25 日
CurrentPeriodGrossPay number 当該期間の給与総額 $744.10
YearToDateGrossPay number 当年度累計給与総額 $2744.10
CurrentPeriodTaxes number 当該期間の税額 $410.10
YearToDateTaxes number 当年度累計累計税額 $855.90
CurrentPeriodDeductions number 当該期間の控除額 $410.10
YearToDateDeductions number 当年度累計控除額 $855.90
CurrentPeriodNetPay number 当該期間の純支払額 $744.10
YearToDateNetPay number 当年度累計純支払額 $2744.10

サポート対象のロケール

prebuilt-payStub.us バージョン 2027-07-31-preview では、en-us ロケールがサポートされています。

次のステップ