Document Intelligence の請求書モデル

重要

  • Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
  • Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
  • パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
    • 米国東部
    • 米国西部 2
    • "西ヨーロッパ"
    • 米国中北部

このコンテンツの適用対象: checkmark v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.1 (GA) 青のチェックマーク v3.0 (GA) 青のチェックマーク v2.1 (GA)

このコンテンツの適用対象: checkmark v3.1 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.0 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v3.0 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) 紫のチェックマーク v3.1 | 以前のバージョン: 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (プレビュー)

Document Intelligence の請求書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、売上請求書、公共料金、および発注書から主要なフィールドと明細項目を分析および抽出します。 電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の請求書を使用できます。 API によって請求書のテキストが分析され、顧客名、請求先住所、期限、支払金額などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、27 の言語の請求書がサポートされています。

サポートされているドキュメントの種類:

  • Invoices
  • 光熱費
  • 販売注文
  • 注文書

自動請求書処理

自動請求書処理は、課金アカウント ドキュメントから accounts payable の主要なフィールドを抽出するプロセスです。 抽出されたデータには、レビューと支払いのために買掛金勘定 (AP) ワークフローと統合された請求書からの明細が含まれます。 これまで、買掛金勘定プロセスは手動で行われ、そのため、非常に時間がかかっていました。 請求書からキー データを正確に抽出することは、通常、請求書の自動化プロセスの最も重要な手順の 1 つです。

Document Intelligence Studio で処理された請求書サンプル:

Document Intelligence Studio で分析された請求書サンプルのスクリーンショット。

Document Intelligence サンプル ラベル付けツールで処理された請求書サンプル:

サンプルの請求書のスクリーンショット。

開発オプション

Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。

機能 リソース モデル ID
請求書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
請求書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています:

機能 リソース モデル ID
請求書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-invoice

Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース
請求書モデル Document Intelligence ラベル付けツール
REST API
クライアント ライブラリ SDK
Document Intelligence Docker コンテナー

入力の要件

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読み込み
    Layout ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。

  • サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
  • PDF と TIFF では、最大 2,000 ページまでの処理がサポートされています。 Free レベルのサブスクライバーの場合は、最初の 2 ページだけが処理されます。
  • サポートされているファイル サイズは 50 MB 未満で、寸法は 50 x 50 ピクセル以上、10,000 x 10,000 ピクセル以下でなければなりません。

請求書モデル データの抽出

顧客情報、ベンダーの詳細、品目などのデータが請求書からどのように抽出されるかをご覧ください。 以下のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

  1. Document Intelligence Studio ホーム ページで、[請求書] を選択します。

  2. サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

ドキュメント インテリジェンス サンプル ラベル付けツール

  1. Document Intelligence サンプル ツールに移動します。

  2. サンプル ツールのホーム ページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。

    レイアウト モデル分析結果プロセスのスクリーンショット。

  3. ドロップダウン メニューから、分析する [フォームの種類] を選択します。

  4. 次のオプションを使用して、分析するファイルの URL を選択します。

  5. [ソース] フィールドで、ドロップダウン メニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。

    ソースの場所ドロップダウン メニューのスクリーンショット。

  6. [Document Intelligence サービス エンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。

  7. [キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。

    [フォームの種類の選択] ドロップダウン メニューを示すスクリーンショット。

  8. [Run analysis](解析の実行) を選択します。 Document Intelligence サンプル ラベル付けツールは、Analyze Prebuilt API を呼び出してドキュメントを分析します。

  9. 結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。

    レイアウト モデルの分析結果操作のスクリーンショット。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。

サポートされている言語とロケール

サポートされている言語の完全な一覧については、事前構築済みモデルの言語サポートに関するページを "参照" してください。

フィールドの抽出

  • サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの請求書モデル スキーマに関するページを参照してください。

  • 抽出された請求書のキーと値のペアと品目は、JSON 出力の documentResults セクションにあります。

キー値ペア

事前構築済みの請求書 2022-06-30 以降のリリースでは、キーと値のペアのオプションの戻り値がサポートされています。 既定では、キーと値のペアの戻り値は無効になっています。 キーと値のペアは、ラベルまたはキーとそれに関連する応答または値を識別する、請求書内の特定の範囲です。 請求書では、これらのペアはラベルと、そのフィールドまたは電話番号に対してユーザーが入力した値になります。 さまざまなドキュメントの種類、形式、構造に基づいて、識別可能なキーと値を抽出するために、AI モデルがトレーニングされています。

モデルによってキーの存在が検出されても、関連する値がない場合や、省略可能なフィールドの処理では、キーが単独で存在する可能性もあります。 たとえば、一部のインスタンスでは、フォームのミドル ネーム フィールドを空白のままにすることができます。 キーと値のペアは常に、ドキュメントに含まれるテキストの範囲です。 "顧客" と "ユーザー" など、同じ値が異なる方法で記述されるドキュメントの場合、関連付けられているキーは、(コンテキストに基づき) 顧客またはユーザーのいずれかです。

抽出されるフィールド

請求書サービスでは、テキスト、テーブルのほか、26 個の請求書フィールドを抽出します。 次に、JSON の出力応答で請求書から抽出されるフィールドを示します (次の出力では、このサンプル請求書を使用しています)。

名前 種類 説明 Text 値 (標準化された出力)
CustomerName string 請求対象の顧客 Microsoft Corp
CustomerId string 顧客の参照 ID CID-12345
PurchaseOrder string 注文書の参照番号 PO-3333
InvoiceId string この特定の請求書の ID (多くの場合、"請求書番号") INV-100
InvoiceDate date 請求書の発行日 2019 年 11 月 15 日 2019-11-15
DueDate date この請求書の支払期日 12/15/2019 2019-12-15
VendorName string 請求書を作成したベンダー CONTOSO
VendorAddress string ベンダーの住所 123 456th St New York, NY, 10001
VendorAddressRecipient string VendorAddress に関連付けられている名前 Contoso Headquarters
CustomerAddress string 顧客の住所 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient string CustomerAddress に関連付けられている名前 Microsoft Corp
BillingAddress string 顧客の明示的な請求先住所 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient string BillingAddress に関連付けられている名前 Microsoft サービス
ShippingAddress string 顧客の明示的な送付先住所 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient string ShippingAddress に関連付けられている名前 Microsoft Delivery
小計 数値 この請求書で識別された小計フィールド $100.00 100
TotalTax 数値 この請求書で識別された合計税額フィールド $10.00 10
InvoiceTotal 数値 この請求書に関連付けられている合計新規料金 $110.00 110
AmountDue 数値 ベンダーに対する合計金額 $610.00 610
ServiceAddress string 顧客の明示的なサービス住所または物件所在地 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient string ServiceAddress に関連付けられている名前 Microsoft サービス
RemittanceAddress string 顧客の明示的な送金住所または支払住所 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string RemittanceAddress に関連付けられている名前 Contoso Billing
ServiceStartDate date サービス期間の最初の日 (たとえば、公共料金サービス期間) 2019 年 10 月 14 日 2019-10-14
ServiceEndDate date サービス期間の最後の日 (たとえば、公共料金サービス期間) 11/14/2019 2019-11-14
PreviousUnpaidBalance 数値 明示的な以前の未払い残高 $500.00 500

以下に、JSON の出力応答で請求書から抽出される行項目を示します。ここでは、このサンプル請求書を使用しています。

名前 種類 説明 テキスト (品目 #1) 値 (標準化された出力)
アイテム string 品目の完全な文字列テキスト行 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00
Amount number 品目の金額 $60.00 100
説明 string 請求書の明細項目の説明テキスト コンサルティング サービス コンサルティング サービス
数量 数値 この請求書明細項目の数量 2 2
UnitPrice number この項目の 1 つの単位の正味価格または総価格 (請求書の総請求書の設定によって異なります) $30.00 30
ProductCode string 特定の品目に関連付けられている製品コード、製品番号、または SKU A123
ユニット string 品目の単位 (kg、lb など) 時間
Date 日付 各品目に対応する日付。 多くの場合、これは品目が発送された日付です 3/4/2021 2021-03-04
数値 各品目に関連付けられている税。 使用可能な値には、課税額、税金 (%)、税金 (Y/N) などがあります 10%

以下に、JSON 出力応答内の請求書から抽出された複雑なフィールドを示します。

TaxDetails

税の詳細で、請求書の合計に適用される特定の税金が定義されます。

名前 種類 説明 テキスト (品目 #1) 値 (標準化された出力)
アイテム string 税項目の完全な文字列テキスト行 付加価値税15% $60.00
金額 数値 税項目の税額 60.00 60
string 税項目の税率 15%

PaymentDetails

フィールドで検出されたすべての支払いオプションを一覧表示します。

名前 種類 説明 テキスト (品目 #1) 値 (標準化された出力)
IBAN string 内部銀行の口座番号 GB33BUKB20201555555555
SWIFT string SWIFT コード BUKBGB22
BankAccountNumber string 銀行口座番号、銀行口座の一意識別子 123456
BPayBillerCode string オーストラリアの B-Pay 請求元コード 12345
BPayReference string オーストラリアの B-Pay 参照コード 98765432100

JSON 出力

JSON 出力には、次の 3 つの部分があります。

  • "readResults" ノードには、認識されたすべてのテキストと選択マークが格納されます。 テキストは、まずページで整理され、そのうえで行ごと、さらに個々の単語ごとに整理されます。
  • "pageResults" ノードには、境界ボックスで抽出されたテーブルとセル、信頼度、および readResults 内の行と単語への参照が格納されます。
  • "documentResults" ノードには、モデルによって検出された請求書固有の値と品目が格納されます。 ここで、請求書 ID、出荷先、請求先、顧客、合計、品目など、請求書のすべてのフィールドを参照できます。

移行ガイド

次のステップ