Document Intelligence の請求書モデル
重要
- Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
- Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
- パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
- 米国中北部
このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA) v2.1 (GA)
このコンテンツの適用対象: v3.1 (GA) | 最新バージョン: v4.0 (プレビュー) | 以前のバージョン: v3.0 v2.1
このコンテンツの適用対象: v3.0 (GA) | 最新バージョン: v4.0 (プレビュー) v3.1 | 以前のバージョン: v2.1
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)
Document Intelligence の請求書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、売上請求書、公共料金、および発注書から主要なフィールドと明細項目を分析および抽出します。 電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の請求書を使用できます。 API によって請求書のテキストが分析され、顧客名、請求先住所、期限、支払金額などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、27 の言語の請求書がサポートされています。
サポートされているドキュメントの種類:
- Invoices
- 光熱費
- 販売注文
- 注文書
自動請求書処理
自動請求書処理は、課金アカウント ドキュメントから accounts payable
の主要なフィールドを抽出するプロセスです。 抽出されたデータには、レビューと支払いのために買掛金勘定 (AP) ワークフローと統合された請求書からの明細が含まれます。 これまで、買掛金勘定プロセスは手動で行われ、そのため、非常に時間がかかっていました。 請求書からキー データを正確に抽出することは、通常、請求書の自動化プロセスの最も重要な手順の 1 つです。
Document Intelligence Studio で処理された請求書サンプル:
Document Intelligence サンプル ラベル付けツールで処理された請求書サンプル:
開発オプション
Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。
機能 | リソース | モデル ID |
---|---|---|
請求書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース | モデル ID |
---|---|---|
請求書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています:
機能 | リソース | モデル ID |
---|---|---|
請求書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-invoice |
Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース |
---|---|
請求書モデル | • Document Intelligence ラベル付けツール • REST API • クライアント ライブラリ SDK • Document Intelligence Docker コンテナー |
入力の要件
サポートされているファイル形式:
モデル PDF 画像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML読み込み ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview) 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは
4
MB です。画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は
1
GB です。カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1
GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは2
GB で、最大 10,000 ページです。
- サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
- PDF と TIFF では、最大 2,000 ページまでの処理がサポートされています。 Free レベルのサブスクライバーの場合は、最初の 2 ページだけが処理されます。
- サポートされているファイル サイズは 50 MB 未満で、寸法は 50 x 50 ピクセル以上、10,000 x 10,000 ピクセル以下でなければなりません。
請求書モデル データの抽出
顧客情報、ベンダーの詳細、品目などのデータが請求書からどのように抽出されるかをご覧ください。 以下のリソースが必要です。
Azure サブスクリプション—無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Document Intelligence Studio ホーム ページで、[請求書] を選択します。
サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
ドキュメント インテリジェンス サンプル ラベル付けツール
サンプル ツールのホーム ページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。
ドロップダウン メニューから、分析する [フォームの種類] を選択します。
次のオプションを使用して、分析するファイルの URL を選択します。
[ソース] フィールドで、ドロップダウン メニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。
[Document Intelligence サービス エンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。
[キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。
[Run analysis](解析の実行) を選択します。 Document Intelligence サンプル ラベル付けツールは、Analyze Prebuilt API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。
Note
サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。
サポートされている言語とロケール
サポートされている言語の完全な一覧については、事前構築済みモデルの言語サポートに関するページを "参照" してください。
フィールドの抽出
サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの請求書モデル スキーマに関するページを参照してください。
抽出された請求書のキーと値のペアと品目は、JSON 出力の
documentResults
セクションにあります。
キー値ペア
事前構築済みの請求書 2022-06-30 以降のリリースでは、キーと値のペアのオプションの戻り値がサポートされています。 既定では、キーと値のペアの戻り値は無効になっています。 キーと値のペアは、ラベルまたはキーとそれに関連する応答または値を識別する、請求書内の特定の範囲です。 請求書では、これらのペアはラベルと、そのフィールドまたは電話番号に対してユーザーが入力した値になります。 さまざまなドキュメントの種類、形式、構造に基づいて、識別可能なキーと値を抽出するために、AI モデルがトレーニングされています。
モデルによってキーの存在が検出されても、関連する値がない場合や、省略可能なフィールドの処理では、キーが単独で存在する可能性もあります。 たとえば、一部のインスタンスでは、フォームのミドル ネーム フィールドを空白のままにすることができます。 キーと値のペアは常に、ドキュメントに含まれるテキストの範囲です。 "顧客" と "ユーザー" など、同じ値が異なる方法で記述されるドキュメントの場合、関連付けられているキーは、(コンテキストに基づき) 顧客またはユーザーのいずれかです。
抽出されるフィールド
請求書サービスでは、テキスト、テーブルのほか、26 個の請求書フィールドを抽出します。 次に、JSON の出力応答で請求書から抽出されるフィールドを示します (次の出力では、このサンプル請求書を使用しています)。
名前 | 種類 | 説明 | Text | 値 (標準化された出力) |
---|---|---|---|---|
CustomerName | string | 請求対象の顧客 | Microsoft Corp | |
CustomerId | string | 顧客の参照 ID | CID-12345 | |
PurchaseOrder | string | 注文書の参照番号 | PO-3333 | |
InvoiceId | string | この特定の請求書の ID (多くの場合、"請求書番号") | INV-100 | |
InvoiceDate | date | 請求書の発行日 | 2019 年 11 月 15 日 | 2019-11-15 |
DueDate | date | この請求書の支払期日 | 12/15/2019 | 2019-12-15 |
VendorName | string | 請求書を作成したベンダー | CONTOSO | |
VendorAddress | string | ベンダーの住所 | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | string | VendorAddress に関連付けられている名前 | Contoso Headquarters | |
CustomerAddress | string | 顧客の住所 | 123 Other Street, Redmond, Washington, 98052 | |
CustomerAddressRecipient | string | CustomerAddress に関連付けられている名前 | Microsoft Corp | |
BillingAddress | string | 顧客の明示的な請求先住所 | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | string | BillingAddress に関連付けられている名前 | Microsoft サービス | |
ShippingAddress | string | 顧客の明示的な送付先住所 | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | string | ShippingAddress に関連付けられている名前 | Microsoft Delivery | |
小計 | 数値 | この請求書で識別された小計フィールド | $100.00 | 100 |
TotalTax | 数値 | この請求書で識別された合計税額フィールド | $10.00 | 10 |
InvoiceTotal | 数値 | この請求書に関連付けられている合計新規料金 | $110.00 | 110 |
AmountDue | 数値 | ベンダーに対する合計金額 | $610.00 | 610 |
ServiceAddress | string | 顧客の明示的なサービス住所または物件所在地 | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | string | ServiceAddress に関連付けられている名前 | Microsoft サービス | |
RemittanceAddress | string | 顧客の明示的な送金住所または支払住所 | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | string | RemittanceAddress に関連付けられている名前 | Contoso Billing | |
ServiceStartDate | date | サービス期間の最初の日 (たとえば、公共料金サービス期間) | 2019 年 10 月 14 日 | 2019-10-14 |
ServiceEndDate | date | サービス期間の最後の日 (たとえば、公共料金サービス期間) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | 数値 | 明示的な以前の未払い残高 | $500.00 | 500 |
以下に、JSON の出力応答で請求書から抽出される行項目を示します。ここでは、このサンプル請求書を使用しています。
名前 | 種類 | 説明 | テキスト (品目 #1) | 値 (標準化された出力) |
---|---|---|---|---|
アイテム | string | 品目の完全な文字列テキスト行 | 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00 | |
Amount | number | 品目の金額 | $60.00 | 100 |
説明 | string | 請求書の明細項目の説明テキスト | コンサルティング サービス | コンサルティング サービス |
数量 | 数値 | この請求書明細項目の数量 | 2 | 2 |
UnitPrice | number | この項目の 1 つの単位の正味価格または総価格 (請求書の総請求書の設定によって異なります) | $30.00 | 30 |
ProductCode | string | 特定の品目に関連付けられている製品コード、製品番号、または SKU | A123 | |
ユニット | string | 品目の単位 (kg、lb など) | 時間 | |
Date | 日付 | 各品目に対応する日付。 多くの場合、これは品目が発送された日付です | 3/4/2021 | 2021-03-04 |
税 | 数値 | 各品目に関連付けられている税。 使用可能な値には、課税額、税金 (%)、税金 (Y/N) などがあります | 10% |
以下に、JSON 出力応答内の請求書から抽出された複雑なフィールドを示します。
TaxDetails
税の詳細で、請求書の合計に適用される特定の税金が定義されます。
名前 | 種類 | 説明 | テキスト (品目 #1) | 値 (標準化された出力) |
---|---|---|---|---|
アイテム | string | 税項目の完全な文字列テキスト行 | 付加価値税15% $60.00 | |
金額 | 数値 | 税項目の税額 | 60.00 | 60 |
率 | string | 税項目の税率 | 15% |
PaymentDetails
フィールドで検出されたすべての支払いオプションを一覧表示します。
名前 | 種類 | 説明 | テキスト (品目 #1) | 値 (標準化された出力) |
---|---|---|---|---|
IBAN |
string | 内部銀行の口座番号 | GB33BUKB20201555555555 | |
SWIFT |
string | SWIFT コード | BUKBGB22 | |
BankAccountNumber | string | 銀行口座番号、銀行口座の一意識別子 | 123456 | |
BPayBillerCode | string | オーストラリアの B-Pay 請求元コード | 12345 | |
BPayReference | string | オーストラリアの B-Pay 参照コード | 98765432100 |
JSON 出力
JSON 出力には、次の 3 つの部分があります。
"readResults"
ノードには、認識されたすべてのテキストと選択マークが格納されます。 テキストは、まずページで整理され、そのうえで行ごと、さらに個々の単語ごとに整理されます。"pageResults"
ノードには、境界ボックスで抽出されたテーブルとセル、信頼度、および readResults 内の行と単語への参照が格納されます。"documentResults"
ノードには、モデルによって検出された請求書固有の値と品目が格納されます。 ここで、請求書 ID、出荷先、請求先、顧客、合計、品目など、請求書のすべてのフィールドを参照できます。
移行ガイド
- アプリケーションとワークフローで v3.0 バージョンを使用する方法については、Document Intelligence v3.1 への移行ガイドの説明を参照してください。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
Document Intelligence サンプル ラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。