ドキュメント処理モデル

重要

  • Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
  • Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
  • パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
    • 米国東部
    • 米国西部 2
    • "西ヨーロッパ"
    • 米国中北部

このコンテンツの適用対象: checkmark v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.1 (GA) 青のチェックマーク v3.0 (GA) 青のチェックマーク v2.1 (GA)

このコンテンツの適用対象: checkmark v3.1 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.0 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v3.0 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) 紫のチェックマーク v3.1 | 以前のバージョン: 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (プレビュー)

Azure AI Document Intelligence は、アプリとフローにインテリジェントなドキュメント処理を追加できる、さまざまなモデルをサポートしています。 事前構築済みのドメイン固有のモデルを使うか、特定のビジネス ニーズとユース ケースに合わせてカスタム モデルをトレーニングできます。 Document Intelligence は、REST API または Python、C#、Java、JavaScript の各クライアント ライブラリで使用できます。

Note

  • 財務データ、保護された健康データ、個人データ、または機密性の高いデータを含むドキュメント処理プロジェクトには、細心の注意が必要です。
  • すべての国/地域の要件および業界固有の要件に必ず従うようにしてください。

モデルの概要

次の表は、現行のプレビュー版と安定版の API ごとに使用可能なモデルを示しています。

モデルの種類 モデル 2024-02-29-preview
2023-10-31-preview
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
ドキュメント分析モデル 読み取り ✔️ ✔️ ✔️ 該当なし
ドキュメント分析モデル レイアウト ✔️ ✔️ ✔️ ✔️
ドキュメント分析モデル 一般的なドキュメント レイアウトに移動** ✔️ ✔️ 該当なし
事前構築済みのモデル 銀行小切手 ✔️ 該当なし なし 該当なし
事前構築済みのモデル 口座取引明細書 ✔️ 該当なし なし 該当なし
事前構築済みのモデル Paystub ✔️ 該当なし なし 該当なし
事前構築済みのモデル コントラクト ✔️ ✔️ 該当なし 該当なし
事前構築済みのモデル 医療保険カード ✔️ ✔️ ✔️ 該当なし
事前構築済みのモデル 身分証明書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 請求書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 領収書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 米国統一税* ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国 1040 税* ✔️ ✔️ 該当なし 該当なし
事前構築済みのモデル 米国 1098 税* ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国 1099 税* ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国 W2 税 ✔️ ✔️ ✔️ 該当なし
事前構築済みのモデル 米国住宅ローン 1003 URLA ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国住宅ローン 1004 URAR ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国住宅ローン 1005 ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国住宅ローン 1008 概要 ✔️ 該当なし なし 該当なし
事前構築済みのモデル 米国住宅ローン決算開示 ✔️ 該当なし なし 該当なし
事前構築済みのモデル 結婚証明書 ✔️ 該当なし なし 該当なし
事前構築済みのモデル クレジット カード ✔️ 該当なし なし 該当なし
事前構築済みのモデル 名刺 deprecated ✔️ ✔️ ✔️
カスタム分類モデル カスタム分類子 ✔️ ✔️ 該当なし 該当なし
カスタム生成モデル カスタム生成モデル ✔️ 該当なし なし 該当なし
カスタム抽出モデル カスタム ニューラル ✔️ ✔️ ✔️ 該当なし
Customextraction モデル カスタム テンプレート ✔️ ✔️ ✔️ ✔️
カスタム抽出モデル カスタム構成済み ✔️ ✔️ ✔️ ✔️
すべてのモデル アドオン機能 ✔️ ✔️ 該当なし 該当なし

* - サブモデルを含みます。 サポートされているバリエーションとサブタイプについては、モデル固有の情報を参照してください。

Latency

待機時間は、API サーバーが受信要求を処理し、クライアントに送信応答を配信するためにかかる時間です。 ドキュメントの分析にかかる時間は、サイズ(例えばページ数)や各ページの関連コンテンツによって異なります。 Document Intelligence は、類似したドキュメントの待ち時間が同等であるが、必ずしも同じとは限らないマルチテナント サービスです。 待ち時間やパフォーマンスにおける不定期の変動は、画像や大きなドキュメントを大規模に処理するマイクロサービス ベースのステートレスなすべての非同期サービスに固有のものです。 Microsoft では、ハードウェア、容量、スケーリング機能を継続的にスケールアップしていますが、実行時に待ち時間の問題が発生する可能性は依然として存在します。

アドオン機能 アドオン/無料 2024-02-29-preview
&bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Font プロパティの抽出 アドオン ✔️ ✔️ 該当なし 該当なし
数式の抽出 アドオン ✔️ ✔️ 該当なし 該当なし
高解像度の抽出 アドオン ✔️ ✔️ 該当なし 該当なし
バーコード抽出 Free ✔️ ✔️ 該当なし 該当なし
言語検出 Free ✔️ ✔️ 該当なし 該当なし
キーと値のペア Free ✔️ 該当なし なし 該当なし
クエリ フィールド アドオン* ✔️ 該当なし なし 該当なし
検索可能な PDF アドオン* ✔️ 該当なし なし 該当なし

モデル分析機能

モデル ID テキストの抽出 クエリ フィールド 段落 段落の役割 選択マーク テーブル キーと値のペア 言語 バーコード ドキュメント分析 数式* スタイルのフォント* 高解像度* 検索可能な PDF
prebuilt-read O O O O O
事前構築済みレイアウト O O O O O
事前構築済みドキュメント O O O O O
事前構築された名刺
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (バリエーション) O O O O O
prebuilt-tax.us.1040(variations) O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - 追加コストが発生する Premium 機能

アドオン* - クエリ フィールドは、他のアドオン機能とは価格設定が異なります。 詳細については、価格のページを参照してください。

境界ボックスと多角形の座標

境界ボックス (v3.0 以降のバージョンの polygon) は、ドキュメントのテキスト要素を囲む抽象的な四角形であり、オブジェクト検出の参照ポイントとして使用されます。

  • 境界ボックスでは、4 つの数値ペアの配列で表される xy 座標平面を使用して位置を指定します。 各ペアが、左上、右上、右下、左下の順序でこのボックスの角を表します。

  • 画像の座標はピクセル単位で表示されます。 PDF の場合、座標はインチ単位で表示されます。

名刺モデルを除くすべてのモデルについて、Document Intelligence では、より高度な分析を可能にするアドオン機能がサポートされるようになりました。 これらのオプション機能は、ドキュメント抽出のシナリオに応じて有効または無効にすることができます。 2023-07-31 (GA) 以降の API バージョンでは 7 つのアドオン機能を利用できます。

言語のサポート

Document Intelligence のディープ ラーニング ベースのユニバーサル モデルでは、画像やドキュメント (言語が混在しているテキスト行を含む) から多言語テキストを抽出できる多くの言語がサポートされています。 言語サポートは、Document Intelligence サービスの機能によって異なります。 完全な一覧については、以下の記事を参照してください。

リージョン別の提供状況

Document Intelligence は、60 以上の Azure グローバル インフラストラクチャ リージョンの多くで一般提供されています。

詳細については、Azure の地域に関するページを参照して、ご自身と顧客にとって最適なリージョンを選択してください。

モデルの詳細

このセクションでは、各モデルで期待できる出力について説明します。 大部分のモデルの出力はアドオン機能を使用することで拡張できます。

OCR の読み取り

Read API を使用すると、テキスト行、単語、その場所、検出された言語、および手書きのスタイル (検出された場合) を分析および抽出することができます。

Document Intelligence Studio を使用して処理されたサンプル ドキュメント:

Document Intelligence Studio の Read を使用して処理されたサンプル ドキュメントのスクリーンショット

レイアウト分析

レイアウト分析モデルは、テキスト、テーブル、選択マーク、およびタイトル、セクション見出し、ページ ヘッダー、ページ フッターなどのその他の構造要素を分析して抽出します。

Document Intelligence Studio を使用して処理されたサンプル ドキュメント:

Document Intelligence Studio を使用して処理された新聞のサンプル ページのスクリーンショット。

医療保険カード

医療保険カード モデルでは、強力な光学式文字認識 (OCR) 機能と、ディープ ラーニング モデルの組み合わせにより、米国の医療保険カードが分析されて、重要な情報が抽出されます。

Document Intelligence Studio を使用して処理された米国の医療保険カードのサンプル:

Document Intelligence Studio での米国の医療保険カード分析のサンプルのスクリーンショット。

米国税務書類

米国税務書類モデルでは、税務書類の選択グループから主要なフィールドと明細を分析して抽出します。 この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の英語の米国税務書類の分析をサポートします。 現在サポートされているモデルは次のとおりです。

モデル 説明 ModelID
米国税 W-2 課税対象の報酬の詳細を抽出します。 prebuilt-tax.us.w2
米国税 1040 住宅ローンの利息の詳細を抽出します。 prebuilt-tax.us.1040(variations)
米国税 1098 住宅ローンの利息の詳細を抽出します。 prebuilt-tax.us.1098(variations)
米国税 1099 雇用主以外のソースから受け取った所得を抽出します。 prebuilt-tax.us.1099 (バリエーション)

Document Intelligence Studio を使用して処理された W-2 ドキュメントのサンプル:

サンプルの W-2 のスクリーンショット。

米国の住宅ローン ドキュメント

米国の住宅ローン ドキュメント モデルは、住宅ローン ドキュメントの選択されたグループから、借り手、ローン、不動産情報を含む主要なフィールドの分析と抽出を行います。 この API では、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の英語の米国住宅ローン ドキュメントの分析がサポートされます。 現在サポートされているモデルは次のとおりです。

モデル 説明 ModelID
1003 使用許諾契約書 (EULA) ローン、借り手、不動産の詳細を抽出します。 prebuilt-mortgage.us.1003
1008 概要ドキュメント 借り手、売り手、不動産、住宅ローン、引受の詳細を抽出します。 prebuilt-mortgage.us.1008
決算開示 決算、取引コスト、ローンの詳細を抽出します。 prebuilt-mortgage.us.closingDisclosure
結婚証明書 共同ローン申請者の結婚情報の詳細を抽出します。 prebuilt-marriageCertificate
米国税 W-2 所得確認のために課税対象の報酬の詳細を抽出します。 prebuilt-tax.us.w2

"Document Intelligence Studio を使用して処理された決済開示ドキュメントのサンプル":

決済開示サンプルのスクリーンショット。

コントラクト

契約モデルは、当事者、管轄区域、契約 ID、役職を含む契約の主要なフィールドと品目を分析して抽出します。 このモデルでは現在、英語の契約文書がサポートされています。

Document Intelligence Studio を使用して処理された契約書のサンプル:

Document Intelligence Studio を使用した契約書モデル抽出のスクリーンショット。

請求書

請求書モデルでは、請求書の処理が自動化され、顧客名、請求先住所、期限、金額、明細、およびその他のキー データが抽出されます。 現在、このモデルは、英語、スペイン語、ドイツ語、フランス語、イタリア語、ポルトガル語、オランダ語の請求書をサポートしています。

Document Intelligence Studio を使用して処理された請求書のサンプル:

サンプルの請求書のスクリーンショット。

Receipt

レシート モデルを使用して、印刷されたレシートや手書きのレシートから、マーチャント名、日付、明細、数量の売上領収書をスキャンすることができます。 バージョン v3.0 は、1 ページのホテル領収書の処理もサポートしています。

Document Intelligence Studio を使用して処理された領収書のサンプル:

領収書のサンプルのスクリーンショット。

身分証明書 (ID)

身分証明書 (ID) モデルを使用すると、米国の運転免許証 (全 50 州およびコロンビア特別区) および国際パスポートの個人情報ページ (ビザや他の渡航文書を除く) を処理し、キー フィールドを抽出することができます。

Document Intelligence Studio を使用して処理された米国の運転免許証のサンプル:

ID カードのサンプルのスクリーンショット。

結婚証明書

結婚証明書モデルを使用して、米国の結婚証明書を処理し、個人、日付、場所などの主要なフィールドを抽出します。

"Document Intelligence Studio を使用して処理された米国の結婚証明書のサンプル":

結婚証明書のサンプルのスクリーンショット。

クレジット カード

クレジット カード モデルを使用して、クレジット カードとデビット カードを処理し、主要なフィールドを抽出します。

"Document Intelligence Studio を使用して処理されたクレジット カードのサンプル":

クレジット カードのサンプルのスクリーンショット。

カスタム モデル

カスタム モデルは、大きく 2 種類に分類できます。 つまり、"ドキュメントの種類" の分類をサポートするカスタム分類モデルと、特定のドキュメントの種類から定義されたスキーマを抽出できるカスタム抽出モデルです。

カスタム モデルの種類と関連するモデル ビルド モードの図。

カスタム ドキュメント モデルでは、ビジネスに固有のフォームやドキュメントからデータを分析し、抽出することができます。 これらは、個々のコンテンツ内のフォーム フィールドを認識し、キーと値のペアおよびテーブル データを抽出します。 作業を開始するために必要なフォームの種類の例は 1 つだけです。

バージョン v3.0 以降のカスタム モデルでは、カスタム テンプレート (フォーム) 内の署名検出と、テンプレートとニューラルの両モデル内のページをまたぐ表がサポートされています。 署名検出では、ドキュメントに署名した人物の ID ではなく、署名の存在を探します。 モデルが署名検出に対して未署名を返した場合、そのモデルでは、定義されたフィールドに署名が見つかりませんでした。

Document Intelligence Studio を使用して処理されたカスタム テンプレートのサンプル:

Document Intelligence ツールの [analyze-a-custom-form]\(カスタム フォームの分析\) ウィンドウのスクリーンショット。

カスタム抽出

カスタム抽出モデルは、カスタム テンプレートまたはカスタム ニューラルの 2 種類のいずれかにできます。 カスタム抽出モデルを作成するには、抽出する値を持つドキュメントのデータセットにラベルを付け、ラベル付けされたデータセットに対してモデルをトレーニングします。 始めるために必要な同じフォームまたはドキュメントの種類の例は 5 つのみです。

Document Intelligence Studio を使用して処理されたカスタム抽出のサンプル:

Document Intelligence Studio でのカスタム抽出モデル分析のスクリーンショット。

カスタム分類子

カスタム分類モデルを使用すると、抽出モデルを呼び出す前にドキュメントの種類を識別できます。 分類モデルは、2023-07-31 (GA) API 以降で使用できます。 カスタム分類モデルをトレーニングするには、少なくとも 2 つの個別のクラスと、クラスごとに少なくとも 5 つのサンプルが必要です。

作成済みモデル

作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 1 つのモデル ID で呼び出される作成済みモデルに複数のカスタム モデルを割り当てることができます。 200 個までのトレーニングされたカスタム モデルを 1 つの作成済みモデルに割り当てることができます。

Document Intelligence Studio の作成済みモデル ダイアログ ウィンドウ:

Document Intelligence Studio のカスタム モデル作成ダイアログ ウィンドウのスクリーンショット。

入力の要件

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読み込み
    Layout ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降では、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。

バージョンの移行

アプリケーションで Document Intelligence v3.0 を使用する方法については、Document Intelligence v3.1 移行ガイドに関する記事を参照してください

Model 説明
ドキュメント分析
レイアウト ドキュメントからテキストとレイアウトの情報を抽出します。
事前構築済み
請求書 英語およびスペイン語の請求書から主要な情報を抽出します。
Receipt 英語の領収書から主要な情報を抽出します。
身分証明書 米国の運転免許証と国際パスポートから主要な情報を抽出します。
名刺 英語の名刺から主要な情報を抽出します。
Custom
Custom ビジネスに固有のフォームとドキュメントからデータを抽出します。 カスタム モデルは、特定のデータとユース ケースに合わせてトレーニングされます。
構成 カスタム モデルのコレクションを作成し、フォームの種類から構築された 1 つのモデルに割り当てます。

Layout

Layout API を使って、ドキュメントを分析し、テキスト、テーブルとヘッダー、選択マーク、構造情報を抽出することができます。

"サンプル ラベル付けツールを使用して処理されたサンプルのドキュメント":

サンプル ラベル付けツールを使用する

請求書

請求書モデルは、販売請求書から主要な情報が分析されて抽出されます。 API によって、さまざまな書式の請求書が分析され、顧客名、請求先住所、期限、請求額などの主要な情報が抽出されます。

"サンプル ラベル付けツールを使用して処理されたサンプルの請求書":

サンプル ラベル付けツールを使用するサンプルの請求書分析のスクリーンショット。

Receipt

  • 領収書モデルでは、印刷された領収書と手書きのレシートから重要な情報を分析して抽出します。

"サンプル ラベル付けツールを使用して処理されたサンプルのレシート":

領収書のサンプルのスクリーンショット。

身分証明書

身分証明書モデルでは、次のドキュメントから重要な情報を分析して抽出します。

  • 米国の運転免許証 (50 州のすべてとコロンビア特別区)

  • 国際パスポートの個人情報ページ (査証やその他の旅行ドキュメントを除く)。 API では、身分証明書を分析して抽出します。

"サンプル ラベル付けツールを使用して処理された米国の運転免許証のサンプル":

ID カードのサンプルのスクリーンショット。

名刺

名刺モデルでは、名刺の画像から主要な情報が分析されて抽出されます。

"サンプル ラベル付けツールを使用して処理されたサンプルの名刺":

サンプルの名刺のスクリーンショット。

Custom

  • カスタム モデルを使って、ビジネスに固有のフォームやドキュメントからデータを分析し、抽出することができます。 この API は、特定のコンテンツ内のフォーム フィールドを認識し、キーと値のペアおよびテーブル データを抽出するようにトレーニングされた、機械学習プログラムです。 始めるために必要なのは同じフォームの種類の 5 つの例だけであり、カスタム モデルのトレーニングは、ラベル付けされたデータセットがあってもなくても実行できます。

"サンプル ラベル付けツールを使用して処理されたサンプルのカスタム モデル":

Document Intelligence ツールの [analyze-a-custom-form]\(カスタム フォームの分析\) ウィンドウのスクリーンショット。

作成済みカスタム モデル

作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 1 つのモデル ID で呼び出される作成済みモデルに複数のカスタム モデルを割り当てることができます。 100 個までのトレーニングされたカスタム モデルを 1 つの構成済みモデルに割り当てることができます。

"サンプル ラベル付けツールが使用されている作成済みモデル ダイアログ ウィンドウ":

Document Intelligence Studio のカスタム モデル作成ダイアログ ウィンドウのスクリーンショット。

モデル データの抽出

Model テキストの抽出 言語検出 選択マーク テーブル 段落 段落の役割 キーと値のペア Fields
レイアウト
請求書
Receipt
身分証明書
名刺
カスタム フォーム

入力の要件

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読み込み
    Layout ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降では、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。

バージョンの移行

アプリケーションで Document Intelligence v3.0 を使用する方法については、Document Intelligence v3.1 移行ガイドに関する記事を参照してください

次のステップ