ドキュメント インテリジェンス ID ドキュメント モデル

重要

  • Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
  • Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
  • パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
    • 米国東部
    • 米国西部 2
    • "西ヨーロッパ"
    • 米国中北部

このコンテンツの適用対象: checkmark v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.1 (GA) 青のチェックマーク v3.0 (GA) 青のチェックマーク v2.1 (GA)

このコンテンツの適用対象: checkmark v3.1 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) | 以前のバージョン: 青のチェックマーク v3.0 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v3.0 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (プレビュー) 紫のチェックマーク v3.1 | 以前のバージョン: 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (プレビュー)

ドキュメント インテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープ ラーニング モデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API により、身分証明書 (以下を含む) を分析し、構造化された JSON データ表現を返します。

  • パスポートブック、世界中のパスポート カード
  • 米国、ヨーロッパ、インド、カナダ、オーストラリアの運転免許証
  • 米国の身分証明書、居住許可証 (グリーンカード)、社会保障カード、軍 ID
  • 欧州の身分証明書、居住許可証
  • インド PAN カード、アーダー カード
  • カナダの身分証明書、居住許可証(メープルカード)
  • オーストラリアの写真カード、キーパス ID (デジタル バージョンを含む)

ドキュメント インテリジェンスでは、 ドキュメント インテリジェンスの事前構築済み ID モデルを使用して、政府発行の身分証明書 (ID) から情報を分析および抽出できます。 強力な光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、世界各国のパスポートと米国の運転免許証 (50 州すべてとワシントン D.C.) から重要な情報を抽出することができます。 ID API により、これらの ID ドキュメントから、名、姓、生年月日、ドキュメント番号などの重要な情報が抽出されます。 この API は、 ドキュメント インテリジェンス v2.1 でクラウド サービスとして使用できます。

身分証明書処理

身分証明書の処理では、本人確認書類からデータを手動または OCR ベースの技術で抽出します。 身分証明書の処理は、ID の証明を必要とするビジネス オペレーションの重要なステップです。 例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療機関の受診、クレーム処理、サービス業などがあります。 個人は運転免許証、パスポート、その他の同様の書類を通じて本人確認を行うことで、企業がサービスや特典を提供する前に効率的に検証できるようにします。

ドキュメント インテリジェンス スタジオ処理された米国の運転免許証のサンプル

サンプルの運転免許証の画像。

データの抽出

事前構築済み ID サービスにより、世界各国のパスポートと米国の運転免許証から主要な値が抽出され、整理され、構造化された JSON 応答で返されます。

運転免許証の例

運転免許証のサンプル

パスポートの例

パスポートのサンプル

開発オプション

Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています:

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース
身分証明書モデル Document Intelligence ラベル付けツール
REST API
クライアント ライブラリ SDK
Document Intelligence Docker コンテナー

入力の要件

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読み込み
    Layout ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。

  • サポートされているファイル形式: JPEG、PNG、PDF、TIFF。

  • PDF および TIFF ファイルのサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。

  • サポートされるファイル サイズ: 合計 50 MB 未満、最小ピクセル数: 50 x 50 px、最大ピクセル数: 10,000 x 10,000 px。

ID ドキュメント モデルのデータ抽出

名前、生年月日、有効期限などのデータを身分証明書から抽出します。 以下のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Note

ドキュメント インテリジェンス スタジオは、v3.1 および v3.0 API 以降のバージョンで使用できます。

  1. Document Intelligence Studio ホーム ページ[Identity documents] を選択します。

  2. サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

ドキュメント インテリジェンス サンプル ラベル付けツール

  1. Document Intelligence サンプル ツールに移動します。

  2. サンプル ツールのホーム ページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。

    レイアウト モデルの分析結果操作のスクリーンショット。

  3. ドロップダウン メニューから、分析する [フォームの種類] を選択します。

  4. 次のオプションを使用して、分析するファイルの URL を選択します。

  5. [ソース] フィールドで、ドロップダウン メニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。

    ソースの場所ドロップダウン メニューのスクリーンショット。

  6. [Document Intelligence サービス エンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。

  7. [キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。

    [ドキュメントの種類を選択] ドロップダウン メニューのスクリーンショット。

  8. [Run analysis](解析の実行) を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは Analyze Prebuilt API を呼び出してドキュメントを分析します。

  9. 結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。

    身分証明モデルの分析結果操作のスクリーンショット。

  10. JSON 出力ファイルをダウンロードして、詳細なレイアウト結果を表示します。

    • "readResults" ノードには、あらゆるテキスト行が、ページ上の対応する境界ボックスの配置と共に表示されます。
    • "selectionMarks" ノードには、すべての選択マーク (チェック ボックス、ラジオ マーク) と、その状態が選択済み未選択のどちらであるかが示されます。
    • 抽出された表は、"pageResults" セクションに含まれています。 ドキュメント インテリジェンスでは、各テーブルについて、テキスト、行インデックス、列インデックス、行スパン、列スパン、境界ボックスなどが抽出されます。
    • "documentResults" フィールドには、キーと値のペアの情報と、ドキュメントの最も関連性の高い部分の行項目の情報が含まれます。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。

[サポートされているドキュメントの種類]

リージョン ドキュメント タイプ
世界全域 旅券手帳、パスポート カード
アメリカ合衆国 運転免許証、ID カード、居住許可証 (グリーン カード)、社会保障カード、軍 ID
ヨーロッパ 運転免許証、ID カード、居住許可証
インド 運転免許証、PAN カード、Aadhaar カード
カナダ 運転免許証、ID カード、居住許可証 (Maple カード)
オーストラリア 運転免許証、フォト カード、Key-pass ID (デジタル版を含む)

フィールドの抽出

サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの身分証明書モデル スキーマに関するページを参照してください。

サポート ドキュメントの種類

ID ドキュメント モデルは現在、米国の運転免許証と、国際パスポート (ビザやその他の渡航書類を除く) の抽出からの経歴ページをサポートしています。

抽出されるフィールド

名前 種類 説明
country ISO 3166 標準に準拠した国番号 "USA"
DateOfBirth date YYYY-MM-DD 形式の DOB "1980-01-01"
DateOfExpiration date YYYY-MM-DD 形式の有効期限日 "2019-05-05"
DocumentNumber string 関連するパスポート番号、運転免許証番号など "340020013"
FirstName string 該当する場合は、抽出された名とミドルネームのイニシャル "JENNIFER"
LastName string 抽出された姓 "BROOKS"
Nationality country ISO 3166 標準に準拠した国番号 "USA"
Sex 性別 抽出される可能性がある値には、"M"、"F"、"X" が含まれます "F"
MachineReadableZone オブジェクト それぞれ 44 文字の 2 行を含む抽出されたパスポート MRZ "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string ドキュメントの種類 (例: パスポート、運転免許証) "passport"
Address string 抽出された住所 (運転免許証) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
リージョン string 抽出された地域、州、都道府県など (運転免許証のみ) "Washington"

移行ガイド

次のステップ