ドキュメントインテリジェンス ID ドキュメントモデル

[アーティクル]
10/20/2024

重要

Document Intelligence パブリックプレビューリリースは、開発中の機能への早期アクセスを提供します。機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
Document Intelligence クライアントライブラリのパブリックプレビューバージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
パブリックプレビューバージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメントフィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
- 米国中北部

このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA) v2.1 (GA)

このコンテンツの適用対象: v3.1 (GA) | 最新バージョン: v4.0 (プレビュー) | 以前のバージョン: v3.0 v2.1

このコンテンツの適用対象: v3.0 (GA) | 最新バージョン: v4.0 (プレビュー) v3.1 | 以前のバージョン: v2.1

このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)

ドキュメントインテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープラーニングモデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API により、身分証明書 (以下を含む) を分析し、構造化された JSON データ表現を返します。

パスポートブック、世界中のパスポートカード
米国、ヨーロッパ、インド、カナダ、オーストラリアの運転免許証
米国の身分証明書、居住許可証 (グリーンカード)、社会保障カード、軍 ID
欧州の身分証明書、居住許可証
インド PAN カード、アーダーカード
カナダの身分証明書、居住許可証(メープルカード)
オーストラリアの写真カード、キーパス ID (デジタルバージョンを含む)

ドキュメントインテリジェンスでは、ドキュメントインテリジェンスの事前構築済み ID モデルを使用して、政府発行の身分証明書 (ID) から情報を分析および抽出できます。強力な光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、世界各国のパスポートと米国の運転免許証 (50 州すべてとワシントン D.C.) から重要な情報を抽出することができます。 ID API により、これらの ID ドキュメントから、名、姓、生年月日、ドキュメント番号などの重要な情報が抽出されます。この API は、ドキュメントインテリジェンス v2.1 でクラウドサービスとして使用できます。

身分証明書処理

身分証明書の処理では、本人確認書類からデータを手動または OCR ベースの技術で抽出します。身分証明書の処理は、ID の証明を必要とするビジネスオペレーションの重要なステップです。例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療機関の受診、クレーム処理、サービス業などがあります。個人は運転免許証、パスポート、その他の同様の書類を通じて本人確認を行うことで、企業がサービスや特典を提供する前に効率的に検証できるようにします。

ドキュメントインテリジェンススタジオで処理された米国の運転免許証のサンプル

サンプルの運転免許証の画像。

データの抽出

事前構築済み ID サービスにより、世界各国のパスポートと米国の運転免許証から主要な値が抽出され、整理され、構造化された JSON 応答で返されます。

運転免許証の例

運転免許証のサンプル

パスポートの例

パスポートのサンプル

開発オプション

Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。

機能	リソース	モデル ID
身分証明書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能	リソース	モデル ID
身分証明書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

ドキュメントインテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています：

機能	リソース	モデル ID
身分証明書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能	リソース
身分証明書モデル	• Document Intelligence ラベル付けツール • REST API • クライアントライブラリ SDK • Document Intelligence Docker コンテナー

入力の要件

サポートされているファイル形式:

モデル	PDF	画像: `JPEG/JPG`、`PNG`、`BMP`、`TIFF`、`HEIF`	Microsoft Office: Word (`DOCX`)、Excel (`XLSX`)、PowerPoint (`PPTX`)、HTML
読み込み	✔	✔	✔
Layout	✔	✔	✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
一般的なドキュメント	✔	✔
事前構築済み	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔ (2024-07-31-preview、2024-02-29-preview)

最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。
画像のディメンションは、50 ピクセル　x 50 ピクセルから 10,000 ピクセル　x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。
カスタムモデルトレーニングにおけるトレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500、カスタムニューラルモデルの場合は 50,000 です。
- カスタム抽出モデルトレーニングにおけるトレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
- カスタム分類モデルトレーニングの場合、トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。

サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
PDF および TIFF ファイルのサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。
サポートされるファイルサイズ: 合計 50 MB 未満、最小ピクセル数: 50 x 50 px、最大ピクセル数: 10,000 x 10,000 px。

ID ドキュメントモデルのデータ抽出

名前、生年月日、有効期限などのデータを身分証明書から抽出します。以下のリソースが必要です。

Azure サブスクリプション—無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (F0) を利用して、サービスを試用できます。リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Note

ドキュメントインテリジェンススタジオは、v3.1 および v3.0 API 以降のバージョンで使用できます。

Document Intelligence Studio ホームページで [Identity documents] を選択します。
サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

Document Intelligence Studio を試す。

ドキュメントインテリジェンスサンプルラベル付けツール

Document Intelligence サンプルツールに移動します。
サンプルツールのホームページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。
ドロップダウンメニューから、分析する [フォームの種類] を選択します。
次のオプションを使用して、分析するファイルの URL を選択します。
[ソース] フィールドで、ドロップダウンメニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。
[Document Intelligence サービスエンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。
[キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。
[Run analysis](解析の実行) を選択します。ドキュメントインテリジェンスサンプルラベル付けツールは Analyze Prebuilt API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。
JSON 出力ファイルをダウンロードして、詳細なレイアウト結果を表示します。
- "readResults" ノードには、あらゆるテキスト行が、ページ上の対応する境界ボックスの配置と共に表示されます。
- "selectionMarks" ノードには、すべての選択マーク (チェックボックス、ラジオマーク) と、その状態が選択済みと未選択のどちらであるかが示されます。
- 抽出された表は、"pageResults" セクションに含まれています。ドキュメントインテリジェンスでは、各テーブルについて、テキスト、行インデックス、列インデックス、行スパン、列スパン、境界ボックスなどが抽出されます。
- "documentResults" フィールドには、キーと値のペアの情報と、ドキュメントの最も関連性の高い部分の行項目の情報が含まれます。

Note

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。これは、Document Intelligence サービスではなくツールの制限です。

[サポートされているドキュメントの種類]

リージョン	ドキュメントタイプ
世界全域	旅券手帳、パスポートカード
アメリカ合衆国	運転免許証、ID カード、居住許可証 (グリーンカード)、社会保障カード、軍 ID
ヨーロッパ	運転免許証、ID カード、居住許可証
インド	運転免許証、PAN カード、Aadhaar カード
カナダ	運転免許証、ID カード、居住許可証 (Maple カード)
オーストラリア	運転免許証、フォトカード、Key-pass ID (デジタル版を含む)

フィールドの抽出

サポートされているドキュメント抽出フィールドについては、GitHub サンプルリポジトリの身分証明書モデルスキーマに関するページを参照してください。

サポートドキュメントの種類

ID ドキュメントモデルは現在、米国の運転免許証と、国際パスポート (ビザやその他の渡航書類を除く) の抽出からの経歴ページをサポートしています。

抽出されるフィールド

名前	種類	説明	値
国	country	ISO 3166 標準に準拠した国番号	"USA"
DateOfBirth	date	YYYY-MM-DD 形式の DOB	"1980-01-01"
DateOfExpiration	date	YYYY-MM-DD 形式の有効期限日	"2019-05-05"
DocumentNumber	string	関連するパスポート番号、運転免許証番号など	"340020013"
FirstName	string	該当する場合は、抽出された名とミドルネームのイニシャル	"JENNIFER"
LastName	string	抽出された姓	"BROOKS"
Nationality	country	ISO 3166 標準に準拠した国番号	"USA"
Sex	性別	抽出される可能性がある値には、"M"、"F"、"X" が含まれます	"F"
MachineReadableZone	オブジェクト	それぞれ 44 文字の 2 行を含む抽出されたパスポート `MRZ`	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType	string	ドキュメントの種類 (例: パスポート、運転免許証)	"passport"
Address	string	抽出された住所 (運転免許証)	"123 STREET ADDRESS YOUR CITY WA 99999-1234"
リージョン	string	抽出された地域、州、都道府県など (運転免許証のみ)	"Washington"

移行ガイド

アプリケーションとワークフローで v3.0 バージョンを使用する方法については、Document Intelligence v3.1 への移行ガイドの説明を参照してください。

次のステップ

Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

その他のサンプルを GitHub でご覧ください。

その他のサンプルを GitHub でご覧ください。

Document Intelligence サンプルラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

次の方法で共有

ドキュメントインテリジェンス ID ドキュメントモデル

身分証明書処理