ドキュメント インテリジェンス ID ドキュメント モデル
重要
- Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
- Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
- パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
- 米国中北部
このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA) v2.1 (GA)
このコンテンツの適用対象: v3.1 (GA) | 最新バージョン: v4.0 (プレビュー) | 以前のバージョン: v3.0 v2.1
このコンテンツの適用対象: v3.0 (GA) | 最新バージョン: v4.0 (プレビュー) v3.1 | 以前のバージョン: v2.1
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)
ドキュメント インテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープ ラーニング モデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API により、身分証明書 (以下を含む) を分析し、構造化された JSON データ表現を返します。
- パスポートブック、世界中のパスポート カード
- 米国、ヨーロッパ、インド、カナダ、オーストラリアの運転免許証
- 米国の身分証明書、居住許可証 (グリーンカード)、社会保障カード、軍 ID
- 欧州の身分証明書、居住許可証
- インド PAN カード、アーダー カード
- カナダの身分証明書、居住許可証(メープルカード)
- オーストラリアの写真カード、キーパス ID (デジタル バージョンを含む)
ドキュメント インテリジェンスでは、 ドキュメント インテリジェンスの事前構築済み ID モデルを使用して、政府発行の身分証明書 (ID) から情報を分析および抽出できます。 強力な光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、世界各国のパスポートと米国の運転免許証 (50 州すべてとワシントン D.C.) から重要な情報を抽出することができます。 ID API により、これらの ID ドキュメントから、名、姓、生年月日、ドキュメント番号などの重要な情報が抽出されます。 この API は、 ドキュメント インテリジェンス v2.1 でクラウド サービスとして使用できます。
身分証明書処理
身分証明書の処理では、本人確認書類からデータを手動または OCR ベースの技術で抽出します。 身分証明書の処理は、ID の証明を必要とするビジネス オペレーションの重要なステップです。 例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療機関の受診、クレーム処理、サービス業などがあります。 個人は運転免許証、パスポート、その他の同様の書類を通じて本人確認を行うことで、企業がサービスや特典を提供する前に効率的に検証できるようにします。
ドキュメント インテリジェンス スタジオで処理された米国の運転免許証のサンプル
データの抽出
事前構築済み ID サービスにより、世界各国のパスポートと米国の運転免許証から主要な値が抽出され、整理され、構造化された JSON 応答で返されます。
運転免許証の例
パスポートの例
開発オプション
Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。
機能 | リソース | モデル ID |
---|---|---|
身分証明書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース | モデル ID |
---|---|---|
身分証明書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています:
機能 | リソース | モデル ID |
---|---|---|
身分証明書モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース |
---|---|
身分証明書モデル | • Document Intelligence ラベル付けツール • REST API • クライアント ライブラリ SDK • Document Intelligence Docker コンテナー |
入力の要件
サポートされているファイル形式:
モデル PDF 画像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML読み込み ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview) 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは
4
MB です。画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は
1
GB です。カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1
GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは2
GB で、最大 10,000 ページです。
サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
PDF および TIFF ファイルのサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。
サポートされるファイル サイズ: 合計 50 MB 未満、最小ピクセル数: 50 x 50 px、最大ピクセル数: 10,000 x 10,000 px。
ID ドキュメント モデルのデータ抽出
名前、生年月日、有効期限などのデータを身分証明書から抽出します。 以下のリソースが必要です。
Azure サブスクリプション—無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Note
ドキュメント インテリジェンス スタジオは、v3.1 および v3.0 API 以降のバージョンで使用できます。
Document Intelligence Studio ホーム ページで [Identity documents] を選択します。
サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
ドキュメント インテリジェンス サンプル ラベル付けツール
サンプル ツールのホーム ページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。
ドロップダウン メニューから、分析する [フォームの種類] を選択します。
次のオプションを使用して、分析するファイルの URL を選択します。
[ソース] フィールドで、ドロップダウン メニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。
[Document Intelligence サービス エンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。
[キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。
[Run analysis](解析の実行) を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは Analyze Prebuilt API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。
JSON 出力ファイルをダウンロードして、詳細なレイアウト結果を表示します。
- "readResults" ノードには、あらゆるテキスト行が、ページ上の対応する境界ボックスの配置と共に表示されます。
- "selectionMarks" ノードには、すべての選択マーク (チェック ボックス、ラジオ マーク) と、その状態が選択済みと未選択のどちらであるかが示されます。
- 抽出された表は、"pageResults" セクションに含まれています。 ドキュメント インテリジェンスでは、各テーブルについて、テキスト、行インデックス、列インデックス、行スパン、列スパン、境界ボックスなどが抽出されます。
- "documentResults" フィールドには、キーと値のペアの情報と、ドキュメントの最も関連性の高い部分の行項目の情報が含まれます。
Note
サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。
[サポートされているドキュメントの種類]
リージョン | ドキュメント タイプ |
---|---|
世界全域 | 旅券手帳、パスポート カード |
アメリカ合衆国 | 運転免許証、ID カード、居住許可証 (グリーン カード)、社会保障カード、軍 ID |
ヨーロッパ | 運転免許証、ID カード、居住許可証 |
インド | 運転免許証、PAN カード、Aadhaar カード |
カナダ | 運転免許証、ID カード、居住許可証 (Maple カード) |
オーストラリア | 運転免許証、フォト カード、Key-pass ID (デジタル版を含む) |
フィールドの抽出
サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの身分証明書モデル スキーマに関するページを参照してください。
サポート ドキュメントの種類
ID ドキュメント モデルは現在、米国の運転免許証と、国際パスポート (ビザやその他の渡航書類を除く) の抽出からの経歴ページをサポートしています。
抽出されるフィールド
名前 | 種類 | 説明 | 値 |
---|---|---|---|
国 | country | ISO 3166 標準に準拠した国番号 | "USA" |
DateOfBirth | date | YYYY-MM-DD 形式の DOB | "1980-01-01" |
DateOfExpiration | date | YYYY-MM-DD 形式の有効期限日 | "2019-05-05" |
DocumentNumber | string | 関連するパスポート番号、運転免許証番号など | "340020013" |
FirstName | string | 該当する場合は、抽出された名とミドルネームのイニシャル | "JENNIFER" |
LastName | string | 抽出された姓 | "BROOKS" |
Nationality | country | ISO 3166 標準に準拠した国番号 | "USA" |
Sex | 性別 | 抽出される可能性がある値には、"M"、"F"、"X" が含まれます | "F" |
MachineReadableZone | オブジェクト | それぞれ 44 文字の 2 行を含む抽出されたパスポート MRZ |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | ドキュメントの種類 (例: パスポート、運転免許証) | "passport" |
Address | string | 抽出された住所 (運転免許証) | "123 STREET ADDRESS YOUR CITY WA 99999-1234" |
リージョン | string | 抽出された地域、州、都道府県など (運転免許証のみ) | "Washington" |
移行ガイド
- アプリケーションとワークフローで v3.0 バージョンを使用する方法については、Document Intelligence v3.1 への移行ガイドの説明を参照してください。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
Document Intelligence サンプル ラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。