Document Intelligence の住宅ローン ドキュメント モデル
このコンテンツの適用対象: v4.0 (プレビュー)
Document Intelligenceの 住宅ローン モデルでは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルを使用して、住宅ローン ドキュメントの主要なフィールドを分析して抽出します。 住宅ローンのドキュメントには、さまざまな形式と品質のものがあります。 API により、住宅ローン ドキュメントが分析され、構造化された JSON データ表現が返されます。 このモデルでは、現在、英語のドキュメントをサポートしています。
サポートされているドキュメントの種類:
- 統一住宅ローン申請書 (様式 1003)
- 統一引受転送概要書 (様式 1008)
- 決算開示様式
開発オプション
Document Intelligence v4.0 (2024-02-29-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース | モデル ID |
---|---|---|
住宅ローン モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
入力の要件
最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
サポートされているファイル形式:
モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML既読 ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-02-29-preview) PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。
画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。
カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1GB
で、最大 10,000 ページです。
住宅ローン ドキュメントのデータ抽出を試す
住宅ローン ドキュメント サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。
Azure サブスクリプション - 無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Document Intelligence Studio
Document Intelligence Studio ホーム ページで、[住宅ローン] を選択します。
サンプルの住宅ローン ドキュメントを分析したり、自身のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
サポートされている言語とロケール
サポートされている言語の完全なリストについては、言語サポート — 事前構築済みモデルに関するページを "参照" してください。.
フィールド抽出 1003 統一住宅ローン申請書 (URLA)
1003 URLA フォームから JSON 出力応答に抽出されたフィールドを次に示します。
名前 | 種類 | 説明 | 出力例 |
---|---|---|---|
LenderLoanNumber | String | 貸し手のローン番号またはユニバーサル ローン ID | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Agency case number | 115894 |
り手 | Object | 名前、SSN、生年月日など、借り手の ID マーカーを含むオブジェクト。 | |
共同借用者 | Object | 共同借用者の名前と署名の日付を含むオブジェクト。 | |
CurrentEmployment | Object | 現在の雇用状況に関する情報 (雇用主名、雇用主の電話番号、雇用主の住所など) を含むオブジェクト。 | |
Loan | Object | ローン情報 (金額、目的タイプ、借換タイプなど) を含むオブジェクト。 | |
プロパティ | オブジェクト | 不動産物件に関する情報 (住所、単位数、価値など) を含むオブジェクト。 |
抽出された 1003 URLA のキーと値のペアとライン項目は、JSON 出力の documentResults
セクションにあります。
フィールド抽出 1008 統一引受転送概要書
JSON 出力応答で 1008 フォームから抽出されたフィールドを次に示します。
名前 | 種類 | 説明 | 出力例 |
---|---|---|---|
り手 | Object | 借り手に関する情報 (名前、借り手の番号など) を含むオブジェクト。 | |
プロパティ | Object | 不動産物件に関する情報 (住所、居住状態、販売価格など) を含むオブジェクト。 | |
Mortgage | Object | 住宅ローンに関する情報 (ローンの種類、償却の種類、ローンの目的の種類など) を含むオブジェクト。 | |
Underwriting | Object | 引受情報に関する情報 (引受人名、鑑定人名、借り手の収入など、) を含むオブジェクト。 | |
営業担当者 | Object | 売り手に関する情報 (名前、住所、番号など) を含むオブジェクト。 |
抽出されたフォーム 1008 のキーと値のペアと項目は、JSON 出力の documentResults
セクションにあります。
フィールド抽出住宅ローン決算開示
JSON 出力応答で住宅ローン決算開示フォームから抽出されたフィールドを次に示します。
名前 | 種類 | 説明 | 出力例 |
---|---|---|---|
閉じる | Object | 決算情報に関する情報 (発行日、決算日、出金日など) を含むオブジェクト。 | |
取引 | Object | 取引情報に関する情報 (借り手名、借り手住所、販売者名) を含むオブジェクト。 | |
Loan | Object | ローン情報 (期間、目的、商品など) を含むオブジェクト。 |
抽出された住宅ローン決算開示のキーと値のペアと品目は、JSON 出力の documentResults
セクションにあります。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示