Document Intelligence Studio とは?

[アーティクル]
07/17/2024

このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA)

重要

Document Intelligence Studio ソブリンクラウドリージョンの個別の URL が存在します。
Azure for US Government: Document Intelligence Studio (Azure Fairfax クラウド)
21Vianet によって運営される Microsoft Azure: Document Intelligence Studio (Azure in China)

Document Intelligence Studio は、Document Intelligence サービスの機能を視覚的に検査、理解、トレーニングし、アプリケーションへと統合するためのオンラインツールです。スタジオには、コードを記述することなく、さまざまな Document Intelligence モデルで実験し、返されたデータを対話型の方法でサンプリングするためのプラットフォームが用意されています。 Document Intelligence Studio を使用して、以下を行います。

ドキュメントインテリジェンスのさまざまな機能について詳しく学びます。
Document Intelligence リソースを使用して、サンプルドキュメントでモデルをテストするか、独自のドキュメントをアップロードします。
さまざまなアドオン機能とプレビュー機能を試して、ニーズに合わせて出力を調整します。
ドキュメントを分類するためにカスタム分類モデルをトレーニングします。
ドキュメントからフィールドを抽出するためにカスタム抽出モデルをトレーニングします。
アプリケーションに統合するために言語固有の SDKs のサンプルコードを取得します。

Studio では、モデル分析とカスタムモデルトレーニング用に Document Intelligence v3.0 以降の API バージョンがサポートされています。ラベル付けされたデータを含む以前にトレーニングされた v2.1 モデルはサポートされていますが、v2.1 モデルのトレーニングはサポートされていません。 v2.1 から v3.0 への移行の詳細については、REST API 移行ガイドを参照してください。

ドキュメント分析または事前構築済みモデルを使用したドキュメントの分析を始めるには、Document Intelligence Studio クイックスタートを使用してください。言語固有の SDKs のいずれか 1 つを使用して、カスタムモデルを構築し、アプリケーションでそのモデルを参照します。 Document Intelligence Studio を使用するには、Azure portal から次の資産を取得する必要があります。

Azure サブスクリプション - 無料で作成できます。
Azure AI サービスまたは Document Intelligence リソース。 Azure サブスクリプションを用意できたら、Azure portal で単一サービスまたはマルチサービスのリソースを作成し、キーとエンドポイントを取得します。 Free 価格レベル (F0) を使ってサービスを試用し、後から運用環境用の有料レベルにアップグレードします。

承認ポリシー

組織は、Azure AI Document Intelligence リソースと Azure Blob Storage に対してローカル認証を無効にし、Microsoft Entra (旧称 Azure Active Directory) 認証を適用することを選択できます。

Microsoft Entra 認証を使用するには、キーベースの承認が無効になっている必要があります。キーアクセスを無効にすると、使用可能な承認方法は Microsoft Entra ID だけになります。
Microsoft Entra では、Azure リソースに対して最小限の特権を付与し、きめ細かく制御できます。
詳細については、次のガイダンスを "参照" してください。
- Azure AI サービスに対してローカル認証を無効にする。
- Azure Storage アカウントの共有キーによる承認を禁止する
ロールの割り当ての指定。 Document Intelligence Studio の基本的なアクセスには、Cognitive Services User ロールが必要です。詳細については、Document Intelligence のロールの割り当てに関する記事を "参照" してください。

重要

Entra 認証を設定する際、Cognitive Services 共同作成者ロールではなく、Cognitive Services ユーザーロールを持っていることを確認してください。
Azure コンテキストでは、共同作成者ロールで実行できるのは、アクセスキーの一覧表示など、リソース自体を制御および管理するアクションのみです。
共同作成者ロールを持つユーザーアカウントは、アクセスキーを使用して呼び出した場合のみ、Document Intelligence にアクセスできます。ただし、Entra ID を使用してアクセス権を設定すると、キーによるアクセスは無効になり、アカウントでリソースを使用するには Cognitive Service ユーザー ロールが必要になります。

Document Intelligence モデルサポート

ヘルプウィザード、ラベル付けインターフェイス、トレーニングステップ、対話型の視覚化を使用して、次の各機能がどのように動作するかを理解してください。

読み取り: サンプルドキュメントまたは独自のドキュメントで Document Intelligence の Studio の読み取り機能を試用し、テキスト行、単語、検出された言語、手書きのスタイル (検出された場合) を抽出してみてください。詳細については、読み取りの概要の記事を "参照" してください。
レイアウト: サンプルドキュメントまたは独自のドキュメントで Document Intelligence の Studio のレイアウト機能を試用し、テキスト、テーブル、選択マーク、構造情報を抽出してみてください。詳細については、レイアウトの概要の記事を "参照" してください。
事前構築済みモデル: Document Intelligence の事前構築済みモデルを使用すると、独自のモデルをトレーニングして構築しなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。例として、Studio 請求書機能に関するページから開始します。詳細については、モデルの概要の記事を "参照" してください。
カスタム抽出モデル: Document Intelligence の Studio のカスタムモデル機能を使用すると、自分のデータでトレーニングされたモデルから、使用するフォームやドキュメントに合わせてフィールドと値を抽出できます。複数種類のフォームからデータを抽出するには、スタンドアロンカスタムモデルを作成するか、2 つ以上のカスタムモデルを結合して、構成済みモデルを作成します。サンプルドキュメントを使用してカスタムモデルをテストし、反復処理してモデルを改善します。詳細については、カスタムモデルの概要の記事を "参照" してください。
カスタム分類モデル: ドキュメント分類は Document Intelligence によってサポートされる新しいシナリオです。ドキュメント分類子 API では、分類と分割のシナリオがサポートされています。分類モデルをトレーニングして、アプリケーションでサポートされているさまざまな種類のドキュメントを識別します。分類モデルの入力ファイルには、複数のドキュメントを含め、関連付けられているページ範囲内の各ドキュメントを分類できます。詳細については、「カスタム分類モデル」を "参照" してください。
アドオン機能: Document Intelligence では、より高度な分析機能がサポートされています。これらのオプション機能は、各モデルページの Analyze Options ボタンを使用して、Studio 内で有効または無効にすることができます。使用可能なアドオン機能としては、highResolution、formula、font、barcode extraction の 4 つの機能があります。詳細については、「アドオン機能」を "参照" してください。

Document Intelligence モデルを試す

リソースが構成されたら、Document Intelligence Studio によって提供されるさまざまなモデルを試すことができます。フロントページから、コードなしの方法での使用を試す Document Intelligence モデルを選択します。
ドキュメント分析モデルまたは事前構築済みモデルをテストするには、モデルを選択し、いずれかのサンプルドキュメントを使用するか、分析対象の独自のドキュメントをアップロードします。分析結果は、コンテンツ結果コードウィンドウの右側に表示されます。
カスタムモデルは、お使いのドキュメントでトレーニングする必要があります。カスタムモデルの概要については、カスタムモデルの概要に関するページを参照してください。
Document Intelligence Studio でシナリオを検証した後に、C#、Java、JavaScript、Python のクライアントライブラリまたは REST API を使用して、独自のアプリケーションへの Document Intelligence モデルの組み込みを開始します。

各モデルについて詳しくは、概念に関するページを "参照" してください。

リソースの詳細を表示する

名前や価格レベルなどのリソースの詳細を表示するには、Document Intelligence Studio ホームページの右上隅にある [設定] アイコンを選択し、[リソース] タブを選択します。他のリソースにアクセスできる場合は、リソースを切り替えることもできます。

スタジオの [設定] ページの [リソース] タブのスクリーンショット。

Document Intelligence を使用すると、アプリケーションとワークフローでのデータ処理をすぐに自動化し、データ主導の戦略を簡単に強化し、ドキュメント検索機能を巧みに強化できます。

分析オプション

Document Intelligence では、高度な分析機能がサポートされています。 Studio では、アドオン機能を簡単に構成するためのエントリポイント (分析オプションボタン) を 1 つ使用できます。
ドキュメント抽出シナリオに応じて、分析範囲、ドキュメントページ範囲、オプションの検出、プレミアム検出機能を構成します。

Note

Document Intelligence Studio では、フォントの抽出は視覚化されません。ただし、フォントの検出結果については JSON 出力のスタイルセクションで確認できます。

事前構築済みのモデルまたはいずれかの独自のモデルを使用したドキュメントの自動ラベル付け

カスタム抽出モデルラベル付けページでは、Document Intelligence Service の事前構築済みモデルまたは自前のトレーニング済みモデルのいずれかを使用して、ドキュメントの自動ラベル付けが行えるようになりました。
一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。後でラベル付けページでラベルが重複しないように、ラベルを変更してください。

自動ラベルテーブル

カスタム抽出モデルのラベル付けページで、手動でテーブルにラベル付けしなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。

テストファイルをトレーニングデータセットに直接追加する

カスタム抽出モデルをトレーニングしたら、テストページを使用して、必要に応じてテストドキュメントをトレーニングデータセットにアップロードすることで、モデルの品質を改善します。
一部のラベルに対して低い信頼度スコアが返される場合は、コンテンツに正しくラベル付けされていることを確認します。正しくない場合は、モデルの品質を改善するために、それらをトレーニングデータセットに追加し再ラベル付けを行います。

カスタムプロジェクトでドキュメントリストオプションとフィルターを使用する

カスタム抽出モデルラベル付けページを使用すると、検索、フィルター処理、および特徴量による並べ替えを使用して、トレーニングドキュメント内を簡単に検索できます。
グリッドビューを使用してドキュメントをプレビューするか、リストビューを使用してドキュメント内をより簡単にスクロールできます。

カスタム抽出プロジェクトを簡単に共有できます。詳細については、「プロジェクト共有とカスタムモデル」を参照してください。

トラブルシューティング

シナリオ	原因	解決策
カスタムプロジェクトを開いたときに、エラーメッセージ `Form Recognizer Not Found` が返される。	このカスタムプロジェクトにバインドされている Document Intelligence リソースが削除されたか、または別のリソースグループに移動されました。	この問題を解決するには、次の 2 つの方法があります。 • 同じサブスクリプションと、同じ名前を持つリソースグループで、Document Intelligence リソースを再作成します。 • カスタムプロジェクトを再作成して Document Intelligence リソースを移行し、同じストレージアカウントを指定します。
事前構築済みのアプリを使用しているとき、または事前カスタムプロジェクトを開いたときに、エラーメッセージ `PermissionDenied` が返される。	事前構築済みのモデルに対して分析を行うとき、またはカスタムプロジェクトを開くときに、プリンシパルで API/Operation にアクセスできませんでした。 Document Intelligence リソースに対してローカル (キーベース) 認証が無効になっており、リソースにアクセスするための十分なアクセス許可がない可能性があります。	「Azure でのロールの割り当て」を参照して、アクセスロールを構成してください。
カスタムプロジェクトを開いたときに、エラーメッセージ `AuthorizationPermissionMismatch` が返される。	要求には、指定されたアクセス許可を使用して操作を実行する権限がありません。ストレージアカウントに対してローカル (キーベース) 認証が無効になっており、BLOB データにアクセスするためのアクセス許可が付与されていない可能性があります。	「Azure でのロールの割り当て」を参照して、アクセスロールを構成してください。
Document Intelligence Studio にサインインできず、エラーメッセージ `InteractionRequiredAuthError:login_required:AADSTS50058:A silent sign-request was sent but no user is signed in` が返される	ブラウザーがサードパーティの Cookie をブロックしているため、正常にサインインできない可能性があります。	解決するには、お使いのブラウザーのサードパーティの設定の管理を参照してください。

Studio にアクセスするためのサードパーティの設定を管理する

Edge:

Edge の [設定] に移動します
「サード*パーティ」を検索します
[Cookie とサイトデータの管理と削除] に移動します
[サードパーティの Cookie をブロックする] の設定をオフにします

Chrome の場合:

Chrome の [設定] に移動します
「サード*パーティ」を検索します
[既定の動作] で、[サードパーティの Cookie を許可する] を選択します

Firefox:

Firefox の [設定] に移動します
「Cookie」を検索します
[強化型トラッキング防止] で、[例外を管理] を選択します
お使いの環境の https://documentintelligence.ai.azure.com または Document Intelligence Studio の URL に例外を追加します

Safari の場合:

[Safari]>[設定] の順に選択します
[プライバシー] を選択します
[すべての Cookie をブロック] を選択解除します

次のステップ

Document Intelligence Studio にアクセスする。
Document Intelligence Studio クイックスタートを参照して使用を開始する。

次の方法で共有

Document Intelligence Studio とは?

承認ポリシー

Document Intelligence モデルサポート