Azure AI をターゲットにした言語処理テクノロジを選択する
Azure AI サービス は、開発者や組織が、すぐに使用できる、構築済みでカスタマイズ可能な API とモデルを使用して、インテリジェントで最先端の、市場対応型の責任あるアプリケーションを迅速に作成するのに役立ちます。
この記事では、自然言語処理 (NLP)、テキスト分析、言語理解、翻訳、ドキュメント データ抽出などの対象となる言語処理機能を提供する Azure AI サービスについて説明します。 Azure AI Language は、Azure AI サービスの中で最も広範なカテゴリの 1 つです。 ワークロードで API を使用して、名前付きエンティティの認識、感情分析、言語検出、テキスト要約などの言語機能を組み込むことができます。
サービス
次のサービスは、Azure AI サービス向けのターゲット言語処理機能を提供します。
Azure AI Language は、テキスト分析のための自然言語処理を提供します。
- 説明したさまざまな言語関連のタスクのために構造化ドキュメントまたは非構造化ドキュメントを操作する必要がある場合は、Azure AI Language サービスを使用 します。
- チャットでドキュメントを検索したり、コンテンツの安全性を確認したり、翻訳したりする必要がある場合は、言語サービスを使用しない でください。
Azure AI 翻訳 は機械翻訳サービスです。 リアルタイムのテキスト翻訳、バッチおよび単一ファイルの ドキュメント翻訳、およびシナリオに専門用語や業界固有の言語を組み込むことができる カスタム翻訳 を実行できます。 多くの言語をサポートしています。
- 翻訳を具体的に実行する必要がある場合は、Translator サービスを使用 します。 他の汎用基礎言語モデルを使用して翻訳を実行することもできますが、翻訳者をその特殊な目的に使用すると、より確実に効果的であり、ターゲットを絞った翻訳モデルを使用することでコスト効率も向上します。
- チャットに参加したり、コンテンツの感情を分析したり、コンテンツ モデレーションの必要がある場合は、Translator サービスを使用しない でください。 感情分析の場合は、代わりに言語サービスを使用してください。 コンテンツ モデレーションには、コンテンツ セーフティ サービスを使用します。
Azure AI Document Intelligence は、画像を直接電子フォームに変換できるサービスです。 予想されるフィールドを指定してから、提供した画像を検索し、人間の介入なしにそれらのフィールドをキャプチャすることができます。 このサービスでは、多数の事前構築済みモデルがホストされており、独自のカスタム フォーム モデルを構築することもできます。
- スキャンしたドキュメントからどのフィールドを抽出して電子フォームに適切に入力する必要があるかを正確に把握している場合は、Document Intelligence サービスを使用 します。
- ドキュメント インテリジェンスを使用 して、さまざまなドキュメント コーパス内の主要な構造 (ヘッダー、フッター、章区切りなど) を識別し、検索拡張生成 (RAG) 実装などでプログラムによってドキュメントをさらに操作します。
- ドキュメント インテリジェンス サービスをリアルタイム検索 API として使用しない でください。
Azure AI Language
Azure AI Language は、テキストを理解し分析するための自然言語処理 (NLP) 機能を提供するクラウドベースのサービスです。 このサービスを使用すると、Web ベースの Language Studio、REST API、およびクライアント ライブラリを使用してインテリジェントなアプリケーションを構築できます。
機能
次の表は、Azure AI Language サービスで利用できる機能の一覧を示しています。
機能 | 説明 |
---|---|
カスタムの質問応答 | ユーザーからの入力に対して最も適切な回答を見つけます。ソーシャル メディア アプリケーション、チャット ボット、音声対応デスクトップ アプリケーションなどの会話型クライアント アプリケーションの構築によく使用されます。 |
カスタム テキスト分類 | 非構造化テキスト ドキュメントを定義済みのカスタム クラスに分類するカスタム AI モデルを構築するために使用します。 |
会話言語理解 (CLU) | 受信した発話の全体的な意図を予測し、そこから重要な情報を抽出するためのカスタム自然言語理解モデルを構築するために使用します。 |
エンティティ リンク設定 | 構造化されていないテキストで見つかったエンティティ (単語またはフレーズ) の ID を明確にし、Wikipedia へのリンクを返します。 |
言語検出 | 文書が書かれている言語を検出し、さまざまな言語、変種、方言、および一部の地域/文化言語の言語コードを返します。 |
キー フレーズ抽出 | 非構造化テキスト内の主要な概念を評価して返し、リストとして返します。 |
固有表現認識 (NER) | 非構造化テキスト内のエンティティ (単語またはフレーズ) を、複数の定義済みカテゴリ グループに分類します。 例として、人、イベント、場所、日付、 その他のものがあります。 |
オーケストレーション ワークフロー | 会話言語理解 (CLU)を接続するために使用します。 |
個人を特定できる情報 (PII) と健康に関する情報 (PHI) の検出 | 非構造化テキスト ドキュメント と 会話の記録の両方で機密情報を識別、分類、編集します。 例として、電話番号、メール アドレス、各種形式の ID、 その他のものがあります。 |
感情分析とオピニオン マイニング | 肯定的または否定的な感情に関する手がかりをテキストから抽出し、それをテキストの特定の側面と関連付けることで、人々がブランドやトピックについてどう思っているかを知るのに役立ちます。 |
概要 | 抽出テキスト要約を使用して、ドキュメントと会話の文字起こしの要約を作成します。 元のコンテンツ内で最も重要または関連性が高い情報をまとめて表す文を抽出します。 |
健康のためのテキスト分析 | 医師の診断書、退院サマリー、臨床文書、電子健康記録などの非構造化テキストから関連する医療情報を抽出し、ラベル付けします。 ワークロードを設計するときは、このクラウド ホスト機能の処理場所とデータの保存場所を評価して、コンプライアンスの期待に一致していることを確認します。 一部のワークロードは、クラウドでホストされているプラットフォームに医療データを送信するために容量が制限される場合があります。 この API を Docker コンテナーとして使用して、クラウドまたはオンプレミスの独自のコンピューティングでホストできます。これは、PaaS に関連するコンプライアンスの問題に対処するのに役立つ可能性があります。 詳細については、 Text Analytics for Health コンテナを使用するを参照してください。 |
ユース ケース
次の表は、Azure AI Language サービスの考えられるユース ケースの一覧を示しています。
*機能がカスタマイズ可能な場合は、当社のツールを使用して AI モデルをトレーニングし、データに特化させることができます。 それ以外の場合、機能は事前に構成されています。つまり、使用される AI モデルを変更することはできません。 ユーザーは単にデータを送信し、機能の出力をアプリケーションで使用します。
Azure AI Translator
Azure AI 翻訳 は、Azure AI サービス ファミリの一部である機械翻訳サービスです。 Translator は、多くの Microsoft 製品およびサービスに採用されています。
機能
次の表は、Azure AI 翻訳 サービスで利用できる機能の一覧を示しています。
機能 | 説明 |
---|---|
テキスト翻訳 | サポートされているソースとターゲットの言語間でテキスト変換をリアルタイムで実行します。 動的ディクショナリ を作成し、Translator API を使って 翻訳を防止する 方法について説明します。 |
ドキュメント変換 | 非同期バッチ翻訳: 元のドキュメントの構造と形式を維持しながら、バッチファイルと複雑なファイルを翻訳します。 バッチ翻訳プロセスでは、翻訳前と翻訳後のドキュメント用のコンテナーを含む Azure Blob Storage アカウントが必要です。 同期単一ファイル翻訳: 元の文書の構造と形式を維持しながら、単一の文書ファイルを単独で、または用語集ファイルと一緒に翻訳します。 このファイル翻訳プロセスでは、Azure Blob Storage アカウントは必要ありません。 最後の応答に翻訳されたドキュメントが含まれており、それが呼び出し元のクライアントに直接返されます。 |
Custom Translator | ドメインおよび業界固有の言語、用語、スタイルを翻訳するために、カスタマイズされたモデルを作成します。 カスタム翻訳用の辞書 (フレーズまたは文) を作成 します。 |
ユース ケース
次の表は、Azure AI 翻訳 サービスの考えられるユース ケースの一覧を示しています。
ユース ケース | ドキュメント |
---|---|
業界固有のテキストを翻訳します。 | AIサービス Custom Translator |
業界に特化しない一般的なテキストを翻訳します。 | Azure テキスト翻訳とは |
Azure AI Document Intelligence
Azure AI Language は、テキストを理解し分析するための自然言語処理 (NLP) 機能を提供するクラウドベースのサービスです。 このサービスを使用すると、Web ベースの Language Studio、REST API、およびクライアント ライブラリを使用してインテリジェントなアプリケーションを構築できます。
機能
次の表は、AI Document Intelligence サービスで利用できる機能の一部を示しています。
機能 | 説明 |
---|---|
名刺抽出 | Document Intelligence 名刺モデルは、光学式文字認識 (OCR) 機能とディープラーニング モデルを組み合わせて、名刺画像からデータを分析および抽出します。 API により、印刷された名刺が分析され、名、姓、会社名、メール アドレス、電話番号などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 |
契約モデル抽出 | Document Intelligence 契約モデルは、光学式文字認識 (OCR) 機能を使用して、選択された重要な契約エンティティのグループから主要なフィールドと明細項目を分析および抽出します。 電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質のコントラクトを使用できます。 API は、関係者、管轄区域、コントラクト ID、役職などの重要な情報を抽出し、構造化された JSON データ表現を返して、ドキュメント テキストを分析します。 このモデルでは現在、英語のドキュメント形式がサポートされています。 |
クレジットカードの抽出 | Document Intelligence のクレジット/デビット カード モデルは、光学式文字認識 (OCR) 機能を使用して、クレジット カードとデビット カードの重要なフィールドを分析および抽出します。 クレジット カードとデビット カードは、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質である可能性があります。 API によってドキュメントのテキストが分析され、カード番号、発行銀行、有効期限などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、英語のドキュメント形式がサポートされています。 |
健康保険証の抽出 | Document Intelligence の健康保険カード モデルは、光学文字認識 (OCR) 機能とディープラーニング モデルを組み合わせて、米国の健康保険カードから重要な情報を分析および抽出します。 医医療保険カードは、医療処理の重要なドキュメントであり、患者のオンボーディング、財務カバレッジ情報、キャッシュレス支払い、および保険金請求処理についてデジタル分析することができます。 医療保険カード モデルは、医療カードの画像を分析します。保険者、メンバー、処方箋、グループ番号などの重要な情報を抽出します。構造化された JSON 表現を返します。 医療保険カードは、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の請求書で表示できます。 |
米国の税務書類の抽出 | Document Intelligence 契約モデルは、光学式文字認識 (OCR) 機能を使用して、選択した税務書類のグループから主要なフィールドと明細項目を分析および抽出します。 電話でキャプチャされた画像、スキャンされた書類、デジタル PDF など、さまざまな形式や品質の税務書類を使用できます。 API によって書類のテキストが分析されます; 顧客名、請求先住所、期限、支払金額などの主要な情報が抽出されます; 構造化された JSON データ表現が返されます。 このモデルでは現在、特定の英語の税務書類形式がサポートされています。 |
他にもたくさんあります... | Azure AI Document Intelligence は、アプリとフローにインテリジェントなドキュメント処理を追加できる、さまざまなモデルをサポートしています。 事前構築済みのドメイン固有のモデルを使うか、特定のビジネス ニーズとユース ケースに合わせてカスタム モデルをトレーニングできます。 Document Intelligence は、REST API または Python、C#、Java、JavaScript の各クライアント ライブラリで使用できます。 |
シナリオに適したモデルを選択する方法の詳細については、「どのモデルを選択すればよいですか?」を参照してください。