Azure AI Vision とは?

[アーティクル]
09/03/2024

Azure AI Vision サービスを使うと、自分にとって関心のある視覚的特徴に基づいて、画像を処理して情報を返す高度なアルゴリズムにアクセスできます。次の表は、主要な製品カテゴリの一覧です。

サービス	説明
光学式文字認識 (OCR)	光学式文字認識 (OCR) サービスは、画像からテキストを抽出します。 Read API を使って、写真やドキュメントから印刷と手書きのテキストを抽出できます。ディープラーニングベースのモデルを使用して、さまざまなサーフェスや背景のテキストを操作します。たとえば、ビジネスドキュメント、請求書、レシート、ポスター、名刺、レター、ホワイトボードが対象となります。 OCR API では、複数の言語で印刷されたテキストの抽出がサポートされます。使用を開始するには、OCR クイックスタートに従ってください。
画像分析	画像分析サービスは、物、顔、成人向けコンテンツ、自動生成されたテキストの説明など、さまざまな視覚的特徴を画像から抽出します。使用を開始するには、画像分析のクイックスタートに従ってください。
Face	Face サービスは、画像に含まれている人の顔を検出、認識、分析する AI アルゴリズムを提供します。顔認識ソフトウェアは、本人確認、タッチレスアクセス制御、プライバシーのための顔ぼかしなど、さまざまなシナリオで重要です。使用を開始するには、Face のクイックスタートに従ってください。
ビデオ分析	ビデオ分析には、空間分析やビデオ検索のようなビデオ関連の機能が含まれています。空間分析では、ビデオフィードでの人々の存在と移動を分析し、他のシステムで応答できるイベントを生成します。使用を開始するには、空間分析コンテナーをインストールしてください。ビデオ検索では、自然言語で検索できるビデオのインデックスを作成できます。

デジタル資産管理用の Azure AI Vision

Azure AI Vision は、多くのデジタル資産管理 (DAM) シナリオに活用できます。 DAM は、リッチメディアアセットの整理、保管、取得、およびデジタルの権利とアクセス許可の管理を行うビジネスプロセスです。たとえば、会社では、表示されるロゴ、顔、オブジェクト、色などに基づいて、画像をグループ化し、識別することができます。または、画像のキャプションを自動的に生成し、キーワードを添付して検索できるようにすることもできます。 Azure AI サービス、Azure AI Search、およびインテリジェントレポートを使用するオールインワンの DAM ソリューションについては、GitHub 上のナレッジマイニングソリューションアクセラレータガイドを参照してください。その他の DAM の例については、Azure AI Vision ソリューションテンプレートのリポジトリを参照してください。

作業の開始

Vision Studio を使用して、Web ブラウザーですぐに Azure AI Vision の機能を試すことができます。

アプリへの Azure AI Vision の組み込みを開始するには、クイックスタートに従ってください。

イメージの要件

Azure AI Vision では、次の要件に合った画像を分析できます。

イメージが、JPEG、PNG、GIF、または BMP で提示されている
イメージのファイルサイズが 4 メガバイト (MB) 未満である
イメージのディメンションが 50 x 50 ピクセルよりも大きい値である
- Read API の場合、画像の寸法は、50 x 50 から 10,000 x 10,000 ピクセルの間である必要があります。

データのプライバシーとセキュリティ

Azure AI サービス全般に言えることですが、Azure AI Vision サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。詳細については、Microsoft Trust Center の Azure AI サービスページを参照してください。

次のステップ

クイックスタートに従って、任意の開発言語でサービスを実装して実行します。

次の方法で共有