物体検出の分析情報を取得する

[アーティクル]
10/09/2024

オブジェクトの検出

Azure AI Video Indexer は、自動車、バッグ、バックパック、ノート PC などのビデオ内のオブジェクトを検出します。

サポート対象のオブジェクト

airplane
apple
リュックサック
banana
野球のグローブ
ベッド
ベンチ
自転車
boat
本
ボトル
Excel
ブロッコリー
bus
ケーキ

car
ニンジン
携帯電話
椅子
clock
コンピューターのマウス
ソファ
cup
ダイニングテーブル
ドーナツ
消火栓
フォーク
フリスビー

ヘアドライヤー
ハンドバッグ
ホットドッグ
keyboard
凧
knife
laptop
電子レンジ
motorcycle
コンピューターのマウス
ネクタイ
orange
oven
パーキングメーター
pizza
鉢植え

sandwich
scissors
シンク
スケートボード
スキー
スノーボード
スプーン
スポーツのボール
一時停止標識
スーツケース
サーフボード
テディベア

テニスラケット
toaster
toilet
歯ブラシ
信号機
トレーニング
傘
花瓶
ワイングラス

Web ポータルで分析情報 JSON を表示する

ビデオをアップロードしてインデックスを作成すると、Web ポータルを使用してダウンロードするための JSON 形式で分析情報を入手できます。

Library タブを選択します。
操作するメディアを選択します。
ダウンロードを選択し、Insights (JSON)を選択します。 JSON ファイルが新しいブラウザータブで開きます。
応答例で説明されているキーペアを探します。

API の使用

Get Video Index 要求を使用します。 &includeSummarizedInsights=false渡すことをお勧めします。
応答例で説明されているキーペアを探します。

応答の例

検出されたオブジェクトと追跡されたオブジェクトは、ダウンロードした insights.json ファイルの [検出されたオブジェクト] の下に表示されます。一意の物体が検出されるたびに、その物体に ID が付けられます。また、その物体は追跡されます。つまり、検出された物体が再度フレームに表示されないか、モデルによって監視されます。再度表示されると、その物体のインスタンスに、開始時刻と終了時刻が異なる別のインスタンスが追加されます。

この例では、最初に自動車が検出されたとき、それは最初に検出された物体でもあったので、ID は 1 になりました。その後、別の自動車が検出されたとき、それは 23 番目に検出された物体でした。したがって、その自動車の ID は 23 になりました。その後、最初の車が再び表示され、別のインスタンスが JSON に追加されました。結果の JSON を次に示します。

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]

Key	定義
ID	メディアファイル内で検出された物体の増分 ID 番号
Type	物体の種類 (例: 自動車)
ThumbnailID	単一の物体検出を表す GUID
displayName	VI ポータルエクスペリエンスに表示される名前
WikiDataID	WikiData 構造体の一意識別子
インスタンス	追跡されたすべてのインスタンスのリスト
信頼度	物体検出の信頼度を示す 0 ～ 1 のスコア
adjustedStart	エディター使用時のビデオの調整済み開始時刻
adjustedEnd	エディター使用時のビデオの調整済み終了時刻
start	物体がフレームに出現する時刻
終了	物体がフレームに表示されなくなる時刻

コンポーネント

オブジェクト検出用のコンポーネントは定義されていません。

透明性に関するメモ

重要

すべてのVI機能のトランスパレンシーノートの概要を読む必要があります。各分析情報には、独自の透明性に関するメモもあります。

標準および高度な処理用にフレームあたり最大 20 個の検出があり、クラスあたり 35 トラックがあります。
物体のサイズはフレームの 90% を超えてはなりません。フレームの大部分に一貫してまたがっている非常に大きなオブジェクトは認識されない場合があります。
小さいオブジェクトやぼやけたオブジェクトは、検出が困難な場合があります。見逃されたり、誤って分類されたりする可能性があります (ワイングラス、カップ)。
一時的で、ごく少数のフレームに表示されるオブジェクトは認識されない場合があります。
物体検出の精度に影響を与える可能性のあるその他の要因には、低い光条件、カメラの動き、オクルージョンなどがあります。
Azure AI Video Indexer では、実際のオブジェクトのみがサポートされます。アニメーションや CGI はサポートされません。コンピューターで生成されたグラフィックス (ニュースステッカーなど) は、奇妙な結果を生み出す可能性があります。
バインダー、パンフレット、その他の筆記資料は、"書籍" として検出される傾向があります。

サンプルコード

VIのすべてのサンプルを見る

次の方法で共有

物体検出の分析情報を取得する

オブジェクトの検出

サポート対象のオブジェクト

Web ポータルで分析情報 JSON を表示する

API の使用

応答の例

コンポーネント

透明性に関するメモ

サンプルコード

フィードバック

その他のリソース

次の方法で共有

物体検出の分析情報を取得する

オブジェクトの検出

サポート対象のオブジェクト

Web ポータルで分析情報 JSON を表示する

API の使用

応答の例

コンポーネント

透明性に関するメモ

サンプル コード

フィードバック

その他のリソース

サンプルコード