Detekce objektů
Tento článek vysvětluje koncept detekce objektů. Detekce objektů je podobná označování, ale rozhraní API vrací souřadnice ohraničujícího rámečku (v pixelech) pro každý objekt nalezený na obrázku. Pokud například obrázek obsahuje psa, kočku a osobu, operace detekce objektů vypíše tyto objekty s jejich souřadnicemi na obrázku. Pomocí této funkce můžete zpracovat vztahy mezi objekty na obrázku. Umožňuje také určit, jestli je na obrázku více instancí stejného objektu.
Funkce rozpoznávání objektů používá značky založené na objektech nebo živých věcech identifikovaných na obrázku. Mezi taxonomií označování a taxonomií detekce objektů neexistuje žádný formální vztah. Na koncepční úrovni funkce rozpoznávání objektů najde pouze objekty a živé věci, zatímco funkce značky může také obsahovat kontextové termíny, jako je vnitřní, které nelze lokalizovat s ohraničujícími rámečky.
Vyzkoušejte možnosti rychlého a snadného rozpoznávání objektů v prohlížeči pomocí nástroje Azure AI Vision Studio.
Příklad detekce objektů
Následující odpověď JSON ukazuje, co vrátí rozhraní API pro analýzu obrázků, když rozpozná objekty v ukázkovém obrázku.
{
"objects":[
{
"rectangle":{
"x":730,
"y":66,
"w":135,
"h":85
},
"object":"kitchen appliance",
"confidence":0.501
},
{
"rectangle":{
"x":523,
"y":377,
"w":185,
"h":46
},
"object":"computer keyboard",
"confidence":0.51
},
{
"rectangle":{
"x":471,
"y":218,
"w":289,
"h":226
},
"object":"Laptop",
"confidence":0.85,
"parent":{
"object":"computer",
"confidence":0.851
}
},
{
"rectangle":{
"x":654,
"y":0,
"w":584,
"h":473
},
"object":"person",
"confidence":0.855
}
],
"requestId":"25018882-a494-4e64-8196-f627a35c1135",
"metadata":{
"height":473,
"width":1260,
"format":"Jpeg"
},
"modelVersion":"2021-05-01"
}
Omezení
Je důležité si uvědomit omezení detekce objektů, abyste se vyhnuli nebo zmírnit účinky falešně negativních (zmeškaných objektů) a omezených podrobností.
- Objekty se obvykle nezjistí, pokud jsou malé (méně než 5 % obrázku).
- Objekty se obvykle nerozpoznají, pokud jsou uspořádané úzce dohromady (například zásobník plátů).
- Objekty se nerozlišují podle názvů značek nebo produktů (různé typy sodovek na skladové polici, například). Informace o značce však můžete z obrázku získat pomocí funkce rozpoznávání značek.
Použití rozhraní API
Funkce detekce objektů je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat prostřednictvím nativní sady SDK nebo prostřednictvím volání REST. Zahrňte Objects
do parametru visualFeatures
dotazu. Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu objektů.