Förstå anpassade modelltyper
Anpassade Azure AI Vision-modeller har olika funktioner baserat på typen. Typerna av anpassade modeller är Bildklassificering, Objektidentifiering och Produktigenkänning.
Bildklassificering
Bildklassificering är en funktion för visuellt innehåll där en modell tränas att förutsäga en etikett för en bild baserat på innehållet i hela bilden. Vanligtvis relaterar klassetiketten till bildens huvudämne, men enskilda användningsfall kan variera.
Följande bilder klassificeras till exempel baserat på vilken typ av frukt de innehåller.
Modeller kan tränas för klassificering med flera klasser (där det finns flera klasser, men varje bild bara kan tillhöra en klass) eller klassificering med flera etiketter (där en bild kan associeras med flera etiketter).
Objektidentifiering
Objektidentifiering är en form av visuellt innehåll där en modell tränas att identifiera förekomsten och platsen för en eller flera objektklasser i en bild. Till exempel kan ett AI-aktiverat kassasystem i en livsmedelsbutik behöva identifiera typen och platsen för de artiklar som köps.
Det finns två komponenter för objektidentifiering:
- Klassetiketten för varje objekt som identifieras i bilden. Du kan till exempel förutsäga att en bild innehåller ett äpple och två apelsiner.
- Platsen för varje objekt i bilden, som anges som koordinater för en avgränsningsruta som omger objektet.
Produktigenkänning
Produktigenkänning fungerar på samma sätt som objektidentifiering, men med förbättrad noggrannhet för produktetiketter och varumärken. Förutsägelserna för produktigenkänning har både klassetiketten och platsen, så att du kan veta var i bilden produkten finns.