Förstå anpassade modelltyper

3 minuter

Anpassade Azure AI Vision-modeller har olika funktioner baserat på typen. Typerna av anpassade modeller är Bildklassificering, Objektidentifiering och Produktigenkänning.

Bildklassificering

Bildklassificering är en funktion för visuellt innehåll där en modell tränas att förutsäga en etikett för en bild baserat på innehållet i hela bilden. Vanligtvis relaterar klassetiketten till bildens huvudämne, men enskilda användningsfall kan variera.

Följande bilder klassificeras till exempel baserat på vilken typ av frukt de innehåller.

Diagram with three labeled photographs of fruit, classified as Apple, Banana, and Orange.

Modeller kan tränas för klassificering med flera klasser (där det finns flera klasser, men varje bild bara kan tillhöra en klass) eller klassificering med flera etiketter (där en bild kan associeras med flera etiketter).

Objektidentifiering

Objektidentifiering är en form av visuellt innehåll där en modell tränas att identifiera förekomsten och platsen för en eller flera objektklasser i en bild. Till exempel kan ett AI-aktiverat kassasystem i en livsmedelsbutik behöva identifiera typen och platsen för de artiklar som köps.

A photograph of fruit with the location and type of fruits detected.

Det finns två komponenter för objektidentifiering:

Klassetiketten för varje objekt som identifieras i bilden. Du kan till exempel förutsäga att en bild innehåller ett äpple och två apelsiner.
Platsen för varje objekt i bilden, som anges som koordinater för en avgränsningsruta som omger objektet.

Produktigenkänning

Produktigenkänning fungerar på samma sätt som objektidentifiering, men med förbättrad noggrannhet för produktetiketter och varumärken. Förutsägelserna för produktigenkänning har både klassetiketten och platsen, så att du kan veta var i bilden produkten finns.

Förstå anpassade modelltyper

Bildklassificering

Objektidentifiering

Produktigenkänning

Feedback