Schnellstart: Erstellen einer Objekterkennung mit der Custom Vision-Website

Artikel
09/03/2024

In dieser Schnellstartanleitung erfahren Sie, wie Sie mithilfe der Custom Vision-Website ein Objekterkennungsmodell erstellen. Nachdem Sie ein Modell erstellt haben, können Sie es mit neuen Bildern testen und in Ihre eigene Bilderkennungs-App integrieren.

Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.

Voraussetzungen

Eine Reihe von Bildern, mit denen Sie Ihr Erkennungsmodell trainieren können. Sie können den Satz von Beispielbildern auf GitHub verwenden. Oder Sie können Ihre eigenen Bilder mithilfe der folgenden Tipps auswählen.
Ein unterstützter Webbrowser

Erstellen von Custom Vision-Ressourcen

Für die Verwendung des Custom Vision-Diensts müssen Sie in Azure Custom Vision-Trainings- und -Vorhersageressourcen erstellen. Füllen Sie hierzu im Azure-Portal das Dialogfeld auf der Seite Custom Vision erstellen aus, um sowohl eine Trainings- als auch eine Vorhersageressource zu erstellen.

Erstellen eines neuen Projekts

Navigieren Sie im Webbrowser zur Custom Vision-Webseite, und wählen Sie Sign in (Anmelden). Melden Sie sich mit demselben Konto an, mit dem Sie sich auch beim Azure-Portal angemeldet haben.

Abbildung der Anmeldeseite

Um Ihr erstes Projekt zu erstellen, wählen Sie New Project (Neues Projekt) aus. Das Dialogfeld Neues Projekt erstellen wird angezeigt.
Geben Sie einen Namen und eine Beschreibung für das Projekt ein. Wählen Sie dann Ihre Custom Vision-Trainingsressource aus. Wenn Ihr angemeldetes Konto einem Azure-Konto zugeordnet ist, werden in der Dropdownliste „Ressource“ alle Ihre kompatiblen Azure-Ressourcen angezeigt.

Hinweis

Wenn keine Ressource verfügbar ist, vergewissern Sie sich, dass Sie sich bei customvision.ai mit demselben Konto angemeldet haben, das Sie auch für die Anmeldung beim Azure-Portal verwendet haben. Stellen Sie darüber hinaus sicher, dass Sie auf der Custom Vision-Website dasselbe „Verzeichnis“ wie im Azure-Portal gewählt haben, in dem sich Ihre Custom Vision-Ressourcen befinden. An beiden Orten können Sie Ihr Verzeichnis jeweils oben rechts im Dropdownmenü mit den Konten auswählen.
Suchen Sie unter dem
Wählen Sie Object Detection (Objekterkennung) unter Project Types (Projekttypen) aus.

Wählen Sie dann eine der verfügbaren Domänen aus. Jede Domäne optimiert das Erkennungsmodul für bestimmte Bildtypen, wie in der folgenden Tabelle beschrieben. Sie können die Domäne bei Bedarf später ändern.

Domain	Zweck
Allgemein	Für eine Vielzahl von Aufgaben der Objekterkennung optimiert. Wenn keine der anderen Domänen geeignet erscheint oder Sie unsicher sind, welche Domäne Sie wählen sollen, verwenden Sie die allgemeine Domäne.
Logo	Für die Suche nach Markenlogos in Bildern optimiert.
Produkte in Regalen	Für die Erkennung und Klassifizierung von Produkten in Regalen optimiert.
Kompaktdomänen	Für die Bedingungen der Echtzeitobjekterkennung auf Mobilgeräten optimiert. Die von Kompaktdomänen generierten Modelle können für die lokale Ausführung exportiert werden.

Wählen Sie schließlich Create Project (Projekt erstellen) aus.

Auswählen von Trainingsbildern

Es wird empfohlen, im ersten Trainingssatz mindestens 30 Bilder pro Tag zu verwenden. Sie sollten auch einige zusätzliche Bilder sammeln, um Ihr Modell zu testen, nachdem es trainiert wurde.

Verwenden Sie zum effektiven Trainieren Ihres Modells Bilder mit optischer Vielfalt. Wählen Sie Bilder aus, die sich nach folgenden Aspekten unterscheiden:

Kamerawinkel
Belichtung
background
Visueller Stil
Einzelne/gruppierte Motive
size
type

Stellen Sie außerdem sicher, dass alle Ihre Trainingsbilder die folgenden Kriterien erfüllen:

JPG-, PNG-, BMP- oder GIF-Format
Höchstens 6 MB groß (4 MB für Vorhersagebilder)
Mindestens 256 Pixel an der kürzesten Seite; kürzere Bilder werden von Custom Vision Service automatisch hochskaliert.

Hochladen und Kennzeichnen von Bildern

In diesem Abschnitt werden Bilder hochgeladen und manuell gekennzeichnet, um das Erkennungsmodul zu trainieren.

Wählen Sie zum Hinzufügen von Bildern Bilder hinzufügen und anschließend Lokale Dateien durchsuchen aus. Wählen Sie Öffnen aus, um die Bilder hochzuladen.
Die hochgeladenen Bilder werden im Abschnitt Ohne Markierungen der Benutzeroberfläche angezeigt. Der nächste Schritt besteht darin, die Objekte manuell zu kennzeichnen, die vom Erkennungsmodul erkannt werden sollen. Wählen Sie das erste Bild aus, um das Dialogfenster für das Tagging zu öffnen.
Ziehen Sie ein Auswahlrechteck um das Objekt in Ihrem Bild. Geben Sie dann mit der Schaltfläche + einen neuen Tagnamen ein, oder wählen Sie ein vorhandenes Tag aus der Dropdownliste aus. Es ist wichtig, jede Instanz der Objekte, die Sie erkennen möchten, zu kennzeichnen, da das Erkennungsmodul den nicht gekennzeichneten Hintergrundbereich beim Trainieren als negatives Beispiel verwendet. Wenn Sie mit dem Tagging fertig sind, wählen Sie den Pfeil rechts aus, um Ihre Tags zu speichern und zum nächsten Bild zu gelangen.

Zum Hochladen eines weiteren Bildersatzes kehren Sie zum Anfang dieses Abschnitts zurück und wiederholen die Schritte.

Trainieren des Erkennungsmoduls

Um das Erkennungsmodell zu trainieren, wählen Sie die Schaltfläche Trainieren aus. Das Erkennungsmodul verwendet alle aktuellen Bilder und deren Tags zum Erstellen eines Modells, das die einzelnen gekennzeichneten Objekte identifiziert. Dieser Vorgang kann mehrere Minuten dauern.

Die Schaltfläche „Trainieren“ oben rechts auf der Header-Symbolleiste der Webseite

Der Trainingsprozess sollte nur wenige Minuten dauern. Während dieser Zeit werden auf der Registerkarte Leistung Informationen über den Trainingsprozess angezeigt.

Das Browserfenster mit einem Trainingsdialogfeld im Hauptteil

Auswerten des Erkennungsmoduls

Nach Abschluss des Trainings wird die Leistung des Modells berechnet und angezeigt. Custom Vision Service verwendet die Bilder, die Sie zum Training gesendet haben, zur Berechnung von Genauigkeit, Trefferquote und mittlerer durchschnittlicher Genauigkeit. Genauigkeit und Trefferquote sind zwei unterschiedliche Messungen der Wirksamkeit eines Erkennungsmoduls:

Die Genauigkeit gibt den Anteil der richtig identifizierten Klassifizierungen an. Beispiel: Wenn das Modell 100 Bilder als Hunde identifiziert hat und 99 davon tatsächlich Hunde zeigten, beträgt die Genauigkeit 99 %.
Die Trefferquote gibt den Anteil der tatsächlichen Klassifizierungen an, die richtig identifiziert wurden. Beispiel: Wenn tatsächlich 100 Bilder von Äpfeln vorhanden sind und das Modell 80 davon als Äpfel identifiziert, beträgt die Trefferquote 80 %.
Die durchschnittliche Genauigkeit ist der Durchschnittswert der durchschnittlichen Genauigkeit (Average Precision, AP). Die durchschnittliche Genauigkeit ist der Bereich unterhalb der Kurve zu Genauigkeit/Abruf. (Für jede ausgeführte Vorhersage wird die Genauigkeit in Bezug auf den Abruf gezeichnet.)

Die Trainingsergebnisse zeigen Gesamtgenauigkeit, Trefferquote und mittlere durchschnittliche Genauigkeit an.

Wahrscheinlichkeitsschwellenwert

Beachten Sie den Schieberegler für den Wahrscheinlichkeitsschwellenwert im linken Bereich der Registerkarte Leistung. Dies ist das Maß an Vertrauen, das eine Vorhersage aufweisen muss, um als richtig betrachtet zu werden (zur Berechnung von Genauigkeit und Trefferquote).

Wenn Sie Vorhersageaufrufe mit einem hohen Wahrscheinlichkeitsschwellenwert interpretieren, neigen sie dazu, Ergebnisse mit hoher Genauigkeit auf Kosten der Trefferquote zu liefern. Die erkannten Klassifizierungen sind richtig, aber viele bleiben unerkannt. Ein niedriger Wahrscheinlichkeitsschwellenwert bewirkt das Gegenteil. Die meisten der tatsächlichen Klassifizierungen werden erkannt, aber es gibt mehr falsch positive Ergebnisse innerhalb dieser Menge. In diesem Sinne empfiehlt es sich, den Wahrscheinlichkeitsschwellenwert gemäß den spezifischen Anforderungen Ihres Projekts festzulegen. Wenn Sie später auf der Clientseite Vorhersageergebnisse erhalten, sollten Sie denselben Wahrscheinlichkeitsschwellenwert wie hier verwenden.

Überlappungsschwellenwert

Mit dem Schieberegler für den Überlappungsschwellenwert wird gesteuert, wie korrekt eine Objektvorhersage sein muss, damit sie beim Trainieren als korrekt betrachtet wird. Er legt die kleinstmögliche Überlappung zwischen dem vorhergesagten Objektbegrenzungsrahmen und dem tatsächlich vom Benutzer eingegebenen Begrenzungsrahmen fest. Wenn die Begrenzungsrahmen nicht in diesem Maße überlappen, wird die Vorhersage nicht als korrekt betrachtet.

Verwalten von Trainingsiterationen

Bei jedem Trainingsvorgang für Ihr Erkennungsmodul erstellen Sie eine neue Iteration mit eigenen aktualisierten Leistungsmetriken. Sie können alle Ihre Iterationen im linken Bereich der Registerkarte Leistung anzeigen. Im linken Bereich befindet sich auch die Schaltfläche Löschen, mit der Sie veraltete Iterationen löschen können. Beim Löschen einer Iteration werden auch alle Bilder gelöscht, die dieser eindeutig zugeordnet sind.

Informationen zum programmgesteuerten Zugriff auf die trainierten Modelle finden Sie unter Verwenden des Modells mit der Vorhersage-API.

Nächste Schritte

In diesem Quickstart haben Sie erfahren, wie Sie über die Custom Vision-Website ein Objekterkennungsmodell erstellen und trainieren. Informieren Sie sich als Nächstes über den iterativen Prozess zur Verbesserung Ihres Modells.

Testen und erneutes Trainieren eines Modells mit Custom Vision Service

Was ist Custom Vision?

Freigeben über