Was ist der Azure KI-Gesichtserkennungsdienst?

Artikel
09/03/2024

Der Azure KI-Gesichtserkennungsdienst verfügt über KI-Algorithmen zum Ermitteln, Erkennen und Analysieren menschlicher Gesichter in Bildern. Gesichtserkennungssoftware ist in zahlreichen Szenarien wichtig, z. B. Identifikation, berührungslose Zugangskontrolle und automatische Gesichtsunschärfe aus Datenschutzgründen.

Sie können den Gesichtserkennungsdienst über ein Clientbibliothek-SDK oder durch einen direkten Aufruf der REST-API nutzen. Im Schnellstart erfahren Sie mehr zu den ersten Schritten.

Schnellstart

Alternativ können Sie die Funktionen des Gesichtserkennungsdiensts mit Vision Studio ganz schnell und einfach in Ihrem Browser ausprobieren.

Vision Studio für die Gesichtserkennung testen

Achtung

Der Zugriff auf den Gesichtserkennungsdienst ist auf der Grundlage von Berechtigungs- und Nutzungskriterien begrenzt, um unsere Prinzipien für verantwortungsvolle KI zu unterstützen. Der Gesichtserkennungsdienst ist nur für von Microsoft verwaltete Kunden und Partner verfügbar. Verwenden Sie das Aufnahmeformular für die Gesichtserkennung, um sich für den Zugriff zu bewerben. Weitere Informationen finden Sie auf der Seite Eingeschränkter Zugriff auf die Gesichtserkennung.

Diese Dokumentation enthält die folgenden Arten von Artikeln:

In den Schnellstarts finden Sie Schritt-für-Schritt-Anleitungen, mit denen Sie Aufrufe an den Dienst senden können und in kurzer Zeit Ergebnisse erhalten.
Die Anleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.
Die konzeptionellen Artikel enthalten ausführliche Erläuterungen der Funktionen und Features eines Diensts.
Die Tutorials sind ausführlichere Leitfäden, in denen die Verwendung dieses Diensts als Komponente in umfassenderen Unternehmenslösungen veranschaulicht wird.

Folgen Sie einem Trainingsmodul für Gesichtserkennung, wenn Ihnen eine strukturiertere Herangehensweise besser gefällt:

Erkennen und Analysieren von Gesichtern mit dem Dienst zur Gesichtserkennung

Beispiele für Anwendungsfälle

Im Folgenden finden Sie häufige Anwendungsfälle für den Gesichtserkennungsdienst:

Überprüfen der Benutzeridentität: Überprüfen sie eine Person anhand eines vertrauenswürdigen Gesichtsbilds. Diese Überprüfung kann verwendet werden, um Zugriff auf digitale oder physische Objekte zu gewähren, wie ein Bankkonto oder Zugang zu einem Gebäude. In den meisten Fällen könnte das vertrauenswürdige Gesichtsbild von einer vom Staat ausgestellten ID wie einem Reisepass oder Führerschein stammen, oder es könnte aus einem Registrierungsfoto stammen, das persönlich aufgenommen wurde. Während der Überprüfung kann die Liveness-Erkennung eine wichtige Rolle bei der Überprüfung spielen, um zu überprüfen, ob das Bild von einer echten Person stammt, nicht von einem gedruckten Foto oder einer Maske. Weitere Details zur Überprüfung mit Liveness finden Sie im Lernprogramm zur Liveness. Um die Identitätsüberprüfung ohne Liveness zu überprüfen, folgen Sie dem Schnellstart.

Livenesserkennung: Die Livenesserkennung ist ein Antispoofing-Feature, das überprüft, ob ein Benutzer physisch vor der Kamera vorhanden ist. Diese Funktion wird verwendet, um Spoofingangriffe mit einem gedruckten Foto, einem aufgezeichneten Video oder einer 3D-Maske des Gesichts des Benutzers zu verhindern. Tutorial zu Liveness

Kontaktlose Zugangskontrolle: Im Vergleich zu heutigen Lösungen wie Karten oder Tickets ermöglicht die Gesichtserkennung eine verbesserte Zugangskontrolle, während gleichzeitig die Hygiene- und Sicherheitsrisiken durch das Teilen, den Verlust oder den Diebstahl einer Karte reduziert werden. Die Gesichtserkennung unterstützt den Eincheckprozess von Personen beim Einchecken in Flughäfen, Stadien, Vergnügungsparks, Gebäuden, Rezeptionen von Bürogebäuden, Krankenhäusern, Fitnessstudios, Clubs oder Schulen.

Gesichtsbearbeitung: Erkannte Gesichter von Personen, die in einem Video aufgezeichnet wurden, werden bearbeitet oder unscharf gemacht, um ihre Privatsphäre zu schützen.

Warnung

Am 11. Juni 2020 kündigte Microsoft an, dass keine Technologie zur Gesichtserkennung mehr an die Polizeibehörden in den USA verkauft wird, bis es eine strenge, auf den Menschenrechten basierende Regelung gibt. Daher dürfen Kunden keine Gesichtserkennungsfeatures oder in Azure-Diensten enthaltenen Funktionen (wie Gesichtserkennung oder Video Indexer) verwenden, wenn es sich bei dem Kunden um eine Polizeibehörde in den USA handelt oder wenn der Kunde die Nutzung derartiger Dienste durch oder für eine Polizeibehörde zulässt. Wenn Sie eine neue Gesichtserkennung-Ressource erstellen, müssen Sie im Azure-Portal bestätigen und sich damit einverstanden erklären, dass Sie den Dienst nicht bei oder für eine Polizeibehörde in den Vereinigten Staaten verwenden, und dass Sie die „Responsible AI“-Dokumentation gelesen haben und diesen Dienst gemäß dieser Dokumentation nutzen werden.

Gesichtserkennung und Analyse

Die Gesichtserkennung ist in allen anderen Szenarien als erster Schritt erforderlich. Mit der Erkennungs-API können menschliche Gesichter in einem Bild erkannt und die Rechteckkoordinaten ihrer Positionen zurückgegeben werden. Außerdem wird eine eindeutige ID zurückgegeben, die die gespeicherten Gesichtserkennungsdaten darstellt. Diese werden in späteren Vorgängen verwendet, um Gesichter zu identifizieren oder zu überprüfen.

Optional können bei der Gesichtserkennung auch verschiedene Gesichtsattribute extrahiert werden, z. B. die Kopfhaltung, das Alter, Emotionen, die Gesichtsbehaarung und Brillen. Bei diesen Attributen handelt es sich um allgemeine Vorhersagen, nicht um tatsächliche Klassifizierungen. Einige Attribute sind nützlich, um sicherzustellen, dass Ihre Anwendung qualitativ hochwertige Gesichtsdaten erhält, wenn Benutzer*innen sich selbst zu einem Gesichtserkennung-Dienst hinzufügen. Beispielsweise kann Ihre Anwendung Benutzer*innen empfehlen, ihre Sonnenbrille abzunehmen, wenn sie eine tragen.

Achtung

Microsoft hat Gesichtserkennungsfunktionen eingestellt oder eingeschränkt, mit denen sich emotionale Zustände und Identitätsattribute ableiten lassen, die bei missbräuchlicher Nutzung zu einer Stereotypisierung oder Diskriminierung von Personen oder zu einer unlauteren Verweigerung von Dienstleistungen führen können. Die eingestellten Funktionen gelten für Emotion und Geschlecht. Die eingeschränkten Funktionen betreffen Alter, Lächeln, Gesichtsbehaarung, Haare und Make-up. Senden Sie eine E-Mail an die Azure-API für die Gesichtserkennung, wenn Sie über einen verantwortungsvollen Anwendungsfall verfügen, der von der Verwendung einer der eingeschränkten Funktionen profitieren würde. Weitere Informationen zu dieser Entscheidung finden Sie hier.

Weitere Informationen zur Gesichtserkennung und -analyse finden Sie im Artikel zu den Konzepten der Gesichtserkennungs-API. Lesen Sie auch die Referenzdokumentation zur Erkennungs-API.

Mit Vision Studio können Sie die Features zur Gesichtserkennung ganz schnell und einfach in Ihrem Browser testen.

Vision Studio für die Gesichtserkennung testen

Liveness-Erkennung

Wichtig

Die Face-Client-SDKs für Liveness sind ein eingeschränktes Feature. Sie müssen den Zugriff auf das Liveness-Feature anfordern, indem Sie das Aufnahmeformular für die Gesichtserkennung ausfüllen. Wenn Ihrem Azure-Abonnement Zugriff gewährt wird, können Sie das Face Liveness-SDK herunterladen.

Mithilfe der Erkennung von Face Liveness lässt sich bestimmen, ob ein Gesicht in einem Eingabevideostream echt (lebendig) oder eine Fälschung (Spoof) ist. Dies ist ein wichtiger Baustein in einem biometrischen Authentifizierungssystem, um Spoofingangriffe von Betrüger*innen zu verhindern, die versuchen, mithilfe eines Fotos, eines Videos, einer Maske oder einer anderen Imitationsmethode Zugriff auf das System zu erlangen.

Die Liveness-Erkennung soll sicherstellen, dass das System zum Zeitpunkt der Authentifizierung mit einer physisch anwesenden, echten Person interagiert. Solche Systeme werden aufgrund der zunehmenden Nutzung von digitalen Finanzen, Remotezugriffssteuerung und Onlineidentitätsüberprüfung immer wichtiger.

Die Liveness-Erkennungslösung schützt erfolgreich vor einer Vielzahl von Spooftypen – von Papierausdrucken über 2D/3D-Masken bis hin zu Spoofpräsentationen auf Smartphones und Laptops. Die Liveness-Erkennung ist ein aktiver Forschungsbereich, und es werden kontinuierlich Verbesserungen vorgenommen, um immer ausgefeilteren Spoofingangriffen entgegenzuwirken. Für den Client und die Dienstkomponenten werden im Laufe der Zeit immer wieder Verbesserungen bereitgestellt, da die gesamte Lösung immer besser darin wird, neue Arten von Angriffen abzuwehren.

Unsere Liveness-Erkennungslösung erfüllt die Anforderungen nach iBeta Level 1 und 2 ISO/IEC 30107-3.

Lernprogramm

Konzepte Tutorial für Gesichts-Liveness
Missbrauchsüberwachung

Referenzdokumente zum Face Liveness SDK:

Vorgänge der Gesichtserkennung

Moderne Unternehmen und Apps können die Gesichtserkennungstechnologien verwenden, einschließlich Gesichtsüberprüfung („1:1“-Abgleich) und Gesichtsidentifikation („1:n“-Abgleich), um zu bestätigen, dass ein Benutzer die Person ist, die er sein möchte.

Wichtig

Wenn Sie Microsoft-Produkte oder -Dienste zur Verarbeitung biometrischer Daten verwenden, sind Sie für Folgendes verantwortlich: (i) Unterrichten der betroffenen Personen, auch über die Aufbewahrungsfristen und die Vernichtung; (ii) Einholen der Zustimmung der betroffenen Personen und (iii) Löschen der biometrischen Daten, soweit dies nach den geltenden Datenschutzvorschriften angemessen und erforderlich ist. „Biometrische Daten“ hat die in Artikel 4 der Datenschutz-Grundverordnung (DSGVO) und gegebenenfalls in anderen Datenschutzvorschriften festgelegte Bedeutung. Weitere Informationen finden Sie unter Daten und Datenschutz bei der Gesichtserkennung.

Identifikation

Die Gesichtserkennung kann den „1:n“-Abgleich eines Gesichts in einem Bild mit einer Gruppe von Gesichtern in einem sicheren Repository adressieren. Übereinstimmungskandidaten werden basierend auf der Genauigkeit der Übereinstimmung ihrer Gesichtsdaten mit dem Abfragegesicht zurückgegeben. Dieses Szenario wird verwendet, um einer bestimmten Gruppe von Personen Zugang zu einem Gebäude oder zum Flughafen zu gewähren oder den Benutzer eines Geräts zu überprüfen.

Die folgende Abbildung enthält ein Beispiel für eine Datenbank mit dem Namen "myfriends". Jede Gruppe kann bis zu 1 Million unterschiedliche Personenobjekte enthalten. Für jedes Personenobjekt können bis zu 248 Gesichter registriert sein.

Raster mit drei Spalten für unterschiedliche Personen, jeweils mit drei Zeilen mit Bildern von Gesichtern

Nachdem Sie eine Gruppe erstellt und trainiert haben, können Sie die Identifizierung eines neuen erkannten Gesichts anhand der Gruppe durchführen. Wenn das Gesicht als eine Person aus der Gruppe erkannt wird, wird das Personenobjekt zurückgegeben.

Überprüfung

Der Überprüfungsvorgang beantwortet die Frage „Gehören diese beiden Gesichter zu derselben Person?“.

Bei der Überprüfung erfolgt auch ein 1:1-Abgleich eines Gesichts in einem Bild mit einem einzelnen Gesicht in einem sicheren Repository oder Foto, um sicherzustellen, dass es sich um die gleiche Person handelt. Die Überprüfung kann zur Zugriffssteuerung verwendet werden, z. B bei einer Banking-App, mit der Benutzer*innen ein Bankkonto remote eröffnen können, indem sie ein neues Bild von sich selbst machen und es mit einem Bild ihres Ausweises senden. Sie kann auch als endgültige Überprüfung der Ergebnisse eines Identifikations-API-Aufrufs verwendet werden.

Weitere Informationen zur Gesichtserkennung finden Sie im Konzeptleitfaden zur Gesichtserkennung oder in der Referenzdokumentation zur Identify- und Verify-API.

Suchen ähnlicher Gesichter

Der Vorgang „Ähnliches suchen“ ermöglicht einen Abgleich zwischen einem Zielgesicht und mehreren Kandidatengesichtern, um eine Untermenge von Gesichtern zu ermitteln, die dem Zielgesicht ähnlich sind. Dies ist hilfreich, wenn eine Gesichtserkennungssuche anhand von Bildern durchgeführt werden soll.

Der Dienst unterstützt die beiden Arbeitsmodi matchPerson und matchFace. Im Modus matchPerson werden ähnliche Gesichter zurückgegeben, nachdem mit der Überprüfungs-API nach derselben Person gefiltert wurde. Im Modus matchFace wird der Filter für dieselbe Person ignoriert. Er gibt eine Liste mit ähnlichen Kandidatengesichtern zurück, die nicht unbedingt zu derselben Person gehören müssen.

Das folgende Beispiel zeigt das Zielgesicht:

Lächelnde Frau

Und diese Bilder sind die Kandidatengesichter:

Fünf Bilder mit lächelnden Personen. Bild A und Bild B zeigen dieselbe Person.

Für die Suche nach vier ähnlichen Gesichtern gibt der Modus matchPerson A und B zurück. Diese zeigen dieselbe Person wie das Zielgesicht. Im Modus matchFace werden A, B, C und D zurückgegeben, also genau vier Kandidaten – auch wenn es sich teilweise um andere Personen handelt oder die Ähnlichkeit nur gering ist. Weitere Informationen finden Sie in der Referenzdokumentation zur Find Similar-API.

Gruppieren von Gesichtern

Mit dem Gruppierungsvorgang wird eine Gruppe von unbekannten Gesichtern anhand der Ähnlichkeit in kleinere Gruppen aufgeteilt. Jede Gruppe ist eine zusammenhanglose korrekte Teilmenge der ursprünglichen Gesichtergruppe. Außerdem wird ein einzelnes „messyGroup“-Array zurückgegeben, das die Gesichts-IDs enthält, für die keine Ähnlichkeiten gefunden wurden.

Für alle Gesichter einer zurückgegebenen Gruppe ist die Wahrscheinlichkeit hoch, dass sie zu derselben Person gehören, aber es kann für eine Person auch mehrere unterschiedliche Gruppen geben. Diese Gruppen werden durch einen anderen Faktor unterschieden, z. B. den Ausdruck. Weitere Informationen finden Sie in der Referenzdokumentation zur Gruppen-API.

Eingabeanforderungen

Allgemeine Anforderungen an die Bildeingabe:

Als Eingabebildformate werden JPEG, PNG, GIF (der erste Frame), BMP unterstützt.
Die Bilddateien dürfen maximal 6 MB groß sein.

Eingabeanforderungen für die Gesichtserkennung:

Die minimal erkennbare Gesichtsgröße beträgt 36×36 Pixel auf einem Bild, das selbst nicht größer als 1.920×1.080 Pixel sein darf. Auf Bildern, die größer als 1.920×1.080 Pixel sind, ist eine proportional größere minimale Gesichtsgröße möglich. Eine Verkleinerung der Gesichtsgröße kann dazu führen, dass einige Gesichter nicht erkannt werden, selbst wenn sie größer als die minimal erkennbare Gesichtsgröße sind.
Die maximal erkennbare Gesichtsgröße beträgt 4.096×4.096 Pixel.
Gesichter außerhalb der Größenspanne von 36×36 bis 4.096×4.096 Pixel werden nicht erkannt.

Eingabeanforderungen für die Gesichtserkennung:

Einige Gesichter können möglicherweise aufgrund von Bildkompositionen wie den folgenden nicht erkannt werden:
- Bilder mit extremer Beleuchtung (z. B. starkes Gegenlicht)
- Hindernisse, die ein oder beide Augen verdecken
- Unterschiede beim Haartyp oder der Gesichtsbehaarung
- Veränderungen am Gesicht (z. B. durch Alterung)
- Extreme Gesichtsausdrücke

Datenschutz und Sicherheit

Wie bei allen Azure KI Services-Ressourcen müssen Entwickler, die den Gesichtserkennungsdienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie im Microsoft Trust Center auf der Seite zu Azure KI Services.

Nächste Schritte

Befolgen Sie eine Schnellstartanleitung zum Codieren der Basiskomponenten einer Gesichtserkennungs-App in der Sprache Ihrer Wahl.