Testen eines Typs vertraulicher Informationen mit genauer Datenübereinstimmung

Tipp

Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Starten Sie jetzt im Testhub für Microsoft Purview-Complianceportal. Erfahren Sie mehr über Anmelde- und Testbedingungen.

Gilt für

Nachdem Ihr vertraulicher Informationstyp (EDM) erstellt wurde und eine Stunde nach der Überprüfung, ob das Hochladen und Indizieren Ihrer Tabelle für vertrauliche Informationen abgeschlossen ist, können Sie testen, ob die zu schützenden Informationen erkannt werden, indem Sie die Test-Funktion im Abschnitt Vertrauliche Informationstypen im Microsoft Purview Compliance Portal verwenden.

Hinweis

Die Weitergabe von Änderungen an einer vorhandenen EDM SIT kann einige Zeit dauern. Wenn Sie Änderungen an einem EDM SIT vornehmen, um Erkennungsprobleme zu beheben, müssen Sie mindestens eine Stunde warten, nachdem Sie diese Änderungen vorgenommen haben, bevor Sie die Test-Funktion verwenden, um deren Auswirkungen zu überprüfen.

Unabhängig von der Methode, die Sie zum Testen verwenden, enthalten die Testergebnisse Übereinstimmungen sowohl für die spezifische EDM SIT als auch für die primären Elemente, die für diese EDM SIT konfiguriert sind.

Methoden zum Testen Ihrer EDM SIT

Es gibt zwei Methoden, die Sie verwenden können, um Ihre EDM SIT zu testen.

Methode Verfügbar in der neuen EDM-Benutzeroberfläche Verfügbar in der neuen und klassischen EDM-Benutzeroberfläche
SIT-Methode (Sensitive Information Type, Vertraulicher Informationstyp) Ja Ja
EDM-Klassifizierermethode Ja Nein

Hinweis

Wenn Sie die klassische EDM-Erfahrung verwenden, müssen Sie die SIT-Methode verwenden.

Testen einer EDM SIT mit der Methode "Typen vertraulicher Informationen"

Führen Sie die folgenden Schritte aus, um eine EDM SIT mit der Methode Vertraulicher Informationstypen zu testen.

Wählen Sie die entsprechende Registerkarte für das von Ihnen verwendete Portal aus. Weitere Informationen zum Microsoft Purview-Portal finden Sie im Microsoft Purview-Portal. Weitere Informationen zum Complianceportal finden Sie unter Microsoft Purview-Complianceportal.

  1. Melden Sie sich beim Microsoft Purview-Portal>an Information Protection>Klassifizierer>Vertrauliche Informationstypen.

  2. Wählen Sie ihre EDM SIT aus der Liste und dann das Symbol Test aus.

  3. Laden Sie im Flyoutbereich eine Datei hoch, die daten enthält, die Sie erkennen möchten. Erstellen Sie beispielsweise eine Datei, die eine Teilmenge der Zeilen in der Tabelle mit vertraulichen Informationen enthält. Wenn Sie das Feature für konfigurierbare Übereinstimmungen in Ihrem Schema verwendet haben, um ignorierte Trennzeichen zu definieren, stellen Sie sicher, dass die Beispieldatei Beispiele mit und ohne diese Trennzeichen enthält.

  4. Wählen Sie Testen aus.

  5. Nachdem die Datei hochgeladen und gescannt wurde, suchen Sie nach Übereinstimmungen mit Ihrem EDM SIT.

  6. Wenn die Test-Funktion in der SIT eine Übereinstimmung erkennt, überprüfen Sie, ob der SIT sie nicht abschneidet oder das übereinstimmende Element nicht falsch extrahiert. Häufige Probleme sind SITs, die:

    • Extrahieren Sie nur eine Teilzeichenfolge der vollständigen Zeichenfolge, die erkannt werden soll.
    • Nur das erste Wort in einer Zeichenfolge mit mehreren Wörtern aufnehmen
    • Hinzufügen zusätzlicher Symbole oder Zeichen in die Extraktion

Ausführliche Informationen zur Verwendung von regulären Ausdrücken finden Sie in der Schnellreferenz zur Sprache für reguläre Ausdrücke.

Testen Ihres EDM SIT mit der EDM Classifier-Methode

Wählen Sie die entsprechende Registerkarte für das von Ihnen verwendete Portal aus. Weitere Informationen zum Microsoft Purview-Portal finden Sie im Microsoft Purview-Portal. Weitere Informationen zum Complianceportal finden Sie unter Microsoft Purview-Complianceportal.

  1. Melden Sie sich beim Microsoft Purview-Portal>an Information Protection>Klassifiziererfür EDM-Klassifizierer>.

  2. Stellen Sie sicher, dass die Umschaltfläche Neue EDM-Erfahrung auf Ein festgelegt ist.

  3. Wählen Sie ihre EDM SIT aus der Liste und dann das Symbol Test aus.

  4. Laden Sie eine Datei hoch, die daten enthält, die Sie erkennen möchten. Erstellen Sie beispielsweise eine Datei, die eine Teilmenge der Zeilen in der Tabelle mit vertraulichen Informationen enthält. Wenn Sie das Feature für konfigurierbare Übereinstimmungen in Ihrem Schema verwendet haben, um ignorierte Trennzeichen zu definieren, stellen Sie sicher, dass Ihre Beispieldatei Beispiele mit und ohne diese Trennzeichen enthält.

  5. Nachdem die Datei hochgeladen und gescannt wurde, suchen Sie nach Übereinstimmungen mit Ihrem EDM SIT.

  6. Wenn die Test-Funktion in der SIT eine Übereinstimmung erkennt, überprüfen Sie, ob der SIT sie nicht abschneidet oder das übereinstimmende Element nicht falsch extrahiert. Häufige Probleme sind SITs, die:

    • Extrahieren Sie nur eine Teilzeichenfolge der vollständigen Zeichenfolge, die erkannt werden soll.
    • Nur das erste Wort in einer Zeichenfolge mit mehreren Wörtern aufnehmen
    • Hinzufügen zusätzlicher Symbole oder Zeichen in die Extraktion

Testen Ihrer EDM SIT mithilfe von PowerShell

Verwenden Sie zum Testen mit PowerShell das folgende PowerShell-Cmdlet:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Unabhängig von der Methode, die Sie zum Testen verwenden, enthalten die Testergebnisse Übereinstimmungen sowohl für die spezifische EDM SIT als auch für die primären Elemente, die für diese EDM SIT konfiguriert sind.

Hinweis

Wenn Sie einen vertraulichen EDM-Informationstyp oder den primären SIT-Typ erstellen oder bearbeiten, auf dem ein EDM-Typ basiert, werden alle neuen Inhalte (sowie Inhalte, die geändert werden, nachdem Sie Änderungen an den SITs vorgenommen haben) nach Inhalten durchforstet, die den neuen Definitionen entsprechen. Bereits vorhandene Inhalte werden jedoch erst durchforstet, wenn sie geändert oder erneut indiziert werden.

Um die erneute Durchforstung vorhandener Inhalte auf einer SharePoint-Website oder -Bibliothek oder in OneDrive zu erzwingen, befolgen Sie die Anweisungen unter Manuelles Anfordern der Durchforstung und Neuindizierung einer Website, einer Bibliothek oder einer Liste.

Testen Ihrer EDM SIT mit Informationsschutzrichtlinien

Sie können sehen, wo Ihr EDM SIT verwendet wird und wie genau es in der Produktion ist, indem Sie sie in Richtlinien verwenden:

  1. Erstellen Sie eine Richtlinie für automatische Bezeichnungen , und führen Sie sie in der Simulationsübersicht aus.

  2. Fügen Sie Einige Inhalte, die die EDM SIT auslösen, zusammen mit Inhalten, die die EDM SIT nicht auslösen, an einem Speicherort hinzu, den Ihre Richtlinie überwacht.

  3. Öffnen Sie die Registerkarte Zu überprüfende Elemente , um die Übereinstimmungen zu überprüfen.

  4. Optimieren Sie Ihre Richtlinien nach Bedarf.

Sobald Sie mit den Ergebnissen Ihrer Tests und Optimierungen zufrieden sind, ist Ihr EDM-basiertes benutzerdefiniertes SIT für die Verwendung in Informationsschutzrichtlinien für instance bereit:

Tipps zur Problembehandlung

Wenn Ihre EDM SIT keine Übereinstimmungen in Ihren Daten erkennt, können Ihnen die folgenden Tipps helfen, das Problem zu diagnostizieren.

Problem Tipps zur Problembehandlung
Keine Übereinstimmungen gefunden Vergewissern Sie sich, dass Ihre vertraulichen Daten ordnungsgemäß hochgeladen wurden, indem Sie die unter Hash erläuterten Befehle verwenden, und laden Sie die Quelltabelle vertraulicher Informationen hoch, um eine genaue Übereinstimmung mit vertraulichen Informationstypen zu ermitteln.
Keine Übereinstimmungen gefunden Testen Sie die SIT, die Sie verwendet haben, als Sie das primäre Element in jedem Ihrer Muster konfiguriert haben. Dieser Test überprüft, ob die SIT mit den Beispielen im Element übereinstimmen kann. Die Verwendung eines falsch definierten SIT als Klassifizierungselement einer EDM SIT ist die häufigste Ursache für Erkennungsfehler in EDM.
Die SIT, die Sie für ein primäres Element im EDM-Typ ausgewählt haben, findet keine Übereinstimmung im Element oder findet weniger Übereinstimmungen als erwartet. Vergewissern Sie sich, dass die SIT die Im Inhalt vorkommenden Trennzeichen und Trennzeichen unterstützt. Achten Sie darauf, die in Ihrem Schema definierten ignorierten Trennzeichen einzuschließen.
Die SIT, die Ihrem primären Element zugeordnet ist, findet Übereinstimmungen in Ihren Inhalten, die EDM SIT jedoch nicht.
  • Überprüfen Sie, ob Ihre REGEX-Anweisungen Leerzeichentrennzeichen am Anfang oder Ende eines Elements abfangen, das Sie erkennen möchten. Für instance suchen Sie nach Anweisungen, die das \s Trennzeichen enthalten. Wenn Leerzeichentrennzeichen enthalten sind, stimmt das Leerzeichen nicht mit dem Hashwert in der Datentabelle überein. Verwenden Sie stattdessen ein Worttrennzeichen, z \b. B. .
  • Überprüfen Sie Ihre REGEX-Anweisungen, um sicherzustellen, dass sie die gesamte Zeichenfolge erfassen, die Sie erkennen möchten, nicht nur eine Teilzeichenfolge. Betrachten Sie beispielsweise dieses Muster für E-Mail-Adressen: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Dieses Muster entspricht user@contoso.comordnungsgemäß , erfasst user@contoso.co.jp jedoch nur in unvollständiger Form.
Eine EDM SIT mit primären Elementen, aber ohne definierte sekundäre Elemente, erkennt Elemente, erkennt jedoch keine Übereinstimmungen (oder erkennt weniger Übereinstimmungen als erwartet), wenn sowohl primäre als auch sekundäre Elemente erforderlich sind. Wenn Werte in einer Spalte, die für sekundäre Nachweise verwendet wird, nicht aus einem einzelnen Wort oder aus Zeichenfolgen bestehen, die keine Leerzeichen, Kommas oder andere Worttrennzeichen enthalten, gibt es zwei Möglichkeiten, zu testen:
  1. Wählen Sie die Option für den Abgleich mit mehreren Token aus.
  2. Ordnen Sie die Werte einer SIT zu, die entweder ein REGEX verwendet, das zum Erkennen von Mehrwortzeichenfolgen entwickelt wurde, die dem gewünschten Muster folgen (z. B. einer festen Anzahl aufeinanderfolgender Wörter, die mit einem Großbuchstaben beginnen), oder einem Schlüsselwort (keyword) Wörterbuch, das alle eindeutigen Werte in dieser Spalte auflistet. Wenn beispielsweise eine zusätzliche Beweisspalte für die Stadt oder den Wohnsitz einer Person vorhanden ist, können Sie eine Liste mit allen eindeutigen Stadtnamen aus der Tabelle erstellen und diese dann verwenden, um einen wörterbuchbasierten vertraulichen Informationstyp zu erstellen.

Verwenden Sie dieses SIT als Klassifizierungselement für die entsprechende Spalte in Ihrem EDM SIT, indem Sie die EDM SIT-Definition in XML exportieren und bearbeiten. Weitere Informationen finden Sie unter Manuelles Erstellen eines Regelpakets.
Die SIT-Testfunktion erkennt überhaupt keine Übereinstimmungen. Vergewissern Sie sich, dass die ausgewählte SIT Anforderungen für zusätzliche Schlüsselwörter oder andere Überprüfungen enthält. Informationen zu integrierten SITs finden Sie unter Entitätsdefinitionen vertraulicher Informationstypen , um die Mindestanforderungen für den Abgleich der einzelnen Typen zu bestimmen.
Die Testfunktion funktioniert, aber Ihre SharePoint- oder OneDrive-Elemente werden nicht in DLP oder Regeln für automatische Bezeichnungen erkannt. Vergewissern Sie sich, dass die Dokumente, in denen Sie Übereinstimmungen finden, tatsächlich im Inhalts-Explorer angezeigt werden. Übereinstimmungen werden nur in Inhalten erkannt, die erstellt werden, nachdem Änderungen an sit angewendet wurden. Wenn also keine erwarteten Übereinstimmungen angezeigt werden, durchforsten Sie die Websites und Bibliotheken nach bereits vorhandenen Elementen erneut. Ausführliche Informationen zum erneuten Durchforsten von SharePoint und OneDrive finden Sie unter Manuelles Anfordern der Durchforstung und Neuindizierung einer Website, einer Bibliothek oder einer Liste.
DLP- oder Automatische Bezeichnungsregeln, die mehrere Übereinstimmungen erfordern, werden nicht ausgelöst. Stellen Sie sicher, dass die Näherungsanforderungen sowohl für Ihre EDM SIT als auch für die Basis-SITs erfüllt sind. Wenn beispielsweise der maximale Abstand zwischen dem primären Element und unterstützenden Schlüsselwörtern 300 Zeichen beträgt, die Schlüsselwörter jedoch nur in der ersten Zeile einer langen Tabelle vorhanden sind, erfüllen wahrscheinlich nur die ersten Zeilen übereinstimmender Werte die Näherungsanforderungen. Ändern Sie Ihre SIT-Definitionen, um gelockerte Näherungsregeln zu unterstützen, oder verwenden Sie die Option Überall im Dokument für die zusätzlichen Beweisbedingungen.
Die Erkennung einer EDM SIT ist inkonsistent oder unregelmäßig. Stellen Sie sicher, dass die SIT, die Sie als Basis für das primäre Element in Ihrer EDM SIT verwendet haben, keine unnötigen Inhalte erkennt. Die Verwendung eines SIT-Werts, der mit zu vielen nicht verknüpften Inhalten übereinstimmt, z. B. ein beliebiges Wort, eine beliebige Zahl oder alle E-Mail-Adressen, kann dazu führen, dass der Dienst relevante Übereinstimmungen ignoriert. Überprüfen Sie die Anzahl der Inhaltselemente, die dem vertraulichen Typ entsprechen, den Sie für Ihre primären Elemente im Inhalts-Explorer verwendet haben.

Gehen Sie wie folgt vor, um zu schätzen, ob die SIT mit zu vielen Inhalten übereinstimmt:
  1. Dividieren Sie die Anzahl der Inhaltselemente im microsoft Purview-Explorer durch die Anzahl der Tage seit der Erstellung des vertraulichen Typs.
  2. Wenn die Anzahl der Übereinstimmungen pro Tag im Bereich von Hunderttausenden oder mehr liegt, ist es möglich, dass der primäre SIT-Wert zu breit ist.

Empfehlungen und bewährte Methoden für die Auswahl des richtigen vertraulichen Informationstyps für eine EDM SIT finden Sie unter Informationen zu genauen, auf datenübereinstimmungsbasierten Typen vertraulicher Informationen.