Creare un file campione EDM SIT (nuova esperienza)
La creazione e la creazione di un tipo di informazioni sensibili basato su EDM (Exact Data Match) (SIT) è un processo in più fasi. Possono essere usati nei criteri di prevenzione della perdita dei dati di Microsoft Purview, in eDiscovery e in alcune attività di governance del contenuto.
Consiglio
Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.
Si applica a
- Nuova esperienza
Se si vuole creare un SIT EDM usando l'esperienza classica, vedere Creare l'esperienza classica di EDM SIT.
Prima di iniziare
- Assicurarsi di aver completato i passaggi in Esportare i dati di origine per il tipo esatto di informazioni sensibili basate sulla corrispondenza dei dati.
Formattazione del file di esempio
Il sistema estrae i nomi delle colonne dal file di esempio per creare lo schema e consiglia di eseguire il mapping dei dati dei campi di esempio ai SIT di base. Deve essere formattato in modo identico al file di tabella delle informazioni sensibili di origine e deve contenere valori sintetici rappresentativi dei dati effettivi. Il file può essere salvato in .csv (valori delimitati da virgole), .tsv (valori separati da tabulazioni) o in formato separato da pipe (|), ma deve corrispondere al file di tabella delle informazioni sensibili all'origine effettivo. Il formato con estensione tsv è consigliato nei casi in cui i valori dei dati includono virgole, ad esempio indirizzi stradali.
- Usare circa 10-20 righe di dati per assicurarsi che il sistema disponga di esempi sufficienti per l'uso.
- I valori dei campi che contengono virgole devono essere racchiusi tra virgolette ".
- La prima riga deve essere la riga di intestazione e contenere i nomi di colonna.
- Il file deve contenere almeno una riga di dati.
- Ogni riga di dati deve contenere il numero corretto di campi, corrispondenti alle intestazioni.
- Il file di esempio può contenere fino a 32 colonne.
- Le dimensioni del file di esempio non possono superare i 2,5 MB.
- I nomi di colonna (campo) devono iniziare con una lettera, avere almeno tre caratteri di lunghezza e essere costituiti solo da caratteri alfanumerici (A-Z, a-z, 0-9) e non possono includere spazi, caratteri di sottolineatura o altri caratteri speciali.
Ad esempio, se i dati effettivi usano il formato delimitato da tabulazioni (con estensione tsv) e hanno un aspetto simile al seguente:
Il file di esempio deve quindi avere le stesse intestazioni di colonna, ma usare valori sintetici per le righe, come illustrato di seguito
FirstName | LastName | PatientNumber | CreditCardNumber |
---|---|---|---|
Eric | Salomone | 987-65-4321 | 9000000000000000 |
Lisa | Taylor | 123-45-6789 | 500000000000000 |
Andre | Lawson | 234-56-7890 | 200000000000000 |
Come usare i modelli di file di esempio
Se si usa il settore sanitario degli Stati Uniti, dei servizi finanziari degli Stati Uniti o del settore assicurativo statunitense, è possibile iniziare con i modelli di file di esempio seguenti per velocizzare il processo di creazione di file di esempio. Questi file contengono le intestazioni di colonna più usate nei rispettivi settori, nonché valori sintetici nei campi.
- Dati sanitari degli Stati Uniti
- Dati finanziari degli Stati Uniti
- Dati sulle assicurazioni statunitensi
Per usare questi modelli:
- Scaricare il modello di file di esempio per il settore.
- Confrontare le intestazioni di colonna nel modello con i dati di origine effettivi e selezionare quelli da usare come campi primari nel file di esempio personalizzato.
- Confrontare la formattazione dei dati di origine effettivi con la formattazione dei valori sintetici. Modificare la formattazione dei valori sintetici in modo che corrisponda alla formattazione dei valori dei dati di origine.
- Salvare il file di esempio personalizzato da usare quando si crea lo schema SIT EDM e il pacchetto di regole.
Consiglio
Quando si lavora nella nuova esperienza, è possibile caricare un file di esempio o immettere manualmente i valori del file di esempio. È consigliabile creare il file di esempio.
Passaggio successivo
- Per una nuova esperienza: Creare uno schema SIT EDM e un pacchetto di regole