Panoramica della governance dei dati
La chiave per una corretta governance dei dati è suddividere i dati strutturati in entità di dati e aree del soggetto dei dati. È quindi possibile usare una soluzione di governance dei dati per racchiudere le entità dati e le aree dell'interessato specifiche con persone, processi, criteri e tecnologie. La soluzione consente di gestire i cicli di vita delle entità dati. La definizione di un vocabolario aziendale comune in un glossario all'interno del catalogo dati consente anche di gestire i dati.
La tecnologia del catalogo dati è fondamentale. Non è possibile gestire i dati se non si sa dove si trovano i dati o cosa significa. Il software del catalogo dati offre l'individuazione automatica dei dati, la profilatura automatica che determina la qualità dei dati e il rilevamento automatico dei dati sensibili. La tecnologia del catalogo dati consente anche di eseguire il mapping di dati diversi ai nomi e alle definizioni comuni dei dati del vocabolario nel glossario aziendale del catalogo per comprendere cosa significano i dati.
La classificazione dei dati classifica gli asset di dati assegnando etichette logiche o classi univoche in base al contesto aziendale. Esempi di etichette di classificazione o classi includono:
- Numero passaporto.
- Numero di patente del conducente.
- Numero di carta di credito.
- Codice SWIFT.
- Nome dell'individuo.
È possibile definire schemi di classificazione dei dati, ad esempio uno schema di classificazione della riservatezza dei dati nel catalogo dati. Per definire lo schema, associare criteri e regole nel catalogo a livelli di classificazione diversi.
Uno schema di classificazione della conservazione del ciclo di vita dei dati offre classificazioni di conservazione diverse per la gestione del ciclo di vita dei dati. Un'applicazione personalizzata del ciclo di vita del microservizio può usare questo schema per mantenere il ciclo di vita dei dati all'interno dell'ambiente.
Etichettare o contrassegnare gli attributi dei dati nel glossario aziendale con classificazioni di riservatezza e conservazione che specificano la governance. L'etichettatura di un attributo nel glossario definisce automaticamente come gestire i dati mappati all'attributo negli archivi dati sottostanti. Il catalogo dati esegue il mapping degli attributi dei dati fisici in archivi dati diversi agli attributi del glossario aziendale.
È possibile integrare più tecnologie con il catalogo dati per accedere a questi attributi e applicare criteri e regole in tutti gli archivi dati nel panorama dei dati distribuiti. È anche possibile applicare le stesse etichette di classificazione ai dati non strutturati.
Le entità dati master sono importanti perché i dati sono ampiamente condivisi. Le entità dati master sono spesso associate ai documenti. Cliente e fattura, fornitore e contratto, nonché asset e manuale operativo sono esempi di entità dati master e associazioni di documenti. Usando questo tipo di connessione, è possibile contrassegnare i documenti correlati con valori di dati master, ad esempio un nome fornitore, e mantenere le relazioni tra dati strutturati e non strutturati.
È possibile creare pipeline che creano asset di dati attendibili usando le entità dati di vocabolario comuni dal catalogo dati. È quindi possibile pubblicare questi asset in un marketplace di dati da condividere.
La chiave è che è possibile usare i metodi di governance dei dati disponibili per ottenere i dati sotto controllo. Una volta considerati attendibili i dati, è possibile usare i dati per determinare il valore. La modalità di organizzazione e coordinamento della governance dei dati determina il livello di successo.
Modello di maturità della governance dei dati
Il modello di maturità della governance dei dati descrive la maturità della capacità di coprire tutti gli aspetti di governance nel panorama dei dati. Le tabelle seguenti consentono di valutare la posizione corrente nel modello di maturità della governance dei dati.
Persone
Non regolamentato | Fase 1 | Fase 2 | Completamente regolamentato |
---|---|---|---|
Nessuno sponsor executive degli stakeholder | Sponsor degli stakeholder presente | Sponsor degli stakeholder presente | Sponsor degli stakeholder presente |
Nessun ruolo e responsabilità | Ruoli e responsabilità definiti | Ruoli e responsabilità definiti | Ruoli e responsabilità definiti |
Nessun comitato di controllo per la governance dei dati | Scheda di controllo della governance dei dati sul posto, ma nessun dato | Comitato di controllo della governance dei dati presente con dati | Comitato di controllo della governance dei dati presente con dati |
Nessun gruppo di lavoro per la governance dei dati | Nessun gruppo di lavoro per la governance dei dati | Alcuni gruppi di lavoro per la governance dei dati presenti | Tutti i gruppi di lavoro per la governance dei dati presenti |
Nessun proprietario di dati responsabile dei dati | Nessun proprietario di dati responsabile dei dati | Alcuni proprietari di dati presenti | Tutti i proprietari dei dati presenti |
Nessun amministratore dei dati nominato e responsabile della qualità dei dati | Alcuni amministratori dei dati vengono applicati per la qualità dei dati, ma l'ambito è troppo ampio, come l'intero reparto | Amministratori dei dati presenti e assegnati a gruppi di lavoro di governance dei dati per dati specifici | Amministratori dei dati presenti e assegnati a gruppi di lavoro di governance dei dati per dati specifici |
Nessun responsabile della la privacy dei dati | Nessun responsabile della la privacy dei dati | Responsabile della privacy responsabile della privacy, senza strumenti | Responsabile della privacy responsabile della privacy con strumenti |
Nessun responsabile della sicurezza dell'accesso | Reparto IT responsabile della sicurezza dell'accesso | Reparto sicurezza IT responsabile della sicurezza dell'accesso | Sicurezza IT responsabile della sicurezza dell'accesso e responsabile dell'applicazione della privacy |
Nessun produttore di asset di dati attendibile | Autore di dati identificato e responsabile della produzione di dati attendibili | Autore di dati identificato e responsabile della produzione di dati attendibili | Autore di dati identificato e responsabile della produzione di dati attendibili |
Nessun esperto in materia (PMI) identificato per le entità dati | Alcune PMI identificate, ma non coinvolte | Esperti di dominio identificati e appartenenti a gruppi di lavoro per la governance dei dati | Esperti di dominio identificati e appartenenti a gruppi di lavoro per la governance dei dati |
Process
Non regolamentato | Fase 1 | Fase 2 | Completamente regolamentato |
---|---|---|---|
Nessun vocabolario aziendale comune | Vocabolario aziendale comune iniziato in un glossario | Vocabolario aziendale comune stabilito | Vocabolario aziendale comune completo e gestito |
Nessun modo per conoscere la posizione, la qualità o la riservatezza dei dati | Individuazione automatica, profilatura e rilevamento dei dati sensibili del catalogo dati in alcuni sistemi | Individuazione automatica, profilatura e rilevamento dei dati sensibili del catalogo dati in tutti i dati strutturati | Individuazione automatica, profilatura e rilevamento dei dati sensibili del catalogo dati su dati strutturati e non strutturati in tutti i sistemi, con l'assegnazione automatica completa di tag |
Nessun processo per gestire la creazione o la manutenzione di criteri e regole | Governance della sicurezza dell'accesso ai dati, creazione di criteri e manutenzione in alcuni sistemi | Governance della sicurezza per l'accesso ai dati, privacy e creazione e manutenzione dei criteri di conservazione | Governance della sicurezza per l'accesso ai dati, privacy e creazione e manutenzione dei criteri di conservazione |
Nessun modo per applicare criteri e regole | Applicazione a fasi di regole e criteri di sicurezza per l'accesso ai dati tra sistemi senza integrazione del catalogo | Applicazione a fasi di regole e criteri di sicurezza per l'accesso ai dati e privacy tra sistemi con integrazione del catalogo | Applicazione di criteri e regole di sicurezza, privacy e conservazione per l'accesso ai dati in tutti i sistemi |
Nessun processo per monitorare la qualità dei dati, la privacy dei dati o la sicurezza dell'accesso ai dati | Alcune possibilità di monitorare la qualità dei dati, alcune possibilità di monitorare la privacy, ad esempio le query | Monitoraggio e gestione della qualità dei dati e della privacy dei dati nei sistemi principali con maschera del sistema di gestione dei database (DBMS) | Monitoraggio e amministrazione della qualità dei dati e della privacy dei dati in tutti i sistemi con maschera dinamica |
Nessuna disponibilità di asset di dati completamente attendibili | Sviluppo avviato per un piccolo set di asset di dati attendibili con software di data fabric | Diversi asset di dati attendibili di base creati con l'infrastruttura di dati | Distribuzione continua di asset di dati attendibili tramite il marketplace dei dati aziendali |
Nessun modo per sapere se si verifica una violazione dei criteri o un processo se si verifica | Rilevamento delle violazioni di sicurezza per l'accesso ai dati in alcuni sistemi | Rilevamento delle violazioni di sicurezza per l'accesso ai dati in tutti i sistemi | Rilevamento delle violazioni di sicurezza per l'accesso ai dati in tutti i sistemi |
Nessun processo di test delle vulnerabilità | Processo limitato di test delle vulnerabilità | Processo di test della vulnerabilità per tutti i sistemi | Processo di test della vulnerabilità per tutti i sistemi |
Nessun processo comune per la creazione, la manutenzione e la sincronizzazione dei dati master | Gestione dei dati master (MDM) con processi comuni di creazione, lettura, aggiornamento ed eliminazione (CRUD) e sincronizzazione per singole entità | MDM con processi CRUD e di sincronizzazione dei dati master comuni per alcune entità dati | MDM con processi CRUD e di sincronizzazione dei dati master comuni per tutte le entità dati master |
Criteri
Non regolamentato | Fase 1 | Fase 2 | Completamente regolamentato |
---|---|---|---|
Nessuno schema di classificazione della governance dei dati in materia di riservatezza e conservazione | Schema di classificazione della governance dei dati per la riservatezza | Schema di classificazione della governance dei dati in materia sia di riservatezza sia di conservazione | Schema di classificazione della governance dei dati in materia sia di riservatezza sia di conservazione |
Nessun tipo di criteri e regole per la governance della qualità dei dati | Criteri e regole per la governance della qualità dei dati iniziata nel vocabolario comune nel glossario aziendale | Criteri e regole per gestire la qualità dei dati definita nel vocabolario comune nel glossario aziendale del catalogo | Criteri e regole per gestire la qualità dei dati definita nel vocabolario comune nel glossario aziendale del catalogo |
Nessun tipo di criteri e regole per gestire la sicurezza dell'accesso ai dati | Alcuni criteri e regole per gestire la sicurezza dell'accesso ai dati creati in tecnologie diverse | Criteri e regole per gestire la sicurezza dell'accesso ai dati consolidata nel catalogo dati usando uno schema di classificazione | Criteri e regole per gestire la sicurezza dell'accesso ai dati consolidata nel catalogo dati usando uno schema di classificazione e applicato ovunque |
Nessun tipo di criteri e regole per la governance della privacy dei dati | Alcuni criteri e regole per la governance della privacy dei dati | Criteri e regole per gestire la privacy dei dati consolidati nel catalogo dati usando uno schema di classificazione | Criteri e regole per gestire la privacy dei dati consolidata nel catalogo dati usando uno schema di classificazione e applicato ovunque |
Nessun tipo di criteri e regole per la governance della conservazione dei dati | Alcuni criteri e regole per la governance della conservazione dei dati | Criteri e regole per gestire la conservazione dei dati consolidata nel catalogo dati usando uno schema di classificazione | Criteri e regole per gestire la conservazione dei dati consolidata nel catalogo dati usando schemi di classificazione e applicati ovunque |
Nessun tipo di criteri e regole per gestire la manutenzione dei dati master | Criteri e regole per gestire la manutenzione dei dati master per una singola entità dati master | Criteri e regole per gestire la manutenzione dei dati master per alcune entità dati master | Criteri e regole per gestire la manutenzione dei dati master per tutte le entità dati master |
Tecnologia
Non regolamentato | Fase 1 | Fase 2 | Completamente regolamentato |
---|---|---|---|
Nessun catalogo dati con individuazione automatica dei dati, profilatura e rilevamento dei dati sensibili | Catalogo dati con individuazione automatica dei dati, profilatura e rilevamento dei dati sensibili acquistato | Catalogo dati con individuazione automatica dei dati, profilatura e rilevamento dei dati sensibili acquistato | Catalogo dati con individuazione automatica dei dati, profilatura e rilevamento dei dati sensibili acquistato |
Nessun software di infrastruttura dati con connettività perimetrali e data center multicloud | Software di infrastruttura di dati con connettività perimetrale e data center multicloud e integrazione del catalogo acquistato | Software di infrastruttura di dati con connettività perimetrale e data center multicloud e integrazione del catalogo acquistato | Software di infrastruttura di dati con connettività perimetrale e data center multicloud e integrazione del catalogo acquistato |
Nessuna derivazione dei metadati | Derivazione dei metadati disponibile nel catalogo dati per gli asset attendibili sviluppati tramite l'infrastruttura | Derivazione dei metadati disponibile nel catalogo dati per gli asset attendibili sviluppati tramite l'infrastruttura | Derivazione dei metadati disponibile nel catalogo dati per gli asset attendibili sviluppati tramite l'infrastruttura |
Nessuno strumento di amministrazione dei dati | Strumenti di amministrazione dei dati disponibili come parte del software di infrastruttura dati | Strumenti di amministrazione dei dati disponibili come parte del software di infrastruttura dati | Strumenti di amministrazione dei dati disponibili come parte del software di infrastruttura dati |
Nessuno strumento di sicurezza dell'accesso ai dati | Sicurezza dell'accesso ai dati in più tecnologie | Sicurezza dell'accesso ai dati in più tecnologie | Sicurezza dell'accesso ai dati applicata in tutti i sistemi |
Nessun software di implementazioone della privacy dei dati | Nessun software di implementazioone della privacy dei dati | Software di applicazione della privacy dei dati in alcuni sistemi di gestione dei database | Software di applicazione della privacy dei dati in tutti gli archivi dati |
Nessun sistema MDM | Sistema MDM a entità singola | Sistema MDM multientity | Sistema MDM multientity |
Riepilogo della maturità della governance dei dati
Dopo aver determinato la posizione attuale nel modello di maturità della governance, incontrare gli stakeholder principali per eseguire il mapping di una strategia per aumentare la maturità. Per iniziare, definire i requisiti, la tecnologia, la qualità dei dati, i metadati, la condivisione dei dati e la strategia master dei dati.