Esercitazione: Registrare gli asset di dati in Azure Data Catalog

Importante

Azure Data Catalog è stato ritirato il 15 maggio 2024.

Per le funzionalità del catalogo dati, usare il servizio Microsoft Purview, che offre una governance unificata dei dati per l'intero patrimonio di dati.

Questa esercitazione descrive come usare lo strumento di registrazione per registrare gli asset di dati dell'esempio di database con il catalogo. La registrazione è il processo di estrazione dei metadati strutturali chiave, quali nomi, tipi e percorsi, dall'origine dati e dagli asset che contiene e di copia dei metadati nel catalogo. Le origini dati e gli asset di dati rimangono dove sono, ma i metadati vengono usati dal catalogo per renderli più facilmente individuabili e comprensibili.

In questa esercitazione apprenderai a:

  • Registrare gli asset di dati
  • Eseguire ricerche negli asset di dati
  • Annotare gli asset di dati
  • Connettersi agli asset di dati
  • Gestire gli asset di dati
  • Eliminare gli asset di dati

Prerequisiti

Per configurare Data Catalog, l'utente deve essere proprietario o comproprietario di una sottoscrizione di Azure.

Registrare gli asset di dati

Registrazione di un'origine dati

In questo esempio, gli asset di dati (tabelle) verranno registrati da un esempio di database per il database SQL di Azure, ma è possibile usare qualsiasi origine dati supportata se si preferisce lavorare con dati noti e più attinenti al proprio ruolo. Per un elenco di origini dati supportate, vedere: Origini dati supportate.

Il nome del database usato in questa esercitazione è RLSTest.

È ora possibile registrare gli asset di dati dall'esempio di database usando Azure Data Catalog.

  1. Passare alla home page di Azure Data Catalog e selezionare Pubblica dati.

    Il catalogo dati è aperto con il pulsante Pubblica dati selezionato.

  2. Selezionare Avvia applicazione per scaricare, installare ed eseguire lo strumento di registrazione nel computer.

    Nella pagina Pubblica dati è selezionato il pulsante Avvia applicazione.

  3. Nella pagina iniziale selezionare Accedi e immettere le credenziali.

    Nella pagina iniziale è selezionato il pulsante Accedi.

  4. Nella pagina Microsoft Azure Data Catalog selezionare SQL Server e quindi Avanti.

    Nella pagina Catalogo dati di Microsoft Azure è selezionato il pulsante SQL Server. Viene quindi selezionato il pulsante successivo.

  5. Immettere le proprietà della connessione a SQL Server per l'esempio di database nel database SQL di Azure e selezionare CONNETTI.

    Nella pagina delle proprietà di connessione del server S Q L le caselle di testo sono evidenziate per questi attributi: Nome server, Nome utente, Password e Database. Viene quindi selezionato il pulsante Connetti.

  6. Registrare i metadati degli asset di dati. In questo esempio vengono registrati oggetti Product dallo spazio dei nomi dell'esempio:

    1. Nell'albero Gerarchia server espandere l'esempio di database e selezionare SalesLT.

    2. Selezionare Product, ProductCategory, ProductDescription e ProductModel usando CTRL+selezione.

    3. Selezionare la freccia verso destra (>) per spostare la selezione. Questa azione sposta tutti gli oggetti selezionati nell'elenco Oggetti da registrare .

      Nella gerarchia server è selezionata l'opzione Sales L T. Quindi, nell'elenco Oggetti disponibili, il prodotto, la categoria di prodotti, la descrizione del prodotto, il modello di prodotto e la produzione di modelli producono oggetti descrizione sono tutti evidenziati. Viene quindi selezionato lo spostamento selezionato >.

    4. Selezionare Includi anteprima per includere un'anteprima sotto forma di snapshot dei dati. Lo snapshot include fino a 20 record di ogni tabella e viene copiato nel catalogo.

    5. Selezionare Includi profilo dati per includere uno snapshot delle statistiche per il profilo dei dati, ad esempio valori minimi, massimi e medi per una colonna e il numero di righe.

    6. Nel campo Aggiungi tag immettere sales, product, azure sql. Questa azione aggiunge i tag di ricerca per gli asset di dati. I tag sono un modo eccezionale per consentire agli utenti di trovare un'origine dati registrata.

    7. Specificare il nome di un esperto per i dati (facoltativo).

      Negli oggetti da registrare vengono visualizzati i nomi seguenti: prodotto, categoria di prodotti, descrizione del prodotto, modello di prodotto e descrizione del prodotto del modello di prodotto. Vengono quindi selezionate le opzioni 'Includi anteprima' e 'Includi profilo dati'. Vengono quindi aggiunti tre tag al campo tag: sales, product e Azure SQL.

    8. Selezionare REGISTRA. Nel Catalogo dati di Azure vengono registrati gli oggetti selezionati. In questo esercizio vengono registrati gli oggetti selezionati nell'esempio di database. Lo strumento di registrazione estrae i metadati dall'asset di dati e li copia nel servizio Azure Data Catalog. I dati non vengono rimossi e rimangono sotto il controllo degli amministratori e dei criteri del sistema di origine.

      Nella finestra Catalogo dati di Microsoft Azure tutti gli oggetti appena registrati vengono visualizzati nell'elenco Oggetti da registrare. Nella parte superiore della finestra è presente una notifica che informa che il processo per registrare gli oggetti selezionati è terminato. Viene quindi selezionato il pulsante Visualizza portale.

    9. Per visualizzare gli oggetti origine dati registrati, selezionare Visualizza portale. Nel portale di Azure Data Catalog verificare che tutte e quattro le tabelle e il database siano visualizzati nella griglia (verificare che la barra di ricerca sia vuota).

      Nella finestra Catalogo dati di Microsoft Azure sono disponibili nuovi riquadri nella visualizzazione griglia per ognuno degli oggetti registrati.

In questo esercizio sono stati registrati gli oggetti dell'esempio di database per il database SQL di Azure in modo che possano essere facilmente individuati dagli utenti dell'organizzazione.

Nel prossimo esercizio verrà illustrato come individuare gli asset di dati registrati.

Individuare gli asset di dati

L'individuazione in Azure Data Catalog usa due meccanismi principali: ricerca e filtri.

La ricerca è stata progettata in modo da essere intuitiva ed efficiente. Per impostazione predefinita, i termini di ricerca vengono confrontati con qualsiasi proprietà del catalogo, tra cui le annotazioni indicate dall'utente.

I filtri sono progettati per completare la ricerca. Gli utenti possono selezionare caratteristiche specifiche, ad esempio esperti, tipo di origine dati, tipo di oggetto e tag, per visualizzare gli asset di dati corrispondenti e per limitare i risultati della ricerca agli asset corrispondenti.

Usando una combinazione di ricerca e filtri, gli utenti possono spostarsi rapidamente tra le origini dati registrate con Azure Data Catalog.

In questo esercizio si userà il portale di Azure Data Catalog per individuare gli asset di dati registrati nell'esercizio precedente. Per informazioni dettagliate sulla sintassi di ricerca, vedere Riferimento alla sintassi di ricerca in Data Catalog .

Ecco alcuni esempi di individuazione degli asset di dati nel catalogo.

La ricerca di base consente di eseguire ricerche nel catalogo con uno o più termini di ricerca. I risultati sono gli asset che corrispondono alle proprietà di uno o più termini specificati.

  1. Selezionare Home nel portale di Azure Data Catalog. Se il Web browser è stato chiuso, passare alla home page di Azure Data Catalog.

  2. Nella casella di ricerca immettere product e premere INVIO.

    Nel portale di Azure Data Catalog è selezionato il pulsante Home. Quindi, nella casella di ricerca 'product' è stato immesso.

  3. Verificare che tutte e quattro le tabelle e il database siano visualizzati nei risultati. È possibile passare dalla visualizzazione griglia alla visualizzazione elenco e viceversa selezionando i pulsanti sulla barra degli strumenti, come illustrato nella figura seguente. Si noti che la parola chiave di ricerca è evidenziata nei risultati della ricerca perché l'opzione Evidenzia è ATTIVATA. È anche possibile specificare il numero di risultati per pagina nei risultati della ricerca.

    Nella barra di ricerca

    Il pannello Ricerche è visualizzato a sinistra e il pannello Proprietà a destra. Il pannello Ricerche consente di modificare i criteri di ricerca e filtrare i risultati. Il pannello Proprietà visualizza le proprietà di un oggetto selezionato nella griglia o nell'elenco.

  4. Selezionare Product nei risultati della ricerca. Selezionare le schede Anteprima, Colonne, Profilo dati e Documentazione oppure usare la freccia per espandere il riquadro in basso.

    Nella parte superiore dei risultati della ricerca è selezionato il pulsante 'Anteprima'.

    Nella scheda Anteprima viene visualizzata un'anteprima dei dati nella tabella Product.

  5. Selezionare la scheda Colonne per informazioni dettagliate sulle colonne dell'asset di dati, ad esempio nome e tipo di dati.

  6. Selezionare la scheda Profilo dati per visualizzare informazioni dettagliate sui dati dell'asset di dati, ad esempio numero di righe, dimensioni dei dati o valore minimo in una colonna.

Individuare gli asset di dati con la ricerca dell'ambito della proprietà

L'ambito della proprietà consente di individuare gli asset di dati in cui il termine di ricerca corrisponde alla proprietà specificata.

  1. Deselezionare il filtro Tabella in Tipo oggetto in Filtri.

  2. Nella casella di ricerca immettere tags:product e premere INVIO. Per informazioni su tutte le proprietà che possono essere usate per le ricerche nel catalogo dati, vedere Riferimento alla sintassi di ricerca in Data Catalog .

  3. Verificare che le tabelle e il database siano visualizzati nei risultati.

    'Tags : product' viene immesso nella barra di ricerca e il filtro Tipo oggetto indica che 'Table' è stato selezionato.

  1. Nella sezione Ricerca corrente del riquadro Ricerche immettere un nome per la ricerca e selezionare Salva.

    Nel riquadro ricerche 'Ricerca tag prodotto' è stato immesso come nome per la ricerca. Viene quindi selezionato il pulsante

  2. Verificare che la ricerca salvata venga visualizzata in Ricerche salvate.

  3. Selezionare una delle azioni che possono essere eseguite sulla ricerca salvata, ovvero Rinomina, Elimina o Salva come predefinita.

Raggruppamento con parentesi

Il raggruppamento con parentesi consente di raggruppare parti della query per ottenere l'isolamento logico, in particolare con operatori booleani.

  1. Nella casella di ricerca immettere name:product AND (tags:product AND objectType:table) e premere INVIO.

  2. Verificare che nei risultati della ricerca venga visualizzata solo la tabella Product .

    Nella barra di ricerca è stato immesso 'nome: product AND (tag : prodotto AND oggetto Tipo: tabella )'. La tabella product è l'unico risultato della ricerca restituito.

Operatori di confronto

Gli operatori di confronto consentono di usare confronti diversi dall'uguaglianza per le proprietà che hanno dati di tipo numero e data.

  1. Nella casella di ricerca immettere lastRegisteredTime:>"06/09/2016".

  2. Deselezionare il filtro Tabella in Tipo oggetto.

  3. Premere INVIO.

  4. Verificare che nei risultati della ricerca siano visibili le tabelle Product, ProductCategory e ProductDescription, oltre al database SQL registrato.

    Nella barra di ricerca ultima ora registrata: è stato immesso > 09/06/2016. Le tabelle Product, Product Category, Product Description sono state restituite. È stato restituito anche il database S Q L.

Per informazioni dettagliate sull'individuazione di asset di dati, vedere Come individuare gli asset di dati. Per altre informazioni sulla sintassi di ricerca, vedere Informazioni di riferimento sulla sintassi di ricerca di Data Catalog.

Annotare gli asset di dati

In questo esercizio verrà usato il portale di Azure Data Catalog per annotare gli asset di dati esistenti nel catalogo, con informazioni come descrizioni, tag o esperti. Le annotazioni integrano i metadati strutturali estratti dall'origine dati durante la registrazione. Con le annotazioni gli asset di dati diventano molto più facili da individuare e interpretare.

In questo esercizio verrà annotato un singolo asset di dati (ProductPhoto). Verranno aggiunti un nome descrittivo e una descrizione all'asset di dati ProductPhoto.

  1. Passare alla home page di Azure Data Catalog ed eseguire una ricerca con tags:product per trovare gli asset di dati registrati.

  2. Selezionare ProductModel nei risultati della ricerca.

  3. Immettere Product images nel campo Nome descrittivo e Product photos for marketing materials nel campo Descrizione.

    Nel riquadro Proprietà vengono visualizzati il nome, il nome descrittivo e la descrizione della risorsa selezionata. Le informazioni sono modificabili.

    Il contenuto del campo Descrizione consente ad altri utenti di individuare l'asset di dati selezionato e di comprendere perché e come usarlo. È anche possibile aggiungere altri tag e visualizzare le colonne. È possibile cercare e filtrare le origini dati usando i metadati descrittivi aggiunti al catalogo.

In questa pagina è anche possibile eseguire queste operazioni:

  • Aggiungere esperti per l'asset di dati. Selezionare Aggiungi nell'area Esperti.

  • Aggiungere tag a livello di set di dati. Selezionare Aggiungi nell'area Tag. Un tag può essere un tag utente o un tag di glossario. L'edizione Standard di Azure Data Catalog include un glossario aziendale che consente agli amministratori del catalogo di definire una tassonomia aziendale centrale. Gli utenti del catalogo possono quindi annotare gli asset di dati con i termini di glossario. Per altre informazioni, vedere Come configurare il glossario aziendale per l'assegnazione di tag regolamentata

  • Aggiungere tag a livello di colonna. Selezionare Aggiungi in Tag per la colonna da annotare.

  • Aggiungere una descrizione a livello di colonna. Immettere una Descrizione per una colonna. È anche possibile visualizzare i metadati di descrizione estratti dall'origine dati.

  • In Richiedi accesso specificare in che modo gli utenti devono richiedere l'accesso all'asset di dati.

  • Fare clic sulla scheda Documentazione e specificare la documentazione per l'asset di dati. La documentazione di Azure Data Catalog consente di usare il catalogo dati come repository di contenuti per creare un testo descrittivo completo degli asset di dati.

È anche possibile aggiungere un'annotazione a più asset di dati. È ad esempio possibile selezionare tutti gli asset di dati registrati e specificare un esperto per gli asset.

La casella di controllo nella riga del titolo della tabella dei risultati è selezionata. Tutti gli asset restituiti sono stati selezionati quando questa casella di controllo nella riga del titolo è stata selezionata. Le modifiche apportate alla finestra

Azure Data Catalog supporta un approccio di tipo crowdsourcing alle annotazioni. Qualsiasi utente di Data Catalog può aggiungere tag (utente o glossario), descrizioni e altri metadati. In questo modo, gli utenti aggiungono la loro idea degli asset di dati e del relativo uso e possono condividerla con altri utenti.

Per informazioni dettagliate sull'annotazione di asset di dati, vedere Come annotare gli asset di dati .

Connettersi agli asset di dati

In questo esercizio, gli asset di dati verranno aperti in uno strumento client integrato (Excel) e in uno strumento non integrato (SQL Server Management Studio) usando le informazioni di connessione.

Nota

È importante ricordare che Azure Data Catalog non consente di accedere all'origine dati effettiva, ma ne semplifica l'individuazione e la comprensione. Quando ci si connette a un'origine dati, l'applicazione client scelta usa le credenziali di Windows oppure richiede le credenziali in base alla necessità. Se all'utente non è stato concesso in precedenza l'accesso all'origine dati, dovrà essere concesso per consentirne la connessione.

Connettersi a un asset di dati da Excel

  1. Selezionare Product nei risultati della ricerca. Selezionare Apri in sulla barra degli strumenti e quindi Excel.

    Il prodotto viene selezionato nella tabella dei risultati restituiti. Il pulsante Apri in è selezionato ed è selezionato Excel dal menu a discesa.

  2. Selezionare Apri nella finestra popup di download. Questa esperienza potrebbe variare in base al browser.

  3. Nella finestra Avviso di sicurezza di Microsoft Excel selezionare Abilita.

    Nel popup Avviso di sicurezza di Microsoft Excel è selezionato il pulsante Abilita.

  4. Mantenere i valori predefiniti nella finestra di dialogo Importa dati e selezionare OK.

    Nella finestra di dialogo Importa dati selezionare O K.

  5. Visualizzare l'origine dati in Excel.

    Tutti i dati vengono visualizzati nella tabella di Excel.

SQL Server Management Studio

In questo esercizio ci si connetterà agli asset di dati individuati usando Azure Data Catalog. Il portale di Azure Data Catalog consente di connettersi direttamente usando le applicazioni client integrate nel menu Apri in . È anche possibile connettersi con qualsiasi applicazione scelta usando le informazioni sulla località della connessione incluse nei metadati dell'asset. È ad esempio possibile usare SQL Server Management Studio per connettersi al database SQL di Azure e accedere ai dati degli asset di dati registrati in questa esercitazione.

  1. Aprire SQL Server Management Studio.

  2. Nella finestra di dialogo Connetti al server immettere il nome del server presente nel riquadro Proprietà del portale di Azure Data Catalog.

  3. Usare l'autenticazione e le credenziali appropriate per accedere agli asset di dati. Se non è possibile accedere, usare le informazioni nel campo Richiedi accesso per ottenere l'accesso.

    Nella finestra di dialogo Informazioni di connessione è evidenziato il campo Richiedi accesso.

Selezionare Visualizza stringhe di connessione per visualizzare e copiare negli Appunti le stringhe di connessione ADO.NET, ODBC e OLEDB da usare nell'applicazione.

Gestire gli asset di dati

In questo passaggio verrà illustrato come configurare la sicurezza per gli asset di dati. Data Catalog non consente agli utenti di accedere ai dati stessi. Il proprietario dell'origine dati controlla l'accesso ai dati.

È possibile usare Azure Data Catalog per trovare le origini dati e di visualizzare i metadati correlati alle origini registrate nel catalogo. Potrebbero esserci situazioni tuttavia in cui le origini dati devono essere visibili solo a utenti specifici o ai membri di gruppi specifici. Per questi scenari, è possibile usare Data Catalog per acquisire la proprietà degli asset di dati registrati e controllare la visibilità degli asset di cui si è proprietari.

Nota

Le funzionalità di gestione descritte in questo esercizio sono disponibili solo nell'Edizione Standard di Azure Data Catalog e non nell'Edizione gratuita. In Azure Data Catalog è possibile assumere la proprietà di asset di dati, aggiungere comproprietari ad asset di dati e impostare la visibilità degli asset di dati.

Assumere la proprietà di asset di dati e limitarne la visibilità

  1. Passare alla home page di Azure Data Catalog. Nella casella di testo di ricerca immettere tags:cycles e premere INVIO.

  2. Selezionare un elemento nell'elenco risultati e quindi Diventa proprietario sulla barra degli strumenti.

  3. Nella sezione Gestione del pannello Proprietà selezionare Diventa proprietario.

    L'elemento Product viene selezionato nell'elenco dei risultati e nella scheda Proprietà, nella sezione Gestione, il pulsante Take Ownership (Proprietà) è evidenziato.

  4. Per limitare la visibilità, scegliere Proprietario e questi utenti nella sezione Visibilità e selezionare Aggiungi. Immettere gli indirizzi di posta elettronica degli utenti nella casella di testo e premere INVIO.

    Nella sezione Gestione della scheda Proprietà è selezionato il pulsante Aggiungi in Proprietari. Quindi, in Visibilità, viene selezionato il pulsante Proprietari e questi utenti. Viene quindi selezionato il pulsante Aggiungi in Visibilità.

Rimuovere gli asset di dati

In questo esercizio si userà il portale di Azure Data Catalog per rimuovere i dati di anteprima dagli asset di dati registrati ed eliminare gli asset di dati dal catalogo.

In Azure Data Catalog è possibile eliminare un singolo asset o più asset contemporaneamente.

  1. Passare alla home page di Azure Data Catalog.

  2. Nella casella di testo di ricerca immettere tags:cycles e premere INVIO.

  3. Selezionare un elemento nell'elenco risultati e selezionare Elimina sulla barra degli strumenti, come illustrato nella figura seguente:

    Il riquadro Prodotto viene selezionato da un elenco dei risultati di ricerca e il pulsante Elimina è selezionato nella barra degli strumenti superiore.

    Se si usa la visualizzazione elenco, la casella di controllo è a sinistra dell'elemento come illustrato nella figura seguente:

    Nella visualizzazione elenco la casella di selezione si trova a sinistra dell'elemento del risultato della ricerca. L'asset Prodotto è selezionato e il pulsante Elimina è selezionato nella barra degli strumenti superiore.

    È anche possibile selezionare più asset di dati ed eliminarli come illustrato nell'immagine seguente:

    Azure Data Catalog - Eliminare più asset di datiNella visualizzazione elenco sono stati selezionati più asset e il pulsante Elimina è selezionato nella barra degli strumenti superiore.

Nota

Il comportamento predefinito del catalogo consente a tutti gli utenti di registrare qualsiasi origine dati e consente a qualsiasi utente di eliminare qualsiasi asset di dati registrato. Le funzionalità di gestione incluse nell'Edizione Standard di Azure Data Catalog forniscono opzioni aggiuntive per acquisire la proprietà degli asset, limitando gli utenti che possono individuare ed eliminare gli asset.

Pulire le risorse

Seguire la procedura Rimuovere gli asset di dati per pulire tutti gli asset usati durante l'esercitazione.

Riepilogo

In questa esercitazione sono state analizzate le funzionalità di base di Azure Data Catalog, compresa la registrazione, l'annotazione, l'individuazione e la gestione di asset di dati aziendali. Ora che è stata completata l'esercitazione, è possibile iniziare. È possibile iniziare subito registrando le origini dati usate personalmente o dal team e invitando i colleghi a usare il catalogo.

Passaggi successivi