Individuare, connettere ed esplorare i dati in Synapse con Microsoft Purview

Articolo
05/20/2024

In questo documento viene mostrato il tipo di interazioni che è possibile eseguire durante la registrazione di un account Microsoft Purview in Synapse.

Prerequisiti

Usare Microsoft Purview in Synapse

Per usare Microsoft Purview in Synapse è necessario avere accesso a tale account Microsoft Purview. Synapse esegue il pass-through dell'autorizzazione di Microsoft Purview. Ad esempio, se si dispone di un ruolo delle autorizzazione come curatore, sarà possibile modificare i metadati analizzati da Microsoft Purview.

Individuazione dei dati: set di dati di ricerca

Per individuare i dati registrati e analizzati da Microsoft Purview è possibile usare la barra di ricerca in alto al centro dell'area di lavoro di Synapse. Assicurarsi di selezionare Microsoft Purview per cercare tutti i dati dell'organizzazione.

Azioni di Microsoft Purview

Ecco un elenco delle funzionalità di Microsoft Purview disponibili in Synapse:

Panoramica dei metadati
Visualizzare e modificare lo schema dei metadati con classificazioni, termini di glossario, tipi di dati e descrizioni
Visualizzare derivazione dei dati per comprendere le dipendenze ed eseguire l'analisi di impatto. Per altre informazioni vedere derivazione dei dati
Visualizzare e modificare Contatti per sapere chi è il proprietario o l’esperto di un set di dati
Risorse correlate per comprendere le dipendenze gerarchiche di un set di dati specifico. Questa esperienza è utile per esplorare la gerarchia dei dati.
Fare clic su Richiedi accesso per richiedere l'accesso ai dati attivando il flusso di lavoro per l’accesso self-service ai dati e configurato dall'amministratore del flusso di lavoro in Microsoft Purview. Per altre informazioni vedere Richiedere l'accesso e Flusso di lavoro per l’accesso self-service ai dati.

Azioni che è possibile eseguire sui set di dati con le risorse di Synapse

Connettere i dati a Synapse

È possibile creare un nuovo servizio collegato a Synapse. Questa azione sarà necessaria per copiare i dati in Synapse o nell'hub di dati (per origini dati supportate come ADLSg2)
Per oggetti come file, cartelle o tabelle, è possibile creare direttamente un nuovo set di dati di integrazione e sfruttare un servizio collegato esistente, se già creato

Non è ancora possibile dedurre se è presente un servizio collegato esistente o un set di dati di integrazione.

 Sviluppare in Synapse

È possibile eseguire tre azioni: Nuovo script SQL, Nuovo notebooke Nuovo flusso di dati.

In Nuovo script SQL, a seconda del tipo di supporto, è possibile:

Visualizzare le prime 100 righe per comprendere la forma dei dati.
Creare una tabella esterna dal database SQL di Synapse
Caricare i dati in un database SQL di Synapse

In Nuovo notebookè possibile:

Caricare i dati in un dataframe Spark
Creare una tabella Spark (se si esegue questa operazione in formato Parquet, viene creata anche una tabella del pool SQL serverless).

In Nuovo flusso di datiè possibile creare un set di dati di integrazione che può essere usato come origine dati in una pipeline del flusso di dati. Il flusso di dati è una capacità di sviluppo senza codice per eseguire la trasformazione dei dati. Per altre informazioni sull’ Uso del flusso di dati in Synapse.

Condividi tramite