Mirroring del catalogo Unity di Azure Databricks (anteprima)

Articolo
11/19/2024

Molte organizzazioni registrano oggi i dati in Unity Catalog all'interno di Azure Databricks. Un catalogo Unity con mirroring in Fabric consente al cliente di leggere i dati gestiti da Unity Catalog dai carichi di lavoro di Fabric. Azure Databricks e Fabric sono migliori insieme.

Per un'esercitazione sulla configurazione dell'area di lavoro di Azure Databricks per il mirroring del catalogo Unity in Fabric, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Azure Databricks (anteprima).

I database con mirroring in Fabric consentono agli utenti di usufruire di un prodotto end-to-end altamente integrato e facile da usare progettato per semplificare le esigenze di analisi. È possibile usufruire di un prodotto facile da usare progettato per semplificare le esigenze di analisi e creare una collaborazione tra Microsoft Fabric e Azure Databricks.

Quando si usa Fabric per leggere i dati registrati in Unity Catalog, non esiste alcuna replica di dati o spostamento dati. Solo la struttura del catalogo di Azure Databricks viene sottoposta a mirroring in Fabric e i dati del catalogo sottostanti sono accessibili tramite collegamenti. Di conseguenza, tutte le modifiche apportate ai dati vengono riflesse immediatamente in Fabric.

Quali esperienze di analisi sono integrate

I cataloghi con mirroring sono un elemento di Fabric Archiviazione dati distinto dall'endpoint di analisi warehouse e SQL.

Quando si esegue il mirroring di un catalogo Unity di Azure Databricks, Fabric crea tre elementi:

Elemento di Azure Databricks con mirroring
Un endpoint di analisi SQL in un Lakehouse
Un modello semantico predefinito

È possibile accedere ai dati di Azure Databricks con mirroring in diversi modi:

Ogni elemento di Azure Databricks con mirroring ha un endpoint di analisi SQL generato automaticamente che offre un'esperienza analitica avanzata creata dal processo di mirroring. Usare i comandi T-SQL per definire ed eseguire query sugli oggetti dati dall'endpoint di analisi SQL di sola lettura.
Usare Power BI con la modalità Direct Lake per creare report sull'elemento di Azure Databricks.

Sincronizzazione dei metadata

Quando si crea un nuovo database con mirroring da Azure Databricks in Fabric, per impostazione predefinita, l'opzione Sincronizza automaticamente le modifiche future del catalogo per lo schema selezionato è abilitata. Le modifiche ai metadati seguenti vengono riflesse dall'area di lavoro di Azure Databricks a Fabric se la sincronizzazione automatica è abilitata:

Aggiunta di schemi a un catalogo.
Eliminazione di schemi da un catalogo.
Aggiunta di tabelle a uno schema.
Eliminazione di tabelle da uno schema.

Selezione schema/tabella:

Per impostazione predefinita, l'intero catalogo viene selezionato quando l'utente aggiunge il catalogo.
L'utente può escludere determinate tabelle all'interno dello schema.
Se si deseleziona uno schema, tutte le tabelle all'interno dello schema vengono deselezionate.
Se l'utente torna indietro e seleziona lo schema, tutte le tabelle all'interno dello schema vengono nuovamente selezionate.
Lo stesso comportamento di selezione si applica agli schemi all'interno di un catalogo.

Esistono altre condizioni di filtraggio applicate a cataloghi/schemi/tabelle:

Le viste materializzate e le tabelle di streaming non verranno visualizzate.
Le tabelle esterne che non supportano il formato Delta non verranno visualizzate.

Condividi tramite

Mirroring del catalogo Unity di Azure Databricks (anteprima)

Quali esperienze di analisi sono integrate

Sincronizzazione dei metadata

Commenti e suggerimenti

Risorse aggiuntive

Condividi tramite

Mirroring del catalogo Unity di Azure Databricks (anteprima)

Quali esperienze di analisi sono integrate

Sincronizzazione dei metadata

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive