Che cos'è il mirroring in Fabric?

Articolo
11/08/2024

Come soluzione di replica dei dati, il mirroring in Fabric è una soluzione a basso costo e a bassa latenza per riunire i dati di vari sistemi in una singola piattaforma di analisi. È possibile replicare continuamente il patrimonio di dati esistente direttamente in OneLake di Fabric, inclusi i dati di database SQL di Azure, Azure Cosmos DB, Azure Databricks e Snowflake.

Con i dati più aggiornati in un formato interrogabile in OneLake, è ora possibile usare tutti i diversi servizi in Fabric, ad esempio l'esecuzione di analisi con Spark, l'esecuzione di notebook, l'ingegneria dei dati, la visualizzazione tramite report di Power BI e altro ancora.

Il mirroring in Fabric consente di usufruire di un prodotto end-to-end altamente integrato e facile da usare, progettato per semplificare le esigenze di analisi. Progettato per l'apertura e la collaborazione tra Microsoft e le soluzioni tecnologiche in grado di leggere il formato di tabella Delta Lake open source, il mirroring è una soluzione chiavi in mano a basso costo e a bassa latenza che consente di creare una replica dei dati in OneLake utilizzabile per tutte le esigenze analitiche.

Le tabelle Delta possono quindi essere usate ovunque in Fabric, consentendo agli utenti di accelerare il percorso in Fabric.

Perché usare il mirroring in Fabric?

Oggi molte organizzazioni hanno dati operativi o analitici cruciali nei silo.

L'accesso e l'uso di questi dati oggi richiede pipeline ETL (Extract, Transform and Load, Estrazione, trasformazione e carico), processi aziendali e silo decisionali complessi, che producono:

Accesso limitato e riservato a dati importanti, in continua evoluzione
Attrito tra persone, processi e tecnologia
Tempi di attesa lunghi per creare pipeline di dati e processi per dati importanti e critici
Nessuna libertà di usare gli strumenti necessari per analizzare e condividere in modo pratico le informazioni dettagliate
Mancanza di una base adeguata per le persone che operano in condivisione e collaborazione sui dati
Nessun formato di dati comune e aperto per tutti gli scenari analitici: BI, IA, integrazione, progettazione e persino app

Il mirroring in Fabric offre un'esperienza semplice per accelerare il time-to-value delle informazioni dettagliate e delle decisioni, ma anche per suddividere i silo di dati tra le soluzioni tecnologiche:

Replica near real-time dei dati in un data lake SaaS, con analisi predefinite per BI e IA

La piattaforma Microsoft Fabric è fondata su una base di Software as a Service (SaaS), che introduce un livello completamente nuovo di semplicità e integrazione. Per altre informazioni su Microsoft Fabric, vedere Che cos'è Microsoft Fabric?

Il mirroring crea tre elementi nell'area di lavoro di Fabric:

Il mirroring gestisce la replica dei dati in OneLake e la conversione in Parquet, in un formato pronto per l'analisi. Questo consente scenari downstream quali ingegneria dei dati, data science e altri.
Un endpoint di Analisi SQL
Un modello semantico predefinito

Oltre alla Editor di query SQL di Microsoft Fabric, è disponibile un ampio ecosistema di strumenti, tra cui SQL Server Management Studio, Azure Data Studio e GitHub Copilot.

La condivisione consente il controllo e la gestione dell’accessibilità per poter controllare l'accesso alle informazioni riservate. La condivisione inoltre consente di democratizzare e rendere sicure le decisioni nell'organizzazione.

Attualmente sono disponibili i database esterni seguenti:

Piattaforma	Replica near real-time	Esercitazione end-to-end
Database con mirroring di Microsoft Fabric da Azure Cosmos DB (anteprima)	Sì	Esercitazione: Azure Cosmos DB
Database con mirroring di Microsoft Fabric da Azure Databricks (anteprima)	Sì	Esercitazione: Azure Databricks
Database con mirroring di Microsoft Fabric da database SQL di Azure (anteprima)	Sì	Esercitazione: Database SQL di Azure
Database con mirroring di Microsoft Fabric da Snowflake	Sì	Esercitazione: Snowflake

Come funziona la replica near real-time del mirroring?

Il mirroring è abilitato creando una connessione sicura all'origine dati operativa. L’utente sceglie se replicare un intero database o le singole tabelle e il mirroring manterrà automaticamente sincronizzati i dati. Dopo la configurazione, i dati verranno replicati in modo continuo in OneLake per l'utilizzo di analisi.

Di seguito sono riportati i principi fondamentali del mirroring:

L'abilitazione del mirroring in Fabric è semplice e intuitiva e non richiede di creare pipeline ETL complesse, allocare altre risorse di calcolo e gestire lo spostamento dati.
Il mirroring in Fabric è un servizio gestito in modo completo, pertanto non è necessario preoccuparsi di ospitare, mantenere o gestire la replica del collegamento con mirroring.

Se la condivisione consente il controllo e la gestione dell’accessibilità, i controlli come la sicurezza a livello di riga (RLS), la protezione a livello di oggetto (OLS) e altri assicurano la possibilità di controllare l'accesso alle informazioni riservate. La condivisione inoltre consente di democratizzare e rendere sicure le decisioni nell'organizzazione.

Mediante la condivisione, gli utenti concedono ad altri utenti o a un gruppo di utenti l'accesso a un database con mirroring senza concedere l'accesso all'area di lavoro e al resto degli elementi. Quando qualcuno condivide un database con mirroring, concede l'accesso anche all'endpoint di analisi SQL e al modello semantico predefinito associato.

Accedere alla finestra di dialogo Condivisione con il pulsante Condividi accanto al nome del database con mirroring nella visualizzazione Area di lavoro. I database con mirroring condivisi sono disponibili tramite l'hub dati di OneLake o la sezione Condivisi con l'utente corrente in Microsoft Fabric.

Per altre informazioni, vedere Condividere il magazzino e gestire le autorizzazioni.

Query tra database

Con i dati del database con mirroring archiviati in OneLake, è possibile scrivere query tra database, unire dati dai database con mirroring, magazzini e endpoint di analisi SQL di Lakehouse in una singola query T-SQL. Per altre informazioni, vedere Scrivere una query tra database.

Ad esempio, è possibile fare riferimento alla tabella dai database con mirroring e dai magazzini usando la denominazione in tre parti. Nell'esempio seguente usare il nome in tre parti per fare riferimento a ContosoSalesTable nel magazzino ContosoWarehouse. Da altri database o magazzini, la prima parte della convenzione di denominazione standard di SQL in tre parti è il nome del database con mirroring.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Ingegneria dei dati con i dati di database con mirroring

Microsoft Fabric offre varie funzionalità di ingegneria dei dati per garantire che i dati siano facilmente accessibili, ben organizzati e di alta qualità. Da Ingegneria dei dati di Fabric è possibile:

Creare e gestire i dati come Spark usando un lakehouse
Progettare pipeline per copiare dati in un lakehouse
Usare le definizioni dei processi di Spark per inviare un processo batch/streaming al cluster Spark
Usare i notebook per scrivere codice per l'inserimento, la preparazione e la trasformazione dei dati

Data Science con i dati del database con mirroring

Microsoft Fabric offre Synapse Data Science per consentire agli utenti di completare flussi di lavoro di data science end-to-end ai fini dell'arricchimento dei dati e dell’approfondimento azienda. È possibile completare un'ampia gamma di attività nell'intero processo di data science: da esplorazione, preparazione e pulizia dei dati a sperimentazione, modellazione, punteggio del modello e gestione di informazioni dettagliate predittive nei report di BI.

Gli utenti di Microsoft Fabric possono accedere ai carichi di lavoro di Data science. Da qui è possibile individuare e accedere a varie risorse pertinenti. Ad esempio, possono creare esperimenti, modelli e notebook di apprendimento automatico. possono importare i notebook esistenti nella pagina iniziale di Data Science.

Condividi tramite

Che cos'è il mirroring in Fabric?

Perché usare il mirroring in Fabric?

Come funziona la replica near real-time del mirroring?

Query tra database

Ingegneria dei dati con i dati di database con mirroring

Data Science con i dati del database con mirroring

Commenti e suggerimenti

Risorse aggiuntive

Condividi tramite

Che cos'è il mirroring in Fabric?

Perché usare il mirroring in Fabric?

Come funziona la replica near real-time del mirroring?

Condivisione

Query tra database

Ingegneria dei dati con i dati di database con mirroring

Data Science con i dati del database con mirroring

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive