Che cos'è un lakehouse in Microsoft Fabric?
Microsoft Fabric Lakehouse è una piattaforma di architettura dei dati per l'archiviazione, la gestione e l'analisi di dati strutturati e non strutturati in un'unica posizione. È una soluzione flessibile e scalabile che consente alle organizzazioni di gestire grandi volumi di dati usando vari strumenti e framework per elaborare e analizzare tali dati. Si integra con altri strumenti di gestione e analisi dei dati per offrire una soluzione completa per l’analisi e l'ingegneria dei dati.
Endpoint di Analisi SQL di Lakehouse
Lakehouse crea un livello di servizio generando automaticamente un endpoint di Analisi SQL e un modello semantico predefinito durante la creazione. Questa nuova funzionalità trasparente consente all'utente di lavorare direttamente sulle tabelle Delta nel lake per offrire un'esperienza priva di problemi e ad alte prestazioni, dall'inserimento dati alla creazione di report.
È importante notare che l'endpoint di Analisi SQL è un'esperienza di sola lettura e non supporta la superficie di attacco T-SQL completa di un data warehouse transazionale.
Nota
Solo le tabelle in formato Delta sono disponibili nell'endpoint di Analisi SQL. Non è possibile eseguire query su Parquet, CSV e altri formati usando l'endpoint di Analisi SQL. Se la tabella non viene visualizzata, sarà necessario convertirla in formato Delta.
Individuazione e registrazione automatica delle tabelle
L'individuazione e la registrazione automatica delle tabelle è una funzionalità di Lakehouse che fornisce un file completamente gestito per l'esperienza delle tabelle per data engineer e data scientist. È possibile eliminare un file nell'area gestita del lakehouse; il sistema lo convalida automaticamente per i formati strutturati supportati e lo registra nel metastore con i metadati necessari, ad esempio nomi colonna, formati, compressione e altro. Attualmente, l'unico formato supportato è la tabella Delta. È quindi possibile fare riferimento al file come tabella e usare la sintassi SparkSQL per interagire con i dati.
Interazione con l'elemento lakehouse
Un data engineer può interagire con il lakehouse e i dati all'interno del lakehouse in diversi modi:
Esplora lakehouse: Esplora è la pagina di interazione principale di Lakehouse. È possibile caricare i dati nel lakehouse, esplorare i dati nel lakehouse usando Esplora oggetti, impostare etichette MIP ed eseguire altre operazioni. Altre informazioni sull'esperienza di esplorazione: Spostarsi in Esplora lakehouse di Fabric.
Notebook: i data engineer possono usare il notebook per scrivere codice per la lettura, la trasformazione o la scrittura direttamente in Lakehouse come tabelle e/o cartelle. Per altre informazioni su come usare i notebook per Lakehouse, vedere Esplorare i dati nel lakehouse con un notebook e Come usare un notebook per caricare dati nel lakehouse.
Pipeline: i data engineer possono usare strumenti di integrazione dei dati come lo strumento Copia pipeline per eseguire il pull dei dati da altre origini con destinazione Lakehouse. Altre informazioni su come usare l'attività Copy: Come copiare dati usando l'attività Copy.
Definizioni processo Apache Spark: i data engineer possono sviluppare applicazioni solide e orchestrare l'esecuzione di processi Spark compilati in Java, Scala e Python. Altre informazioni sui processi Spark: Che cos'è una definizione processo Apache Spark?
Flussi di dati Gen 2: i data engineer possono usare flussi di dati Gen 2 per inserire e preparare i dati. Per altre informazioni sul caricamento dei dati usando flussi di dati, vedere Creare il primo flusso di dati per ottenere e trasformare i dati.
Altre informazioni sui diversi modi per caricare dati nel lakehouse: opzioni per ottenere i dati in Fabric Lakehouse.
Multitasking con lakehouse
L'esperienza di multitasking offre una struttura a schede del browser che consente di aprire e passare da un elemento all’altro senza soluzione di continuità, consentendo di gestire il data lakehouse in modo più efficiente che mai. È possibile passare con facilità da una finestra all’altra senza perdere la traccia delle attività. Lakehouse offre un'esperienza di multitasking avanzata per rendere il percorso di gestione dei dati il più efficiente e intuitivo possibile con le funzionalità seguenti:
Mantieni le operazioni in esecuzione: è possibile caricare o eseguire un'operazione di caricamento dati in una scheda e controllare un'altra attività in un’altra scheda. Con il multitasking avanzato, le operazioni in esecuzione non vengono annullate quando si passa da una scheda all'altra. È possibile concentrarsi sul lavoro senza interruzioni.
Mantieni il contesto: gli oggetti selezionati, le tabelle dati o i file rimangono aperti e facilmente disponibili quando si passa da una scheda all'altra. Il contesto del data lakehouse è sempre a portata di mano.
Ricaricamento dell'elenco che non blocca: un meccanismo di ricaricamento che non blocca, per elenchi di tabelle e file. È possibile continuare a lavorare mentre l'elenco viene aggiornato in background. Garantisce di avere i dati più recenti, offrendo al tempo stesso un'esperienza uniforme e senza interruzioni.
Notifiche chiaramente definite: le notifiche di tipo avviso popup specificano da quale lakehouse provengono, rendendo più semplice tenere traccia delle modifiche e degli aggiornamenti nell'ambiente multitasking.
Progettazione di un lakehouse accessibile
L'accessibilità è sempre stata una priorità assoluta per garantire che Lakehouse sia inclusivo e intuitivo per tutti. Di seguito sono indicate le iniziative chiave implementate finora per supportare l'accessibilità:
Compatibilità con l'utilità per la lettura dello schermo: è possibile lavorare senza soluzione di continuità con le utilità per la lettura dello schermo, per cui gli utenti con problemi visivi possono navigare nella piattaforma e interagire in modo efficace.
Adattare dinamicamicamente il contenuto del testo: progettazione reattiva che si adatta a diverse dimensioni e orientamenti dello schermo. L’adattamento dinamica del testo e del contenuto facilita agli utenti la visualizzazione e l’interazione con l'applicazione in un'ampia gamma di dispositivi.
Spostamento tramite tastiera: spostamento tramite tastiera migliorato per consentire agli utenti di spostarsi nel lakehouse senza basarsi su un mouse, migliorando l'esperienza per coloro che sono affetti da disabilità motorie.
Testo alternativo per le immagini: tutte le immagini ora includono un testo alternativo descrittivo, consentendo alle utilità per la lettura dello schermo di trasmettere informazioni significative.
Campi modulo ed etichette: tutti i campi modulo hanno etichette associate, semplificando l'input dei dati per tutti, inclusi coloro che usano utilità per la lettura dello schermo.
Contenuto correlato
In questa panoramica si ottiene una conoscenza di base di un lakehouse. Passare all'articolo successivo per informazioni su come creare e usare un lakehouse:
- Per iniziare a usare i lakehouse, vedere Creare un lakehouse in Microsoft Fabric.