Che cosa è Data Factory in Microsoft Fabric?

Data Factory offre un'esperienza moderna di integrazione dei dati per l'inserimento, la preparazione e la trasformazione dei dati da un set completo di origini dati (ad esempio database, data warehouse, Lakehouse, dati in tempo reale e altro ancora). Qualsiasi utente, che sia uno sviluppatore cittadino o professionista, potrà trasformare i dati con trasformazioni intelligenti e sfruttare una vasta gamma di attività. È possibile creare pipeline per eseguire una o più attività, accedere a origini dati o servizi tramite servizi collegati e, dopo aver creato una pipeline, è possibile aggiungere trigger per eseguire automaticamente i processi in momenti specifici o in risposta a scenari mutevoli. Con Data Factory in Microsoft Fabric, vengono offerte funzionalità di copia rapida (spostamento dei dati) sia ai flussi di dati che alle pipeline di dati. Con la copia rapida è possibile spostare i dati tra gli archivi dati preferiti in molto velocemente. In particolare, la copia rapida consente di trasferire i dati su Lakehouse e Data Warehouse in Microsoft Fabric per l'analisi.

Data Factory implementa due funzionalità principali: flussi di dati e pipeline.

  • I flussi di dati consentono di sfruttare più di 300 trasformazioni nell'unità di progettazione dei flussi di dati, consentendo di trasformare i dati più facilmente e con maggiore flessibilità rispetto a qualsiasi altro strumento, incluse le trasformazioni dei dati basate su intelligenza artificiale.
  • Le pipeline di dati consentono di sfruttare le funzionalità predefinite di orchestrazione dei dati per comporre flussi di lavoro di dati flessibili che soddisfano le esigenze aziendali.

Flussi di dati

I flussi di dati offrono un'interfaccia low-code per l'inserimento di dati da centinaia di origini dati, trasformando i dati tramite più di 300 trasformazioni di dati. È quindi possibile caricare i dati risultanti in più destinazioni, ad esempio i database SQL di Azure e altro ancora. I flussi di dati possono essere eseguiti ripetutamente usando l'aggiornamento manuale o pianificato o all'interno di un'orchestrazione della pipeline di dati.

I flussi di dati vengono creati usando l'esperienza comune Power Query attualmente disponibile in diversi prodotti e servizi Microsoft, ad esempio Excel, Power BI, Power Platform, Dynamics 365 Insights e altre applicazioni. Power Query consente a tutti gli utenti, siano essi sviluppatori cittadini o professionisti, di eseguire l'inserimento dei dati e le trasformazioni dei dati nel proprio patrimonio di dati. Eseguire join, aggregazioni, pulizia dei dati, trasformazioni personalizzate e molto altro ancora da un'interfaccia utente di facile utilizzo, altamente visiva e low-code.

Screenshot dell'interfaccia utente di Power BI che mostra l'esperienza del flusso di dati.

Pipeline di dati

Le pipeline di dati abilitano potenti funzionalità del flusso di lavoro su scala cloud. Con le pipeline di dati, è possibile creare flussi di lavoro complessi in grado di aggiornare il flusso di dati, spostare i dati di dimensioni PB e definire pipeline di flusso di controllo sofisticate.

Usare le pipeline di dati per creare flussi di lavoro ETL e data factory complessi che possono eseguire molte attività diverse su larga scala. Le funzionalità del flusso di controllo sono integrate in pipeline di dati che consentono di compilare la logica del flusso di lavoro, che fornisce cicli e condizionali.

Aggiungere un'attività Copy guidata dalla configurazione insieme all'aggiornamento del flusso di dati low-code in una singola pipeline per una pipeline di dati ETL end-to-end. È anche possibile aggiungere attività code-first per notebook Spark, script SQL, stored procedure e altro ancora.

Screenshot dell'interfaccia utente che mostra l'attività Copy.

Per iniziare a usare Microsoft Fabric, vedere Avvio rapido: creare il primo Dataflow Gen2 per ottenere e trasformare i dati.