Introduzione

Completato

Molte organizzazioni lavorano con grandi quantità di dati. I Big Data spesso possono essere non elaborati, non organizzati e archiviati in diverse posizioni, ad esempio sistemi relazionali, non relazionali e altri sistemi di archiviazione. Una sfida significativa per queste organizzazioni consiste nell'ordinare questi Big Data e trasformarli in informazioni aziendali utili.

Microsoft Azure Data Factory è un servizio cloud gestito che è possibile usare per creare informazioni aziendali dettagliate e di utilità pratica dai dati non organizzati. Consente di gestire progetti complessi di estrazione, trasformazione e caricamento (ETL) ibridi, di estrazione, caricamento e trasformazione e di integrazione dei dati.

Immagine che illustra un possibile scenario di Big Data. Gli elementi rappresentati sono origini dati, inserimento, archiviazione dei dati, analisi e visualizzazione.

Scenario di esempio

Si supponga di lavorare per una società di giochi, in cui si raccolgono i log dei dati generati durante le sessioni di gioco. Se fosse possibile analizzare questi dati di log, si potrebbero ottenere informazioni dettagliate su preferenze dei clienti, dati demografici e comportamento di utilizzo. Le persone del team di vendita esprimono un interesse per le opportunità di up selling e cross-selling e si chiedono se questi log di dati potrebbero contenere informazioni utili. I team tecnici e di sviluppo sono interessati a conoscere i potenziali problemi correlati all'esperienza di gioco e a sapere in che modo le nuove funzionalità potrebbero aiutare a risolverli.

Il problema è che per analizzare correttamente i dati nei log, è anche necessario fare riferimento ai dati archiviati in posizioni locali. Questi dati includono informazioni sui clienti, sui giochi e sulle campagne di marketing. L'azienda archivia i dati dei log dei giochi in un archivio dati del cloud e vuole usare anche tutti i dati locali.

Per procedere con l'analisi dei dati, un passaggio fondamentale consiste nel combinare i dati locali con gli altri dati dei log di gioco. Il piano prevede l'elaborazione dei dati combinati usando Azure Analysis Services. Pubblicare quindi i dati trasformati in un data warehouse cloud e visualizzarli usando Power BI e altri strumenti. Azure Data Factory può essere utile per raggiungere questo obiettivo.

Cosa stiamo facendo?

In questo modulo viene illustrato come Azure Data Factory orchestra i Big Data. Valutare se Azure Data Factory può essere utile per integrare le origini dati. Si apprenderà anche come Azure Data Factory può inserire dati da origini dati SaaS (Software as a Service) locali, multicloud e software as a Service.

Qual è l'obiettivo principale?

Al termine di questo modulo, si è appreso come Azure Data Factory consente di creare e pianificare flussi di lavoro basati sui dati per inserire dati da archivi dati diversi. Si valuta se Azure Data Factory può aiutare a compilare processi ETL complessi per trasformare visivamente i dati con i servizi di calcolo o con i flussi di dati.