Implementare una soluzione di Machine Learning con Azure Databricks
Azure Databricks è una piattaforma su scala cloud per analisi dei dati e Machine Learning. I data scientist e i tecnici di Machine Learning possono usare Azure Databricks per implementare soluzioni di Machine Learning su larga scala.
Prerequisiti
Questo percorso di apprendimento presuppone che si abbia esperienza nell'uso di Python per esplorare i dati ed eseguire il training di modelli di Machine Learning con framework open source comuni, ad esempio Scikit-Learn, PyTorch e TensorFlow. È consigliabile completare il percorso di apprendimento Creare modelli di Machine Learning prima di iniziare questo.
Codice obiettivo
Si vuole richiedere un codice obiettivo?
Moduli in questo percorso di apprendimento
Azure Databricks è un servizio cloud che offre una piattaforma scalabile per l'analisi dei dati tramite Apache Spark.
Azure Databricks è basato su Apache Spark e consente agli ingegneri dei dati e agli analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.
L'apprendimento automatico prevede l'uso di dati per eseguire il training di un modello predittivo. Azure Databricks supporta più framework di apprendimento automatico di uso comune che è possibile usare per eseguire il training dei modelli.
MLflow è una piattaforma open source per la gestione del ciclo di vita di Machine Learning supportata in modo nativo in Azure Databricks.
L'ottimizzazione degli iperparametri è una parte essenziale dell'apprendimento automatico. In Azure Databricks è possibile usare la libreria Hyperopt per ottimizzare automaticamente gli iperparametri.
AutoML in Azure Databricks semplifica il processo di creazione di un modello di Machine Learning efficace per i dati.
Il Deep Learning usa reti neurali per eseguire il training di modelli di Machine Learning estremamente efficaci per previsioni complesse, visione artificiale, elaborazione del linguaggio naturale e altri carichi di lavoro di intelligenza artificiale.
L’apprendimento automatico consente un processo decisionale e un’automazione basati sui dati, ma la distribuzione di modelli nell’ambiente di produzione per informazioni dettagliate in tempo reale è complessa. Azure Databricks semplifica questo processo offrendo una piattaforma unificata per la creazione, il training e la distribuzione di modelli di apprendimento automatico su larga scala, promuovendo la collaborazione tra scienziati dei dati e tecnici.