Strumenti di Machine Learning e data science in Data Science Virtual Machine di Azure
Articolo
Le Macchine virtuali di Data Science di Azure dispongono di un set completo di strumenti e librerie per Machine Learning. Queste risorse sono disponibili nei linguaggi più diffusi, ad esempio Python, R e Julia.
La DSVM supporta questi strumenti e librerie di Machine Learning:
È possibile usare il servizio cloud di Azure Machine Learning per sviluppare e distribuire modelli di Machine Learning. È possibile usare Python SDK per tenere traccia dei modelli durante la compilazione, il training, il ridimensionamento e la gestione. Distribuire modelli come contenitori ed eseguirli nel cloud, in locale o in Azure IoT Edge.
Edizioni supportate
Windows (ambiente Conda: AzureML), Linux (ambiente Conda: py36)
Usi tipici
Piattaforma di Machine Learning generica
Come viene configurata o installata?
Installata con supporto GPU
Come usarla o eseguirla
Come Python SDK e nell'interfaccia della riga di comando di Azure. Attivare l'ambiente conda AzureML nell'edizione di Windows o attivare per py36 nell'edizione Linux.
Collegamenti agli esempi
Trovare notebook Jupyter di esempio nella directory AzureML, in notebook.
H2O
Categoria
Valore
Che cos'è?
Piattaforma di intelligenza artificiale open source che supporta funzionalità di Machine Learning in memoria, distribuite, veloci e scalabili.
Versioni supportate
Linux
Usi tipici
Machine Learning generico distribuito e scalabile
Come viene configurata o installata?
H2O è installato in /dsvm/tools/h2o.
Come usarla o eseguirla
Connettersi alla macchina virtuale con X2Go. Avviare un nuovo terminale ed eseguire java -jar /dsvm/tools/h2o/current/h2o.jar. Quindi avviare un Web browser e connettersi a http://localhost:54321.
Collegamenti agli esempi
Trovare esempi nella macchina virtuale in Jupyter, nella directory h2o.
In DSVM esistono molte altre librerie di Machine Learning, come ad esempio il noto pacchetto scikit-learn, incluso nella distribuzione di Anaconda Python per DSVM. Per un elenco dei pacchetti disponibili in Python, R e Julia, eseguire i rispettivi strumenti di gestione dei pacchetti.
LightGBM
Categoria
Valore
Che cos'è?
Framework veloce, distribuito e a prestazioni elevate di gradient boosting (GBDT, GBRT, GBM o MART) basato su algoritmi dell'albero delle decisioni. Attività di Machine Learning: posizionamento, classificazione e così via: usarle.
Versioni supportate
Windows, Linux
Usi tipici
Framework di gradient boosting generico
Come viene configurata o installata?
LightGBM viene installato come pacchetto Python in Windows. In Linux, l'eseguibile della riga di comando si trova in /opt/LightGBM/lightgbm. Il pacchetto R è installato e vengono installati i pacchetti Python.
Interfaccia utente grafica per il data mining che usa R.
Edizioni supportate
Windows, Linux
Usi tipici
Strumento di data mining dell'interfaccia utente generico per R
Come usarla o eseguirla
Come strumento dell'interfaccia utente. In Windows avviare un prompt dei comandi, eseguire R e quindi all'interno di R eseguire rattle(). In Linux connettersi con X2Go, avviare un terminale, eseguire R e quindi all'interno di R eseguire rattle().
Raccolta di algoritmi di Machine Learning per attività di data mining. È possibile applicare direttamente gli algoritmi oppure chiamarli dal proprio codice Java. Weka contiene strumenti per la pre-elaborazione, la classificazione, la regressione, il clustering, le regole di associazione e la visualizzazione dei dati.
Edizioni supportate
Windows, Linux
Usi tipici
Strumento di Machine Learning generico
Come usarla o eseguirla
In Windows cercare Weka nel menu Start. In Linux accedere con X2Go e quindi andare a Applications>Development>Weka.
Libreria di gradient boosting (GBDT, GBRT o GBM) veloce, portatile e distribuita per Python, R, Java, Scala, C++ e altro ancora. Viene eseguita in un solo computer e in Apache Hadoop e Spark.
Edizioni supportate
Windows, Linux
Usi tipici
Libreria di Machine Learning generica
Come viene configurata o installata?
Installata con supporto GPU
Come usarla o eseguirla
Come pacchetto R della libreria Python (2.7 e 3.6+) e strumento della riga di comando nel percorso (C:\dsvm\tools\xgboost\bin\xgboost.exe per Windows e /dsvm/tools/xgboost/xgboost per Linux)
Collegamenti agli esempi
Gli esempi sono inclusi nella macchina virtuale, in /dsvm/tools/xgboost/demo su Linux e C:\dsvm\tools\xgboost\demo su Windows.