Strumenti di Machine Learning e data science in Data Science Virtual Machine di Azure

Le Macchine virtuali di Data Science di Azure dispongono di un set completo di strumenti e librerie per Machine Learning. Queste risorse sono disponibili nei linguaggi più diffusi, ad esempio Python, R e Julia.

La DSVM supporta questi strumenti e librerie di Machine Learning:

Azure Machine Learning SDK per Python

Per informazioni di riferimento complete, vedere Azure Machine Learning SDK per Python.

Categoria Valore
Che cos'è? È possibile usare il servizio cloud di Azure Machine Learning per sviluppare e distribuire modelli di Machine Learning. È possibile usare Python SDK per tenere traccia dei modelli durante la compilazione, il training, il ridimensionamento e la gestione. Distribuire modelli come contenitori ed eseguirli nel cloud, in locale o in Azure IoT Edge.
Edizioni supportate Windows (ambiente Conda: AzureML), Linux (ambiente Conda: py36)
Usi tipici Piattaforma di Machine Learning generica
Come viene configurata o installata? Installata con supporto GPU
Come usarla o eseguirla Come Python SDK e nell'interfaccia della riga di comando di Azure. Attivare l'ambiente conda AzureML nell'edizione di Windows o attivare per py36 nell'edizione Linux.
Collegamenti agli esempi Trovare notebook Jupyter di esempio nella directory AzureML, in notebook.

H2O

Categoria Valore
Che cos'è? Piattaforma di intelligenza artificiale open source che supporta funzionalità di Machine Learning in memoria, distribuite, veloci e scalabili.
Versioni supportate Linux
Usi tipici Machine Learning generico distribuito e scalabile
Come viene configurata o installata? H2O è installato in /dsvm/tools/h2o.
Come usarla o eseguirla Connettersi alla macchina virtuale con X2Go. Avviare un nuovo terminale ed eseguire java -jar /dsvm/tools/h2o/current/h2o.jar. Quindi avviare un Web browser e connettersi a http://localhost:54321.
Collegamenti agli esempi Trovare esempi nella macchina virtuale in Jupyter, nella directory h2o.

In DSVM esistono molte altre librerie di Machine Learning, come ad esempio il noto pacchetto scikit-learn, incluso nella distribuzione di Anaconda Python per DSVM. Per un elenco dei pacchetti disponibili in Python, R e Julia, eseguire i rispettivi strumenti di gestione dei pacchetti.

LightGBM

Categoria Valore
Che cos'è? Framework veloce, distribuito e a prestazioni elevate di gradient boosting (GBDT, GBRT, GBM o MART) basato su algoritmi dell'albero delle decisioni. Attività di Machine Learning: posizionamento, classificazione e così via: usarle.
Versioni supportate Windows, Linux
Usi tipici Framework di gradient boosting generico
Come viene configurata o installata? LightGBM viene installato come pacchetto Python in Windows. In Linux, l'eseguibile della riga di comando si trova in /opt/LightGBM/lightgbm. Il pacchetto R è installato e vengono installati i pacchetti Python.
Collegamenti agli esempi Guida a LightGBM

Rattle

Categoria Valore
Che cos'è? Interfaccia utente grafica per il data mining che usa R.
Edizioni supportate Windows, Linux
Usi tipici Strumento di data mining dell'interfaccia utente generico per R
Come usarla o eseguirla Come strumento dell'interfaccia utente. In Windows avviare un prompt dei comandi, eseguire R e quindi all'interno di R eseguire rattle(). In Linux connettersi con X2Go, avviare un terminale, eseguire R e quindi all'interno di R eseguire rattle().
Collegamenti agli esempi Rattle

Vowpal Wabbit

Categoria Valore
Che cos'è? Libreria del sistema di Machine Learning esterno veloce e open source
Edizioni supportate Windows, Linux
Usi tipici Libreria di Machine Learning generica
Come viene configurata o installata? Windows: programma di installazione MSI
Linux: apt-get
Come usarla o eseguirla Come strumento della riga di comando nel percorso (C:\Program Files\VowpalWabbit\vw.exe in Windows, /usr/bin/vw in Linux)
Collegamenti agli esempi Esempi di Vowpal Wabbit

Weka

Categoria Valore
Che cos'è? Raccolta di algoritmi di Machine Learning per attività di data mining. È possibile applicare direttamente gli algoritmi oppure chiamarli dal proprio codice Java. Weka contiene strumenti per la pre-elaborazione, la classificazione, la regressione, il clustering, le regole di associazione e la visualizzazione dei dati.
Edizioni supportate Windows, Linux
Usi tipici Strumento di Machine Learning generico
Come usarla o eseguirla In Windows cercare Weka nel menu Start. In Linux accedere con X2Go e quindi andare a Applications>Development>Weka.
Collegamenti agli esempi Esempi di Weka

XGBoost

Categoria Valore
Che cos'è? Libreria di gradient boosting (GBDT, GBRT o GBM) veloce, portatile e distribuita per Python, R, Java, Scala, C++ e altro ancora. Viene eseguita in un solo computer e in Apache Hadoop e Spark.
Edizioni supportate Windows, Linux
Usi tipici Libreria di Machine Learning generica
Come viene configurata o installata? Installata con supporto GPU
Come usarla o eseguirla Come pacchetto R della libreria Python (2.7 e 3.6+) e strumento della riga di comando nel percorso (C:\dsvm\tools\xgboost\bin\xgboost.exe per Windows e /dsvm/tools/xgboost/xgboost per Linux)
Collegamenti agli esempi Gli esempi sono inclusi nella macchina virtuale, in /dsvm/tools/xgboost/demo su Linux e C:\dsvm\tools\xgboost\demo su Windows.