Ferramentas de aprendizagem automática e ciência de dados nas Máquinas Virtuais de Ciência de Dados do Azure

As Máquinas Virtuais de Ciência de Dados (DSVMs) do Azure têm um conjunto avançado de ferramentas e bibliotecas para aprendizado de máquina. Esses recursos estão disponíveis em linguagens populares, como Python, R e Julia.

A DSVM suporta estas ferramentas e bibliotecas de aprendizagem automática:

SDK do Azure Machine Learning para Python

Para obter uma referência completa, visite SDK do Azure Machine Learning para Python.

Categoria Value
O que é? Você pode usar o serviço de nuvem do Azure Machine Learning para desenvolver e implantar modelos de aprendizado de máquina. Você pode usar o SDK do Python para acompanhar seus modelos à medida que os cria, treina, dimensiona e gerencia. Implante modelos como contêineres e execute-os na nuvem, no local ou no Azure IoT Edge.
Edições suportadas Windows (ambiente conda: AzureML), Linux (ambiente conda: py36)
Utilizações típicas Plataforma geral de aprendizagem automática
Como é configurado ou instalado? Instalado com suporte a GPU
Como usá-lo ou executá-lo Como um SDK Python e na CLI do Azure. Ative para o ambiente AzureML conda na edição Windows ou ative para py36 na edição Linux.
Link para amostras Encontre exemplos de AzureML blocos de anotações Jupyter no diretório, em blocos de anotações.

H2O

Categoria Value
O que é? Uma plataforma de IA de código aberto que suporta aprendizagem automática distribuída, rápida, na memória e escalável.
Versões suportadas Linux
Utilizações típicas Aprendizagem automática escalável e distribuída de uso geral
Como é configurado ou instalado? O H2O está instalado em /dsvm/tools/h2o.
Como usá-lo ou executá-lo Conecte-se à VM com o X2Go. Inicie um novo terminal e execute java -jar /dsvm/tools/h2o/current/h2o.jar. Em seguida, inicie um navegador da Web e conecte-se ao http://localhost:54321.
Link para amostras Encontre exemplos na VM no Jupyter, sob o h2o diretório.

Existem várias outras bibliotecas de aprendizado de máquina em DSVMs - por exemplo, o pacote popular scikit-learn que faz parte da distribuição Anaconda Python para DSVMs. Para obter uma lista de pacotes disponíveis em Python, R e Julia, execute os respetivos gerenciadores de pacotes.

LightGBM

Categoria Value
O que é? Uma estrutura rápida, distribuída e de alto desempenho para aumento de gradiente (GBDT, GBRT, GBM ou MART) baseada em algoritmos de árvore de decisão. Tarefas de aprendizagem automática - classificação, classificação, etc. - usá-lo.
Versões suportadas Windows, Linux
Utilizações típicas Estrutura de aumento de gradiente de uso geral
Como é configurado ou instalado? LightGBM é instalado como um pacote Python no Windows. No Linux, o executável de linha de comando está localizado em /opt/LightGBM/lightgbm. O pacote R está instalado e os pacotes Python estão instalados.
Link para amostras Guia LightGBM

Rattle

Categoria Value
O que é? Uma interface gráfica do usuário para mineração de dados que usa R.
Edições suportadas Windows, Linux
Utilizações típicas Ferramenta geral de mineração de dados da interface do usuário para R
Como usá-lo ou executá-lo Como uma ferramenta de interface do usuário. No Windows, inicie um prompt de comando, execute R e, em seguida, dentro de R, execute rattle(). No Linux, conecte-se ao X2Go, inicie um terminal, execute R e, em seguida, dentro do R, execute rattle().
Link para amostras Rattle

Vowpal Wabbit

Categoria Value
O que é? Uma biblioteca de sistema de aprendizagem rápida, de código aberto e fora do núcleo
Edições suportadas Windows, Linux
Utilizações típicas Biblioteca geral de aprendizagem automática
Como é configurado ou instalado? Windows: instalador msi
Linux: apt-get
Como usá-lo ou executá-lo Como uma ferramenta de linha de comando no caminho (C:\Program Files\VowpalWabbit\vw.exe no Windows, /usr/bin/vw no Linux)
Link para amostras Amostras VowPal Wabbit

Weka

Categoria Value
O que é? Uma coleção de algoritmos de aprendizado de máquina para tarefas de mineração de dados. Você pode aplicar os algoritmos diretamente ou chamá-los a partir do seu próprio código Java. O Weka contém ferramentas para pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados.
Edições suportadas Windows, Linux
Utilizações típicas Ferramenta geral de aprendizagem automática
Como usá-lo ou executá-lo No Windows, procure Weka no menu Iniciar . No Linux, inicie sessão com o X2Go e, em seguida, aceda a Desenvolvimento>de Aplicações>Weka.
Link para amostras Amostras de Weka

XGBoost

Categoria Value
O que é? Uma biblioteca rápida, portátil e distribuída de aumento de gradiente (GBDT, GBRT ou GBM) para Python, R, Java, Scala, C++ e muito mais. Ele é executado em uma única máquina e no Apache Hadoop e Spark.
Edições suportadas Windows, Linux
Utilizações típicas Biblioteca geral de aprendizagem automática
Como é configurado ou instalado? Instalado com suporte a GPU
Como usá-lo ou executá-lo Como uma biblioteca Python (2.7 e 3.6+), pacote R e ferramenta de linha de comando no caminho (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows e /dsvm/tools/xgboost/xgboost Linux)
Links para exemplos Os exemplos estão incluídos na VM, no /dsvm/tools/xgboost/demo Linux e C:\dsvm\tools\xgboost\demo no Windows.