Ferramentas de aprendizagem automática e ciência de dados nas Máquinas Virtuais de Ciência de Dados do Azure

Artigo
09/01/2024

As Máquinas Virtuais de Ciência de Dados (DSVMs) do Azure têm um conjunto avançado de ferramentas e bibliotecas para aprendizado de máquina. Esses recursos estão disponíveis em linguagens populares, como Python, R e Julia.

A DSVM suporta estas ferramentas e bibliotecas de aprendizagem automática:

SDK do Azure Machine Learning para Python

Para obter uma referência completa, visite SDK do Azure Machine Learning para Python.

Categoria	Value
O que é?	Você pode usar o serviço de nuvem do Azure Machine Learning para desenvolver e implantar modelos de aprendizado de máquina. Você pode usar o SDK do Python para acompanhar seus modelos à medida que os cria, treina, dimensiona e gerencia. Implante modelos como contêineres e execute-os na nuvem, no local ou no Azure IoT Edge.
Edições suportadas	Windows (ambiente conda: AzureML), Linux (ambiente conda: py36)
Utilizações típicas	Plataforma geral de aprendizagem automática
Como é configurado ou instalado?	Instalado com suporte a GPU
Como usá-lo ou executá-lo	Como um SDK Python e na CLI do Azure. Ative para o ambiente `AzureML` conda na edição Windows ou ative para `py36` na edição Linux.
Link para amostras	Encontre exemplos de `AzureML` blocos de anotações Jupyter no diretório, em blocos de anotações.

H2O

Categoria	Value
O que é?	Uma plataforma de IA de código aberto que suporta aprendizagem automática distribuída, rápida, na memória e escalável.
Versões suportadas	Linux
Utilizações típicas	Aprendizagem automática escalável e distribuída de uso geral
Como é configurado ou instalado?	O H2O está instalado em `/dsvm/tools/h2o`.
Como usá-lo ou executá-lo	Conecte-se à VM com o X2Go. Inicie um novo terminal e execute `java -jar /dsvm/tools/h2o/current/h2o.jar`. Em seguida, inicie um navegador da Web e conecte-se ao `http://localhost:54321`.
Link para amostras	Encontre exemplos na VM no Jupyter, sob o `h2o` diretório.

Existem várias outras bibliotecas de aprendizado de máquina em DSVMs - por exemplo, o pacote popular scikit-learn que faz parte da distribuição Anaconda Python para DSVMs. Para obter uma lista de pacotes disponíveis em Python, R e Julia, execute os respetivos gerenciadores de pacotes.

LightGBM

Categoria	Value
O que é?	Uma estrutura rápida, distribuída e de alto desempenho para aumento de gradiente (GBDT, GBRT, GBM ou MART) baseada em algoritmos de árvore de decisão. Tarefas de aprendizagem automática - classificação, classificação, etc. - usá-lo.
Versões suportadas	Windows, Linux
Utilizações típicas	Estrutura de aumento de gradiente de uso geral
Como é configurado ou instalado?	LightGBM é instalado como um pacote Python no Windows. No Linux, o executável de linha de comando está localizado em `/opt/LightGBM/lightgbm`. O pacote R está instalado e os pacotes Python estão instalados.
Link para amostras	Guia LightGBM

Rattle

Categoria	Value
O que é?	Uma interface gráfica do usuário para mineração de dados que usa R.
Edições suportadas	Windows, Linux
Utilizações típicas	Ferramenta geral de mineração de dados da interface do usuário para R
Como usá-lo ou executá-lo	Como uma ferramenta de interface do usuário. No Windows, inicie um prompt de comando, execute R e, em seguida, dentro de R, execute `rattle()`. No Linux, conecte-se ao X2Go, inicie um terminal, execute R e, em seguida, dentro do R, execute `rattle()`.
Link para amostras	Rattle

Vowpal Wabbit

Categoria	Value
O que é?	Uma biblioteca de sistema de aprendizagem rápida, de código aberto e fora do núcleo
Edições suportadas	Windows, Linux
Utilizações típicas	Biblioteca geral de aprendizagem automática
Como é configurado ou instalado?	Windows: instalador msi Linux: apt-get
Como usá-lo ou executá-lo	Como uma ferramenta de linha de comando no caminho (`C:\Program Files\VowpalWabbit\vw.exe` no Windows, `/usr/bin/vw` no Linux)
Link para amostras	Amostras VowPal Wabbit

Weka

Categoria	Value
O que é?	Uma coleção de algoritmos de aprendizado de máquina para tarefas de mineração de dados. Você pode aplicar os algoritmos diretamente ou chamá-los a partir do seu próprio código Java. O Weka contém ferramentas para pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados.
Edições suportadas	Windows, Linux
Utilizações típicas	Ferramenta geral de aprendizagem automática
Como usá-lo ou executá-lo	No Windows, procure Weka no menu Iniciar . No Linux, inicie sessão com o X2Go e, em seguida, aceda a Desenvolvimento>de Aplicações>Weka.
Link para amostras	Amostras de Weka

XGBoost

Categoria	Value
O que é?	Uma biblioteca rápida, portátil e distribuída de aumento de gradiente (GBDT, GBRT ou GBM) para Python, R, Java, Scala, C++ e muito mais. Ele é executado em uma única máquina e no Apache Hadoop e Spark.
Edições suportadas	Windows, Linux
Utilizações típicas	Biblioteca geral de aprendizagem automática
Como é configurado ou instalado?	Instalado com suporte a GPU
Como usá-lo ou executá-lo	Como uma biblioteca Python (2.7 e 3.6+), pacote R e ferramenta de linha de comando no caminho (`C:\dsvm\tools\xgboost\bin\xgboost.exe` para Windows e `/dsvm/tools/xgboost/xgboost` Linux)
Links para exemplos	Os exemplos estão incluídos na VM, no `/dsvm/tools/xgboost/demo` Linux e `C:\dsvm\tools\xgboost\demo` no Windows.

Partilhar via