Ferramentas de aprendizagem automática e ciência de dados nas Máquinas Virtuais de Ciência de Dados do Azure
Artigo
As Máquinas Virtuais de Ciência de Dados (DSVMs) do Azure têm um conjunto avançado de ferramentas e bibliotecas para aprendizado de máquina. Esses recursos estão disponíveis em linguagens populares, como Python, R e Julia.
A DSVM suporta estas ferramentas e bibliotecas de aprendizagem automática:
Você pode usar o serviço de nuvem do Azure Machine Learning para desenvolver e implantar modelos de aprendizado de máquina. Você pode usar o SDK do Python para acompanhar seus modelos à medida que os cria, treina, dimensiona e gerencia. Implante modelos como contêineres e execute-os na nuvem, no local ou no Azure IoT Edge.
Edições suportadas
Windows (ambiente conda: AzureML), Linux (ambiente conda: py36)
Utilizações típicas
Plataforma geral de aprendizagem automática
Como é configurado ou instalado?
Instalado com suporte a GPU
Como usá-lo ou executá-lo
Como um SDK Python e na CLI do Azure. Ative para o ambiente AzureML conda na edição Windows ou ative para py36 na edição Linux.
Link para amostras
Encontre exemplos de AzureML blocos de anotações Jupyter no diretório, em blocos de anotações.
H2O
Categoria
Value
O que é?
Uma plataforma de IA de código aberto que suporta aprendizagem automática distribuída, rápida, na memória e escalável.
Versões suportadas
Linux
Utilizações típicas
Aprendizagem automática escalável e distribuída de uso geral
Como é configurado ou instalado?
O H2O está instalado em /dsvm/tools/h2o.
Como usá-lo ou executá-lo
Conecte-se à VM com o X2Go. Inicie um novo terminal e execute java -jar /dsvm/tools/h2o/current/h2o.jar. Em seguida, inicie um navegador da Web e conecte-se ao http://localhost:54321.
Link para amostras
Encontre exemplos na VM no Jupyter, sob o h2o diretório.
Existem várias outras bibliotecas de aprendizado de máquina em DSVMs - por exemplo, o pacote popular scikit-learn que faz parte da distribuição Anaconda Python para DSVMs. Para obter uma lista de pacotes disponíveis em Python, R e Julia, execute os respetivos gerenciadores de pacotes.
LightGBM
Categoria
Value
O que é?
Uma estrutura rápida, distribuída e de alto desempenho para aumento de gradiente (GBDT, GBRT, GBM ou MART) baseada em algoritmos de árvore de decisão. Tarefas de aprendizagem automática - classificação, classificação, etc. - usá-lo.
Versões suportadas
Windows, Linux
Utilizações típicas
Estrutura de aumento de gradiente de uso geral
Como é configurado ou instalado?
LightGBM é instalado como um pacote Python no Windows. No Linux, o executável de linha de comando está localizado em /opt/LightGBM/lightgbm. O pacote R está instalado e os pacotes Python estão instalados.
Uma interface gráfica do usuário para mineração de dados que usa R.
Edições suportadas
Windows, Linux
Utilizações típicas
Ferramenta geral de mineração de dados da interface do usuário para R
Como usá-lo ou executá-lo
Como uma ferramenta de interface do usuário. No Windows, inicie um prompt de comando, execute R e, em seguida, dentro de R, execute rattle(). No Linux, conecte-se ao X2Go, inicie um terminal, execute R e, em seguida, dentro do R, execute rattle().
Uma coleção de algoritmos de aprendizado de máquina para tarefas de mineração de dados. Você pode aplicar os algoritmos diretamente ou chamá-los a partir do seu próprio código Java. O Weka contém ferramentas para pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados.
Edições suportadas
Windows, Linux
Utilizações típicas
Ferramenta geral de aprendizagem automática
Como usá-lo ou executá-lo
No Windows, procure Weka no menu Iniciar . No Linux, inicie sessão com o X2Go e, em seguida, aceda a Desenvolvimento>de Aplicações>Weka.
Uma biblioteca rápida, portátil e distribuída de aumento de gradiente (GBDT, GBRT ou GBM) para Python, R, Java, Scala, C++ e muito mais. Ele é executado em uma única máquina e no Apache Hadoop e Spark.
Edições suportadas
Windows, Linux
Utilizações típicas
Biblioteca geral de aprendizagem automática
Como é configurado ou instalado?
Instalado com suporte a GPU
Como usá-lo ou executá-lo
Como uma biblioteca Python (2.7 e 3.6+), pacote R e ferramenta de linha de comando no caminho (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows e /dsvm/tools/xgboost/xgboost Linux)
Links para exemplos
Os exemplos estão incluídos na VM, no /dsvm/tools/xgboost/demo Linux e C:\dsvm\tools\xgboost\demo no Windows.