O que é a Máquina Virtual de Ciência de Dados do Azure para Linux e Windows?

A DSVM (Máquina Virtual de Ciência de Dados) é uma imagem de VM personalizada disponível na plataforma de nuvem do Azure e pode lidar com ciência de dados. Ele tem muitas ferramentas populares de ciência de dados pré-instaladas e pré-configuradas para iniciar a criação de aplicativos inteligentes para análises avançadas.

A DSVM está disponível em:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Além disso, oferecemos a DSVM do Azure para PyTorch - uma imagem do Ubuntu 20.04 do Azure Marketplace otimizada para cargas de trabalho de aprendizagem profunda grandes e distribuídas. Esta DSVM pré-instalada vem validada com a versão mais recente do PyTorch, para reduzir os custos de configuração e acelerar o tempo de valorização. Ele vem embalado com vários recursos de otimização:

  • Tempo de execução ONNX
  • Velocidade Profunda
  • MSCCL
  • ORTMoE
  • Escala justa
  • Nvidia Apex
  • Uma pilha atualizada com as últimas versões compatíveis do Ubuntu, Python, PyTorch e CUDA

Comparação com o Azure Machine Learning

A DSVM é uma imagem de VM personalizada para Ciência de Dados, mas o Azure Machine Learning é uma plataforma de ponta a ponta que abrange:

  • Computação totalmente gerenciada
    • Instâncias de Computação
    • Clusters de computação para tarefas de ML distribuídas
    • Clusters de inferência para pontuação em tempo real
  • Armazenamentos de dados (por exemplo, Blob, ADLS Gen2, SQL DB)
  • Acompanhamento de experiências
  • Gestão de modelos
  • Notebooks
  • Ambientes (gerenciar dependências conda e R)
  • Etiquetagem
  • Pipelines (automatize fluxos de trabalho de ciência de dados de ponta a ponta)

Comparação com instâncias de computação do Azure Machine Learning

As Instâncias de Computação do Azure Machine Learning são uma imagem de VM totalmente configurada e gerenciada , enquanto a DSVM é uma VM não gerenciada .

Principais diferenças entre uma DSVM e uma instância de computação do Azure Machine Learning:

Caraterística Ciência dos Dados
VM
Azure Machine Learning
Instância de Computação
Totalmente Gerida Não Sim
Suporte de Linguagens Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python e R
Sistema operativo Ubuntu
Windows
Ubuntu
Opção de GPU pré-configurada Sim Sim
Opção de aumento de escala Sim Sim
Acesso SSH Sim Sim
Acesso RDP Sim No
Incorporada
Blocos de anotações hospedados
Não
(requer configuração adicional)
Sim
SSO integrado Não
(requer configuração adicional)
Sim
Colaboração integrada Não Sim
Ferramentas pré-instaladas Jupyter(lab), Código VS,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter (laboratório)

Exemplos de casos de uso de clientes DSVM

Experimentação e avaliação a curto prazo

A DSVM pode avaliar ou aprender novas ferramentas de ciência de dados. Experimente alguns dos nossos exemplos e instruções passo a passo publicados.

Aprendizagem profunda com GPUs

Na DSVM, seus modelos de treinamento podem usar algoritmos de aprendizado profundo em hardware baseado em unidade de processamento gráfico (GPU). Se você aproveitar os recursos de dimensionamento de VM da plataforma Azure, a DSVM o ajudará a aproveitar o hardware baseado em GPU na nuvem, de acordo com suas necessidades. Você pode alternar para uma VM baseada em GPU quando treinar modelos grandes ou quando precisar de cálculos de alta velocidade enquanto mantém o mesmo disco do sistema operacional. Você pode escolher qualquer uma das SKUs de máquina virtual habilitadas para GPU da série N com DSVM. As contas gratuitas do Azure não suportam SKUs de máquina virtual habilitadas para GPU.

Uma DSVM de edição do Windows vem pré-instalada com drivers de GPU, estruturas e versões de GPU de estruturas de aprendizado profundo. Nas edições Linux, o deep learning em GPUs é ativado nas DSVMs do Ubuntu.

Você também pode implantar as edições DSVM do Ubuntu ou do Windows em uma máquina virtual do Azure que não seja baseada em GPUs. Neste caso, todas as estruturas de aprendizagem profunda retornam ao modo CPU.

Saiba mais sobre as estruturas de aprendizagem profunda e IA disponíveis.

Formação e ensino de ciência de dados

Os formadores e educadores empresariais que ensinam aulas de ciência de dados geralmente fornecem uma imagem de máquina virtual. A imagem garante que os alunos tenham uma configuração consistente e que as amostras funcionem de forma previsível.

A DSVM cria um ambiente sob demanda com uma configuração consistente, para facilitar os desafios de suporte e incompatibilidade. Os casos em que estes ambientes precisem de ser criados com frequência, especialmente para aulas de formação mais curtas, beneficiam substancialmente.

O que inclui a DSVM?

Para obter mais informações, consulte esta lista completa de ferramentas em DSVMs Windows e Linux.

Próximos passos

Para obter mais informações, visite estes recursos: