Algoritmo e referência de componente para o designer do Azure Machine Learning

APLICA-SE A: SDK do Python azure-ai-ml v2 (atual)

Observação

O designer dá suporte a dois tipos de componentes, componentes predefinidos clássicos e componentes personalizados. Esses dois tipos de componentes não são compatíveis.

Os componentes predefinidos clássicos fornecem componentes predefinidos principalmente para processamento de dados e tarefas tradicionais de aprendizado de máquina, como regressão e classificação. Esse tipo de componente continua com suporte, mas não terá componentes novos adicionados.

Os componentes personalizados permitem que você forneça seu próprio código como um componente. Com suporte para compartilhamento entre os workspaces e as criação contínua nas interfaces SDK, CLI e Studio.

Este artigo é aplicável em componentes predefinidos clássicos.

Esse conteúdo de referência fornece a experiência técnica em cada um dos componentes predefinidos clássicos disponíveis no designer do Azure Machine Learning.

Cada componente representa um conjunto de códigos que podem ser executados de modo independente e executar uma tarefa de aprendizado de máquina, quando fornecidas as entradas necessárias. Um componente pode conter um algoritmo específico ou executar uma tarefa que seja importante no aprendizado de máquina, tal como substituição de um valor ausente ou análise estatística.

Para obter ajuda com a escolha de algoritmos, consulte

Dica

Em qualquer pipeline no designer, é possível obter informações sobre um componente específico. Selecione o link Saiba mais no cartão de componente ao passar o mouse sobre o componente na lista de componentes ou no painel direito do componente.

Componentes de preparação de dados

Funcionalidade Descrição componente
Dados de entrada e saída Mova dados de fontes de nuvem para seu pipeline. Durante a execução de um pipeline, grave os resultados ou os dados intermediários no Armazenamento do Azure ou no Banco de Dados SQL ou use o armazenamento em nuvem para trocar dados entre os pipelines. Inserir dados manualmente
Exportar dados
Importar dados
Transformação de dados Operações em dados que são exclusivos para o aprendizado de máquina, tais como normalização ou compartimentalização de dados, redução de dimensionalidade e conversão de dados entre vários formatos de arquivo. Adicionar Colunas
Adicionar Linhas
Aplicar Operação Matemática
Aplicar Transformação SQL
Limpar Dados Ausentes
Recortar Valores
Converter em CSV
Converter em Conjunto de Dados
Converter em Valores de Indicador
Editar Metadados
Agrupar Dados em Compartimentos
Unir Dados
Normalizar Dados
Particionar e Gerar Amostra
Remover Linhas Duplicadas
SMOTE
Selecionar Colunas para Transformação
Projetar Colunas no Conjunto de Dados
Dividir Dados
Seleção de recursos Escolha um subconjunto de recursos relevantes e úteis a serem usados na criação de um modelo analítico. Seleção de Recursos Baseada em Filtro
Importância do Recurso de Permuta
Funções estatísticas Forneça uma ampla variedade de métodos estatísticos relacionados à ciência de dados. Resumir Dados

Algoritmos de aprendizado de máquina

Funcionalidade Descrição componente
Regressão Prever um valor. Regressão de Árvore de Decisão Aumentada
Regressão de Floresta de Decisão
Regressão rápida de quantil de floresta
Regressão Linear
Regressão de Rede Neural
Regressão de Poisson
Clustering Agrupar dados juntos. Cluster K-Means
classificação Prever uma classe. Escolha entre os algoritmos binário (duas classes) ou multiclasse. Árvore de Decisão Aumentada Multiclasse
Floresta de Decisão Multiclasse
Regressão Logística Multiclasse
Rede Neural Multiclasse
Um contra Todas as Multiclasses
Multiclasse Um contra Um
Perceptron Médio de Duas Classes
Árvore de Decisão Aumentada de Duas Classes
Floresta de Decisão de Duas Classes
Regressão Logística de Duas Classes
Rede Neural de Duas Classes
Computador de Vetor de Suporte de Duas Classes

Componentes de criação e avaliação de modelos

Funcionalidade Descrição componente
Treinamento de modelo Execute os dados por meio do algoritmo. Treinar Modelo de Clustering
Treinar Modelo
Treinar Modelo do PyTorch
Ajustar os Hiperparâmetros de Modelo
Pontuação e Avaliação do Modelo Medir a precisão do modelo treinado. Aplicar Transformação
Atribuir Dados a Clusters
Modelo de Validação Cruzada
Avaliar Modelo
Pontuar Modelo de Imagem
Pontuar Modelo
Linguagem Python Grave o código e incorpore-o em um componente para integrar o Python ao seu pipeline. Criar Modelo Python
Executar Script do Python
Linguagem R Grave o código e incorpore-o em um componente para integrar o R ao seu pipeline. Executar Script R
Análise de texto Disponibilize ferramentas computacionais especializadas para trabalhar com texto estruturado e não estruturado. Converter Palavra em Vetor
Extrair Recursos N-Gram do Texto
Hash de Recursos
Pré-processar Texto
Alocação de Dirichlet Latente
Pontuar o modelo Vowpal Wabbit
Treinar o modelo Vowpal Wabbit
Pesquisa Visual Computacional Componentes relacionados ao pré-processamento de dados de imagem e ao reconhecimento de imagem. Aplicar Transformação de Imagem
Converter em Diretório de Imagem
Transformação da Imagem de Inicialização
Dividir Diretório de Imagens
DenseNet
ResNet
Recomendação Criar modelos de recomendação. Avaliar o Sistema de Recomendação
Pontuar o Sistema de Recomendação SVD
Pontuar o sistema de recomendação grande e profundo
Treinar o Sistema de Recomendação SVD
Treinar o sistema de recomendação grande e profundo
Detecção de anomalias Modelos de detecção de anomalias treinados. Detecção de Anomalias Baseada em PCA
Treinar um Modelo de Detecção de Anomalias

Serviço Web

Saiba mais sobre os componentes de serviço Web, que são necessários para a inferência em tempo real no designer do Azure Machine Learning.

Mensagens de erro

Saiba mais sobre as mensagens de erro e os códigos de exceção que podem ser encontrados usando os componentes do designer do Azure Machine Learning.

Ambiente de componentes

Todos os componentes internos no designer serão executados em um ambiente fixo fornecido pela Microsoft.

Anteriormente, esse ambiente era baseado no Python 3.6 e agora foi atualizado para o Python 3.8. Essa atualização é transparente, pois os componentes serão executados automaticamente no ambiente do Python 3.8 e nenhuma ação do usuário é necessária. A atualização do ambiente pode afetar as saídas de componentes e a implantação de ponto de extremidade em tempo real de uma inferência, confira as seções a seguir para saber mais.

As saídas de componentes são diferentes dos resultados anteriores

Depois que a versão do Python for atualizada de 3.6 para 3.8, as dependências de componentes internos poderão ser atualizadas de forma correspondente. Portanto, você pode descobrir que algumas saídas de componentes são diferentes dos resultados anteriores.

Se estiver usando o componente Executar Script do Python e já tiver instalado pacotes vinculados ao Python 3.6, você poderá obter erros como:

  • "Não foi possível encontrar uma versão que atenda ao requisito".
  • "Nenhuma distribuição correspondente foi encontrada." Em seguida, você precisará especificar a versão do pacote adaptada ao Python 3.8 e executar o pipeline novamente.

Implantar ponto de extremidade em tempo real do problema do pipeline de inferência em tempo real

Se você implantar o ponto de extremidade em tempo real diretamente de um pipeline de inferência em tempo real concluído anteriormente, ele poderá obter erros.

Recomendação: clone o pipeline de inferência, envie novamente e, em seguida, implante no ponto de extremidade em tempo real.

Próximas etapas