Componente Inserir Dados Manualmente

Artigo
09/02/2024

Este artigo descreve o componente no Azure Machine Learning Designer.

Use o componente Inserir Dados Manualmente para criar um pequeno conjunto de dados digitando valores. O conjunto de dados pode ter várias colunas.

Esse componente pode ser útil em cenários como estes:

Gerar um pequeno conjunto de valores para teste.
Criar uma lista pré-selecionada de etiquetas.
Digitar uma lista de nomes de coluna para inserir em um conjunto de dados.

Criar um conjunto de dados

Adicione o componente Inserir Dados Manualmente ao seu pipeline. Você pode encontrar esse componente na categoria Entrada e Saída de Dados do Azure Machine Learning.
Em Formato dos dados, escolha uma das opções a seguir. Essas opções determinam como analisar os dados que você informa. Os requisitos para cada formato variam muito. Portanto, não deixe de ler os tópicos relacionados.
- ARFF: formato de arquivo com relação de atributo usado pelo Weka.
- CSV: formato de valores separados por vírgulas. Para mais informações, confira Converter em CSV.
- SVMLight: formato usado pelo Vowpal Wabbit e outras estruturas de machine learning.
- TSV: formato de valores separados por tabulação.
Se você escolher um formato e não informar dados que atendam às especificações relacionadas a ele, ocorrerá um erro de runtime.
Clique dentro da caixa de texto Dados para começar a inserir dados. Os seguintes formatos exigem atenção especial:
- CSV: para criar várias colunas, cole o texto separado por vírgulas ou digite várias colunas usando vírgulas entre os campos.
  
  Se você escolher a opção HasHeader, poderá usar a primeira linha de valores como o título de coluna.
  
  Se você desmarcar essa opção, serão usados os nomes de coluna Col1, Col2 e assim por diante. Você pode adicionar ou alterar os nomes das colunas posteriormente, usando Editar metadados.
- TSV: para criar várias colunas, cole o texto separado por tabulação ou digite várias colunas usando tabulações entre os campos.
  
  Se você escolher a opção HasHeader, poderá usar a primeira linha de valores como o título de coluna.
  
  Se você desmarcar essa opção, serão usados os nomes de coluna Col1, Col2 e assim por diante. Você pode adicionar ou alterar os nomes das colunas posteriormente, usando Editar metadados.
- ARFF: cole um arquivo de formato ARFF existente. Se você estiver digitando os valores diretamente, não se esqueça de adicionar o cabeçalho opcional e os campos de atributo necessários no início dos dados.
  
  Por exemplo, é possível adicionar as linhas de cabeçalho e de atributo a seguir a uma lista simples. O título de coluna seria SampleText. Observe que não há suporte ao tipo Cadeia de caracteres.
```
% Title: SampleText.ARFF  
% Source: Enter Data component  
@ATTRIBUTE SampleText NUMERIC  
@DATA  
\<type first data row here>  
```
- SVMLight: digite ou cole valores usando o formato SVMLight.
  
  Por exemplo, a seguinte amostra representa as primeiras linhas do conjunto de dados de doação de sangue, no formato SVMLight:
```
# features are [Recency], [Frequency], [Monetary], [Time]  
1 1:2 2:50 3:12500 4:98   
1 1:0 2:13 3:3250 4:28   
```
  Quando você executa o componente Inserir Dados Manualmente, essas linhas são convertidas em um conjunto de dados de colunas e valores de índice, como os seguintes:
  
  Col1 Col2 Col3 Col4 Rótulos
  
  0,00016 0,004 0,999961 0,00784 1
  
  0 0,004 0,999955 0,008615 1
Depois de cada linha, pressione a tecla Enter para iniciar uma nova linha.

Se você pressionar Enter várias vezes para adicionar várias linhas à direita em branco, as linhas em branco serão removidas ou cortadas.

Se você criar linhas com valores ausentes, poderá filtrá-las posteriormente.
Conecte a porta de saída a outros componentes e execute o pipeline.

Para exibir o conjunto de dados, clique com o botão direito do mouse no componente e escolha Visualizar.

Col1	Col2	Col3	Col4	Rótulos
0,00016	0,004	0,999961	0,00784	1
0	0,004	0,999955	0,008615	1

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.

Compartilhar via

Componente Inserir Dados Manualmente

Criar um conjunto de dados

Próximas etapas

Comentários

Recursos adicionais