OutputTabularDatasetConfig Classe

Represente como copiar o resultado de uma execução e ser promovido como tabularDataset.

Inicialize um OutputTabularDatasetConfig.

Herança
OutputTabularDatasetConfig

Construtor

OutputTabularDatasetConfig(**kwargs)

Observações

Não deve chamar este construtor diretamente, mas deve criar um OutputFileDatasetConfig e, em seguida, chamar os métodos read_* correspondentes para convertê-lo num OutputTabularDatasetConfig.

A forma como o resultado será copiado para o destino de um OutputTabularDatasetConfig é igual a OutputFileDatasetConfig. A diferença entre eles é que o Conjunto de Dados criado será um TabularDataset que contém todas as transformações especificadas.

Métodos

as_input

Especifique como consumir a saída como entrada nos passos subsequentes do pipeline.

as_mount

Defina o modo da saída para montar.

Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado.

as_upload

Defina o modo da saída para carregar.

Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado.

drop_columns

Remova as colunas especificadas do Conjunto de Dados.

keep_columns

Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados.

random_split

Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada.

As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes.

as_input

Especifique como consumir a saída como entrada nos passos subsequentes do pipeline.

as_input(name=None)

Parâmetros

Name Description
name
Necessário
str

O nome da entrada específica da execução.

Devoluções

Tipo Description

Uma DatasetConsumptionConfig instância que descreve como entregar os dados de entrada.

as_mount

Defina o modo da saída para montar.

Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado.

as_mount()

Devoluções

Tipo Description

Uma OutputTabularDatasetConfig instância com o modo definido como montagem.

as_upload

Defina o modo da saída para carregar.

Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado.

as_upload(overwrite=False, source_globs=None)

Parâmetros

Name Description
overwrite
Necessário

Se pretende substituir ficheiros que já existem no destino.

source_globs
Necessário

Padrões Glob utilizados para filtrar ficheiros que serão carregados.

Devoluções

Tipo Description

Uma OutputTabularDatasetConfig instância com o modo definido para carregar.

drop_columns

Remova as colunas especificadas do Conjunto de Dados.

drop_columns(columns)

Parâmetros

Name Description
columns
Necessário

O nome ou uma lista de nomes para as colunas largarem.

Devoluções

Tipo Description

Uma OutputTabularDatasetConfig instância com as colunas a remover.

keep_columns

Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados.

keep_columns(columns)

Parâmetros

Name Description
columns
Necessário

O nome ou uma lista de nomes das colunas a manter.

Devoluções

Tipo Description

Uma OutputTabularDatasetConfig instância com as colunas a manter.

random_split

Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada.

As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes.

random_split(percentage, seed=None)

Parâmetros

Name Description
percentage
Necessário

A percentagem aproximada pela qual dividir o conjunto de dados. Tem de ser um número entre 0,0 e 1,0.

seed
Necessário
int

Semente opcional a utilizar para o gerador aleatório.

Devoluções

Tipo Description

Devolve uma cadeia de identificação de dois objetos OutputTabularDatasetConfig que representam os dois Conjuntos de Dados após a divisão.