OutputTabularDatasetConfig Classe

Referência

Represente como copiar o resultado de uma execução e ser promovido como tabularDataset.

Inicialize um OutputTabularDatasetConfig.

Herança: OutputDatasetConfig

OutputTabularDatasetConfig

Construtor

OutputTabularDatasetConfig(**kwargs)

Observações

Não deve chamar este construtor diretamente, mas deve criar um OutputFileDatasetConfig e, em seguida, chamar os métodos read_* correspondentes para convertê-lo num OutputTabularDatasetConfig.

A forma como o resultado será copiado para o destino de um OutputTabularDatasetConfig é igual a OutputFileDatasetConfig. A diferença entre eles é que o Conjunto de Dados criado será um TabularDataset que contém todas as transformações especificadas.

Métodos

as_input	Especifique como consumir a saída como entrada nos passos subsequentes do pipeline.
as_mount	Defina o modo da saída para montar. Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado.
as_upload	Defina o modo da saída para carregar. Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado.
drop_columns	Remova as colunas especificadas do Conjunto de Dados.
keep_columns	Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados.
random_split	Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada. As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes.

as_input

Especifique como consumir a saída como entrada nos passos subsequentes do pipeline.

as_input(name=None)

Parâmetros

Name	Description
name Necessário	str O nome da entrada específica da execução.

Devoluções

Tipo	Description
DatasetConsumptionConfig	Uma DatasetConsumptionConfig instância que descreve como entregar os dados de entrada.

as_mount

Defina o modo da saída para montar.

Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado.

as_mount()

Devoluções

Tipo	Description
OutputTabularDatasetConfig	Uma OutputTabularDatasetConfig instância com o modo definido como montagem.

as_upload

Defina o modo da saída para carregar.

Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado.

as_upload(overwrite=False, source_globs=None)

Parâmetros

Name	Description
overwrite Necessário	bool Se pretende substituir ficheiros que já existem no destino.
source_globs Necessário	list[str] Padrões Glob utilizados para filtrar ficheiros que serão carregados.

Devoluções

Tipo	Description
OutputTabularDatasetConfig	Uma OutputTabularDatasetConfig instância com o modo definido para carregar.

drop_columns

Remova as colunas especificadas do Conjunto de Dados.

drop_columns(columns)

Parâmetros

Name	Description
columns Necessário	Union[str, list[str]] O nome ou uma lista de nomes para as colunas largarem.

Devoluções

Tipo	Description
PipelineOutputTabularDataset	Uma OutputTabularDatasetConfig instância com as colunas a remover.

keep_columns

Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados.

keep_columns(columns)

Parâmetros

Name	Description
columns Necessário	Union[str, list[str]] O nome ou uma lista de nomes das colunas a manter.

Devoluções

Tipo	Description
PipelineOutputTabularDataset	Uma OutputTabularDatasetConfig instância com as colunas a manter.

random_split

Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada.

As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes.

random_split(percentage, seed=None)

Parâmetros

Name	Description
percentage Necessário	float A percentagem aproximada pela qual dividir o conjunto de dados. Tem de ser um número entre 0,0 e 1,0.
seed Necessário	int Semente opcional a utilizar para o gerador aleatório.

Devoluções

Tipo	Description
tuple(OutputTabularDatasetConfig, OutputTabularDatasetConfig)	Devolve uma cadeia de identificação de dois objetos OutputTabularDatasetConfig que representam os dois Conjuntos de Dados após a divisão.

Partilhar via

OutputTabularDatasetConfig Classe

Construtor

Observações

Métodos

as_input

Parâmetros

Devoluções

as_mount

Devoluções

as_upload

Parâmetros

Devoluções

drop_columns

Parâmetros

Devoluções

keep_columns

Parâmetros

Devoluções

random_split

Parâmetros

Devoluções

Comentários

Recursos adicionais