OutputTabularDatasetConfig Classe
Represente como copiar o resultado de uma execução e ser promovido como tabularDataset.
Inicialize um OutputTabularDatasetConfig.
- Herança
-
OutputTabularDatasetConfig
Construtor
OutputTabularDatasetConfig(**kwargs)
Observações
Não deve chamar este construtor diretamente, mas deve criar um OutputFileDatasetConfig e, em seguida, chamar os métodos read_* correspondentes para convertê-lo num OutputTabularDatasetConfig.
A forma como o resultado será copiado para o destino de um OutputTabularDatasetConfig é igual a OutputFileDatasetConfig. A diferença entre eles é que o Conjunto de Dados criado será um TabularDataset que contém todas as transformações especificadas.
Métodos
as_input |
Especifique como consumir a saída como entrada nos passos subsequentes do pipeline. |
as_mount |
Defina o modo da saída para montar. Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado. |
as_upload |
Defina o modo da saída para carregar. Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado. |
drop_columns |
Remova as colunas especificadas do Conjunto de Dados. |
keep_columns |
Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados. |
random_split |
Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada. As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes. |
as_input
Especifique como consumir a saída como entrada nos passos subsequentes do pipeline.
as_input(name=None)
Parâmetros
Name | Description |
---|---|
name
Necessário
|
O nome da entrada específica da execução. |
Devoluções
Tipo | Description |
---|---|
Uma DatasetConsumptionConfig instância que descreve como entregar os dados de entrada. |
as_mount
Defina o modo da saída para montar.
Para o modo de montagem, o diretório de saída será um diretório montado FUSE. Os ficheiros escritos no diretório montado serão carregados quando o ficheiro for fechado.
as_mount()
Devoluções
Tipo | Description |
---|---|
Uma OutputTabularDatasetConfig instância com o modo definido como montagem. |
as_upload
Defina o modo da saída para carregar.
Para o modo de carregamento, os ficheiros escritos no diretório de saída serão carregados no final da tarefa. Se a tarefa falhar ou for cancelada, o diretório de saída não será carregado.
as_upload(overwrite=False, source_globs=None)
Parâmetros
Name | Description |
---|---|
overwrite
Necessário
|
Se pretende substituir ficheiros que já existem no destino. |
source_globs
Necessário
|
Padrões Glob utilizados para filtrar ficheiros que serão carregados. |
Devoluções
Tipo | Description |
---|---|
Uma OutputTabularDatasetConfig instância com o modo definido para carregar. |
drop_columns
Remova as colunas especificadas do Conjunto de Dados.
drop_columns(columns)
Parâmetros
Name | Description |
---|---|
columns
Necessário
|
O nome ou uma lista de nomes para as colunas largarem. |
Devoluções
Tipo | Description |
---|---|
Uma OutputTabularDatasetConfig instância com as colunas a remover. |
keep_columns
Mantenha as colunas especificadas e deixe cair todas as outras do Conjunto de Dados.
keep_columns(columns)
Parâmetros
Name | Description |
---|---|
columns
Necessário
|
O nome ou uma lista de nomes das colunas a manter. |
Devoluções
Tipo | Description |
---|---|
Uma OutputTabularDatasetConfig instância com as colunas a manter. |
random_split
Divida os registos no conjunto de dados em duas partes aleatoriamente e aproximadamente pela percentagem especificada.
As configurações de saída resultantes terão os respetivos nomes alterados, o primeiro terá _1 anexado ao nome e o segundo terá _2 anexado ao nome. Se causar uma colisão de nomes ou se quiser especificar um nome personalizado, defina manualmente os respetivos nomes.
random_split(percentage, seed=None)
Parâmetros
Name | Description |
---|---|
percentage
Necessário
|
A percentagem aproximada pela qual dividir o conjunto de dados. Tem de ser um número entre 0,0 e 1,0. |
seed
Necessário
|
Semente opcional a utilizar para o gerador aleatório. |
Devoluções
Tipo | Description |
---|---|
Devolve uma cadeia de identificação de dois objetos OutputTabularDatasetConfig que representam os dois Conjuntos de Dados após a divisão. |