Dataset Třída
Představuje prostředek pro zkoumání, transformaci a správu dat ve službě Azure Machine Learning.
Datová sada je odkaz na data v nebo Datastore za veřejnými webovými adresami URL.
V případě zastaralých metod v této třídě zkontrolujte AbstractDataset vylepšená rozhraní API třídy.
Podporují se následující typy datových sad:
Objekt TabularDataset reprezentuje data v tabulkovém formátu vytvořeném parsováním zadaného souboru nebo seznamu souborů.
Objekt FileDataset odkazuje na jeden nebo několik souborů v úložištích dat nebo z veřejných adres URL.
Pokud chcete začít pracovat s datovými sadami, přečtěte si článek Přidání & registrace datových sad nebo si prohlédněte poznámkové bloky https://aka.ms/tabulardataset-samplenotebook a https://aka.ms/filedataset-samplenotebook.
Inicializujte objekt Dataset.
Pokud chcete získat datovou sadu, která už je v pracovním prostoru zaregistrovaná, použijte metodu get.
- Dědičnost
-
builtins.objectDataset
Konstruktor
Dataset(definition, workspace=None, name=None, id=None)
Parametry
Name | Description |
---|---|
definition
Vyžadováno
|
<xref:azureml.data.DatasetDefinition>
Definice datové sady. |
workspace
Vyžadováno
|
Pracovní prostor, ve kterém datová sada existuje. |
name
Vyžadováno
|
Název datové sady. |
id
Vyžadováno
|
Jedinečný identifikátor datové sady. |
Poznámky
Třída Dataset zveřejňuje dva atributy třídy convenience (File
a Tabular
), které můžete použít k vytvoření datové sady, aniž byste museli pracovat s odpovídajícími metodami továrny. Pokud chcete například vytvořit datovou sadu pomocí těchto atributů:
Dataset.Tabular.from_delimited_files()
Dataset.File.from_files()
Můžete také vytvořit novou TabularDataset nebo FileDataset přímým voláním odpovídajících metod továrny třídy definované v TabularDatasetFactory a FileDatasetFactory.
Následující příklad ukazuje, jak vytvořit objekt TabularDataset odkazující na jednu cestu v úložišti dat.
from azureml.core import Dataset
dataset = Dataset.Tabular.from_delimited_files(path = [(datastore, 'train-dataset/tabular/iris.csv')])
# preview the first 3 rows of the dataset
dataset.take(3).to_pandas_dataframe()
Úplná ukázka je k dispozici na https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datasets-tutorial/train-with-datasets/train-with-datasets.ipynb
Proměnné
Name | Description |
---|---|
azureml.core.Dataset.File
|
Atribut třídy, který poskytuje přístup k FileDatasetFactory metody pro vytváření nových FileDataset objekty. Použití: Dataset.File.from_files(). |
azureml.core.Dataset.Tabular
|
Atribut třídy, který poskytuje přístup k metodám TabularDatasetFactory pro vytváření nových objektů TabularDataset. Použití: Dataset.Tabular.from_delimited_files(). |
Metody
archive |
Archivace aktivní nebo zastaralé datové sady Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
auto_read_files |
Analyzuje soubory na zadané cestě a vrátí novou datovou sadu. Poznámka Tato metoda je zastaralá a už nebude podporována. Ke čtení souborů doporučujeme používat metody Dataset.Tabular.from_*. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
compare_profiles |
Porovnejte profil aktuální datové sady s jiným profilem datové sady. To ukazuje rozdíly v souhrnných statistikách mezi dvěma datovými sadami. Parametr "rhs_dataset" je zkratka pro "pravá strana" a je jednoduše druhou datovou sadou. První datová sada (aktuální objekt datové sady) se považuje za "levou stranu". Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
create_snapshot |
Vytvořte snímek registrované datové sady. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
delete_snapshot |
Odstraňte snímek datové sady podle názvu. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
deprecate |
Vyřazení aktivní datové sady v pracovním prostoru jinou datovou sadou Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
diff |
Rozdělte aktuální datovou sadu pomocí rhs_dataset. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_binary_files |
Vytvořte neregistrovanou datovou sadu v paměti z binárních souborů. Poznámka Tato metoda je zastaralá a už nebude podporována. Doporučujeme místo toho použít Dataset.File.from_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_delimited_files |
Vytvořte neregistrovanou datovou sadu v paměti ze souborů s oddělovači. Poznámka Tato metoda je zastaralá a už nebude podporována. Doporučujeme místo toho použít Dataset.Tabular.from_delimited_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
|
from_excel_files |
Vytvořte neregistrovanou datovou sadu v paměti z excelových souborů. Poznámka Tato metoda je zastaralá a již nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_json_files |
Ze souborů JSON vytvořte neregistrovanou datovou sadu v paměti. Poznámka Tato metoda je zastaralá a již nebude podporována. Ke čtení ze souboru řádků JSON doporučujeme místo toho použít Dataset.Tabular.from_json_lines_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_pandas_dataframe |
Vytvořte neregistrovanou datovou sadu v paměti z datového rámce pandas. Poznámka Tato metoda je zastaralá a již nebude podporována. Doporučujeme místo toho použít Dataset.Tabular.register_pandas_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_parquet_files |
Vytvořte neregistrovanou datovou sadu v paměti ze souborů Parquet. Poznámka Tato metoda je zastaralá a již nebude podporována. Doporučujeme místo toho použít Dataset.Tabular.from_parquet_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
from_sql_query |
Vytvoření neregistrované datové sady v paměti z dotazu SQL Poznámka Tato metoda je zastaralá a již nebude podporována. Doporučujeme místo toho použít Dataset.Tabular.from_sql_query. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
generate_profile |
Vygenerujte nový profil pro datovou sadu. Poznámka Tato metoda je zastaralá a již nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get |
Získejte datovou sadu, která už v pracovním prostoru existuje, zadáním jejího názvu nebo ID. Poznámka Tato metoda je zastaralá a už nebude podporována. Doporučujeme použít get_by_name a get_by_id místo toho. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get_all |
Získejte všechny registrované datové sady v pracovním prostoru. |
get_all_snapshots |
Získejte všechny snímky datové sady. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get_by_id |
Získejte datovou sadu, která se uloží do pracovního prostoru. |
get_by_name |
Získejte zaregistrovanou datovou sadu z pracovního prostoru podle názvu registrace. |
get_definition |
Získejte konkrétní definici datové sady. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get_definitions |
Získejte všechny definice datové sady. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get_profile |
Získejte souhrnné statistiky o datové sadě vypočítané dříve. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
get_snapshot |
Získejte snímek datové sady podle názvu. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
head |
Načítejte zadaný počet záznamů zadaných z této datové sady a vrátí je jako datový rámec. Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
list |
Vypište všechny datové sady v pracovním prostoru, včetně těch, které mají Poznámka Tato metoda je zastaralá a už nebude podporována. Doporučujeme místo toho použít get_all . Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
reactivate |
Opětovná aktivace archivované nebo zastaralé datové sady Poznámka Tato metoda je zastaralá a už nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
register |
Zaregistrujte datovou sadu v pracovním prostoru a zpřístupníte ji ostatním uživatelům pracovního prostoru. Poznámka Tato metoda je zastaralá a už nebude podporována. Doporučujeme místo toho použít register . Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
sample |
Pomocí strategie vzorkování a zadaných parametrů vygenerujte ze zdrojové datové sady novou ukázku. Poznámka Tato metoda je zastaralá a již nebude podporována. TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamtake_sample. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
to_pandas_dataframe |
Vytvořte datový rámec Pandas spuštěním transformačního kanálu definovaného touto definicí datové sady. Poznámka Tato metoda je zastaralá a již nebude podporována. TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamto_pandas_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
to_spark_dataframe |
Vytvořte datový rámec Sparku, který může spustit kanál transformace definovaný touto definicí datové sady. Poznámka Tato metoda je zastaralá a již nebude podporována. TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamto_spark_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
update |
Aktualizujte proměnlivé atributy datové sady v pracovním prostoru a vraťte aktualizovanou datovou sadu z pracovního prostoru. Poznámka Tato metoda je zastaralá a již nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
update_definition |
Aktualizujte definici datové sady. Poznámka Tato metoda je zastaralá a již nebude podporována. Další informace naleznete v tématu https://aka.ms/dataset-deprecation. |
archive
Archivace aktivní nebo zastaralé datové sady
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
archive()
Návraty
Typ | Description |
---|---|
Žádné |
Poznámky
Po archivaci dojde při každém pokusu o využití datové sady k chybě. Pokud se archivuje omylem, opětovná aktivace ho aktivuje.
auto_read_files
Analyzuje soubory na zadané cestě a vrátí novou datovou sadu.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Ke čtení souborů doporučujeme používat metody Dataset.Tabular.from_*. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static auto_read_files(path, include_path=False, partition_format=None)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k datům v registrovaném úložišti dat, místní cesta nebo adresa URL HTTP (CSV/TSV). |
include_path
Vyžadováno
|
Zda se má zahrnout sloupec obsahující cestu k souboru, ze kterého byla data načtena. Užitečné při čtení více souborů a chcete vědět, ze kterého souboru konkrétní záznam pochází. Užitečné také v případě, že jsou v cestě k souboru nebo názvu informace, které chcete ve sloupci mít. |
partition_format
Vyžadováno
|
Zadejte formát oddílu v cestě a vytvořte sloupce řetězců z formátu {x} a sloupce datetime z formátu {x:yyyy/MM/dd/HH/mm/ss}, kde 'yyyy', 'MM', 'dd', 'HH', 'mm' a 'ss' se používají pro extrat rok, měsíc, den, hodinu, minutu a sekundu pro typ datetime. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě k souboru '.. /Accounts/2019/01/01/data.csv, kde jsou data rozdělená podle názvu a času oddělení, můžeme definovat /{Department}/{PartitionDate:yyyy/MM/dd}/data.csv a vytvořit tak sloupce "Oddělení" typu řetězec a 'PartitionDate' typu datetime. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. |
Poznámky
Tuto metodu použijte, pokud chcete automaticky rozpoznat formáty souborů a oddělovače.
Po vytvoření datové sady byste měli použít get_profile seznam rozpoznaných typů sloupců a souhrnné statistiky pro každý sloupec.
Vrácená datová sada není zaregistrovaná v pracovním prostoru.
compare_profiles
Porovnejte profil aktuální datové sady s jiným profilem datové sady.
To ukazuje rozdíly v souhrnných statistikách mezi dvěma datovými sadami. Parametr "rhs_dataset" je zkratka pro "pravá strana" a je jednoduše druhou datovou sadou. První datová sada (aktuální objekt datové sady) se považuje za "levou stranu".
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
compare_profiles(rhs_dataset, profile_arguments={}, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)
Parametry
Name | Description |
---|---|
rhs_dataset
Vyžadováno
|
Druhá datová sada, označovaná také jako "pravá" datová sada pro porovnání. |
profile_arguments
Vyžadováno
|
Argumenty pro retrivní konkrétní profil. |
include_columns
Vyžadováno
|
Seznam názvů sloupců, které se mají zahrnout do porovnání |
exclude_columns
Vyžadováno
|
Seznam názvů sloupců, které se mají při porovnávání vyloučit |
histogram_compare_method
Vyžadováno
|
Výčet popisující metodu porovnání, například: Wasserstein nebo Energy |
Návraty
Typ | Description |
---|---|
<xref:azureml.dataprep.api.engineapi.typedefinitions.DataProfileDifference>
|
Rozdíl mezi dvěma profily datové sady |
Poznámky
Týká se to jenom registrovaných datových sad. Vyvolá výjimku, pokud profil aktuální datové sady neexistuje. Pro neregistrované datové sady použijte metodu profile.compare.
create_snapshot
Vytvořte snímek registrované datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)
Parametry
Name | Description |
---|---|
snapshot_name
Vyžadováno
|
Název snímku. Názvy snímků by měly být v rámci datové sady jedinečné. |
compute_target
Vyžadováno
|
Volitelný cílový výpočetní objekt pro vytvoření profilu snímku Pokud je vynechán, použije se místní výpočetní prostředí. |
create_data_snapshot
Vyžadováno
|
Pokud je true, vytvoří se materializovaná kopie dat. |
target_datastore
Vyžadováno
|
Zacílit úložiště dat pro uložení snímku. Pokud tento parametr vynecháte, vytvoří se snímek ve výchozím úložišti pracovního prostoru. |
Návraty
Typ | Description |
---|---|
Objekt snímku datové sady. |
Poznámky
Snímky zaznamenávají souhrnné statistiky podkladových dat k určitému bodu v čase a volitelnou kopii samotných dat. Další informace o vytváření snímků najdete v tématu https://aka.ms/azureml/howto/createsnapshots.
delete_snapshot
Odstraňte snímek datové sady podle názvu.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
delete_snapshot(snapshot_name)
Parametry
Name | Description |
---|---|
snapshot_name
Vyžadováno
|
Název snímku. |
Návraty
Typ | Description |
---|---|
Žádné |
Poznámky
Tato možnost slouží k uvolnění úložiště spotřebovaného daty uloženými ve snímcích, které už nepotřebujete.
deprecate
Vyřazení aktivní datové sady v pracovním prostoru jinou datovou sadou
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
deprecate(deprecate_by_dataset_id)
Parametry
Name | Description |
---|---|
deprecate_by_dataset_id
Vyžadováno
|
ID datové sady, které je zamýšlenou náhradou za tuto datovou sadu. |
Návraty
Typ | Description |
---|---|
Žádné |
Poznámky
Zastaralé datové sady budou zaznamenávat upozornění, když jsou spotřebovány. Vyřazení datové sady zastará všechny její definice.
Zastaralé datové sady je stále možné využívat. Pokud chcete úplně zablokovat využívání datové sady, archivujte ji.
Pokud se omylem přestane používat, aktivuje se opětovná aktivace.
diff
Rozdělte aktuální datovou sadu pomocí rhs_dataset.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
diff(rhs_dataset, compute_target=None, columns=None)
Parametry
Name | Description |
---|---|
rhs_dataset
Vyžadováno
|
Další datová sada označovaná také jako datová sada na pravé straně pro porovnání |
compute_target
Vyžadováno
|
cílový výpočetních prostředků k provedení rozdílu. Pokud je vynechán, použije se místní výpočetní prostředí. |
columns
Vyžadováno
|
Seznam názvů sloupců, které se mají zahrnout do rozdílu. |
Návraty
Typ | Description |
---|---|
Objekt spuštění akce datové sady |
from_binary_files
Vytvořte neregistrovanou datovou sadu v paměti z binárních souborů.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Doporučujeme místo toho použít Dataset.File.from_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_binary_files(path)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k datům v registrovaném úložišti dat nebo místní cesta. |
Návraty
Typ | Description |
---|---|
Objekt Dataset. |
Poznámky
Tato metoda slouží ke čtení souborů jako datových proudů binárních dat. Vrátí jeden objekt datového proudu souboru na každý přečtený soubor. Tuto metodu použijte při čtení obrázků, videí, zvukových nebo jiných binárních dat.
get_profile a create_snapshot nebude fungovat podle očekávání pro datovou sadu vytvořenou touto metodou.
Vrácená datová sada není zaregistrovaná v pracovním prostoru.
from_delimited_files
Vytvořte neregistrovanou datovou sadu v paměti ze souborů s oddělovači.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Doporučujeme místo toho použít Dataset.Tabular.from_delimited_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
# Create a dataset from delimited files with header option as ALL_FILES_HAVE_SAME_HEADERS
dataset = Dataset.Tabular.from_delimited_files(path=(datastore, 'data/crime-spring.csv'),
header='ALL_FILES_HAVE_SAME_HEADERS')
df = dataset.to_pandas_dataframe()
static from_delimited_files(path, separator=',', header=PromoteHeadersBehavior.ALL_FILES_HAVE_SAME_HEADERS, encoding=FileEncoding.UTF8, quoting=False, infer_column_types=True, skip_rows=0, skip_mode=SkipLinesBehavior.NO_ROWS, comment=None, include_path=False, archive_options=None, partition_format=None)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k datům v registrovaném úložišti dat, místní cesta nebo adresa URL HTTP. |
separator
Vyžadováno
|
Oddělovač použitý k rozdělení sloupců. |
header
Vyžadováno
|
Řídí způsob zvýšení úrovně záhlaví sloupců při čtení ze souborů. |
encoding
Vyžadováno
|
Kódování přečtených souborů. |
quoting
Vyžadováno
|
Určete, jak se mají zpracovávat nové znaky řádků v uvozovkách. Výchozí hodnota (Nepravda) je interpretovat znaky nového řádku jako počáteční nové řádky bez ohledu na to, zda jsou znaky nového řádku v uvozovkách nebo ne. Pokud je nastavená hodnota Pravda, nové znaky řádků v uvozovkách nebudou mít za následek nové řádky a rychlost čtení souborů se zpomalí. |
infer_column_types
Vyžadováno
|
Určuje, zda jsou datové typy sloupců odvozeny. |
skip_rows
Vyžadováno
|
Počet řádků, které se mají přeskočit ve čtecích souborech |
skip_mode
Vyžadováno
|
Určuje, jak se při čtení ze souborů přeskočí řádky. |
comment
Vyžadováno
|
Znak používaný k označení řádků komentáře ve čtených souborech. Řádky začínající tímto řetězcem budou přeskočeny. |
include_path
Vyžadováno
|
Zda se má zahrnout sloupec obsahující cestu k souboru, ze kterého byla data načtena. To je užitečné, když čtete více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo chcete mít v cestě k souboru užitečné informace. |
archive_options
Vyžadováno
|
<xref:azureml.dataprep.ArchiveOptions>
Možnosti archivního souboru, včetně typu archivu a vzoru vstupního globu. Zip v tuto chvíli podporujeme jenom jako typ archivu. Například zadání
přečte všechny soubory s názvem končícím na "10-20.csv" v souboru ZIP. |
partition_format
Vyžadováno
|
Zadejte formát oddílu v cestě a vytvořte sloupce řetězců z formátu {x} a sloupce datetime z formátu {x:yyyy/MM/dd/HH/mm/ss}, kde 'yyyy', 'MM', 'dd', 'HH', 'mm' a 'ss' se používají pro extrat rok, měsíc, den, hodinu, minutu a sekundu pro typ datetime. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě k souboru '.. /Accounts/2019/01/01/data.csv, kde jsou data rozdělená podle názvu a času oddělení, můžeme definovat /{Department}/{PartitionDate:yyyy/MM/dd}/data.csv a vytvořit tak sloupce "Oddělení" typu řetězec a 'PartitionDate' typu datetime. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. |
Poznámky
Tuto metodu použijte ke čtení textových souborů s oddělovači, pokud chcete řídit použité možnosti.
Po vytvoření datové sady byste měli použít get_profile seznam rozpoznaných typů sloupců a souhrnné statistiky pro každý sloupec.
Vrácená datová sada není zaregistrovaná v pracovním prostoru.
from_excel_files
Vytvořte neregistrovanou datovou sadu v paměti z excelových souborů.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_excel_files(path, sheet_name=None, use_column_headers=False, skip_rows=0, include_path=False, infer_column_types=True, partition_format=None)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k datům v registrovaném úložišti dat nebo místní cesta. |
sheet_name
Vyžadováno
|
Název excelového listu, který se má načíst. Ve výchozím nastavení čteme první list z každého excelového souboru. |
use_column_headers
Vyžadováno
|
Určuje, jestli se má první řádek použít jako záhlaví sloupců. |
skip_rows
Vyžadováno
|
Počet řádků, které se mají přeskočit v souborech, které čtetete |
include_path
Vyžadováno
|
Určuje, jestli se má zahrnout sloupec obsahující cestu k souboru, ze kterého byla data načtena. To je užitečné, když čtete více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo zachovat užitečné informace v cestě k souboru. |
infer_column_types
Vyžadováno
|
Pokud je true, datové typy sloupců se odvozí. |
partition_format
Vyžadováno
|
Zadejte formát oddílu v cestě a vytvořte sloupce řetězců z formátu {x} a sloupce datetime z formátu {x:yyyy/MM/dd/HH/mm/ss}, kde se yyyy, MM, dd, HH, mm a ss pro typ datetime používají k extratu roku, měsíce, dne, hodiny, minuty a sekundy. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě k souboru '.. /Accounts/2019/01/01/data.xlsx' kde jsou data rozdělená na oddíly podle názvu a času oddělení, můžeme definovat /{Department}/{PartitionDate:yyyy/MM/dd}/data.xlsx a vytvořit sloupce Department typu string a PartitionDate typu datetime. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. |
Poznámky
Tato metoda slouží ke čtení souborů aplikace Excel ve formátu .xlsx. Data se dají číst z jednoho listu v každém excelovém souboru. Po vytvoření datové sady byste měli použít get_profile k výpisu zjištěných typů sloupců a souhrnné statistiky pro každý sloupec. Vrácená datová sada není zaregistrovaná v pracovním prostoru.
from_json_files
Ze souborů JSON vytvořte neregistrovanou datovou sadu v paměti.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Ke čtení ze souboru řádků JSON doporučujeme místo toho použít Dataset.Tabular.from_json_lines_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_json_files(path, encoding=FileEncoding.UTF8, flatten_nested_arrays=False, include_path=False, partition_format=None)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k souborům nebo složkám, které chcete načíst a analyzovat. Může to být buď místní cesta, nebo adresa URL objektu blob Azure. Podporuje se globbing. Například můžete použít cestu = "./data*" ke čtení všech souborů s názvem začínajícím na "data". |
encoding
Vyžadováno
|
Kódování čtených souborů. |
flatten_nested_arrays
Vyžadováno
|
Vlastnost, která řídí zpracování vnořených polí programem. Pokud se rozhodnete vnořená pole JSON zploštět, může to mít za následek mnohem větší počet řádků. |
include_path
Vyžadováno
|
Určuje, jestli se má zahrnout sloupec obsahující cestu, ze které byla data načtena. To je užitečné, když čtete více souborů a můžete chtít vědět, ze kterého souboru konkrétní záznam pochází, nebo uchovávat užitečné informace v cestě k souboru. |
partition_format
Vyžadováno
|
Zadejte formát oddílu v cestě a vytvořte sloupce řetězců z formátu {x} a sloupce datetime z formátu {x:yyyy/MM/dd/HH/mm/ss}, kde se yyyy, MM, dd, HH, mm a ss pro typ datetime používají k extratu roku, měsíce, dne, hodiny, minuty a sekundy. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě k souboru '.. /Accounts/2019/01/01/data.json' a data jsou rozdělená na oddíly podle názvu a času oddělení. Můžeme definovat /{Department}/{PartitionDate:yyyy/MM/dd}/data.json a vytvořit sloupce Department typu string a PartitionDate typu datetime. |
Návraty
Typ | Description |
---|---|
Místní objekt Dataset. |
from_pandas_dataframe
Vytvořte neregistrovanou datovou sadu v paměti z datového rámce pandas.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Doporučujeme místo toho použít Dataset.Tabular.register_pandas_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_pandas_dataframe(dataframe, path=None, in_memory=False)
Parametry
Name | Description |
---|---|
dataframe
Vyžadováno
|
Datový rámec Pandas. |
path
Vyžadováno
|
Cesta k datům v registrovaném úložišti dat nebo cesta k místní složce. |
in_memory
Vyžadováno
|
Jestli se má datový rámec číst z paměti místo uchování na disk. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. |
Poznámky
Tato metoda slouží k převodu datového rámce Pandas na objekt Dataset. Datovou sadu vytvořenou touto metodou nelze zaregistrovat, protože data pocházejí z paměti.
Pokud in_memory
je hodnota False, datový rámec Pandas se místně převede na soubor CSV. Pokud pat
je typ DataReference, pak se rámec Pandas nahraje do úložiště dat a datová sada bude založená na dataReference. Pokud je cesta místní složka, vytvoří se datová sada z místního souboru, který nelze odstranit.
Vyvolá výjimku, pokud aktuální DataReference není cesta ke složce.
from_parquet_files
Vytvořte neregistrovanou datovou sadu v paměti ze souborů Parquet.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Doporučujeme místo toho použít Dataset.Tabular.from_parquet_files. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_parquet_files(path, include_path=False, partition_format=None)
Parametry
Name | Description |
---|---|
path
Vyžadováno
|
DataReference nebo
str
Cesta k datům v registrovaném úložišti dat nebo místní cesta. |
include_path
Vyžadováno
|
Určuje, jestli se má zahrnout sloupec obsahující cestu k souboru, ze kterého byla data načtena. To je užitečné, když čtete více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo zachovat užitečné informace v cestě k souboru. |
partition_format
Vyžadováno
|
Zadejte formát oddílu v cestě a vytvořte sloupce řetězců z formátu {x} a sloupce datetime z formátu {x:yyyy/MM/dd/HH/mm/ss}, kde se yyyy, MM, dd, HH, mm a ss pro typ datetime používají k extratu roku, měsíce, dne, hodiny, minuty a sekundy. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě k souboru '.. /Accounts/2019/01/01/data.parquet' kde jsou data rozdělená podle názvu a času oddělení, můžeme definovat /{Department}/{PartitionDate:yyyy/MM/dd}/data.parquet a vytvořit tak sloupce Department typu řetězec a PartitionDate typu datetime. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. |
Poznámky
Tuto metodu použijte ke čtení souborů Parquet.
Po vytvoření datové sady byste měli použít get_profile k výpisu zjištěných typů sloupců a souhrnné statistiky pro každý sloupec.
Vrácená datová sada není zaregistrovaná v pracovním prostoru.
from_sql_query
Vytvoření neregistrované datové sady v paměti z dotazu SQL
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Doporučujeme místo toho použít Dataset.Tabular.from_sql_query. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static from_sql_query(data_source, query)
Parametry
Name | Description |
---|---|
data_source
Vyžadováno
|
Podrobnosti o Azure SQL úložiště dat. |
query
Vyžadováno
|
Dotaz, který se má spustit pro čtení dat. |
Návraty
Typ | Description |
---|---|
Místní objekt Dataset. |
generate_profile
Vygenerujte nový profil pro datovou sadu.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
generate_profile(compute_target=None, workspace=None, arguments=None)
Parametry
Name | Description |
---|---|
compute_target
Vyžadováno
|
Volitelný cílový výpočetní objekt pro vytvoření profilu snímku. Pokud tento parametr vynecháte, použije se místní výpočetní prostředí. |
workspace
Vyžadováno
|
Pracovní prostor, vyžadovaný pro přechodné (neregistrované) datové sady. |
arguments
Vyžadováno
|
Argumenty profilu. Platné argumenty jsou:
|
Návraty
Typ | Description |
---|---|
Objekt spuštění akce datové sady |
Poznámky
Synchronní volání se zablokuje, dokud se nedokoní. Voláním get_result získáte výsledek akce.
get
Získejte datovou sadu, která už v pracovním prostoru existuje, zadáním jejího názvu nebo ID.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Doporučujeme použít get_by_name a get_by_id místo toho. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static get(workspace, name=None, id=None)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém byla datová sada vytvořena. |
name
Vyžadováno
|
Název datové sady, která se má načíst. |
id
Vyžadováno
|
Jedinečný identifikátor datové sady v pracovním prostoru. |
Návraty
Typ | Description |
---|---|
Datová sada se zadaným názvem nebo ID. |
Poznámky
Můžete zadat nebo name
id
. Výjimka se vyvolá v následujících případech:
id
jsou zadané iname
, ale neshodují se.datovou sadu se zadaným
name
neboid
nelze najít v pracovním prostoru.
get_all
Získejte všechny registrované datové sady v pracovním prostoru.
get_all()
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém byly datové sady zaregistrované. |
Návraty
Typ | Description |
---|---|
Slovník objektů TabularDataset a FileDataset s klíči podle názvu registrace. |
get_all_snapshots
Získejte všechny snímky datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
get_all_snapshots()
Návraty
Typ | Description |
---|---|
Seznam snímků datových sad |
get_by_id
Získejte datovou sadu, která se uloží do pracovního prostoru.
get_by_id(id, **kwargs)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém je datová sada uložená. |
id
Vyžadováno
|
ID datové sady. |
Návraty
Typ | Description |
---|---|
Objekt datové sady. Pokud je datová sada zaregistrovaná, vrátí se také její registrační název a verze. |
get_by_name
Získejte zaregistrovanou datovou sadu z pracovního prostoru podle názvu registrace.
get_by_name(name, version='latest', **kwargs)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém byla datová sada zaregistrovaná. |
name
Vyžadováno
|
Název registrace. |
version
Vyžadováno
|
Verze registrace. Výchozí hodnota je nejnovější. |
Návraty
Typ | Description |
---|---|
Zaregistrovaný objekt datové sady. |
get_definition
Získejte konkrétní definici datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
get_definition(version_id=None)
Parametry
Name | Description |
---|---|
version_id
Vyžadováno
|
ID verze definice datové sady |
Návraty
Typ | Description |
---|---|
Definice datové sady. |
Poznámky
Pokud version_id
je k dispozici, azure Machine Learning se pokusí získat definici odpovídající dané verzi. Pokud tato verze neexistuje, vyvolá se výjimka.
Pokud version_id
je vynechán, načte se nejnovější verze.
get_definitions
Získejte všechny definice datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
get_definitions()
Návraty
Typ | Description |
---|---|
Slovník definic datových sad. |
Poznámky
Datová sada zaregistrovaná v pracovním prostoru AzureML může mít více definic, z nichž každá se vytvoří voláním update_definition. Každá definice má jedinečný identifikátor. Aktuální definice je nejnovější vytvořená definice.
U neregistrovaných datových sad existuje pouze jedna definice.
get_profile
Získejte souhrnné statistiky o datové sadě vypočítané dříve.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
get_profile(arguments=None, generate_if_not_exist=True, workspace=None, compute_target=None)
Parametry
Name | Description |
---|---|
arguments
Vyžadováno
|
Argumenty profilu. |
generate_if_not_exist
Vyžadováno
|
Určuje, jestli se má vygenerovat profil, pokud neexistuje. |
workspace
Vyžadováno
|
Pracovní prostor, vyžadovaný pro přechodné (neregistrované) datové sady. |
compute_target
Vyžadováno
|
Cílový výpočetní objekt pro spuštění akce profilu. |
Návraty
Typ | Description |
---|---|
<xref:azureml.dataprep.DataProfile>
|
DataProfile datové sady. |
Poznámky
Pro datovou sadu zaregistrovanou v pracovním prostoru Služby Azure Machine Learning tato metoda načte existující profil vytvořený dříve voláním get_profile
, pokud je stále platný. Profily se zruší, když se v datové sadě zjistí změněná data nebo se argumenty, které se get_profile
mají lišit od těch, které se použily při generování profilu. Pokud profil neexistuje nebo je neplatný, určí, generate_if_not_exist
jestli se vygeneruje nový profil.
U datové sady, která není zaregistrovaná v pracovním prostoru Azure Machine Learning, tato metoda vždy spustí generate_profile a vrátí výsledek.
get_snapshot
Získejte snímek datové sady podle názvu.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
get_snapshot(snapshot_name)
Parametry
Name | Description |
---|---|
snapshot_name
Vyžadováno
|
Název snímku. |
Návraty
Typ | Description |
---|---|
Objekt snímku datové sady. |
head
Načítejte zadaný počet záznamů zadaných z této datové sady a vrátí je jako datový rámec.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
head(count)
Parametry
Name | Description |
---|---|
count
Vyžadováno
|
Počet záznamů, které se mají vyžádat. |
Návraty
Typ | Description |
---|---|
Datový rámec Pandas. |
list
Vypište všechny datové sady v pracovním prostoru, včetně těch, které mají is_visible
vlastnost rovnající se false.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Doporučujeme místo toho použít get_all . Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
static list(workspace)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Pracovní prostor, pro který chcete načíst seznam datových sad. |
Návraty
Typ | Description |
---|---|
Seznam objektů datové sady. |
reactivate
Opětovná aktivace archivované nebo zastaralé datové sady
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
reactivate()
Návraty
Typ | Description |
---|---|
Žádné |
register
Zaregistrujte datovou sadu v pracovním prostoru a zpřístupníte ji ostatním uživatelům pracovního prostoru.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Doporučujeme místo toho použít register . Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
register(workspace, name, description=None, tags=None, visible=True, exist_ok=False, update_if_exist=False)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Pracovní prostor AzureML, ve kterém se datová sada má zaregistrovat. |
name
Vyžadováno
|
Název datové sady v pracovním prostoru. |
description
Vyžadováno
|
Popis datové sady. |
tags
Vyžadováno
|
Značky, které chcete přidružit k datové sadě. |
visible
Vyžadováno
|
Označuje, jestli je datová sada viditelná v uživatelském rozhraní. Pokud je false, datová sada je v uživatelském rozhraní skrytá a dostupná prostřednictvím sady SDK. |
exist_ok
Vyžadováno
|
Pokud je true, vrátí metoda datovou sadu, pokud již v daném pracovním prostoru existuje, jinak chyba. |
update_if_exist
Vyžadováno
|
Pokud |
Návraty
Typ | Description |
---|---|
Zaregistrovaný objekt Datové sady v pracovním prostoru. |
sample
Pomocí strategie vzorkování a zadaných parametrů vygenerujte ze zdrojové datové sady novou ukázku.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamtake_sample. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
sample(sample_strategy, arguments)
Parametry
Name | Description |
---|---|
sample_strategy
Vyžadováno
|
Ukázková strategie, která se má použít. Akceptované hodnoty jsou "top_n", "simple_random" nebo "stratified". |
arguments
Vyžadováno
|
Slovník s klíči z volitelného argumentu v seznamu uvedeném výše a hodnotami ze sloupce Typ. Lze použít pouze argumenty z odpovídající metody vzorkování. Například pro typ vzorku "simple_random" můžete zadat pouze slovník s klíči pravděpodobnosti a počátečními klíči. |
Návraty
Typ | Description |
---|---|
Objekt datové sady jako vzorek původní datové sady. |
Poznámky
Ukázky se generují spuštěním kanálu transformace definovaného touto datovou sadou a následným použitím strategie vzorkování a parametrů na výstupní data. Každá metoda vzorkování podporuje následující volitelné argumenty:
top_n
Volitelné argumenty
- n, zadejte integer. Jako ukázku vyberte prvních N řádků.
simple_random
Volitelné argumenty
pravděpodobnost, typ float. Jednoduchý náhodný vzorkování, kde má každý řádek stejnou pravděpodobnost výběru. Pravděpodobnost by měla být číslo mezi 0 a 1.
seed, zadejte float. Používá se generátorem náhodných čísel. Použijte pro opakovatelnost.
Rozvrstvené
Volitelné argumenty
columns, type list[str]. Seznam sloupců vrstev v datech
seed, zadejte float. Používá se generátorem náhodných čísel. Použijte pro opakovatelnost.
zlomky, typ dict[řazená kolekce členů, float]. Řazená kolekce členů: Hodnoty sloupců, které definují vrstvu, musí být ve stejném pořadí jako názvy sloupců. Plovák: hmotnost připevněná k vrstvě během vzorkování.
Následující fragmenty kódu jsou příkladem vzorů návrhu pro různé ukázkové metody.
# sample_strategy "top_n"
top_n_sample_dataset = dataset.sample('top_n', {'n': 5})
# sample_strategy "simple_random"
simple_random_sample_dataset = dataset.sample('simple_random', {'probability': 0.3, 'seed': 10.2})
# sample_strategy "stratified"
fractions = {}
fractions[('THEFT',)] = 0.5
fractions[('DECEPTIVE PRACTICE',)] = 0.2
# take 50% of records with "Primary Type" as THEFT and 20% of records with "Primary Type" as
# DECEPTIVE PRACTICE into sample Dataset
sample_dataset = dataset.sample('stratified', {'columns': ['Primary Type'], 'fractions': fractions})
to_pandas_dataframe
Vytvořte datový rámec Pandas spuštěním transformačního kanálu definovaného touto definicí datové sady.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamto_pandas_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
to_pandas_dataframe()
Návraty
Typ | Description |
---|---|
Datový rámec Pandas. |
Poznámky
Vrátí datový rámec Pandas plně materializovaný v paměti.
to_spark_dataframe
Vytvořte datový rámec Sparku, který může spustit kanál transformace definovaný touto definicí datové sady.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
TabularDataset Vytvořte voláním statických metod v Dataset.Tabular a použijte metodu tamto_spark_dataframe. Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
to_spark_dataframe()
Návraty
Typ | Description |
---|---|
Datový rámec Sparku. |
Poznámky
Vrácený datový rámec Sparku je pouze plánem provádění a ve skutečnosti neobsahuje žádná data, protože datové rámce Sparku se líně vyhodnocují.
update
Aktualizujte proměnlivé atributy datové sady v pracovním prostoru a vraťte aktualizovanou datovou sadu z pracovního prostoru.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
update(name=None, description=None, tags=None, visible=None)
Parametry
Name | Description |
---|---|
name
Vyžadováno
|
Název datové sady v pracovním prostoru. |
description
Vyžadováno
|
Popis dat. |
tags
Vyžadováno
|
Značky, ke kterým chcete přidružit datovou sadu. |
visible
Vyžadováno
|
Určuje, jestli je datová sada viditelná v uživatelském rozhraní. |
Návraty
Typ | Description |
---|---|
Aktualizovaný objekt Dataset z pracovního prostoru. |
update_definition
Aktualizujte definici datové sady.
Poznámka
Tato metoda je zastaralá a již nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
update_definition(definition, definition_update_message)
Parametry
Name | Description |
---|---|
definition
Vyžadováno
|
Nová definice této datové sady. |
definition_update_message
Vyžadováno
|
Zpráva o aktualizaci definice. |
Návraty
Typ | Description |
---|---|
Aktualizovaný objekt Dataset z pracovního prostoru. |
Poznámky
Pokud chcete využít aktualizovanou datovou sadu, použijte objekt vrácený touto metodou.
Atributy
definition
Vrátí aktuální definici datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
Návraty
Typ | Description |
---|---|
Definice datové sady. |
Poznámky
Definice datové sady je řada kroků, které určují, jak číst a transformovat data.
Datová sada zaregistrovaná v pracovním prostoru AzureML může mít více definic, z nichž každá se vytvoří voláním update_definition. Každá definice má jedinečný identifikátor. Více definic umožňuje provádět změny stávajících datových sad bez narušení modelů a kanálů, které závisí na starší definici.
U neregistrovaných datových sad existuje pouze jedna definice.
definition_version
Vrátí verzi aktuální definice datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
Návraty
Typ | Description |
---|---|
Verze definice datové sady. |
Poznámky
Definice datové sady je řada kroků, které určují, jak číst a transformovat data.
Datová sada zaregistrovaná v pracovním prostoru AzureML může mít více definic, z nichž každá se vytvoří voláním update_definition. Každá definice má jedinečný identifikátor. Aktuální definice je nejnovější vytvořená definice, jejíž ID vrátí.
U neregistrovaných datových sad existuje pouze jedna definice.
description
Vrátí popis datové sady.
Návraty
Typ | Description |
---|---|
Popis datové sady. |
Poznámky
Zadání popisu dat v datové sadě umožní uživatelům pracovního prostoru pochopit, co data představují a jak je můžou používat.
id
Pokud byla datová sada zaregistrovaná v pracovním prostoru, vraťte ID datové sady. V opačném případě vraťte hodnotu None.
Návraty
Typ | Description |
---|---|
ID datové sady. |
is_visible
Řízení viditelnosti registrované datové sady v uživatelském rozhraní pracovního prostoru Azure ML
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
Návraty
Typ | Description |
---|---|
Viditelnost datové sady. |
Poznámky
Vrácené hodnoty:
Pravda: Datová sada je viditelná v uživatelském rozhraní pracovního prostoru. Default (Výchozí).
Nepravda: Datová sada je v uživatelském rozhraní pracovního prostoru skrytá.
Nemá žádný vliv na neregistrované datové sady.
name
state
Vrátí stav datové sady.
Poznámka
Tato metoda je zastaralá a už nebude podporována.
Další informace naleznete v tématu https://aka.ms/dataset-deprecation.
Návraty
Typ | Description |
---|---|
Stav datové sady. |
Poznámky
Význam a účinek stavů jsou následující:
Aktivní. Aktivní definice jsou přesně to, co zní, a všechny akce lze provádět s aktivními definicemi.
Zastaralé je možné použít zastaralé definice, ale při každém přístupu k podkladovým datům se do protokolů zaprotokoluje upozornění.
Archivované. Archivovanou definici nelze použít k provedení žádné akce. Pokud chcete s archivovanou definicí provádět akce, je nutné ji znovu aktivovat.
tags
workspace
Pokud byla datová sada zaregistrovaná v pracovním prostoru, vraťte ji. V opačném případě vraťte hodnotu None.
Návraty
Typ | Description |
---|---|
Pracovní prostor. |