Konwersje formatu danych

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

W tym artykule wymieniono moduły dostępne w programie Machine Learning Studio (klasyczne) służące do konwertowania danych na różne formaty plików używane w uczeniu maszynowym.

Obsługiwane formaty obejmują:

  • Format zestawu danych używany w całym Machine Learning.
  • Format ARFF używany przez firmę Weka. Weka to oparty na języku Java zestaw algorytmów uczenia maszynowego typu open source.
  • Format SVMLight . Format SVMLight został opracowany dla struktury SVMlight do uczenia maszynowego. Może być również używany przez Vowpal Wabbit.
  • Formaty plików rozdzielanych tabulatorami (TSV) i rozdzielanych przecinkami (CSV), które są obsługiwane przez większość relacyjnych baz danych. Te formaty są również szeroko obsługiwane w językach R i Python.

Podczas konwertowania danych na te formaty można łatwiej przenosić wyniki i dane między różnymi platformami uczenia maszynowego lub mechanizmami magazynu.

Uwaga

Te moduły konwersji danych konwertują tylko pełny zestaw danych do określonego formatu. Jeśli musisz wykonać rzutowanie, przycinanie, konwersję formatów daty/godziny lub inne manipulowanie wartościami, użyj modułów w funkcji Przekształcanie danych lub zobacz listę powiązanych zadań.

Typowe scenariusze konwersji danych

Moduły konwersji danych są zwykle używane, jeśli musisz przenieść dane z eksperymentu Machine Learning do innego narzędzia lub platformy uczenia maszynowego. Moduły służą również do eksportowania danych z programu Machine Learning w formacie, który może być używany przez bazę danych lub inne narzędzia. Na przykład:

Zadanie Użyj tego
Musisz zapisać pośredni zestaw danych do użycia w Excel lub w celu zaimportowania do bazy danych. Użyj modułu CSV lub modułu TSV , aby przygotować dane w poprawnym formacie. Następnie pobierz dane lub zapisz je w usłudze Azure Storage.
Chcesz ponownie użyć danych z eksperymentu w kodzie języka R lub Python. Użyj modułu CSV lub TSV , aby przygotować dane. Następnie kliknij prawym przyciskiem myszy przekonwertowany zestaw danych, aby uzyskać kod języka Python potrzebny do uzyskania dostępu do zestawu danych.
Przekierowywujesz swój eksperyment i dane między weka i Machine Learning. Użyj modułu ARFF , aby przygotować dane. Następnie pobierz wyniki.
Należy przygotować dane w platformie SVMlight. Użyj modułu Convert to SVMLight,aby przygotować dane. Następnie pobierz wynikowe dane.
Utwórz dane do użycia z Vowpal Wabbit. Użyj formatu SVMLight . Następnie zmodyfikuj pliki zgodnie z opisem w artykule. Zapisz plik w usłudze Azure Blob Storage do użycia z modułem Vowpal Wabbit w usłudze Machine Learning.
Dane nie są w formacie tabelarykowym. Przekonwertuj go do formatu zestawu danych przy użyciu modułu Convert to Dataset (Konwertuj na zestaw danych).

Jeśli musisz zaimportować dane do Machine Learning lub przekształcić dane w poszczególnych kolumnach, użyj tych modułów przed przeprowadzeniem konwersji danych:

Zadanie Użyj tego
Zaimportuj dane z mojego komputera do Machine Learning. Upload w formacie CSV zgodnie z opisem w temacie Importowanie danych szkoleniowych do programu Machine Learning Studio (wersja klasyczna).
Importowanie danych ze źródła danych w chmurze, w tym usługi Hadoop lub Azure. Użyj modułu Import danych .
Zapisz zestawy danych uczenia maszynowego w usłudze Azure Blob Storage, klastrze Hadoop lub innym magazynie opartym na chmurze. Użyj modułu Eksportuj dane.
Zmień typ danych kolumn lub kolumn rzutowania na inny format lub typ. W Machine Learning użyj modułów Edit Metadata (Edytowanie metadanych) SQL Apply SQL Transformation (Stosowanie przekształcenia). Jeśli masz umiejętności z językami R lub Python, wypróbuj moduły Execute Python Script (Wykonywanie skryptu języka Python ) lub Execute R Script (Wykonaj skrypt języka R ).
Zaokrąglaj, grupuj lub normalizuj dane liczbowe. Użyj modułów Zastosuj operację matematyczne, Pogrupuj dane w pojemniki lub Normalizuj dane.

Lista modułów

Kategoria Konwersje formatu danych obejmuje następujące moduły:

Zobacz też