Zastosuj filtr

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Stosuje filtr do określonych kolumn zestawu danych

Kategoria: Przekształcanie/filtrowanie danych

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób używania modułu Zastosuj filtr w programie Machine Learning Studio (wersja klasyczna) do przekształcania kolumny wartości przez zastosowanie wcześniej zdefiniowanego filtru. Filtry są używane w przetwarzaniu sygnału cyfrowego w celu zmniejszenia szumu lub wyróżnienia wzorca. W związku z tym przekształcane wartości są zawsze liczbowe i zazwyczaj reprezentują pewien rodzaj sygnału dźwiękowego lub wizualnego.

Porada

Szukasz innego typu filtru? Program Studio (klasyczny) udostępnia te moduły do próbkowania danych, pobierania podzestawu danych, usuwania złych wartości lub tworzenia zestawów testowych i treningowych: Dzieleniedanych, Czyszczenie brakujących danych,Partycja i Przykład, Stosowanie przekształcenia SQL, Clip Values. Jeśli musisz filtrować dane podczas odczytywania ich ze źródła, zobacz Importowanie danych. Opcje zależą od typu źródła.

Po określeniu, który typ filtru jest najlepszy dla źródła danych, należy określić parametry i użyć funkcji Zastosuj filtr , aby przekształcić zestaw danych. Ponieważ projekt filtrów jest oddzielony od procesu stosowania filtru, filtry są wielokrotnego użytku. Jeśli na przykład często pracujesz z danymi używanymi do prognozowania, możesz zaprojektować kilka typów filtrów średniej ruchomej do trenowania i porównywania wielu modeli. Możesz również zapisać filtr, aby zastosować go do innych eksperymentów lub do różnych zestawów danych.

Jak skonfigurować stosowanie filtru

  1. Dodaj moduł Zastosuj filtr do eksperymentu. Moduł filtru IIR można znaleźć w obszarze Przekształcanie danych w kategorii Filtry.

  2. Z prawym przyciskiem myszy połącz zestaw danych zawierający wartości liczbowe z jednym elementem wejściowym.

  3. Z lewymi elementami wejściowymi połącz istniejący filtr. Możesz ponownie użyć zapisanego filtru lub skonfigurować filtr przy użyciu jednego z następujących modułów filtrów: Filtrprogu, Filtr średniej ruchomej, Filtr mediany, Filtr IIR, Filtr FIR, Filtr zdefiniowany przez użytkownika.

  4. W okienku Właściwości okna Zastosuj filtr kliknij pozycję Uruchom selektora kolumn i wybierz kolumny, do których ma zostać zastosowany filtr.

  5. Uruchom eksperyment lub kliknij prawym przyciskiem myszy pozycję Zastosuj filtr i kliknij polecenie Uruchom wybrane.

Wyniki

Dane wyjściowe zawierają tylko dane w wybranych kolumnach, przekształcone przez zastosowanie określonego wstępnie zdefiniowanego przekształcenia matematycznego.

Jeśli chcesz zobaczyć inne kolumny w zestawie danych, możesz użyć modułu Dodaj kolumny, aby scalić oryginalne i przefiltrowane zestawy danych.

Uwaga

Wartości w oryginalnej kolumnie nie zostały usunięte ani zastąpione i są nadal dostępne w eksperymencie do odwołania. Jednak dane wyjściowe filtru zwykle są bardziej przydatne podczas modelowania.

Przykłady

Przykłady stosowania filtrów w uczeniu maszynowym można znaleźć w Azure AI Gallery:

  • Filtry: przedstawia wszystkie typy filtrów przy użyciu zestawu danych o formie falowej.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

  • Moduł Zastosuj filtr wiąże określony typ filtru z wybranymi kolumnami. Jeśli chcesz zastosować różne typy filtrów do różnych kolumn, użyj opcji Wybierz kolumny w zestawie danych, aby odizolować kolumny i zastosować różne typy filtrów w oddzielnych przepływach pracy. Aby uzyskać więcej informacji, zobacz Select Columns in Dataset (Wybieranie kolumn w zestawie danych).

  • Filtry nie przechodzą przez kolumny danych, na które nie ma wpływu filtr. Oznacza to, że dane wyjściowe funkcji Zastosuj filtr zawierają tylko przekształcone wartości liczbowe. Można jednak użyć modułu Dodaj kolumny , aby połączyć przekształcone wartości ze źródłowym zestawem danych.

Okresy filtrowania

Okres filtru jest częściowo określany przez typ filtru w następujący sposób:

  • W przypadku odpowiedzi finite impulse (FIR), prostej średniej ruchomej i trójkątnych filtrów średniej ruchomej okres filtrowania jest skończony.

  • W przypadku nieskończonej odpowiedzi impulsowej (IIR), wykładniczej średniej ruchomej i skumulowanej średniej ruchomej filtrów okres filtrowania jest nieskończony.

  • W przypadku filtrów progowych okres filtrowania to zawsze 1.

  • W przypadku filtrów mediany, niezależnie od okresu filtru, sieci NaN i brakujące wartości w sygnałie wejściowym nie dają nowych wartości NaN w danych wyjściowych.

Brakujące wartości

W tej sekcji opisano zachowanie w przypadku napotkania brakujących wartości według typu filtru. Ogólnie rzecz biorąc, gdy filtr napotka wartość NaN lub brakującą wartość w wejściowym zestawie danych, wyjściowy zestaw danych zostanie zaadeksowany przy użyciu wartości NaN dla kolejnej liczby próbek, w zależności od okresu filtrowania. Ma to następujące konsekwencje:

  • FiR, proste filtry średniej ruchomej lub trójkątne średnie ruchome mają skończony okres. W związku z tym po każdej brakującej wartości będzie następuje liczba wartości NaN równa kolejności filtrowania minus jeden.

  • Filtry IIR, wykładnicza średnia ruchoma lub skumulowana średnia ruchoma mają nieskończony okres. W związku z tym po napotkaniu pierwszej brakującej wartości sieci NaN będą nadal propagowane przez czas nieokreślony.

  • W filtrze progowym okres filtru progu wynosi 1. W związku z tym brakujące wartości i wartości NaN nie są propagowane.

  • W przypadku filtrów mediany wartości NaN i brakujące wartości napotkane w wejściowym zestawie danych nie dają nowych wartości NaN w danych wyjściowych, niezależnie od okresu filtru.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Filtr IFilter, interfejs Implementacja filtru
Zestaw danych Tabela danych Wejściowy zestaw danych

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Zestaw kolumn Dowolne ColumnSelection NumericAll Wybieranie kolumn do filtrowania

Dane wyjściowe

Nazwa Typ Opis
Zestaw danych wyników Tabela danych Wyjściowy zestaw danych

Zobacz też

Filtr
Lista modułów A–Z