Two-Class Decision Zamów

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Tworzy dwuklasowy model klasyfikacji przy użyciu algorytmu algorytmu podejmowania decyzji

Kategoria: Machine Learning/ Inicjowanie modelu/klasyfikacji

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano, jak za pomocą modułu Two-Class Decision Model w programie Machine Learning Studio (wersja klasyczna) utworzyć model uczenia maszynowego oparty na nadzorowym algorytmie uczenia zespołowego nazywanym algorytmami podejmowania decyzji.

Moduł Two-Class Decision Gdy zwraca nieprzeszkolony klasyfikator. Następnie trenuje się ten model na podstawie zestawu danych treningowych z etykietami przy użyciuhiperparametrów trenowania modelu lub dostrajania modelu. Wytrenowany model może być następnie używany do przewidywania.

Więcej informacji o procesach decyzyjnych

Lasy decyzyjne to niedawne rozszerzenie lasów decyzyjnych. Proces decyzyjny składa się z grupy grafów acyklicznych (DAG, decision directed acyclic graph).

Decyzje mają następujące zalety:

  • Zezwalając gałęziom drzewa na scalanie, decyzje dag zwykle mają mniejszy rozmiar pamięci i lepszą wydajność uogólniania niż drzewo decyzyjne, chociaż kosztem nieco dłuższego czasu trenowania.

  • Przedsiębiorstwa decyzyjne są modelami nieparametrycznymi, które mogą reprezentować nieliniowe granice decyzyjne.

  • Wykonują one zintegrowane operacje wyboru i klasyfikacji funkcji oraz są odporne w obecności hałaśliwych funkcji.

Porada

Aby uzyskać więcej informacji na temat badań na podstawie tego algorytmu uczenia maszynowego, zobacz Decision Systems: Compact and Rich Models for Classification (Modele decyzji: kompaktowanie i rozbudowane modele klasyfikacji) (plik PDF do pobrania).

Jak skonfigurować Two-Class Decision Zadomów

  1. Dodaj moduł Two-Class Decision Module ( Dwuklasowe decyzje) do eksperymentu w programie Studio (wersja klasyczna).

  2. W przypadku metody Próbkowanie wybierz metodę używaną do tworzenia poszczególnych drzew. Możesz wybrać opcję Bagging (Bagging) lub Replicate (Replikuj).

  3. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb szkoleniowy .

    • Pojedynczy parametr: jeśli wiesz, jak chcesz skonfigurować model, możesz podać określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, możesz znaleźć optymalne parametry, określając wiele wartości i używając modułu Hiperparametry modelu dostrajania, aby znaleźć optymalną konfigurację. Instruktor będzie iterować po wielu kombinacjach podanych ustawień i określa kombinację wartości, która tworzy najlepszy model.

  4. W przypadku wartości Liczba dag decyzyjnych wskaż maksymalną liczbę grafów, które można utworzyć w zespole.

  5. W przypadku maksymalnej głębokości poszczególnych grafów należy wskazać maksymalną głębokość poszczególnych grafów.

  6. W przypadku wartości Maksymalna szerokość poszczególnych grafów DAG dla decyzji wskaż maksymalną szerokość poszczególnych grafów.

  7. W części Liczba kroków optymalizacji na warstwę daG decyzji wskaż liczbę iteracji danych do wykonania podczas tworzenia poszczególnych procesów DAG.

  8. Wybierz opcję Zezwalaj na nieznane wartości dla funkcji kategorii, aby utworzyć grupę dla nieznanych wartości w danych testowania lub walidacji.

    Jeśli ją odznaczysz, model może akceptować tylko wartości zawarte w danych szkoleniowych. W pierwszym przypadku model może być mniej dokładny dla znanych wartości, ale może zapewnić lepsze przewidywania dla nowych (nieznanych) wartości.

  9. Dodaj otagowany zestaw danych do eksperymentu i połącz jeden z modułów szkoleniowych.

    Uwaga

    Jeśli przekażemy zakres parametrów do funkcji Train Model, będzie używana tylko pierwsza wartość z listy zakresów parametrów.

    Jeśli przekażemy pojedynczy zestaw wartości parametrów do modułu Hiperparametry modelu dostrajania, jeśli oczekuje on zakresu ustawień dla każdego parametru, zignoruje wartości i użyje wartości domyślnych dla uczących się.

    W przypadku wybrania opcji Zakres parametrów i wprowadzenia pojedynczej wartości dla dowolnego parametru określona pojedyncza wartość będzie używana podczas całej czyszczenie, nawet jeśli inne parametry zmienią się w zakresie wartości.

Wyniki

Po zakończeniu szkolenia:

  • Aby użyć modelu do oceniania, połącz go z modelem Score Model (Ocena modelu) w celu przewidywania wartości dla nowych przykładów wejściowych.

Przykłady

Przykłady sposobu, w jaki decyzje są używane w uczeniu maszynowym, można znaleźć w Azure AI Gallery:

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Porady dotyczące użycia

Jeśli masz ograniczone dane lub chcesz zminimalizować czas trenowania modelu, wypróbuj te ustawienia.

Ograniczony zestaw treningowy

Jeśli zestaw treningowy jest mały:

  • Utwórz decyzje przy użyciu dużej liczby decyzyjnych grupy DAG (na przykład ponad 20).
  • Użyj opcji Bagging w celu ponownego próbkowania.
  • Określ dużą liczbę kroków optymalizacji na warstwę DAG (na przykład ponad 10 000).

Ograniczony czas trenowania

Jeśli zestaw treningowy jest duży, ale czas trenowania jest ograniczony:

  • Utwórz decyzje przy użyciu mniejszej liczby grupy DAG decyzji (na przykład 5–10).
  • Użyj opcji Replikuj do ponownego próbkowania.
  • Określ mniejszą liczbę kroków optymalizacji na warstwę DAG (na przykład mniejszą niż 2000).

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Metoda ponownego próbkowania Dowolne ResamplingMethod Pakowania Wybieranie metody ponownego próbkowania
Liczba decyzje DAG >= 1 Liczba całkowita 8 Określ liczbę wykresów decyzyjnych do skompilowania w zespole
Maksymalna głębokość decyzyjnych dag >= 1 Liczba całkowita 32 Określ maksymalną głębokość wykresów decyzyjnych w zespole
Maksymalna szerokość decyzje dag >= 8 Liczba całkowita 128 Określanie maksymalnej szerokości wykresów decyzyjnych w zespole
Liczba kroków optymalizacji na warstwę dag decyzji >= 1000 Liczba całkowita 2048 Określ liczbę kroków, które należy wykonać, aby zoptymalizować każdy poziom wykresów decyzyjnych
Zezwalaj na nieznane wartości dla cech kategorii Dowolne Boolean Prawda Wskazanie, czy nieznane wartości istniejących cech kategorii mogą być mapowane na nową, dodatkową funkcję

Dane wyjściowe

Nazwa Typ Opis
Nie wytrenowany model ILearner, interfejs Nieprzeszkolony binarny model klasyfikacji

Zobacz też

Klasyfikacja
Wieloklasowe decyzje
Lista modułów A–Z