Interpretowanie wyników modelu w usłudze Machine Learning Studio (wersja klasyczna)

Artykuł
11/29/2017

DOTYCZY: Jest to znacznik wyboru, co oznacza, że ten artykuł dotyczy usługi Machine Learning Studio (klasycznej). Machine Learning Studio (wersja klasyczna) Jest to X, co oznacza, że ten artykuł nie ma zastosowania do usługi Azure Machine Learning. Azure Machine Learning

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z usługi ML Studio (klasycznej) do usługi Azure Machine Learning.
Dowiedz się więcej o usłudze Azure Machine Learning

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

W tym temacie wyjaśniono, jak wizualizować i interpretować wyniki przewidywania w usłudze Machine Learning Studio (wersja klasyczna). Po wytrenowanym modelu i wykonaniu na nim przewidywań ("scored the model"), musisz zrozumieć i zinterpretować wynik przewidywania.

Istnieją cztery główne rodzaje modeli uczenia maszynowego w usłudze Machine Learning Studio (wersja klasyczna):

Klasyfikacja
Klastrowanie
Regresja
Systemy rekomendatora

Moduły używane do przewidywania na podstawie tych modeli to:

Moduł Score Model (Generowanie wyników dla modelu klasyfikacji i regresji)
Przypisywanie do modułu Klastry na potrzeby klastrowania
Score Matchbox Recommender for recommendation systems (Generowanie wyników dla modułów rekomendacji dla systemów rekomendacji)

Dowiedz się, jak wybrać parametry, aby zoptymalizować algorytmy w usłudze ML Studio (wersja klasyczna).

Aby dowiedzieć się, jak oceniać modele, zobacz Jak ocenić wydajność modelu.

Jeśli dopiero zaczynasz korzystać z programu ML Studio (wersja klasyczna), dowiedz się, jak utworzyć prosty eksperyment.

Klasyfikacja

Istnieją dwie podkategorie problemów klasyfikacji:

Problemy z tylko dwiema klasami (klasyfikacja dwuklasowa lub binarna)
Problemy z więcej niż dwiema klasami (klasyfikacja wieloklasowa)

Usługa Machine Learning Studio (klasyczna) ma różne moduły do obsługi każdego z tych typów klasyfikacji, ale metody interpretowania wyników przewidywania są podobne.

Klasyfikacja dwuklasowa

Przykładowy eksperyment

Przykładem problemu z klasyfikacją dwuklasową jest klasyfikacja kwiatów irysów. Zadaniem jest klasyfikowanie kwiatów irysów na podstawie ich cech. Zestaw danych Iris udostępniony w usłudze Machine Learning Studio (wersja klasyczna) jest podzbiorem popularnego zestawu danych Iris zawierającego tylko wystąpienia tylko dwóch gatunków kwiatów (klasy 0 i 1). Istnieją cztery cechy dla każdego kwiatu (długość sepa, szerokość sepal, długość płatka i szerokość płatka).

Zrzut ekranu przedstawiający eksperyment irysów

Rysunek 1. Eksperyment problemu z klasyfikacją dwuklasową Iris

Eksperyment został wykonany w celu rozwiązania tego problemu, jak pokazano na rysunku 1. Model dwuklasowego wzmocnionego drzewa decyzyjnego został wytrenowany i oceniany. Teraz możesz wizualizować wyniki przewidywania z modułu Score Model (Generowanie wyników dla modelu), klikając port wyjściowy modułu Score Model (Generowanie wyników dla modelu), a następnie klikając pozycję Visualize (Wizualizacja).

Moduł Score model (Generowanie wyników dla modelu)

Spowoduje to wyświetlenie wyników oceniania, jak pokazano na rysunku 2.

Wyniki eksperymentu klasyfikacji dwuklasowej irysów

Rysunek 2. Wizualizowanie wyniku modelu oceny w klasyfikacji dwuklasowej

Interpretacja wyników

W tabeli wyników znajduje się sześć kolumn. Cztery lewe kolumny to cztery funkcje. Odpowiednie dwie kolumny, Scored Labels i Scored Prawdopodobieństwa, są wynikami przewidywania. Kolumna Scored Probabilities (Obliczone prawdopodobieństwo) pokazuje prawdopodobieństwo, że kwiat należy do klasy dodatniej (Klasa 1). Na przykład pierwsza liczba w kolumnie (0.028571) oznacza, że istnieje prawdopodobieństwo 0,028571, że pierwszy kwiat należy do klasy 1. W kolumnie Scored Labels (Etykiety wyników) jest wyświetlana przewidywana klasa dla każdego kwiatu. Jest to oparte na kolumnie Scored Probabilities (Obliczone prawdopodobieństwo). Jeśli obliczone prawdopodobieństwo kwiatu jest większe niż 0,5, jest przewidywane jako klasa 1. W przeciwnym razie jest ona przewidywana jako klasa 0.

Publikacja usługi sieci Web

Po zrozumieniu i ocenieniu wyników przewidywania eksperyment można opublikować jako usługę internetową, aby można było wdrożyć go w różnych aplikacjach i wywołać go w celu uzyskania przewidywań klas na każdym nowym kwiatie irysów. Aby dowiedzieć się, jak zmienić eksperyment trenowania w eksperyment oceniania i opublikować go jako usługę internetową, zobacz Samouczek 3: Wdrażanie modelu ryzyka kredytowego. Ta procedura zawiera eksperyment oceniania, jak pokazano na rysunku 3.

Zrzut ekranu przedstawiający eksperyment oceniania

Rysunek 3. Ocenianie eksperymentu problemu z klasyfikacją dwuklasową iris

Teraz musisz ustawić dane wejściowe i wyjściowe dla usługi internetowej. Dane wejściowe to właściwy port wejściowy modelu wyników, który jest danymi wejściowymi funkcji kwiat irysów. Wybór danych wyjściowych zależy od tego, czy interesuje Cię przewidywana klasa (etykieta oceniana), obliczone prawdopodobieństwo, czy oba te elementy. W tym przykładzie przyjęto założenie, że interesuje Cię obie te elementy. Aby wybrać żądane kolumny wyjściowe, użyj modułu Select Columns in Data set (Wybieranie kolumn w zestawie danych). Kliknij pozycję Wybierz kolumny w zestawie danych, kliknij pozycję Uruchom selektor kolumn, a następnie wybierz pozycję Scored Labels (Obliczone etykiety ) i Scored Probabilities (Obliczone prawdopodobieństwo). Po ustawieniu portu wyjściowego select columns in Data set (Wybieranie kolumn w zestawie danych) i ponownym uruchomieniu go powinno być gotowe do opublikowania eksperymentu oceniania jako usługi internetowej, klikając pozycję PUBLISH WEB SERVICE (PUBLIKUJ usługę internetową). Końcowy eksperyment wygląda jak Rysunek 4.

Eksperyment klasyfikacji dwuklasowej irysów

Rysunek 4. Końcowy eksperyment oceniania problemu klasyfikacji dwuklasowej irysów

Po uruchomieniu usługi internetowej i wprowadzeniu niektórych wartości funkcji wystąpienia testowego wynik zwraca dwie liczby. Pierwsza liczba to etykieta oceniana, a druga to obliczone prawdopodobieństwo. Ten kwiat jest przewidywany jako klasa 1 z prawdopodobieństwem 0,9655.

Testowanie modelu oceny

Wyniki testu oceniania

Rysunek 5. Wynik usługi internetowej klasyfikacji dwuklasowej irysów

Klasyfikacja wieloklasowa

Przykładowy eksperyment

W tym eksperymencie wykonasz zadanie rozpoznawania liter jako przykład klasyfikacji wieloklasowej. Klasyfikator próbuje przewidzieć określoną literę %28class%29 na podstawie niektórych ręcznie napisanych wartości atrybutów wyodrębnionych z ręcznie napisanych obrazów.

Przykład rozpoznawania liter

W danych szkoleniowych istnieje 16 funkcji wyodrębnionych z ręcznie napisanych obrazów listów. 26 liter tworzą nasze 26 klas. Rysunek 6 przedstawia eksperyment, który wytrenuje model klasyfikacji wieloklasowej na potrzeby rozpoznawania liter i przewiduje tę samą funkcję ustawioną na zestawie danych testowych.

Eksperyment klasyfikacji wieloklasowej rozpoznawania liter

Rysunek 6. Eksperyment problemu z klasyfikacją wieloklasowej rozpoznawania liter

Wizualizowanie wyników z modułu Score Model (Generowanie wyników w modelu), klikając port wyjściowy modułu Score Model (Generowanie wyników dla modelu), a następnie klikając pozycję Visualize (Wizualizacja), powinna zostać wyświetlona zawartość, jak pokazano na rysunku 7.

Generowanie wyników modelu

Rysunek 7. Wizualizowanie wyników modelu wyników w klasyfikacji wieloklasowej

Interpretacja wyników

Lewe 16 kolumn reprezentuje wartości funkcji zestawu testowego. Kolumny o nazwach takich jak Scored Probabilities for Class "XX" są podobne do kolumny Scored Probabilities (Obliczone prawdopodobieństwo) w przypadku dwuklasowym. Pokazują prawdopodobieństwo, że odpowiedni wpis należy do określonej klasy. Na przykład dla pierwszego wpisu istnieje prawdopodobieństwo 0,003571, że jest to "A", 0,000451 prawdopodobieństwo, że jest to "B", itd. Ostatnia kolumna (scored Labels) jest taka sama jak scored Labels w przypadku dwóch klas. Wybiera klasę z największym szacowanym prawdopodobieństwem jako przewidywaną klasą odpowiedniego wpisu. Na przykład dla pierwszego wpisu etykieta oceniana jest "F", ponieważ ma największe prawdopodobieństwo, że ma wartość "F" (0,916995).

Publikacja usługi sieci Web

Można również uzyskać etykietę ocenianą dla każdego wpisu i prawdopodobieństwo oceny etykiety. Podstawowa logika polega na znalezieniu największego prawdopodobieństwa wśród wszystkich ocenianych prawdopodobieństwa. W tym celu należy użyć modułu Execute R Script (Wykonywanie skryptu języka R). Kod języka R jest wyświetlany na rysunku 8, a wynik eksperymentu pokazano na rysunku 9.

Przykład kodu języka R

Rysunek 8. Kod języka R do wyodrębniania etykiet ocenianych i skojarzonych prawdopodobieństwa etykiet

Wynik eksperymentu

Rysunek 9. Końcowy eksperyment oceniania problemu z klasyfikacją wieloklasową rozpoznawania liter

Po opublikowaniu i uruchomieniu usługi internetowej i wprowadzeniu niektórych wartości funkcji wejściowych zwrócony wynik wygląda następująco: Rysunek 10. Ta ręcznie napisana litera, z wyodrębnionym 16 cechami, przewiduje się, że będzie "T" z prawdopodobieństwem 0,9715.

Moduł testowania oceniania

Wynik testu

Rysunek 10. Wynik usługi sieci Web klasyfikacji wieloklasowej

Regresja

Problemy regresji różnią się od problemów klasyfikacji. W przypadku problemu klasyfikacji próbujesz przewidzieć klasy dyskretne, takie jak klasa, do której należy kwiat tęczówki. Ale jak widać w poniższym przykładzie problemu regresji, próbujesz przewidzieć zmienną ciągłą, taką jak cena samochodu.

Przykładowy eksperyment

Użyj przewidywania cen samochodów jako przykładu dla regresji. Próbujesz przewidzieć cenę samochodu na podstawie jego cech, w tym marki, typu paliwa, typu ciała i koła napędowego. Eksperyment jest pokazany na rysunku 11.

Eksperyment regresji cen samochodów

Rysunek 11. Eksperyment dotyczący regresji cen samochodów

Wizualizowanie modułu Score Model (Generowanie wyników dla modelu ) wynik wygląda następująco: Rysunek 12.

Wyniki oceniania problemu z przewidywaniem cen samochodów

Rysunek 12. Wynik oceniania problemu z przewidywaniem cen samochodów

Interpretacja wyników

Scored Labels to kolumna wyników w tym wyniku oceniania. Liczby są przewidywaną ceną dla każdego samochodu.

Publikacja usługi sieci Web

Eksperyment regresji można opublikować w usłudze internetowej i wywołać go na potrzeby przewidywania cen samochodów w taki sam sposób, jak w przypadku użycia klasyfikacji dwuklasowej.

Eksperyment oceniania dla problemu regresji cen samochodów

Rysunek 13. Eksperyment oceniania problemu regresji cen samochodów

Uruchomienie usługi internetowej zwrócony wynik wygląda następująco: Rysunek 14. Przewidywana cena tego samochodu wynosi 15 085,52 USD.

Testowanie modułu oceniania

Wyniki modułu oceniania

Rysunek 14. Wynik usługi internetowej dotyczący problemu regresji cen samochodów

Klastrowanie

Przykładowy eksperyment

Użyjmy ponownie zestawu danych Iris, aby skompilować eksperyment klastrowania. W tym miejscu można odfiltrować etykiety klas w zestawie danych, aby były dostępne tylko funkcje i mogą być używane do klastrowania. W tym przypadku użycia irysów określ liczbę klastrów, które mają być dwa podczas procesu trenowania, co oznacza, że kwiaty zostaną zgrupowane w dwie klasy. Eksperyment jest pokazany na rysunku 15.

Eksperyment z klastrowaniem irysów

Rysunek 15. Eksperyment z klastrowaniem irysów

Klastrowanie różni się od klasyfikacji, ponieważ zestaw danych treningowych nie ma samych etykiet podstawowych prawdy. Klastrowanie grupuje wystąpienia zestawu danych trenowania w odrębne klastry. Podczas procesu trenowania model etykietuje wpisy, ucząc się różnic między ich funkcjami. Następnie wytrenowany model może służyć do dalszego klasyfikowania przyszłych wpisów. Istnieją dwie części wyniku, które nas interesują w ramach problemu klastrowania. Pierwsza część to etykietowanie zestawu danych treningowych, a druga klasyfikuje nowy zestaw danych za pomocą wytrenowanego modelu.

Pierwszą część wyniku można zwizualizować, klikając lewy port wyjściowy trenowania modelu klastrowania, a następnie klikając pozycję Visualize ( Wizualizacja). Wizualizacja jest wyświetlana na rysunku 16.

Wynik klastrowania

Rysunek 16. Wizualizowanie wyniku klastrowania dla zestawu danych treningowych

Wynik drugiej części, klastrowanie nowych wpisów za pomocą wytrenowanego modelu klastrowania, jest pokazane na rysunku 17.

Wizualizowanie wyniku klastrowania

Rysunek 17. Wizualizowanie wyniku klastrowania w nowym zestawie danych

Interpretacja wyników

Chociaż wyniki obu części wynikają z różnych etapów eksperymentu, wyglądają tak samo i są interpretowane w ten sam sposób. Pierwsze cztery kolumny to funkcje. Ostatnia kolumna, Przypisania, jest wynikiem przewidywania. Wpisy przypisane do tej samej liczby są przewidywane w tym samym klastrze, czyli współużytkują podobieństwa w jakiś sposób (w tym eksperymencie jest używana domyślna metryka odległości euklidesowej). Ponieważ określono liczbę klastrów na 2, wpisy w przypisania są oznaczone etykietą 0 lub 1.

Publikacja usługi sieci Web

Eksperyment klastrowania można opublikować w usłudze internetowej i wywołać go w celu przewidywania klastrowania w taki sam sposób, jak w przypadku użycia klasyfikacji dwuklasowej.

Eksperyment oceniania problemu z klastrowaniem irysów

Rysunek 18. Eksperyment oceniania problemu z klastrowaniem irysów

Po uruchomieniu usługi internetowej zwrócony wynik wygląda następująco: Rysunek 19. Ten kwiat ma znajdować się w klastrze 0.

Moduł testowania oceniania interpretacji

Wynik modułu oceniania

Rysunek 19. Wynik usługi internetowej klasyfikacji dwuklasowej irysów

System rekomendatora

Przykładowy eksperyment

W przypadku systemów rekomendacji można użyć problemu z rekomendacją restauracji jako przykładu: możesz polecić restauracje klientom na podstawie ich historii klasyfikacji. Dane wejściowe składają się z trzech części:

Oceny restauracji od klientów
Dane funkcji klienta
Dane cech restauracji

Istnieje kilka czynności, które możemy wykonać za pomocą modułu Train Matchbox Recommender w usłudze Machine Learning Studio (wersja klasyczna):

Przewidywanie ocen dla danego użytkownika i elementu
Zalecane elementy dla danego użytkownika
Znajdowanie użytkowników powiązanych z danym użytkownikiem
Znajdowanie elementów powiązanych z danym elementem

Możesz wybrać, co chcesz zrobić, wybierając z czterech opcji w menu Rodzaj przewidywania modułu rekomendacji. W tym miejscu możesz zapoznać się ze wszystkimi czterema scenariuszami.

Moduł polecający pole dopasowania

Typowy eksperyment usługi Machine Learning Studio (klasyczny) dla systemu rekomendacji wygląda jak Rysunek 20. Aby uzyskać informacje o sposobie korzystania z tych modułów systemowych modułów polecających, zobacz Train matchbox recommender and Score matchbox recommender (Trenowanie modułu rekomendacji matchbox) i Score matchbox recommender (Generowanie wyników w pole wyboru).

Eksperyment systemowy modułu rekomendacji

Rysunek 20. Eksperyment systemowy modułu rekomendacji

Interpretacja wyników

Przewidywanie ocen dla danego użytkownika i elementu

Wybierając pozycję Przewidywanie klasyfikacji w obszarze Rodzaj przewidywania modułu rekomendacji, prosisz system polecający o przewidywanie oceny dla danego użytkownika i elementu. Wizualizacja danych wyjściowych score Matchbox Recommender wygląda następująco: Rysunek 21.

Wynik wyniku systemu rekomendacji — przewidywanie oceny

Rysunek 21. Wizualizowanie wyniku wyniku modułu rekomendacji — przewidywanie oceny

Dwie pierwsze kolumny to pary elementów użytkownika udostępniane przez dane wejściowe. Trzecia kolumna to przewidywana ocena użytkownika dla określonego elementu. Na przykład w pierwszym wierszu przewiduje się, że klient U1048 ocenia 135026 restauracji jako 2.

Zalecane elementy dla danego użytkownika

Wybierając pozycję Zalecenie dotyczące elementu w obszarze Rodzaj przewidywania modułu rekomendacji, prosisz system rekomendacji o polecanie elementów dla danego użytkownika. Ostatni parametr do wybrania w tym scenariuszu to Wybór zalecanego elementu. Opcja Od elementów ocenianych (na potrzeby oceny modelu) jest przeznaczona głównie do oceny modelu podczas procesu trenowania. Na potrzeby tego etapu przewidywania wybieramy pozycję Z wszystkich elementów. Wizualizacja danych wyjściowych score Matchbox Recommender wygląda następująco: Rysunek 22.

Wynik wyniku systemu rekomendacji — zalecenie dotyczące elementu

Rysunek 22. Wizualizowanie wyniku wyniku rekomendacji elementu systemowego — rekomendacja

Pierwsza z sześciu kolumn reprezentuje podane identyfikatory użytkowników, dla których mają być zalecane elementy, zgodnie z danymi wejściowymi. Pozostałe pięć kolumn reprezentuje elementy zalecane dla użytkownika w kolejności malejącej istotności. Na przykład w pierwszym wierszu najbardziej zalecaną restauracją dla klienta U1048 jest 134986, a następnie 135018, 134975, 135021 i 132862.

Znajdowanie użytkowników powiązanych z danym użytkownikiem

Wybierając pozycję Powiązane użytkownicy w obszarze Rodzaj przewidywania rekomendacji, prosisz system polecający o znalezienie powiązanych użytkowników z danym użytkownikiem. Powiązanych użytkowników to użytkownicy, którzy mają podobne preferencje. Ostatnim parametrem do wyboru w tym scenariuszu jest wybór powiązanego użytkownika. Opcja Od użytkowników, którzy ocenili elementy (na potrzeby oceny modelu) jest przeznaczona głównie do oceny modelu podczas procesu trenowania. Wybierz pozycję Spośród wszystkich użytkowników dla tego etapu przewidywania. Wizualizacja danych wyjściowych score Matchbox Recommender wygląda następująco: Rysunek 23.

Wynik wyniku systemu rekomendacji — użytkownicy związani z systemem

Rysunek 23. Wizualizowanie wyników oceny użytkowników związanych z systemem

Pierwsza z sześciu kolumn zawiera podane identyfikatory użytkowników potrzebne do znalezienia powiązanych użytkowników, zgodnie z danymi wejściowymi. Pozostałe pięć kolumn przechowuje przewidywanych powiązanych użytkowników użytkownika w kolejności malejącej istotności. Na przykład w pierwszym wierszu najbardziej odpowiedni klient dla klienta U1048 to U1051, a następnie U1066, U1044, U1017 i U1072.

Znajdowanie elementów powiązanych z danym elementem

Wybierając pozycję Elementy pokrewne w obszarze Rodzaj przewidywania modułu rekomendacji, prosisz system polecający o znalezienie powiązanych elementów z danym elementem. Powiązane elementy to elementy, które najprawdopodobniej będą lubiane przez tego samego użytkownika. Ostatnim parametrem do wybrania w tym scenariuszu jest wybór elementu Powiązane. Opcja Od elementów ocenianych (na potrzeby oceny modelu) jest przeznaczona głównie do oceny modelu podczas procesu trenowania. Wybieramy opcję Od wszystkich elementów dla tego etapu przewidywania. Wizualizacja danych wyjściowych score Matchbox Recommender wygląda następująco: Rysunek 24.

Wynik wyniku systemu rekomendacji — elementy związane z systemem

Rysunek 24. Wizualizowanie wyników oceny elementów związanych z systemem

Pierwsza z sześciu kolumn reprezentuje podane identyfikatory elementów potrzebne do znalezienia powiązanych elementów, zgodnie z danymi wejściowymi. Pozostałe pięć kolumn przechowuje przewidywane powiązane elementy elementu w kolejności malejącej pod względem istotności. Na przykład w pierwszym wierszu najbardziej odpowiedni element 135026 elementu jest 135074, a następnie 135035, 132875, 135055 i 134992.

Publikacja usługi sieci Web

Proces publikowania tych eksperymentów jako usług internetowych w celu uzyskania przewidywań jest podobny dla każdego z czterech scenariuszy. W tym miejscu użyjemy drugiego scenariusza (zalecamy użycie elementów dla danego użytkownika) jako przykładu. Możesz wykonać tę samą procedurę z pozostałymi trzema.

Zapisanie wytrenowanego systemu rekomendacji jako wytrenowanego modelu i filtrowanie danych wejściowych do jednej kolumny identyfikatora użytkownika zgodnie z żądaniem, można podłączyć eksperyment w sposób pokazany na rysunku 25 i opublikować go jako usługę internetową.

Eksperyment oceniania problemu z rekomendacją restauracji

Rysunek 25. Eksperyment oceniania problemu z rekomendacją restauracji

Uruchomienie usługi internetowej zwracany wynik wygląda następująco: Rysunek 26. Pięć zalecanych restauracji dla użytkownika U1048 to 134986, 135018, 134975, 135021 i 132862.

Przykład usługi systemowej rekomendatora

Przykładowe wyniki eksperymentu

Rysunek 26. Wynik rekomendacji dotyczącej usługi sieci Web dotyczący rekomendacji dotyczących restauracji

Udostępnij za pośrednictwem

Interpretowanie wyników modelu w usłudze Machine Learning Studio (wersja klasyczna)

Klasyfikacja

Klasyfikacja dwuklasowa

Klasyfikacja wieloklasowa

Regresja

Klastrowanie

System rekomendatora

Dodatkowe zasoby