Analiza liczników i analizy warunkowej

Analizy warunkowe odnoszą się do pytania, co model przewidział w przypadku zmiany danych wejściowych akcji. Umożliwiają one zrozumienie i debugowanie modelu uczenia maszynowego pod względem sposobu reagowania na zmiany danych wejściowych (funkcji).

Standardowe techniki interpretacji przybliżają model uczenia maszynowego lub klasyfikują funkcje według ich znaczenia predykcyjnego. Z kolei analiza antyraktualna "przesłuchuje" model w celu określenia, jakie zmiany w określonym punkcie danych przerzuciłyby decyzję modelu.

Taka analiza ułatwia oddzielenie wpływu skorelowanych cech w izolacji. Ułatwia to również uzyskanie bardziej szczegółowego zrozumienia, ile zmian funkcji jest potrzebnych, aby zobaczyć przerzucanie decyzji modelu dla modeli klasyfikacji i zmianę decyzji dla modeli regresji.

Analiza przeciwraktowa i składnik analizy warunkowej pulpitu nawigacyjnego odpowiedzialnej sztucznej inteligencji ma dwie funkcje:

  • Wygeneruj zestaw przykładów z minimalnymi zmianami w określonym punkcie, aby zmienić przewidywanie modelu (pokazując najbliższe punkty danych z przeciwnymi przewidywaniami modelu).
  • Umożliwianie użytkownikom generowania własnych perturbacji warunkowych, aby zrozumieć, jak model reaguje na zmiany funkcji.

Jednym z najważniejszych wyróżnień składnika analizy counterfactual analysis pulpitu nawigacyjnego odpowiedzialnej sztucznej inteligencji jest fakt, że można określić, które funkcje mają się różnić, a ich dopuszczalne zakresy dla prawidłowych i logicznych przykładów kontraktoryjnych.

Możliwości tego składnika pochodzą z pakietu DiCE .

W razie potrzeby użyj kontraktów warunkowych:

  • Sprawdź kryteria sprawiedliwości i niezawodności jako ewaluatora decyzyjnego przez wypaczenie poufnych atrybutów, takich jak płeć i pochodzenie etniczne, a następnie obserwowanie, czy prognozy modelu zmieniają się.
  • Szczegółowe debugowanie określonych wystąpień wejściowych.
  • Dostarczaj rozwiązania użytkownikom i określ, co mogą zrobić, aby uzyskać pożądany wynik z modelu.

Jak są generowane przykłady counterfactual?

Aby wygenerować counterfactuals, DiCE implementuje kilka technik niezależne od modelu. Te metody mają zastosowanie do dowolnego nieprzezroczystego klasyfikatora lub regresji. Są one oparte na próbkowaniu pobliskich punktów wejściowych, jednocześnie optymalizując funkcję utraty na podstawie odległości (i opcjonalnie, rozrzedu, różnorodności i możliwości). Obecnie obsługiwane metody to:

  • Wyszukiwanie losowe: ta metoda losowo wskazuje punkt zapytania w pobliżu punktu zapytania i zwraca liczniki jako punkty, których przewidywana etykieta jest żądaną klasą.
  • Wyszukiwanie genetyczne: Ta metoda próbkuje punkty przy użyciu algorytmu genetycznego, biorąc pod uwagę połączony cel optymalizacji zbliżenia do punktu zapytania, zmiany jak najmniejszej liczby funkcji i poszukiwania różnorodności wśród wygenerowanych kontractuals.
  • Wyszukiwanie drzewa KD: ten algorytm zwraca liczniki z zestawu danych trenowania. Tworzy drzewo KD na punktach danych treningowych na podstawie funkcji odległości, a następnie zwraca najbliższe punkty do określonego punktu zapytania, który daje żądaną przewidywaną etykietę.

Następne kroki