Nastavení zásad založených na datech a ovlivnění rozhodování

Modely strojového učení jsou výkonné při identifikaci vzorů v datech a vytváření předpovědí. Nabízejí ale malou podporu pro odhad toho, jak se skutečný výsledek mění v přítomnosti zásahu.

Odborníci se stále více zaměřují na používání historických dat k informování budoucích rozhodnutí a obchodních zásahů. Jak by se například ovlivnily výnosy, pokud by společnost sledovala novou cenovou strategii? Zlepšil by nový lék stav pacienta, všechno ostatní stejné?

Kauzální součást odvození řídicího panelu Zodpovědné umělé inteligence řeší tyto otázky odhadem účinku funkce na výsledek zájmu v průměru, v rámci populace nebo kohorty a na individuální úrovni. Pomáhá také vytvářet slibné zásahy simulací reakcí na funkce na různé zásahy a vytvořením pravidel pro určení, které kohorty populace by mohly těžit z zásahu. Tyto funkce společně umožňují rozhodovacím tvůrcům uplatňovat nové zásady a řídit skutečnou změnu.

Možnosti této komponenty pocházejí z balíčku EconML . Odhaduje heterogenní účinky léčby z pozorování dat prostřednictvím dvojité techniky strojového učení .

Kauzální odvození použijte v případě, že potřebujete:

  • Identifikujte funkce, které mají největší přímý vliv na váš výsledek zájmu.
  • Rozhodněte se, jaké celkové zásady léčby se mají použít k maximalizaci skutečného dopadu na výsledek zájmu.
  • Seznamte se s tím, jak jednotlivci s určitými hodnotami funkcí reagují na konkrétní zásady léčby.

Jak se generují přehledy příčinné odvozování?

Poznámka:

K vygenerování kauzálních přehledů se vyžadují pouze historická data. Kauzální účinky vypočítané na základě vlastností léčby jsou čistě datovou vlastností. Vytrénovaný model je proto volitelný, když počítáte kauzální účinky.

Dvojité strojové učení je metoda pro odhad heterogenních účinků léčby, pokud jsou pozorovány všechny potenciální zavádějící/kontrolní mechanismy (faktory, které současně měly přímý vliv na rozhodnutí o léčbě shromážděných dat a pozorovaného výsledku), ale existuje některý z následujících problémů:

  • Existuje příliš mnoho, aby bylo možné použít klasické statistické přístupy. To znamená, že jsou vysoce dimenzionální.
  • Jejich účinek na léčbu a výsledek nemůže být uspokojivě modelován parametrickými funkcemi. To znamená, že nejsou parametrické.

K řešení obou problémů můžete použít techniky strojového učení. Příklad najdete v tématu Chernozhukov2016.

Dvojité strojové učení snižuje problém tím, že nejprve odhaduje dvě prediktivní úlohy:

  • Predikce výsledku z ovládacích prvků
  • Predikce léčby z ovládacích prvků

Metoda pak kombinuje tyto dva prediktivní modely v odhadu konečné fáze a vytvoří model heterogenního efektu léčby. Tento přístup umožňuje použití libovolných algoritmů strojového učení pro dvě prediktivní úlohy při zachování mnoha příznivých statistických vlastností souvisejících s konečným modelem. Mezi tyto vlastnosti patří malá střední kvadratická chyba, asymptotická normalita a konstrukce intervalů spolehlivosti.

Jaké další nástroje microsoft poskytuje kauzální odvozování?

  • Project Azua poskytuje nový rámec, který se zaměřuje na komplexní kauzální odvození.

    Technologie Azua DECI (deep end-to-end kauzální odvozování) je jediný model, který může současně provádět kauzální zjišťování a kauzální odvozování. Uživatel poskytuje data a model může vypíše kauzální vztahy mezi všemi proměnnými.

    Tento přístup sám o sobě může poskytovat přehledy o datech. Umožňuje výpočet metrik, jako je individuální účinek léčby (ITE), průměrný účinek léčby (ATE) a podmíněný průměrný účinek léčby (CATE). Tyto výpočty pak můžete použít k optimálnímu rozhodování.

    Architektura je škálovatelná pro velká data z hlediska počtu proměnných i počtu datových bodů. Může také zpracovávat chybějící datové položky se smíšenými statistickými typy.

  • EconML využívá back-end komponenty zodpovědného odvozování řídicího panelu AI. Jedná se o balíček Pythonu, který používá techniky strojového učení k odhadu individualizovaných kauzálních odpovědí z pozorování nebo experimentálních dat.

    Sada metod odhadu v EconML představuje nejnovější pokroky v kauzálním strojovém učení. Začleněním jednotlivých kroků strojového učení do interpretovatelných kauzálních modelů tyto metody zlepšují spolehlivost predikcí citlivostní analýzy a usnadňují širší skupině uživatelů kauzální analýzu.

  • DoWhy je knihovna Pythonu, která má za cíl vyvolat kauzální myšlení a analýzu. DoWhy poskytuje principiální čtyřstupňové rozhraní pro kauzální odvozování, které se zaměřuje na explicitní modelování kauzálních předpokladů a jejich ověřování co nejvíce.

    Klíčovou funkcí DoWhy je nejmodernější rozhraní API pro refutaci, které může automaticky testovat kauzální předpoklady pro jakoukoli metodu odhadu. Umožňuje odvozovat robustnější a přístupnější pro jiné odborníky.

    DoWhy podporuje odhad průměrného kauzálního efektu pro zadní dveře, přední dveře, instrumentální proměnné a další metody identifikace. Podporuje také odhad CATE prostřednictvím integrace s knihovnou EconML.

Další kroky