Förbättrat beslutsträd med flera klasser

I den här artikeln beskrivs en komponent i Azure Mašinsko učenje designer.

Använd den här komponenten för att skapa en maskininlärningsmodell som baseras på algoritmen för förstärkta beslutsträd.

Ett förstärkt beslutsträd är en ensembleinlärningsmetod där det andra trädet korrigeras för felen i det första trädet, det tredje trädet korrigeras för felen i det första och andra träden och så vidare. Förutsägelser baseras på ensemblen av träd tillsammans.

Konfigurera

Den här komponenten skapar en otränad klassificeringsmodell. Eftersom klassificering är en övervakad inlärningsmetod behöver du en etiketterad datauppsättning som innehåller en etikettkolumn med ett värde för alla rader.

Du kan träna den här typen av modell med hjälp av träningsmodellen.

  1. Lägg till komponenten Multiclass Boosted Decision Tree i din pipeline.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enskild parameter: Om du vet hur du vill konfigurera modellen kan du ange en specifik uppsättning värden som argument.

    • Parameterintervall: Välj det här alternativet om du inte är säker på de bästa parametrarna och vill köra en parametersvepning. Välj ett intervall med värden att iterera över, och Tune Model Hyperparameters itererar över alla möjliga kombinationer av de inställningar som du angav för att fastställa de hyperparametrar som ger optimala resultat.

  3. Maximalt antal löv per träd begränsar det maximala antalet terminalnoder (löv) som kan skapas i valfritt träd.

    Genom att öka det här värdet kan du öka trädets storlek och uppnå högre precision, med risk för överanpassning och längre träningstid.

  4. Minsta antal exempel per lövnod anger antalet fall som krävs för att skapa en terminalnod (löv) i ett träd.

    Genom att öka det här värdet ökar du tröskelvärdet för att skapa nya regler. Med standardvärdet 1 kan till exempel även ett enskilt fall leda till att en ny regel skapas. Om du ökar värdet till 5 måste träningsdata innehålla minst fem fall som uppfyller samma villkor.

  5. Inlärningsfrekvensen definierar stegstorleken under inlärningen. Ange ett tal mellan 0 och 1.

    Inlärningsfrekvensen avgör hur snabbt eller långsamt eleven konvergerar på en optimal lösning. Om stegstorleken är för stor kan du överskrida den optimala lösningen. Om stegstorleken är för liten tar det längre tid att träna för att konvergera på den bästa lösningen.

  6. Antalet byggda träd anger det totala antalet beslutsträd som ska skapas i ensemblen. Genom att skapa fler beslutsträd kan du eventuellt få bättre täckning, men träningstiden ökar.

  7. Slumptalsutsäde anger eventuellt ett icke-negativt heltal som ska användas som slumpmässigt startvärde. Om du anger ett startvärde säkerställs reproducerbarheten mellan körningar som har samma data och parametrar.

    Det slumpmässiga fröet anges som standard till 42. Efterföljande körningar med olika slumpmässiga frön kan ha olika resultat.

  8. Träna modellen:

    • Om du ställer in Läget Skapa tränareEnskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du anger Skapa träningsläge till Parameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Kommentar

    Om du skickar ett parameterintervall till Train Model används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enskild uppsättning parametervärden till komponenten Tune Model Hyperparameters ignoreras värdena när det förväntar sig ett intervall med inställningar för varje parameter och använder standardvärdena för eleven.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under hela svepet, även om andra parametrar ändras över ett värdeintervall.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Mašinsko učenje.