Komponent för logistisk regression i flera grupper

I den här artikeln beskrivs en komponent i Azure Mašinsko učenje designer.

Använd den här komponenten för att skapa en logistisk regressionsmodell som kan användas för att förutsäga flera värden.

Klassificering med logistisk regression är en övervakad inlärningsmetod och kräver därför en märkt datauppsättning. Du tränar modellen genom att ange modellen och den märkta datamängden som indata till en komponent, till exempel Träningsmodell. Den tränade modellen kan sedan användas för att förutsäga värden för nya indataexempel.

Azure Mašinsko učenje tillhandahåller även en komponent för logistisk regression i två klasser, som passar för klassificering av binära eller dikottomiska variabler.

Om logistisk regression i flera grupper

Logistisk regression är en välkänd metod i statistik som används för att förutsäga sannolikheten för ett utfall och är populär för klassificeringsuppgifter. Algoritmen förutsäger sannolikheten för förekomst av en händelse genom att anpassa data till en logistisk funktion.

I logistisk regression i flera klasser kan klassificeraren användas för att förutsäga flera utfall.

Konfigurera en logistisk regression med flera klass

  1. Lägg till komponenten Multiclass Logistic Regression i pipelinen.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enkel parameter: Använd det här alternativet om du vet hur du vill konfigurera modellen och ange en specifik uppsättning värden som argument.

    • Parameterintervall: Välj det här alternativet om du inte är säker på de bästa parametrarna och vill köra en parametersvepning. Välj ett intervall med värden att iterera över, och Tune Model Hyperparameters itererar över alla möjliga kombinationer av de inställningar som du angav för att fastställa de hyperparametrar som ger optimala resultat.

  3. Optimeringstolerans, ange tröskelvärdet för optimeringskonvergens. Om förbättringen mellan iterationer är mindre än tröskelvärdet stoppas algoritmen och returnerar den aktuella modellen.

  4. L1-regulariseringsvikt, L2-regulariseringsvikt: Ange ett värde som ska användas för regulariseringsparametrarna L1 och L2. Ett värde som inte är noll rekommenderas för båda.

    Regularisering är en metod för att förhindra överanpassning genom att straffa modeller med extrema koefficientvärden. Regularisering fungerar genom att lägga till straffvärdet som är associerat med koefficientvärden i hypotesens fel. En korrekt modell med extrema koefficientvärden skulle straffas mer, men en mindre exakt modell med mer konservativa värden skulle straffas mindre.

    L1- och L2-regularisering har olika effekter och användningsområden. L1 kan tillämpas på glesa modeller, vilket är användbart när du arbetar med högdimensionella data. L2-regularisering är däremot att föredra för data som inte är glesa. Den här algoritmen stöder en linjär kombination av L1- och L2-regulariseringsvärden: om x = L1 och y = L2, ax + by = c definierar det linjära intervallet för regulariseringstermerna.

    Olika linjära kombinationer av L1- och L2-termer har utformats för logistiska regressionsmodeller, till exempel elastisk net regularisering.

  5. Slumptalsutsäde: Ange ett heltalsvärde som ska användas som startvärde för algoritmen om du vill att resultatet ska kunna upprepas över körningar. Annars används ett systemklockavärde som startvärde, vilket kan ge något olika resultat i körningar av samma pipeline.

  6. Anslut en märkt datauppsättning och träna modellen:

    • Om du ställer in Läget Skapa tränareEnskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du anger Skapa träningsläge till Parameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Kommentar

    Om du skickar ett parameterintervall till Train Model används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enskild uppsättning parametervärden till komponenten Tune Model Hyperparameters ignoreras värdena när det förväntar sig ett intervall med inställningar för varje parameter och använder standardvärdena för eleven.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under hela svepet, även om andra parametrar ändras över ett värdeintervall.

  7. Skicka pipelinen.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Mašinsko učenje.