Bedöma Vowpal Wabbit-modell
Den här artikeln beskriver hur du använder komponenten Score Vowpal Wabbit Model i Azure Mašinsko učenje designer för att generera poäng för en uppsättning indata med hjälp av en befintlig tränad Vowpal Wabbit-modell.
Den här komponenten innehåller den senaste versionen av Vowpal Wabbit-ramverket, version 8.8.1. Använd den här komponenten för att poängsätta data med hjälp av en tränad modell som sparats i VW version 8-format.
Så här konfigurerar du Score Vowpal Wabbit Model
Lägg till komponenten Score Vowpal Wabbit Model i experimentet.
Lägg till en tränad Vowpal Wabbit-modell och anslut den till den vänstra indataporten. Du kan använda en tränad modell som skapats i samma experiment eller hitta en sparad modell i kategorin Datauppsättningar i designerns vänstra navigeringsfönster. Modellen måste dock vara tillgänglig i Azure Mašinsko učenje Designer.
Kommentar
Endast Vowpal Wabbit 8.8.1-modeller stöds. du kan inte ansluta sparade modeller som tränats med hjälp av andra algoritmer.
Lägg till testdatauppsättningen och anslut den till den högra indataporten. Om testdatauppsättningen är en katalog som innehåller testdatafilen anger du namnet på testdatafilen med Namnet på testdatafilen. Om testdatauppsättningen är en enda fil lämnar du Namnet på testdatafilen tom.
I textrutan VW-argument skriver du en uppsättning giltiga kommandoradsargument till den körbara vowpal Wabbit-filen.
Information om vilka Vowpal Wabbit-argument som stöds och som inte stöds i Azure Mašinsko učenje finns i avsnittet Tekniska anteckningar.
Namnet på testdatafilen: Ange namnet på filen som innehåller indata. Det här argumentet används bara när testdatauppsättningen är en katalog.
Ange filtyp: Ange vilket format dina träningsdata använder. Vowpal Wabbit stöder dessa två indatafilformat:
- VW representerar det interna format som används av Vowpal Wabbit . Mer information finns på vowpal Wabbit wiki-sidan .
- SVMLight är ett format som används av andra maskininlärningsverktyg.
Välj alternativet Inkludera en extra kolumn som innehåller etiketter om du vill mata ut etiketter tillsammans med poängen.
När du hanterar textdata kräver Vowpal Wabbit vanligtvis inte etiketter och returnerar endast poängen för varje rad med data.
Välj alternativet Inkludera en extra kolumn som innehåller råpoäng om du vill mata ut råpoäng tillsammans med resultaten.
Skicka pipelinen.
Resultat
När träningen är klar:
Om du vill visualisera resultatet högerklickar du på utdata från komponenten Score Vowpal Wabbit Model . Utdata anger en förutsägelsepoäng normaliserad från 0 till 1.
För att utvärdera resultaten bör utdatauppsättningen innehålla specifika poängkolumnnamn som uppfyller komponentkraven för Utvärdera modell.
- För regressionsaktivitet måste datauppsättningen som ska utvärderas ha en kolumn med namnet
Regression Scored Labels
, som representerar poängsatta etiketter. - För binär klassificeringsaktivitet måste datauppsättningen som ska utvärderas ha två kolumner med namnet
Binary Class Scored Labels
,Binary Class Scored Probabilities
, som representerar poängsatta etiketter respektive sannolikheter. - För uppgift med flera klassificeringar måste datauppsättningen som ska utvärderas ha en kolumn med namnet
Multi Class Scored Labels
, som representerar poängsatta etiketter.
Observera att resultatet av komponenten Score Vowpal Wabbit Model inte kan utvärderas direkt. Innan du utvärderar bör datamängden ändras enligt kraven ovan.
- För regressionsaktivitet måste datauppsättningen som ska utvärderas ha en kolumn med namnet
Tekniska anteckningar
Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.
Parametrar
Vowpal Wabbit har många kommandoradsalternativ för att välja och justera algoritmer. En fullständig diskussion om dessa alternativ är inte möjlig här; vi rekommenderar att du visar Vowpal Wabbit wiki-sidan.
Följande parametrar stöds inte i Azure Mašinsko učenje Studio (klassisk).
Alternativen för in- och utdata som anges i https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments
Dessa egenskaper konfigureras redan automatiskt av komponenten.
Dessutom tillåts inte alla alternativ som genererar flera utdata eller tar flera indata. Dessa inkluderar
--cbt
,--lda
och--wap
.Endast övervakade inlärningsalgoritmer stöds. Detta tillåter inte följande alternativ:
–active
,--rank
osv--search
.
Alla andra argument än de som beskrivs ovan är tillåtna.
Nästa steg
Se den uppsättning komponenter som är tillgängliga för Azure Mašinsko učenje.