Använda matematisk åtgärd
I den här artikeln beskrivs en komponent i Azure Mašinsko učenje designer.
Använd tillämpa matematisk åtgärd för att skapa beräkningar som tillämpas på numeriska kolumner i indatauppsättningen.
Matematiska operationer omfattar aritmetiska funktioner, trigonometriska funktioner, avrundningsfunktioner och specialfunktioner som används inom datavetenskap som gamma- och felfunktioner.
När du har definierat en åtgärd och kört pipelinen läggs värdena till i datauppsättningen. Beroende på hur du konfigurerar komponenten kan du:
- Lägg till resultatet i datauppsättningen (användbart när du verifierar resultatet av åtgärden).
- Ersätt kolumnvärden med de nya, beräknade värdena.
- Generera en ny kolumn för resultat och visa inte de ursprungliga data.
Leta efter den åtgärd du behöver i följande kategorier:
-
Funktionerna i kategorin Grundläggande kan användas för att ändra ett enda värde eller en kolumn med värden. Du kan till exempel få det absoluta värdet för alla tal i en kolumn eller beräkna kvadratroten för varje värde i en kolumn.
-
Funktionerna i kategorin Jämför används alla för jämförelse: du kan göra en parvis jämförelse av värdena i två kolumner, eller så kan du jämföra varje värde i en kolumn med en angiven konstant. Du kan till exempel jämföra kolumner för att avgöra om värdena var desamma i två datauppsättningar. Eller så kan du använda en konstant, till exempel ett maximalt tillåtet värde, för att hitta extremvärden i en numerisk kolumn.
-
Kategorin Åtgärder innehåller grundläggande matematiska funktioner: addition, subtraktion, multiplikation och division. Du kan arbeta med kolumner eller konstanter. Du kan till exempel lägga till värdet i Kolumn A till värdet i Kolumn B. Eller så kan du subtrahera en konstant, till exempel ett tidigare beräknat medelvärde, från varje värde i Kolumn A.
-
Kategorin Avrundning innehåller en mängd olika funktioner för att utföra åtgärder som avrundning, tak, golv och trunkering till olika precisionsnivåer. Du kan ange precisionsnivån för både decimal- och heltal.
-
Kategorin Special innehåller matematiska funktioner som används särskilt inom datavetenskap, till exempel elliptiska integraler och gaussiska felfunktionen.
-
Kategorin Trigonometric innehåller alla trigonometriska standardfunktioner. Du kan till exempel konvertera radianer till grader eller beräkningsfunktioner som tangens i radianer eller grader. Dessa funktioner är unary, vilket innebär att de tar en enda kolumn med värden som indata, tillämpar funktionen trigonometric och returnerar en kolumn med värden som resultat. Kontrollera att indatakolumnen är lämplig typ och innehåller rätt typ av värden för den angivna åtgärden.
Så här konfigurerar du Tillämpa matematisk åtgärd
Komponenten Tillämpa matematisk åtgärd kräver en datauppsättning som innehåller minst en kolumn som bara innehåller tal. Talen kan vara diskreta eller kontinuerliga men måste ha en numerisk datatyp, inte en sträng.
Du kan använda samma åtgärd för flera numeriska kolumner, men alla kolumner måste finnas i samma datauppsättning.
Varje instans av den här komponenten kan bara utföra en typ av åtgärd i taget. Om du vill utföra komplexa matematiska åtgärder kan du behöva länka samman flera instanser av komponenten Tillämpa matematisk åtgärd .
Lägg till komponenten Tillämpa matematisk åtgärd i pipelinen.
Anslut en datauppsättning som innehåller minst en numerisk kolumn.
Välj en eller flera källkolumner som du vill utföra beräkningen på.
- Alla kolumner som du väljer måste vara en numerisk datatyp.
- Dataområdet måste vara giltigt för den valda matematiska åtgärden. Annars kan ett fel eller ett NaN-resultat (inte ett tal) inträffa. Till exempel är Ln(-1.0) en ogiltig åtgärd och resulterar i värdet
NaN
.
Välj Kategori för att välja vilken typ av matematisk åtgärd som ska utföras.
Välj en specifik åtgärd i listan i den kategorin.
Ange ytterligare parametrar som krävs för varje typ av åtgärd.
Använd alternativet Utdataläge för att ange hur du vill att matematikåtgärden ska genereras:
- Lägg till. Alla kolumner som används som indata ingår i utdatauppsättningen, plus att ytterligare en kolumn läggs till som innehåller resultatet av matematikåtgärden.
- På plats. Värdena i kolumnerna som används som indata ersätts med de nya beräknade värdena.
- ResultOnly. En enskild kolumn returneras som innehåller resultatet av matematikåtgärden.
Skicka pipelinen.
Resultat
Om du genererar resultatet med alternativen Lägg till eller ResultOnly anger kolumnrubrikerna i den returnerade datamängden åtgärden och de kolumner som användes. Om du till exempel jämför två kolumner med operatorn Lika med ser resultatet ut så här:
- Equals(Col2_Col1), som anger att du testade Col2 mot Col1.
- Är lika med(Col2_$10), vilket indikerar att du jämförde kolumn 2 med konstanten 10.
Även om du använder alternativet På plats tas inte källdata bort eller ändras. Kolumnen i den ursprungliga datamängden är fortfarande tillgänglig i designern. Om du vill visa de ursprungliga data kan du ansluta komponenten Lägg till kolumner och koppla den till utdata från Tillämpa matematisk åtgärd.
Grundläggande matematiska åtgärder
Funktionerna i kategorin Basic tar vanligtvis ett enda värde från en kolumn, utför den fördefinierade åtgärden och returnerar ett enda värde. För vissa funktioner kan du ange en konstant eller en kolumnuppsättning som ett andra argument.
Azure Mašinsko učenje stöder följande funktioner i kategorin Grundläggande:
Abs
Returnerar det absoluta värdet för de markerade kolumnerna.
Atan2
Returnerar en inverterad tangent med fyra kvadranter.
Välj de kolumner som innehåller punktkoordinaterna. För det andra argumentet, som motsvarar x-koordinaten, kan du också ange en konstant.
Motsvarar funktionen ATAN2 i MATLAB.
Conj
Returnerar konjugaten för värdena i den valda kolumnen.
CubeRoot
Beräknar kubroten för värdena i den valda kolumnen.
DoubleFactorial
Beräknar den dubbla faktorn för värden i den valda kolumnen. Den dubbla faktorn är en förlängning av den normala faktorfunktionen och den betecknas som x!!
.
Eps
Returnerar storleken på gapet mellan det aktuella värdet och det näst högsta talet med dubbel precision. Motsvarar EPS-funktionen i MATLAB.
Exp
Returnerar e upphöjt till värdets kraft i den valda kolumnen. Den här funktionen är samma som Excel EXP-funktionen.
Exp2
Returnerar base-2 exponentiellt för argumenten och löser för y = x * 2t där t är en kolumn med värden som innehåller exponenter.
I Kolumnuppsättning väljer du den kolumn som innehåller exponentvärdena t.
För Exp2 kan du ange ett andra argument x, som kan vara antingen en konstant eller en annan kolumn med värden. I Andra argumenttypen anger du om du ska ange multiplikatorn x som en konstant eller ett värde i en kolumn.
Om du till exempel väljer en kolumn med värdena {0,1,2,3,4,5} för både multiplikatorn och exponenten returnerar funktionen {0, 2, 8, 24, 64 160).
ExpMinus1
Returnerar den negativa exponenten för värden i den valda kolumnen.
Fakultet
Returnerar faktor för värden i den valda kolumnen.
Hypotenusa
Beräknar hypotenuse för en triangel där längden på en sida anges som en kolumn med värden, och längden på den andra sidan anges antingen som en konstant eller som två kolumner.
Ln
Returnerar den naturliga logaritmen för värdena i den valda kolumnen.
LnPlus1
Returnerar den naturliga logaritmen plus en för värdena i den valda kolumnen.
Loggas
Returnerar loggen för värdena i den valda kolumnen, givet den angivna basen.
Du kan ange basen (det andra argumentet) antingen som en konstant eller genom att välja en annan kolumn med värden.
Log10
Returnerar basvärdena på 10 logaritm för den valda kolumnen.
Log2
Returnerar de grundläggande 2-logaritmvärdena för den valda kolumnen.
NthRoot
Returnerar värdets n:e rot med hjälp av ett n som du anger.
Välj de kolumner som du vill beräkna roten för med alternativet Kolumnuppsättning .
I Andra argumenttypen väljer du en annan kolumn som innehåller roten eller anger en konstant som ska användas som rot.
Om det andra argumentet är en kolumn används varje värde i kolumnen som värdet för n för motsvarande rad. Om det andra argumentet är en konstant skriver du värdet för n i textrutan Andra argumentet .
Pow
Beräknar X upphöjt till Y för vart och ett av värdena i den valda kolumnen.
Välj först de kolumner som innehåller basen, som ska vara en flyttal, med hjälp av alternativet ColumnSet.
I Andra argumenttypen väljer du kolumnen som innehåller exponenten eller anger en konstant som ska användas som exponent.
Om det andra argumentet är en kolumn används varje värde i kolumnen som exponent för motsvarande rad. Om det andra argumentet är en konstant skriver du värdet för exponenten i textrutan Andra argumentet .
Sqrt
Returnerar kvadratroten för värdena i den valda kolumnen.
SqrtPi
För varje värde i den valda kolumnen multiplicerar du värdet med pi och returnerar sedan kvadratroten för resultatet.
Square
Kvadraterar värdena i den valda kolumnen.
Jämförelseåtgärder
Använd jämförelsefunktionerna i Azure Mašinsko učenje designer när du behöver testa två uppsättningar värden mot varandra. I en pipeline kan du till exempel behöva utföra dessa jämförelseåtgärder:
- Utvärdera en kolumn med sannolikhetspoängmodellen mot ett tröskelvärde.
- Kontrollera om två uppsättningar med resultat är desamma. För varje rad som är annorlunda lägger du till en FALSE-flagga som kan användas för vidare bearbetning eller filtrering.
EqualTo
Returnerar True om värdena är desamma.
GreaterThan
Returnerar Sant om värdena i kolumnuppsättningen är större än den angivna konstanten eller större än motsvarande värden i jämförelsekolumnen.
GreaterThanOrEqualTo
Returnerar Sant om värdena i kolumnuppsättningen är större än eller lika med den angivna konstanten, eller större än eller lika med motsvarande värden i jämförelsekolumnen.
LessThan
Returnerar Sant om värdena i kolumnuppsättningen är mindre än den angivna konstanten eller mindre än motsvarande värden i jämförelsekolumnen.
LessThanOrEqualTo
Returnerar Sant om värdena i kolumnuppsättningen är mindre än eller lika med den angivna konstanten, eller mindre än eller lika med motsvarande värden i jämförelsekolumnen.
NotEqualTo
Returnerar Sant om värdena i kolumnuppsättningen inte är lika med konstanten eller jämförelsekolumnen och returnerar False om de är lika med.
PairMax
Returnerar värdet som är större – värdet i Kolumnuppsättning eller värdet i konstanten eller jämförelsekolumnen.
PairMin
Returnerar värdet som är mindre – värdet i Kolumnuppsättning eller värdet i konstanten eller jämförelsekolumnen
Aritmetiska åtgärder
Innehåller grundläggande aritmetiska åtgärder: addition och subtraktion, division och multiplikation. Eftersom de flesta åtgärder är binära, vilket kräver två tal, väljer du först åtgärden och sedan den kolumn eller de tal som ska användas i de första och andra argumenten.
Ordningen för division och subtraktion är följande:
- Subtrahera(Arg1_Arg2) = Arg1 – Arg 2
- Divide(Arg1_Arg2) = Arg1 / Arg 2
I följande tabell visas några exempel
Åtgärd | Num1 | Num2 | Resultatkolumn | Resultatvärde |
---|---|---|---|---|
Tillägg | 1 | 5 | Lägg till(Num2_Num1) | 6 |
Multiplikation | 1 | 5 | Multiple(Num2_Num1) | 5 |
Subtraktion | 5 | 1 | Subtrahera(Num2_Num1) | 4 |
Subtraktion | 0 | 1 | Subtrahera(Num2_Num1) | -1 |
Division | 5 | 1 | Dividera(Num2_Num1) | 5 |
Division | 1 | 0 | Dividera(Num2_Num1) | Infinity |
Lägg till
Ange källkolumnerna med hjälp av kolumnuppsättningen och lägg sedan till ett tal som anges i Andra argumentet i dessa värden.
Om du vill lägga till värdena i två kolumner väljer du en kolumn eller kolumner med hjälp av kolumnuppsättningen och väljer sedan en andra kolumn med argumentet Second .
Dividera
Delar upp värdena i Kolumn som anges med en konstant eller med kolumnvärdena som definieras i Andra argumentet. Med andra ord väljer du divisor först och sedan utdelningen. Utdatavärdet är kvoten.
Multiplicera
Multiplicerar värdena i kolumnuppsättningen med de angivna konstant- eller kolumnvärdena.
Subtract
Ange den kolumn med värden som ska användas ( minuend) genom att välja en annan kolumn med alternativet Kolumnuppsättning . Ange sedan det tal som ska subtrahera ( subtrahend) med hjälp av listrutan Second argument (Andra argumentet ). Du kan välja antingen en konstant eller kolumn med värden.
Avrundningsåtgärder
Azure Mašinsko učenje Designer stöder en mängd olika avrundningsåtgärder. För många åtgärder måste du ange hur mycket precision som ska användas vid avrundning. Du kan använda antingen en statisk precisionsnivå, som anges som en konstant, eller så kan du använda ett dynamiskt precisionsvärde som hämtas från en kolumn med värden.
Om du använder en konstant anger du Precisionstyp till Konstant och anger sedan antalet siffror som ett heltal i textrutan Konstant precision . Om du skriver ett icke-heltal genererar komponenten inget fel, men resultatet kan vara oväntat.
Om du vill använda ett annat precisionsvärde för varje rad i datamängden anger du Precisionstyp till ColumnSet och väljer sedan den kolumn som innehåller lämpliga precisionsvärden.
Tak
Returnerar taket för värdena i Kolumnuppsättning.
CeilingPower2
Returnerar kvadrattaket för värdena i Kolumnuppsättning.
Våning
Returnerar golvet för värdena i kolumnuppsättningen till den angivna precisionen.
Mod
Returnerar bråkdelen av värdena i kolumnuppsättningen till den angivna precisionen.
Kvot
Returnerar bråkdelen av värdena i kolumnuppsättningen till den angivna precisionen.
Rest
Returnerar resten för värdena i kolumnuppsättningen.
RoundDigits
Returnerar värdena i Kolumnuppsättning, avrundade med 4/5-regeln till det angivna antalet siffror.
RoundDown
Returnerar värdena i Kolumnuppsättning, avrundade nedåt till det angivna antalet siffror.
RoundUp
Returnerar värdena i Kolumnuppsättning, avrundade upp till det angivna antalet siffror.
ToEven
Returnerar värdena i Kolumnuppsättning, avrundade till närmaste heltal, jämna tal.
ToOdd
Returnerar värdena i Kolumnuppsättning, avrundade till närmaste heltal, udda tal.
Truncate
Trunkerar värdena i kolumnuppsättningen genom att ta bort alla siffror som inte tillåts med den angivna precisionen.
Särskilda matematiska funktioner
Den här kategorin innehåller specialiserade matematiska funktioner som ofta används inom datavetenskap. Om inget annat anges är funktionen unary och returnerar den angivna beräkningen för varje värde i den valda kolumnen eller kolumnerna.
Beta
Returnerar värdet för Eulers betafunktion.
EllipticIntegralE
Returnerar värdet för den ofullständiga elliptiska integralen.
EllipticIntegralK
Returnerar värdet för den fullständiga elliptiska integralen (K).
Erf
Returnerar värdet för felfunktionen.
Felfunktionen (även kallad Gauss-felfunktionen) är en speciell funktion i sigmoidformen som används i sannolikheten för att beskriva diffusion.
Erfc
Returnerar värdet för den kompletterande felfunktionen.
Erfc
definieras som 1 – erf(x).
ErfScaled
Returnerar värdet för funktionen för skalbara fel.
Den skalbara versionen av felfunktionen kan användas för att undvika aritmetiskt underflöde.
ErfInverse
Returnerar värdet för inverteringsfunktionen erf
.
ExponentialIntegralEin
Returnerar värdet för den exponentiella integralen Ei.
Gamma
Returnerar värdet för gammafunktionen.
GammaLn
Returnerar gammafunktionens naturliga logaritm.
GammaRegularizedP
Returnerar värdet för den regulariserade ofullständiga gammafunktionen.
Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.
GammaRegularizedPInverse
Returnerar värdet för den inverterade regulariserade ofullständiga gammafunktionen.
Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.
GammaRegularizedQ
Returnerar värdet för den regulariserade ofullständiga gammafunktionen.
Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.
GammaRegularizedQInverse
Returnerar värdet för den inverterade generaliserade, generaliserade ofullständiga gammafunktionen.
Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.
PolyGamma
Returnerar värdet för polygammafunktionen.
Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.
Trigonometriska funktioner
Den här kategorin iIncludes de flesta av de viktiga trigonometriska och invertera trigonometriska funktionerna. Alla trigonometriska funktioner är ofarliga och kräver inga ytterligare argument.
Acos
Beräknar arccosinus för kolumnvärdena.
AcosDegree
Beräknar arccosinus för kolumnvärdena i grader.
Acosh
Beräknar hyperbolisk arccosinus för kolumnvärdena.
Acot
Beräknar arccotangensen för kolumnvärdena.
AcotDegrees
Beräknar arccotangensen för kolumnvärdena i grader.
Acoth
Beräknar den hyperboliska arccotangensen för kolumnvärdena.
Acsc
Beräknar kolumnvärdenas arccosecant.
AcscDegrees
Beräknar arccosecanten för kolumnvärdena i grader.
Asec
Beräknar kolumnvärdenas arcsecant.
AsecDegrees
Beräknar kolumnvärdenas arcsecant i grader.
Asech
Beräknar den hyperboliska arcsecanten för kolumnvärdena.
Asin
Beräknar kolumnvärdenas arcsinus.
AsinDegrees
Beräknar kolumnvärdenas arcsinus i grader.
Asinh
Beräknar hyperbolisk arcsinus för kolumnvärdena.
Atan
Beräknar arctangensen för kolumnvärdena.
AtanDegrees
Beräknar kolumnvärdenas arctangens i grader.
Atanh
Beräknar den hyperboliska arctangensen för kolumnvärdena.
Cos
Beräknar cosininen för kolumnvärdena.
CosDegrees
Beräknar cosininen för kolumnvärdena i grader.
Cosh
Beräknar hyperbolisk cosiné för kolumnvärdena.
Cot
Beräknar cotangensen för kolumnvärdena.
CotDegrees
Beräknar cotangensen för kolumnvärdena i grader.
Coth
Beräknar hyperbolisk cotangens för kolumnvärdena.
Csc
Beräknar cosekanten för kolumnvärdena.
CscDegrees
Beräknar cosekanten för kolumnvärdena i grader.
Csch
Beräknar hyperbolisk cosecant för kolumnvärdena.
DegreesToRadians
Konverterar grader till radianer.
Sek
Beräknar kolumnvärdenas sekant.
aSecDegrees
Beräknar sekanten för kolumnvärdena i grader.
aSech
Beräknar den hyperboliska sekanten för kolumnvärdena.
Signera
Returnerar tecknet för kolumnvärdena.
Sin
Beräknar sinus för kolumnvärdena.
Sinc
Beräknar sinus-cosinusvärdet för kolumnvärdena.
SinDegrees
Beräknar sinus för kolumnvärdena i grader.
Sinh
Beräknar kolumnvärdenas hyperboliska sinus.
Tan
Beräknar tangenten för kolumnvärdena.
TanDegrees
Beräknar tangenten för argumentet i grader.
Tanh
Beräknar den hyperboliska tangensen för kolumnvärdena.
Tekniska anteckningar
Var försiktig när du väljer mer än en kolumn som den andra operatorn. Resultatet är lätt att förstå om åtgärden är enkel, till exempel att lägga till en konstant i alla kolumner.
Anta att datauppsättningen har flera kolumner och att du lägger till datauppsättningen i sig själv. I resultatet läggs varje kolumn till i sig själv, enligt följande:
Num1 | Num2 | Num3 | Lägg till(Num1_Num1) | Lägg till(Num2_Num2) | Lägg till(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Om du behöver utföra mer komplexa beräkningar kan du länka flera instanser av Tillämpa matematisk åtgärd. Du kan till exempel lägga till två kolumner med hjälp av en instans av Tillämpa matematisk åtgärd och sedan använda en annan instans av Tillämpa matematisk åtgärd för att dividera summan med en konstant för att hämta medelvärdet.
Du kan också använda någon av följande komponenter för att utföra alla beräkningar samtidigt med hjälp av SQL-, R- eller Python-skript:
Nästa steg
Se den uppsättning komponenter som är tillgängliga för Azure Mašinsko učenje.