Använda matematisk åtgärd

I den här artikeln beskrivs en komponent i Azure Mašinsko učenje designer.

Använd tillämpa matematisk åtgärd för att skapa beräkningar som tillämpas på numeriska kolumner i indatauppsättningen.

Matematiska operationer omfattar aritmetiska funktioner, trigonometriska funktioner, avrundningsfunktioner och specialfunktioner som används inom datavetenskap som gamma- och felfunktioner.

När du har definierat en åtgärd och kört pipelinen läggs värdena till i datauppsättningen. Beroende på hur du konfigurerar komponenten kan du:

  • Lägg till resultatet i datauppsättningen (användbart när du verifierar resultatet av åtgärden).
  • Ersätt kolumnvärden med de nya, beräknade värdena.
  • Generera en ny kolumn för resultat och visa inte de ursprungliga data.

Leta efter den åtgärd du behöver i följande kategorier:

  • Grundläggande

    Funktionerna i kategorin Grundläggande kan användas för att ändra ett enda värde eller en kolumn med värden. Du kan till exempel få det absoluta värdet för alla tal i en kolumn eller beräkna kvadratroten för varje värde i en kolumn.

  • Jämför

    Funktionerna i kategorin Jämför används alla för jämförelse: du kan göra en parvis jämförelse av värdena i två kolumner, eller så kan du jämföra varje värde i en kolumn med en angiven konstant. Du kan till exempel jämföra kolumner för att avgöra om värdena var desamma i två datauppsättningar. Eller så kan du använda en konstant, till exempel ett maximalt tillåtet värde, för att hitta extremvärden i en numerisk kolumn.

  • Drift

    Kategorin Åtgärder innehåller grundläggande matematiska funktioner: addition, subtraktion, multiplikation och division. Du kan arbeta med kolumner eller konstanter. Du kan till exempel lägga till värdet i Kolumn A till värdet i Kolumn B. Eller så kan du subtrahera en konstant, till exempel ett tidigare beräknat medelvärde, från varje värde i Kolumn A.

  • Avrundning

    Kategorin Avrundning innehåller en mängd olika funktioner för att utföra åtgärder som avrundning, tak, golv och trunkering till olika precisionsnivåer. Du kan ange precisionsnivån för både decimal- och heltal.

  • Speciell

    Kategorin Special innehåller matematiska funktioner som används särskilt inom datavetenskap, till exempel elliptiska integraler och gaussiska felfunktionen.

  • Trigonometrisk

    Kategorin Trigonometric innehåller alla trigonometriska standardfunktioner. Du kan till exempel konvertera radianer till grader eller beräkningsfunktioner som tangens i radianer eller grader. Dessa funktioner är unary, vilket innebär att de tar en enda kolumn med värden som indata, tillämpar funktionen trigonometric och returnerar en kolumn med värden som resultat. Kontrollera att indatakolumnen är lämplig typ och innehåller rätt typ av värden för den angivna åtgärden.

Så här konfigurerar du Tillämpa matematisk åtgärd

Komponenten Tillämpa matematisk åtgärd kräver en datauppsättning som innehåller minst en kolumn som bara innehåller tal. Talen kan vara diskreta eller kontinuerliga men måste ha en numerisk datatyp, inte en sträng.

Du kan använda samma åtgärd för flera numeriska kolumner, men alla kolumner måste finnas i samma datauppsättning.

Varje instans av den här komponenten kan bara utföra en typ av åtgärd i taget. Om du vill utföra komplexa matematiska åtgärder kan du behöva länka samman flera instanser av komponenten Tillämpa matematisk åtgärd .

  1. Lägg till komponenten Tillämpa matematisk åtgärd i pipelinen.

  2. Anslut en datauppsättning som innehåller minst en numerisk kolumn.

  3. Välj en eller flera källkolumner som du vill utföra beräkningen på.

    • Alla kolumner som du väljer måste vara en numerisk datatyp.
    • Dataområdet måste vara giltigt för den valda matematiska åtgärden. Annars kan ett fel eller ett NaN-resultat (inte ett tal) inträffa. Till exempel är Ln(-1.0) en ogiltig åtgärd och resulterar i värdet NaN.
  4. Välj Kategori för att välja vilken typ av matematisk åtgärd som ska utföras.

  5. Välj en specifik åtgärd i listan i den kategorin.

  6. Ange ytterligare parametrar som krävs för varje typ av åtgärd.

  7. Använd alternativet Utdataläge för att ange hur du vill att matematikåtgärden ska genereras:

    • Lägg till. Alla kolumner som används som indata ingår i utdatauppsättningen, plus att ytterligare en kolumn läggs till som innehåller resultatet av matematikåtgärden.
    • På plats. Värdena i kolumnerna som används som indata ersätts med de nya beräknade värdena.
    • ResultOnly. En enskild kolumn returneras som innehåller resultatet av matematikåtgärden.
  8. Skicka pipelinen.

Resultat

Om du genererar resultatet med alternativen Lägg till eller ResultOnly anger kolumnrubrikerna i den returnerade datamängden åtgärden och de kolumner som användes. Om du till exempel jämför två kolumner med operatorn Lika med ser resultatet ut så här:

  • Equals(Col2_Col1), som anger att du testade Col2 mot Col1.
  • Är lika med(Col2_$10), vilket indikerar att du jämförde kolumn 2 med konstanten 10.

Även om du använder alternativet På plats tas inte källdata bort eller ändras. Kolumnen i den ursprungliga datamängden är fortfarande tillgänglig i designern. Om du vill visa de ursprungliga data kan du ansluta komponenten Lägg till kolumner och koppla den till utdata från Tillämpa matematisk åtgärd.

Grundläggande matematiska åtgärder

Funktionerna i kategorin Basic tar vanligtvis ett enda värde från en kolumn, utför den fördefinierade åtgärden och returnerar ett enda värde. För vissa funktioner kan du ange en konstant eller en kolumnuppsättning som ett andra argument.

Azure Mašinsko učenje stöder följande funktioner i kategorin Grundläggande:

Abs

Returnerar det absoluta värdet för de markerade kolumnerna.

Atan2

Returnerar en inverterad tangent med fyra kvadranter.

Välj de kolumner som innehåller punktkoordinaterna. För det andra argumentet, som motsvarar x-koordinaten, kan du också ange en konstant.

Motsvarar funktionen ATAN2 i MATLAB.

Conj

Returnerar konjugaten för värdena i den valda kolumnen.

CubeRoot

Beräknar kubroten för värdena i den valda kolumnen.

DoubleFactorial

Beräknar den dubbla faktorn för värden i den valda kolumnen. Den dubbla faktorn är en förlängning av den normala faktorfunktionen och den betecknas som x!!.

Eps

Returnerar storleken på gapet mellan det aktuella värdet och det näst högsta talet med dubbel precision. Motsvarar EPS-funktionen i MATLAB.

Exp

Returnerar e upphöjt till värdets kraft i den valda kolumnen. Den här funktionen är samma som Excel EXP-funktionen.

Exp2

Returnerar base-2 exponentiellt för argumenten och löser för y = x * 2t där t är en kolumn med värden som innehåller exponenter.

I Kolumnuppsättning väljer du den kolumn som innehåller exponentvärdena t.

För Exp2 kan du ange ett andra argument x, som kan vara antingen en konstant eller en annan kolumn med värden. I Andra argumenttypen anger du om du ska ange multiplikatorn x som en konstant eller ett värde i en kolumn.

Om du till exempel väljer en kolumn med värdena {0,1,2,3,4,5} för både multiplikatorn och exponenten returnerar funktionen {0, 2, 8, 24, 64 160).

ExpMinus1

Returnerar den negativa exponenten för värden i den valda kolumnen.

Fakultet

Returnerar faktor för värden i den valda kolumnen.

Hypotenusa

Beräknar hypotenuse för en triangel där längden på en sida anges som en kolumn med värden, och längden på den andra sidan anges antingen som en konstant eller som två kolumner.

Ln

Returnerar den naturliga logaritmen för värdena i den valda kolumnen.

LnPlus1

Returnerar den naturliga logaritmen plus en för värdena i den valda kolumnen.

Loggas

Returnerar loggen för värdena i den valda kolumnen, givet den angivna basen.

Du kan ange basen (det andra argumentet) antingen som en konstant eller genom att välja en annan kolumn med värden.

Log10

Returnerar basvärdena på 10 logaritm för den valda kolumnen.

Log2

Returnerar de grundläggande 2-logaritmvärdena för den valda kolumnen.

NthRoot

Returnerar värdets n:e rot med hjälp av ett n som du anger.

Välj de kolumner som du vill beräkna roten för med alternativet Kolumnuppsättning .

I Andra argumenttypen väljer du en annan kolumn som innehåller roten eller anger en konstant som ska användas som rot.

Om det andra argumentet är en kolumn används varje värde i kolumnen som värdet för n för motsvarande rad. Om det andra argumentet är en konstant skriver du värdet för n i textrutan Andra argumentet .

Pow

Beräknar X upphöjt till Y för vart och ett av värdena i den valda kolumnen.

Välj först de kolumner som innehåller basen, som ska vara en flyttal, med hjälp av alternativet ColumnSet.

I Andra argumenttypen väljer du kolumnen som innehåller exponenten eller anger en konstant som ska användas som exponent.

Om det andra argumentet är en kolumn används varje värde i kolumnen som exponent för motsvarande rad. Om det andra argumentet är en konstant skriver du värdet för exponenten i textrutan Andra argumentet .

Sqrt

Returnerar kvadratroten för värdena i den valda kolumnen.

SqrtPi

För varje värde i den valda kolumnen multiplicerar du värdet med pi och returnerar sedan kvadratroten för resultatet.

Square

Kvadraterar värdena i den valda kolumnen.

Jämförelseåtgärder

Använd jämförelsefunktionerna i Azure Mašinsko učenje designer när du behöver testa två uppsättningar värden mot varandra. I en pipeline kan du till exempel behöva utföra dessa jämförelseåtgärder:

  • Utvärdera en kolumn med sannolikhetspoängmodellen mot ett tröskelvärde.
  • Kontrollera om två uppsättningar med resultat är desamma. För varje rad som är annorlunda lägger du till en FALSE-flagga som kan användas för vidare bearbetning eller filtrering.

EqualTo

Returnerar True om värdena är desamma.

GreaterThan

Returnerar Sant om värdena i kolumnuppsättningen är större än den angivna konstanten eller större än motsvarande värden i jämförelsekolumnen.

GreaterThanOrEqualTo

Returnerar Sant om värdena i kolumnuppsättningen är större än eller lika med den angivna konstanten, eller större än eller lika med motsvarande värden i jämförelsekolumnen.

LessThan

Returnerar Sant om värdena i kolumnuppsättningen är mindre än den angivna konstanten eller mindre än motsvarande värden i jämförelsekolumnen.

LessThanOrEqualTo

Returnerar Sant om värdena i kolumnuppsättningen är mindre än eller lika med den angivna konstanten, eller mindre än eller lika med motsvarande värden i jämförelsekolumnen.

NotEqualTo

Returnerar Sant om värdena i kolumnuppsättningen inte är lika med konstanten eller jämförelsekolumnen och returnerar False om de är lika med.

PairMax

Returnerar värdet som är större – värdet i Kolumnuppsättning eller värdet i konstanten eller jämförelsekolumnen.

PairMin

Returnerar värdet som är mindre – värdet i Kolumnuppsättning eller värdet i konstanten eller jämförelsekolumnen

Aritmetiska åtgärder

Innehåller grundläggande aritmetiska åtgärder: addition och subtraktion, division och multiplikation. Eftersom de flesta åtgärder är binära, vilket kräver två tal, väljer du först åtgärden och sedan den kolumn eller de tal som ska användas i de första och andra argumenten.

Ordningen för division och subtraktion är följande:

  • Subtrahera(Arg1_Arg2) = Arg1 – Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

I följande tabell visas några exempel

Åtgärd Num1 Num2 Resultatkolumn Resultatvärde
Tillägg 1 5 Lägg till(Num2_Num1) 6
Multiplikation 1 5 Multiple(Num2_Num1) 5
Subtraktion 5 1 Subtrahera(Num2_Num1) 4
Subtraktion 0 1 Subtrahera(Num2_Num1) -1
Division 5 1 Dividera(Num2_Num1) 5
Division 1 0 Dividera(Num2_Num1) Infinity

Lägg till

Ange källkolumnerna med hjälp av kolumnuppsättningen och lägg sedan till ett tal som anges i Andra argumentet i dessa värden.

Om du vill lägga till värdena i två kolumner väljer du en kolumn eller kolumner med hjälp av kolumnuppsättningen och väljer sedan en andra kolumn med argumentet Second .

Dividera

Delar upp värdena i Kolumn som anges med en konstant eller med kolumnvärdena som definieras i Andra argumentet. Med andra ord väljer du divisor först och sedan utdelningen. Utdatavärdet är kvoten.

Multiplicera

Multiplicerar värdena i kolumnuppsättningen med de angivna konstant- eller kolumnvärdena.

Subtract

Ange den kolumn med värden som ska användas ( minuend) genom att välja en annan kolumn med alternativet Kolumnuppsättning . Ange sedan det tal som ska subtrahera ( subtrahend) med hjälp av listrutan Second argument (Andra argumentet ). Du kan välja antingen en konstant eller kolumn med värden.

Avrundningsåtgärder

Azure Mašinsko učenje Designer stöder en mängd olika avrundningsåtgärder. För många åtgärder måste du ange hur mycket precision som ska användas vid avrundning. Du kan använda antingen en statisk precisionsnivå, som anges som en konstant, eller så kan du använda ett dynamiskt precisionsvärde som hämtas från en kolumn med värden.

  • Om du använder en konstant anger du Precisionstyp till Konstant och anger sedan antalet siffror som ett heltal i textrutan Konstant precision . Om du skriver ett icke-heltal genererar komponenten inget fel, men resultatet kan vara oväntat.

  • Om du vill använda ett annat precisionsvärde för varje rad i datamängden anger du Precisionstyp till ColumnSet och väljer sedan den kolumn som innehåller lämpliga precisionsvärden.

Tak

Returnerar taket för värdena i Kolumnuppsättning.

CeilingPower2

Returnerar kvadrattaket för värdena i Kolumnuppsättning.

Våning

Returnerar golvet för värdena i kolumnuppsättningen till den angivna precisionen.

Mod

Returnerar bråkdelen av värdena i kolumnuppsättningen till den angivna precisionen.

Kvot

Returnerar bråkdelen av värdena i kolumnuppsättningen till den angivna precisionen.

Rest

Returnerar resten för värdena i kolumnuppsättningen.

RoundDigits

Returnerar värdena i Kolumnuppsättning, avrundade med 4/5-regeln till det angivna antalet siffror.

RoundDown

Returnerar värdena i Kolumnuppsättning, avrundade nedåt till det angivna antalet siffror.

RoundUp

Returnerar värdena i Kolumnuppsättning, avrundade upp till det angivna antalet siffror.

ToEven

Returnerar värdena i Kolumnuppsättning, avrundade till närmaste heltal, jämna tal.

ToOdd

Returnerar värdena i Kolumnuppsättning, avrundade till närmaste heltal, udda tal.

Truncate

Trunkerar värdena i kolumnuppsättningen genom att ta bort alla siffror som inte tillåts med den angivna precisionen.

Särskilda matematiska funktioner

Den här kategorin innehåller specialiserade matematiska funktioner som ofta används inom datavetenskap. Om inget annat anges är funktionen unary och returnerar den angivna beräkningen för varje värde i den valda kolumnen eller kolumnerna.

Beta

Returnerar värdet för Eulers betafunktion.

EllipticIntegralE

Returnerar värdet för den ofullständiga elliptiska integralen.

EllipticIntegralK

Returnerar värdet för den fullständiga elliptiska integralen (K).

Erf

Returnerar värdet för felfunktionen.

Felfunktionen (även kallad Gauss-felfunktionen) är en speciell funktion i sigmoidformen som används i sannolikheten för att beskriva diffusion.

Erfc

Returnerar värdet för den kompletterande felfunktionen.

Erfc definieras som 1 – erf(x).

ErfScaled

Returnerar värdet för funktionen för skalbara fel.

Den skalbara versionen av felfunktionen kan användas för att undvika aritmetiskt underflöde.

ErfInverse

Returnerar värdet för inverteringsfunktionen erf .

ExponentialIntegralEin

Returnerar värdet för den exponentiella integralen Ei.

Gamma

Returnerar värdet för gammafunktionen.

GammaLn

Returnerar gammafunktionens naturliga logaritm.

GammaRegularizedP

Returnerar värdet för den regulariserade ofullständiga gammafunktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedPInverse

Returnerar värdet för den inverterade regulariserade ofullständiga gammafunktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedQ

Returnerar värdet för den regulariserade ofullständiga gammafunktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedQInverse

Returnerar värdet för den inverterade generaliserade, generaliserade ofullständiga gammafunktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

PolyGamma

Returnerar värdet för polygammafunktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

Trigonometriska funktioner

Den här kategorin iIncludes de flesta av de viktiga trigonometriska och invertera trigonometriska funktionerna. Alla trigonometriska funktioner är ofarliga och kräver inga ytterligare argument.

Acos

Beräknar arccosinus för kolumnvärdena.

AcosDegree

Beräknar arccosinus för kolumnvärdena i grader.

Acosh

Beräknar hyperbolisk arccosinus för kolumnvärdena.

Acot

Beräknar arccotangensen för kolumnvärdena.

AcotDegrees

Beräknar arccotangensen för kolumnvärdena i grader.

Acoth

Beräknar den hyperboliska arccotangensen för kolumnvärdena.

Acsc

Beräknar kolumnvärdenas arccosecant.

AcscDegrees

Beräknar arccosecanten för kolumnvärdena i grader.

Asec

Beräknar kolumnvärdenas arcsecant.

AsecDegrees

Beräknar kolumnvärdenas arcsecant i grader.

Asech

Beräknar den hyperboliska arcsecanten för kolumnvärdena.

Asin

Beräknar kolumnvärdenas arcsinus.

AsinDegrees

Beräknar kolumnvärdenas arcsinus i grader.

Asinh

Beräknar hyperbolisk arcsinus för kolumnvärdena.

Atan

Beräknar arctangensen för kolumnvärdena.

AtanDegrees

Beräknar kolumnvärdenas arctangens i grader.

Atanh

Beräknar den hyperboliska arctangensen för kolumnvärdena.

Cos

Beräknar cosininen för kolumnvärdena.

CosDegrees

Beräknar cosininen för kolumnvärdena i grader.

Cosh

Beräknar hyperbolisk cosiné för kolumnvärdena.

Cot

Beräknar cotangensen för kolumnvärdena.

CotDegrees

Beräknar cotangensen för kolumnvärdena i grader.

Coth

Beräknar hyperbolisk cotangens för kolumnvärdena.

Csc

Beräknar cosekanten för kolumnvärdena.

CscDegrees

Beräknar cosekanten för kolumnvärdena i grader.

Csch

Beräknar hyperbolisk cosecant för kolumnvärdena.

DegreesToRadians

Konverterar grader till radianer.

Sek

Beräknar kolumnvärdenas sekant.

aSecDegrees

Beräknar sekanten för kolumnvärdena i grader.

aSech

Beräknar den hyperboliska sekanten för kolumnvärdena.

Signera

Returnerar tecknet för kolumnvärdena.

Sin

Beräknar sinus för kolumnvärdena.

Sinc

Beräknar sinus-cosinusvärdet för kolumnvärdena.

SinDegrees

Beräknar sinus för kolumnvärdena i grader.

Sinh

Beräknar kolumnvärdenas hyperboliska sinus.

Tan

Beräknar tangenten för kolumnvärdena.

TanDegrees

Beräknar tangenten för argumentet i grader.

Tanh

Beräknar den hyperboliska tangensen för kolumnvärdena.

Tekniska anteckningar

Var försiktig när du väljer mer än en kolumn som den andra operatorn. Resultatet är lätt att förstå om åtgärden är enkel, till exempel att lägga till en konstant i alla kolumner.

Anta att datauppsättningen har flera kolumner och att du lägger till datauppsättningen i sig själv. I resultatet läggs varje kolumn till i sig själv, enligt följande:

Num1 Num2 Num3 Lägg till(Num1_Num1) Lägg till(Num2_Num2) Lägg till(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Om du behöver utföra mer komplexa beräkningar kan du länka flera instanser av Tillämpa matematisk åtgärd. Du kan till exempel lägga till två kolumner med hjälp av en instans av Tillämpa matematisk åtgärd och sedan använda en annan instans av Tillämpa matematisk åtgärd för att dividera summan med en konstant för att hämta medelvärdet.

Du kan också använda någon av följande komponenter för att utföra alla beräkningar samtidigt med hjälp av SQL-, R- eller Python-skript:

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Mašinsko učenje.