Apply Math Operation (Applica operazione matematica)

Questo articolo descrive un componente della finestra di progettazione di Azure Machine Learning.

Usare l'operazione Applica matematica per creare calcoli applicati alle colonne numeriche nel set di dati di input.

Le operazioni matematiche includono funzioni aritmetiche, funzioni trigonometriche, funzioni di arrotondamento e funzioni speciali usate in data science, ad esempio funzioni gamma ed errori.

Dopo aver definito un'operazione ed eseguito la pipeline, i valori vengono aggiunti al set di dati. A seconda di come si configura il componente, è possibile:

  • Aggiungere i risultati al set di dati (utile quando si verifica il risultato dell'operazione).
  • Sostituire i valori delle colonne con i nuovi valori calcolati.
  • Generare una nuova colonna per i risultati e non visualizzare i dati originali.

Cercare l'operazione necessaria in queste categorie:

  • Base

    Le funzioni nella categoria Basic possono essere usate per modificare un singolo valore o colonna di valori. Ad esempio, è possibile ottenere il valore assoluto di tutti i numeri in una colonna o calcolare la radice quadrata di ogni valore in una colonna.

  • Confronta

    Le funzioni nella categoria Confronta sono tutte usate per il confronto: è possibile eseguire un confronto a coppie dei valori in due colonne oppure confrontare ogni valore in una colonna con una costante specificata. Ad esempio, è possibile confrontare le colonne per determinare se i valori sono uguali in due set di dati. In alternativa, è possibile usare una costante, ad esempio un valore massimo consentito, per individuare gli outlier in una colonna numerica.

  • Operazioni

    La categoria Operazioni include funzioni matematiche di base: addizione, sottrazione, moltiplicazione e divisione. È possibile usare colonne o costanti. Ad esempio, è possibile aggiungere il valore nella colonna A al valore nella colonna B. In alternativa, è possibile sottrarre una costante, ad esempio una media calcolata in precedenza, da ogni valore nella colonna A.

  • Arrotondamento

    La categoria Arrotondamento include un'ampia gamma di funzioni per l'esecuzione di operazioni quali arrotondamento, soffitto, pavimento e troncamento a vari livelli di precisione. È possibile specificare il livello di precisione per i numeri decimali e interi.

  • Speciale

    La categoria Speciale include funzioni matematiche particolarmente usate nella data science, ad esempio integrali ellittici e la funzione di errore gaussiana.

  • Trigonometrico

    La categoria Trigonometrica include tutte le funzioni trigonometriche standard. Ad esempio, è possibile convertire radianti in gradi o funzioni di calcolo come tangente in radianti o gradi. Queste funzioni sono unarie, ovvero accettano una singola colonna di valori come input, applicano la funzione trigonometrica e restituiscono una colonna di valori come risultato. Assicurarsi che la colonna di input sia il tipo appropriato e contenga il tipo corretto di valori per l'operazione specificata.

Come configurare Applica operazione matematica

Il componente Apply Math Operation richiede un set di dati contenente almeno una colonna contenente solo numeri. I numeri possono essere discreti o continui, ma devono essere di un tipo di dati numerico, non di una stringa.

È possibile applicare la stessa operazione a più colonne numeriche, ma tutte le colonne devono trovarsi nello stesso set di dati.

Ogni istanza di questo componente può eseguire un solo tipo di operazione alla volta. Per eseguire operazioni matematiche complesse, potrebbe essere necessario concatenare diverse istanze del componente Applica operazione matematica.

  1. Aggiungere il componente Apply Math Operation (Applica operazione matematica) alla pipeline.

  2. Connettere un set di dati contenente almeno una colonna numerica.

  3. Selezionare una o più colonne di origine in cui eseguire il calcolo.

    • Qualsiasi colonna scelta deve essere un tipo di dati numerico.
    • L'intervallo di dati deve essere valido per l'operazione matematica selezionata. In caso contrario, potrebbe verificarsi un errore o un risultato NaN (non un numero). Ad esempio, Ln(-1.0) è un'operazione non valida e restituisce un valore pari NaNa .
  4. Selezionare Categoria per selezionare il tipo di operazione matematica da eseguire.

  5. Scegliere un'operazione specifica dall'elenco in tale categoria.

  6. Impostare parametri aggiuntivi richiesti da ogni tipo di operazione.

  7. Usare l'opzione Modalità output per indicare come si vuole generare l'operazione matematica:

    • Append. Tutte le colonne usate come input sono incluse nel set di dati di output, oltre a una colonna aggiuntiva che contiene i risultati dell'operazione matematica.
    • Inplace. I valori nelle colonne usate come input vengono sostituiti con i nuovi valori calcolati.
    • ResultOnly. Viene restituita una singola colonna contenente i risultati dell'operazione matematica.
  8. Inviare la pipeline.

Risultati

Se si generano i risultati usando le opzioni Append o ResultOnly , le intestazioni di colonna del set di dati restituito indicano l'operazione e le colonne usate. Ad esempio, se si confrontano due colonne usando l'operatore Equals , i risultati sono simili al seguente:

  • Equals(Col2_Col1), che indica che è stato testato Col2 rispetto a Col1.
  • Equals(Col2_$10), che indica che la colonna 2 è stata confrontata con la costante 10.

Anche se si usa l'opzione Sul posto , i dati di origine non vengono eliminati o modificati. La colonna nel set di dati originale è ancora disponibile nella finestra di progettazione. Per visualizzare i dati originali, è possibile connettere il componente Add Columns (Aggiungi colonne ) e aggiungerlo all'output di Apply Math Operation (Applica operazione matematica).

Operazioni matematiche di base

Le funzioni nella categoria Basic accettano in genere un singolo valore da una colonna, eseguono l'operazione predefinita e restituiscono un singolo valore. Per alcune funzioni, è possibile specificare una costante o un set di colonne come secondo argomento.

Azure Machine Learning supporta le funzioni seguenti nella categoria Basic :

Abs

Restituisce il valore assoluto delle colonne selezionate.

Atan2

Restituisce una tangente inversa a quattro quadranti.

Selezionare le colonne che contengono le coordinate del punto. Per il secondo argomento, che corrisponde alla coordinata x, è anche possibile specificare una costante.

Corrisponde alla funzione ATAN2 in MATLAB.

Conj

Restituisce il coniugato per i valori nella colonna selezionata.

CubeRoot

Calcola la radice del cubo per i valori nella colonna selezionata.

DoubleFactorial

Calcola il fattore doppio per i valori nella colonna selezionata. Il fattore doppio è un'estensione della funzione fattoriale normale e viene indicato come x!!.

Eps

Restituisce le dimensioni del divario tra il valore corrente e il numero a precisione doppia più alto successivo. Corrisponde alla funzione EPS in MATLAB.

Exp

Restituisce e generato alla potenza del valore nella colonna selezionata. Questa funzione corrisponde alla funzione EXP di Excel.

Exp2

Restituisce l'esponenziale base 2 degli argomenti, risolvendo y = x * 2t dove t è una colonna di valori contenenti esponenti.

In Set di colonne selezionare la colonna contenente i valori dell'esponente t.

Per Exp2 è possibile specificare un secondo argomento x, che può essere una costante o un'altra colonna di valori. In Secondo tipo di argomento indicare se si fornirà il moltiplicatore x come costante o un valore in una colonna.

Ad esempio, se si seleziona una colonna con i valori {0,1,2,3,4,5} per il moltiplicatore e l'esponente, la funzione restituisce {0, 2, 8, 24, 64 160).

ExpMinus1

Restituisce l'esponente negativo per i valori nella colonna selezionata.

Fattoriale

Restituisce il fattoriale per i valori nella colonna selezionata.

Ipotenusa

Calcola l'ipotenusa per un triangolo in cui la lunghezza di un lato viene specificata come colonna di valori e la lunghezza del secondo lato viene specificata come costante o come due colonne.

Ln

Restituisce il logaritmo naturale per i valori nella colonna selezionata.

LnPlus1

Restituisce il logaritmo naturale più uno per i valori nella colonna selezionata.

Log

Restituisce il log dei valori nella colonna selezionata, in base alla base specificata.

È possibile specificare la base (il secondo argomento) come costante o selezionando un'altra colonna di valori.

Log10

Restituisce i valori logaritmi di base 10 per la colonna selezionata.

Log2

Restituisce i valori logaritmi di base 2 per la colonna selezionata.

NthRoot

Restituisce l'na radice del valore, utilizzando un valore n specificato.

Selezionare le colonne per le quali calcolare la radice usando l'opzione ColumnSet .

In Secondo tipo di argomento selezionare un'altra colonna contenente la radice oppure specificare una costante da usare come radice.

Se il secondo argomento è una colonna, ogni valore nella colonna viene utilizzato come valore di n per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per n nella casella di testo Secondo argomento .

Pow

Calcola X elevato alla potenza di Y per ognuno dei valori nella colonna selezionata.

In primo luogo, selezionare le colonne che contengono la base, che deve essere float, usando l'opzione ColumnSet .

In Secondo tipo di argomento selezionare la colonna contenente l'esponente oppure specificare una costante da utilizzare come esponente.

Se il secondo argomento è una colonna, ogni valore nella colonna viene utilizzato come esponente per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per l'esponente nella casella di testo Secondo argomento .

Sqrt

Restituisce la radice quadrata dei valori nella colonna selezionata.

SqrtPi

Per ogni valore nella colonna selezionata, moltiplica il valore per pi e quindi restituisce la radice quadrata del risultato.

Square

Piazza i valori nella colonna selezionata.

Operazioni di confronto

Usare le funzioni di confronto nella finestra di progettazione di Azure Machine Learning ogni volta che è necessario testare due set di valori tra loro. Ad esempio, in una pipeline potrebbe essere necessario eseguire queste operazioni di confronto:

  • Valutare una colonna di punteggi di probabilità modello rispetto a un valore soglia.
  • Determinare se due set di risultati sono uguali. Per ogni riga diversa, aggiungere un flag FALSE che può essere usato per un'ulteriore elaborazione o filtro.

EqualTo

Restituisce True se i valori sono uguali.

GreaterThan

Restituisce True se i valori nel set di colonne sono maggiori della costante specificata o maggiori dei valori corrispondenti nella colonna di confronto.

GreaterThanOrEqualTo

Restituisce True se i valori nel set di colonne sono maggiori o uguali alla costante specificata oppure maggiore o uguale ai valori corrispondenti nella colonna di confronto.

LessThan

Restituisce True se i valori nel set di colonne sono minori della costante specificata o minori dei valori corrispondenti nella colonna di confronto.

LessThanOrEqualTo

Restituisce True se i valori nel set di colonne sono minori o uguali alla costante specificata oppure minori o uguali ai valori corrispondenti nella colonna di confronto.

NotEqualTo

Restituisce True se i valori del set di colonne non sono uguali alla colonna costante o di confronto e restituisce False se sono uguali.

PairMax

Restituisce il valore maggiore, ovvero il valore in Column set o il valore nella colonna costante o di confronto.

PairMin

Restituisce il valore minore, ovvero il valore in Column set o il valore nella colonna costante o di confronto

Operazioni aritmetiche

Include le operazioni aritmetiche di base: addizione e sottrazione, divisione e moltiplicazione. Poiché la maggior parte delle operazioni è binaria, richiedendo due numeri, è prima necessario scegliere l'operazione e quindi scegliere la colonna o i numeri da usare nei primi e nei secondi argomenti.

L'ordine per la divisione e la sottrazione sono i seguenti:

  • Sottrazione(Arg1_Arg2) = Arg1 - Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

La tabella seguente illustra alcuni esempi

Operazione Num1 Num2 Colonna risultato Valore restituito
Aggiunta 1 5 Add(Num2_Num1) 6
Moltiplicazione 1 5 Multiple (Num2_Num1) 5
Sottrazione 5 1 Sottrazione (Num2_Num1) 4
Sottrazione 0 1 Sottrazione (Num2_Num1) -1
Divisione 5 1 Divide (Num2_Num1) 5
Divisione 1 0 Divide (Num2_Num1) Infinito

Aggiunta

Specificare le colonne di origine usando Il set di colonne e quindi aggiungere a tali valori un numero specificato in Secondo argomento.

Per aggiungere i valori in due colonne, scegliere una colonna o una colonna usando Il set di colonne e quindi scegliere una seconda colonna usando Secondo argomento.

Divide

Divide i valori in Column impostato da una costante o dai valori di colonna definiti in Secondo argomento. In altre parole, scegli prima il divisore e poi il dividendo. Il valore di output è il quoziente.

Per

Moltiplica i valori in Column impostati in base ai valori di colonna o costanti specificati.

Sottrai

Specificare la colonna di valori su cui operare (minuend), scegliendo una colonna diversa usando l'opzione Set di colonne. Specificare quindi il numero da sottrarre (sottrazione) usando l'elenco a discesa Secondo argomento. È possibile scegliere una costante o una colonna di valori.

Operazioni di arrotondamento

La finestra di progettazione di Azure Machine Learning supporta un'ampia gamma di operazioni di arrotondamento. Per molte operazioni, è necessario specificare la quantità di precisione da usare durante l'arrotondamento. È possibile utilizzare un livello di precisione statico, specificato come costante, oppure applicare un valore di precisione dinamica ottenuto da una colonna di valori.

  • Se si utilizza una costante, impostare Tipo di precisione su Costante e quindi digitare il numero di cifre come numero intero nella casella di testo Precisione costante. Se si digita un numero intero, il componente non genera un errore, ma i risultati possono essere imprevisti.

  • Per usare un valore di precisione diverso per ogni riga nel set di dati, impostare Tipo di precisione su ColumnSet e quindi scegliere la colonna contenente i valori di precisione appropriati.

Arrotonda eccesso

Restituisce il limite massimo per i valori in Set di colonne.

CeilingPower2

Restituisce il soffitto quadrato per i valori in Set di colonne.

Piano

Restituisce il piano per i valori in Set di colonne, alla precisione specificata.

Mod

Restituisce la parte frazionaria dei valori in Set di colonne, sulla precisione specificata.

Quoziente

Restituisce la parte frazionaria dei valori in Set di colonne, sulla precisione specificata.

Residuo

Restituisce il resto per i valori in Set di colonne.

RoundDigits

Restituisce i valori in Set di colonne, arrotondati dalla regola 4/5 al numero specificato di cifre.

RoundDown

Restituisce i valori in Set di colonne, arrotondati per difetto al numero specificato di cifre.

RoundUp

Restituisce i valori in Set di colonne, arrotondati fino al numero specificato di cifre.

ToEven

Restituisce i valori in Set di colonne, arrotondati all'intero più vicino, numero pari.

ToOdd

Restituisce i valori in Set di colonne, arrotondati all'intero numero dispari più vicino.

Truncate

Tronca i valori in Column set rimuovendo tutte le cifre non consentite dalla precisione specificata.

Funzioni matematiche speciali

Questa categoria include funzioni matematiche specializzate spesso usate nell'analisi scientifica dei dati. Se non diversamente specificato, la funzione è unaria e restituisce il calcolo specificato per ogni valore nella colonna o nelle colonne selezionate.

Beta

Restituisce il valore della funzione beta di Euler.

EllipticIntegralE

Restituisce il valore dell'integrale ellittico incompleto.

EllipticIntegralK

Restituisce il valore dell'integrale ellittico completo (K).

Erf

Restituisce il valore della funzione di errore.

La funzione di errore (chiamata anche funzione di errore Gauss) è una funzione speciale della forma sigmoide usata in probabilità per descrivere la diffusione.

Erfc

Restituisce il valore della funzione di errore complementare.

Erfc è definito come 1 – erf(x).

ErfScaled

Restituisce il valore della funzione di errore ridimensionata.

La versione ridimensionata della funzione di errore può essere usata per evitare l'underflow aritmetico.

ErfInverse

Restituisce il valore della funzione inversa erf .

ExponentialIntegralEin

Restituisce il valore dell'Ei integrale esponenziale.

Gamma

Restituisce il valore della funzione gamma.

GammaLn

Restituisce il logaritmo naturale della funzione gamma.

GammaRegularizedP

Restituisce il valore della funzione gamma incompleta regolarizzata.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedPInverse

Restituisce il valore della funzione gamma inversamente regolarizzata incompleta.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedQ

Restituisce il valore della funzione gamma incompleta regolarizzata.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedQInverse

Restituisce il valore della funzione gamma regolarizzata regolarizzata generalizzata inversa.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

PolyGamma

Restituisce il valore della funzione polygamma.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

Funzioni trigonometriche

Questa categoria include la maggior parte delle funzioni trigonometriche e trigonometriche inverse. Tutte le funzioni trigonometriche sono unarie e non richiedono argomenti aggiuntivi.

Acos

Calcola l'arcocosine per i valori di colonna.

AcosDegree

Calcola l'arcocosina dei valori di colonna, in gradi.

Acosh

Calcola l'arcocosine iperbolico dei valori di colonna.

Acot

Calcola l'arcocotangente dei valori di colonna.

AcotDegrees

Calcola l'arcocotangente dei valori di colonna, in gradi.

Acoth

Calcola l'arcocotangente iperbolico dei valori di colonna.

Acsc

Calcola l'arcocosecant dei valori di colonna.

AcscDegrees

Calcola l'arcocosecant dei valori di colonna, in gradi.

A sec

Calcola l'arcosecante dei valori di colonna.

AsecDegrees

Calcola l'arcosecante dei valori di colonna, in gradi.

Asech

Calcola l'arcobolico iperbolico dei valori di colonna.

Asin

Calcola l'arcosine dei valori di colonna.

AsinDegrees

Calcola l'arcosine dei valori di colonna, in gradi.

Asinh

Calcola l'arcosine iperbolico per i valori di colonna.

Atan

Calcola l'arcotangente dei valori di colonna.

AtanDegrees

Calcola l'arcotangente dei valori di colonna, in gradi.

Atanh

Calcola l'arcotangente iperbolico dei valori di colonna.

Cos

Calcola il coseno dei valori di colonna.

CosDegrees

Calcola il coseno per i valori di colonna, in gradi.

Cosh

Calcola il coseno iperbolico per i valori di colonna.

Cot

Calcola la cotangente per i valori di colonna.

CotDegrees

Calcola la cotangente per i valori di colonna, espressa in gradi.

Coth

Calcola la cotangente iperbolica per i valori di colonna.

Csc

Calcola il cosecante per i valori di colonna.

CscDegrees

Calcola il cosecante per i valori di colonna, in gradi.

Csch

Calcola il cosecante iperbolico per i valori di colonna.

DegreesToRadians

Converte i gradi in radianti.

Sec

Calcola la secante dei valori di colonna.

aSecDegrees

Calcola il secante per i valori di colonna, in gradi.

aSech

Calcola la sequenza iperbolica dei valori di colonna.

Segno

Restituisce il segno dei valori della colonna.

Sin

Calcola il seno dei valori di colonna.

Sinc

Calcola il valore seno-coseno dei valori della colonna.

SinDegrees

Calcola il seno per i valori di colonna, in gradi.

Sinh

Calcola il seno iperbolico dei valori di colonna.

Tan

Calcola la tangente dei valori di colonna.

TanDegrees

Calcola la tangente per l'argomento, espressa in gradi.

Tanh

Calcola la tangente iperbolica dei valori di colonna.

Note tecniche

Prestare attenzione quando si selezionano più colonne come secondo operatore. I risultati sono facili da comprendere se l'operazione è semplice, ad esempio l'aggiunta di una costante a tutte le colonne.

Si supponga che il set di dati abbia più colonne e si aggiunga il set di dati a se stesso. Nei risultati, ogni colonna viene aggiunta a se stessa, come indicato di seguito:

Num1 Num2 Num3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Se è necessario eseguire calcoli più complessi, è possibile concatenare più istanze di Apply Math Operation. Ad esempio, è possibile aggiungere due colonne usando un'istanza di Apply Math Operation e quindi usare un'altra istanza di Apply Math Operation per dividere la somma per una costante per ottenere la media.

In alternativa, usare uno dei componenti seguenti per eseguire tutti i calcoli contemporaneamente, usando script SQL, R o Python:

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.