Applicare operazioni matematiche
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Applica un'operazione matematica a valori di colonna
Categoria: Funzioni statistiche
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Applica operazione matematica in Machine Learning Studio (versione classica) per creare calcoli applicati alle colonne numeriche nel set di dati di input.
Le operazioni matematiche supportate includono funzioni aritmetiche comuni, ad esempio moltiplicazione e divisione, funzioni trigonometriche, un'ampia gamma di funzioni di arrotondamento e funzioni speciali usate in data science come le funzioni gamma ed error.
Dopo aver definito un'operazione ed eseguito l'esperimento, i valori vengono aggiunti al set di dati. A seconda della modalità di configurazione del modulo, è possibile:
- Aggiungere i risultati al set di dati. Ciò è particolarmente utile quando si verifica il risultato dell'operazione.
- Sostituire i valori delle colonne con i nuovi valori calcolati.
- Generare una nuova colonna per i risultati e non visualizzare i dati originali.
Suggerimento
Questo modulo esegue una singola operazione matematica alla volta. Per operazioni matematiche complesse, è consigliabile usare questi moduli:
- Execute R Script (Esegui script R)
- Execute Python Script (Esegui script Python)
- Apply SQL Transformation (Applica trasformazione SQL)
Cercare l'operazione necessaria nelle categorie seguenti:
-
Le funzioni nella categoria Basic possono essere usate per modificare un singolo valore o colonna di valori. Ad esempio, è possibile ottenere il valore assoluto di tutti i numeri in una colonna o calcolare la radice quadrata di ogni valore in una colonna.
-
Le funzioni nella categoria Confronta vengono tutte usate per il confronto: è possibile eseguire un confronto a coppie tra i valori in due colonne oppure è possibile confrontare ogni valore in una colonna con una costante specificata. Ad esempio, è possibile confrontare le colonne per determinare se i valori sono uguali in due set di dati. In caso contrario, è possibile usare una costante, ad esempio un valore massimo consentito, per trovare gli outlier in una colonna numerica.
-
Questa categoria include le funzioni matematiche di base: addizione, sottrazione, moltiplicazione e divisione. È possibile usare colonne o costanti. Ad esempio, è possibile aggiungere il valore nella colonna A al valore nella colonna B. In caso contrario, è possibile sottrarre una costante, ad esempio una media calcolata in precedenza, da ogni valore nella colonna A.
-
Questa categoria include un'ampia gamma di funzioni per l'esecuzione di operazioni quali arrotondamento, controsoffitto, piano e troncamento a vari livelli di precisione. È possibile specificare il livello di precisione sia per i numeri decimali che per i numeri interi.
-
La categoria Special include funzioni matematiche particolarmente usate in data science, ad esempio gli integrali ellittici e la funzione di errore gaussiana.
-
Questa categoria include tutte le funzioni trigonometriche standard. Ad esempio, è possibile convertire i radianti in gradi o funzioni di calcolo come tangente in radianti o gradi. Queste funzioni sono unarie, ovvero accettano una singola colonna di valori come input, applicano la funzione trigonometrica e restituiscono una colonna di valori come risultato. È quindi necessario assicurarsi che la colonna di input sia del tipo appropriato e contenga il tipo corretto di valori per l'operazione specificata.
Esempio
Per esempi su come usare Applica operazione matematica, vedere questi esperimenti di esempio nel Azure AI Gallery:
Quantizzazione dei colori: un set di valori di colonna viene sottratto da un altro e quindi i risultati vengono quadrati.
Stima della relazione tra clienti: la costante 1 viene aggiunta a tutti i valori di una colonna per distinguere tra zeri e valori mancanti.
Stima del ritardo dei voli: illustra varie operazioni, tra cui arrotondamento e divisione.
Marketing diretto: usa le operazioni di confronto per determinare se i punteggi di probabilità soddisfano un valore obbligatorio.
Come usare Apply Math Operation
Il modulo Applica operazione matematica richiede un set di dati che contiene almeno una colonna contenente solo numeri. I numeri possono essere discreti o continui, ma devono essere di tipo numerico, non di stringa.
È possibile applicare la stessa operazione a più colonne numeriche, ma tutte le colonne devono essere nello stesso set di dati.
Ogni istanza di questo modulo può eseguire un solo tipo di operazione alla volta. Per eseguire operazioni matematiche complesse, potrebbe essere necessario concatenare diverse istanze del modulo Applica operazione matematica .
Aggiungere il modulo Applica operazione matematica all'esperimento. È possibile trovare questo modulo nella categoria Funzioni statistiche .
Connessione un set di dati che contiene almeno una colonna numerica.
Fare clic su Categoria per selezionare il tipo di operazione matematica da eseguire.
Ad esempio, per eseguire operazioni aritmetiche di base sulle colonne, scegliere Operazioni. Per ottenere un logaritmo o un controsoffitto, scegliere Basic. Per confrontare colonne di valori, usare Confronto.
Suggerimento
Tutte le altre opzioni cambiano a seconda del tipo di operazione matematica scelta. Inoltre, qualsiasi modifica apportata alla categoria reimposta tutte le altre opzioni. Assicurarsi quindi di selezionare prima Categoria .
Scegliere un'operazione specifica dall'elenco in tale categoria.
Selezionare una o più colonne di origine in cui eseguire il calcolo.
- Qualsiasi colonna scelta deve essere un tipo di dati numerico.
- L'intervallo di dati deve essere valido per l'operazione matematica selezionata. In caso contrario, può verificarsi un errore o un risultato NaN (non un numero). Ad esempio, Ln(-1.0) è un'operazione non valida e ha come risultato il valore
NaN
.
Impostare parametri aggiuntivi richiesti da ogni tipo di operazione.
Usare l'opzione Modalità di output per indicare come generare l'operazione matematica:
- Append. Tutte le colonne usate come input vengono incluse nel set di dati di output, oltre a una colonna aggiuntiva che contiene i risultati dell'operazione matematica.
- In luogo. I valori nelle colonne usate come input vengono sostituiti con i nuovi valori calcolati.
- ResultOnly. Viene restituita una singola colonna contenente i risultati dell'operazione matematica.
Eseguire l'esperimento oppure fare clic con il pulsante destro del mouse sul modulo Applica operazione matematica e scegliere Esegui selezionato.
Risultati
Se si generano i risultati usando le opzioni Append o ResultOnly , le intestazioni di colonna del set di dati restituito indicano l'operazione e le colonne usate. Ad esempio, se si confrontano due colonne usando l'operatore Equals , i risultati sono simili ai seguenti:
- Equals(Col2_Col1), che indica che è stato testato Col2 rispetto a Col1.
- Equals(Col2_$10), a indicare che la colonna 2 è stata confrontata con la costante 10.
Anche se si usa l'opzione Inplace , i dati di origine non vengono eliminati o modificati. la colonna nel set di dati originale è ancora disponibile in Studio (versione classica). Per visualizzare i dati originali, è possibile connettere il modulo Aggiungi colonne e unirlo all'output di Applica operazione matematica.
Operazioni matematiche di base
Le funzioni nella categoria Basic in genere accettano un singolo valore da una colonna, eseguono l'operazione predefinita e restituiscono un singolo valore. Per alcune funzioni è possibile specificare una costante come secondo argomento.
Machine Learning supporta le funzioni seguenti nella categoria Basic:
Abs
Restituisce il valore assoluto delle colonne selezionate.
Atan2
Restituisce una tangente inversa a quattro quadranti.
Selezionare le colonne che contengono le coordinate del punto. Per il secondo argomento, che corrisponde alla coordinata x, è anche possibile specificare una costante.
Corrisponde alla funzione ATAN2 in Matlab.
Conj
Restituisce il coniugato per i valori nella colonna selezionata.
CubeRoot
Calcola la radice del cubo per i valori nella colonna selezionata.
DoubleFactorial**
Calcola il fattoriale doppio per i valori nella colonna selezionata. Il fattoriale doppio è un'estensione della funzione fattoriale normale e viene denotato come x!!.
Eps
Restituisce la dimensione del gap tra il valore corrente e il successivo numero a precisione doppia più alto. Corrisponde alla funzione EPS in Matlab.
Exp
Restituisce e elevato alla potenza del valore nella colonna selezionata. Corrisponde alla funzione EXP Excel EXP.
Exp2
Restituisce l'esponenziale in base 2 degli argomenti, risolvendo per y = x * 2t dove t è una colonna di valori contenenti esponenti.
Per Exp2 è possibile specificare un secondo argomento x, che può essere una costante o un'altra colonna di valori
In Secondo tipo di argomento indicare se si fornirà il moltiplicatore t come costante o un valore in una colonna.
È possibile selezionare una singola colonna con i valori esponenti o digitare il valore dell'esponente nella casella di testo Costante secondo argomento. In Set di colonne selezionare quindi la colonna che contiene i valori esponenti.
Ad esempio, se {0,1,2,3,4,5} si seleziona una colonna con i valori sia per il moltiplicatore che per l'esponente, la funzione restituisce {0, 2, 8, 24, 64 160).
ExpMinus1
Restituisce l'esponente negativo per i valori nella colonna selezionata.
Fattoriale
Restituisce il fattoriale per i valori nella colonna selezionata.
Hypotenuse
Calcola l'ipotenusa per un triangolo in cui la lunghezza di un lato viene specificata come colonna di valori e la lunghezza del secondo lato viene specificata come costante o come due colonne.
ImaginaryPart
Restituisce la parte immaginaria dei valori nella colonna selezionata.
Ri
Restituisce il logaritmo naturale per i valori nella colonna selezionata.
LnPlus1
Restituisce il logaritmo naturale più uno per i valori nella colonna selezionata.
Log
Restituisce il logaritmo dei valori nella colonna selezionata secondo la base specificata.
È possibile specificare la base (il secondo argomento) come costante o selezionando un'altra colonna di valori.
Log10
Restituisce il logaritmo in base 10 dei valori nella colonna selezionata.
Log2
Restituisce il logaritmo in base 2 per i valori nella colonna selezionata.
NthRoot
Restituisce l'esima radice del valore, usando un n specificato.
Selezionare le colonne per cui si vuole calcolare la radice usando l'opzione ColumnSet .
In Secondo tipo di argomento selezionare un'altra colonna che contiene la radice o specificare una costante da usare come radice.
Se il secondo argomento è una colonna, ogni valore nella colonna viene usato come valore di n per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per n nella casella di testo Constant second argument (Secondo argomento costante).
Pow
Calcola X elevato alla potenza di Y per ognuno dei valori nella colonna selezionata.
Per prima cosa, selezionare le colonne che contengono la base, che deve essere un valore float, usando l'opzione ColumnSet .
In Secondo tipo di argomento selezionare la colonna che contiene l'esponente o specificare una costante da usare come esponente.
Se il secondo argomento è una colonna, ogni valore della colonna viene usato come esponente per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore dell'esponente nella casella di testo Constant second argument.
RealPart
Restituisce la parte reale dei valori nella colonna selezionata.
Sqrt
Restituisce la radice quadrata dei valori nella colonna selezionata.
SqrtPi
Per ogni valore nella colonna selezionata, moltiplica il valore per pi greco e quindi restituisce la radice quadrata del risultato.
Square
Quadra i valori nella colonna selezionata.
Operazioni di confronto
Usare le funzioni di confronto in Machine Learning Studio (versione classica) ogni volta che è necessario testare due set di valori l'uno sull'altro. Ad esempio, in un esperimento potrebbe essere necessario eseguire queste operazioni di confronto:
- Valutare un modello di colonna di punteggi di probabilità rispetto a un valore soglia.
- Determinare se due set di risultati sono uguali e per ogni riga diversa aggiungere un flag FALSE che può essere usato per ulteriori elaborazioni o filtri.
EqualTo
Restituisce True se i valori sono uguali.
GreaterThan
Restituisce True se i valori nel set di colonne sono maggiori della costante specificata o maggiori dei valori corrispondenti nella colonna di confronto.
GreaterThanOrEqualTo
Restituisce True se i valori nel set di colonne sono maggiori o uguali alla costante specificata oppure maggiore o uguale ai valori corrispondenti nella colonna di confronto.
LessThan
Restituisce True se i valori nel set di colonne sono minori della costante specificata o minori dei valori corrispondenti nella colonna di confronto.
LessThanOrEqualTo
Restituisce True se i valori nel set di colonne sono minori o uguali alla costante specificata oppure minore o uguale ai valori corrispondenti nella colonna di confronto.
NotEqualTo
Restituisce True se i valori in Column set non sono uguali alla costante o alla colonna di confronto, altrimenti restituisce False.
PairMax
Restituisce il valore maggiore: il valore in Column set oppure il valore nella costante o nella colonna di confronto.
PairMin
Restituisce il valore minore, ovvero il valore in Set di colonne o il valore nella colonna costante o di confronto
Operazioni aritmetiche
Include le operazioni aritmetiche di base: addizione e sottrazione, divisione e moltiplicazione. Poiché la maggior parte delle operazioni è binaria e richiede due numeri, è prima di tutto necessario scegliere l'operazione e quindi la colonna o i numeri da usare nel primo e nel secondo argomento.
L'ordine in cui si scelgono le colonne per la divisione e la sottrazione potrebbe sembrare controintuitivo; Tuttavia, per semplificare la comprensione dei risultati, l'intestazione di colonna fornisce il nome dell'operazione e l'ordine in cui sono state usate le colonne.
Operazione | Num1 | Num2 | Colonna dei risultati | Valore del risultato |
---|---|---|---|---|
Addizione | 1 | 5 | Add(Num2_Num1) | 4 |
Moltiplicazione | 1 | 5 | Multiple(Num2_Num1) | 5 |
Sottrazione | 1 | 5 | Subtract(Num2_Num1) | 4 |
Sottrazione | 0 | 1 | Subtract(Num2_Num1) | 0 |
Divisione | 1 | 5 | Divide(Num2_Num1) | 5 |
Divisione | 0 | 1 | Divide(Num2_Num1) | Infinito |
Add
Specificare le colonne di origine usando Set di colonne e quindi aggiungere a tali valori un numero specificato nell'argomento Dell'operazione costante.
Per aggiungere i valori in due colonne, scegliere una o più colonne usando Set di colonne e quindi scegliere una seconda colonna usando l'argomento Operazione.
Divisione
Divide i valori di Column set per una costante o per i valori di colonna definiti in Operation argument. In altre parole, si sceglie prima il divisore e quindi il dividendo. Il valore di output è il quoziente.
Moltiplicazione
Moltiplica i valori di Column set per la costante o i valori di colonna specificati.
Sottrazione
Specificare il numero da sottrarre ( sottraendo) usando l'elenco a discesa dell'argomento Operation. È possibile scegliere una costante o una colonna di valori. Specificare quindi la colonna di valori su cui operare ( minuend), scegliendo una colonna diversa, usando la seconda opzione Set di colonne.
È possibile sottrarre una costante da ogni valore in una colonna di valori, ma non dall'operazione inversa. A tale scopo, usare l'addizione.
Operazioni di arrotondamento
Studio (versione classica) supporta un'ampia gamma di operazioni di arrotondamento. Per molte operazioni, è necessario specificare la quantità di precisione da utilizzare durante l'arrotondamento. È possibile usare un livello di precisione statico, specificato come costante, oppure applicare un valore di precisione dinamica ottenuto da una colonna di valori.
Se si usa una costante, impostare Tipo di precisione su Costante e quindi digitare il numero di cifre come numero intero nella casella di testo Precisione costante . Se si digita un valore diverso da integer, il modulo non genera un errore, ma i risultati possono essere imprevisti.
Per usare un valore di precisione diverso per ogni riga del set di dati, impostare Tipo di precisione su ColumnSet, quindi scegliere la colonna che contiene i valori di precisione appropriati.
Ceiling
Restituisce il limite massimo per i valori in Column set.
CeilingPower2
Restituisce il limite massimo al quadrato per i valori in Column set.
Piano
Restituisce il limite minimo per i valori in Column set con la precisione specificata.
Mod
Restituisce la parte frazionaria dei valori in Column set con la precisione specificata.
Quoziente
Restituisce la parte frazionaria dei valori in Column set con la precisione specificata.
Resto
Restituisce il resto per i valori in Column set.
RoundDigits
Restituisce i valori in Column set, arrotondati per la regola 4/5 al numero di cifre specificato.
RoundDown
Restituisce i valori in Column set, arrotondati per difetto al numero di cifre specificato.
RoundUp
Restituisce i valori in Column set, arrotondati per eccesso al numero di cifre specificato.
ToEven
Restituisce i valori in Column set, arrotondati al numero pari intero più vicino.
ToOdd
Restituisce i valori in Column set, arrotondati al numero dispari intero più vicino.
Truncate
Tronca i valori in Column set rimuovendo tutte le cifre per difetto non consentite dalla precisione specificata.
Funzioni matematiche speciali
Questa categoria include funzioni matematiche specializzate spesso usate in data science. Se non specificato diversamente, la funzione è unaria e restituisce il calcolo specificato per ogni valore nella colonna o nelle colonne selezionate.
Beta
Restituisce il valore della funzione beta di Eulero.
EllipticIntegralE
Restituisce il valore dell'integrale ellittico incompleto.
EllipticIntegralK
Restituisce il valore dell'integrale ellittico completo (K).
Erf
Restituisce il valore della funzione di errore.
La funzione di errore (denominata anche funzione di errore di Gauss) è una funzione speciale di forma sigmoide usata nella probabilità per descrivere la diffusione.
Erfc
Restituisce il valore della funzione di errore complementare.
Erfc è definito come 1 - erf(x).
ErfScaled
Restituisce il valore della funzione di errore in scala.
La versione in scala della funzione di errore consente di evitare l'underflow aritmetico.
ErfInverse
Restituisce il valore della funzione inversa di erf.
ExponentialIntegralEin
Restituisce il valore dell'integrale esponenziale Ei.
Gamma
Restituisce il valore della funzione gamma.
GammaLn
Restituisce il logaritmo naturale della funzione gamma.
GammaRegularizedP
Restituisce il valore della funzione gamma incompleta regolarizzata.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedPInverse
Restituisce il valore della funzione gamma incompleta regolarizzata inversa.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedQ
Restituisce il valore della funzione gamma incompleta regolarizzata.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedQInverse
Restituisce il valore della funzione gamma incompleta regolarizzata generalizzata inversa.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
PolyGamma
Restituisce il valore della funzione poligamma.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
Funzioni trigonometriche
Questa categoria iInclud la maggior parte delle importanti funzioni trigonometriche e inverse. Tutte le funzioni trigonometriche sono unarie e non richiedono argomenti aggiuntivi.
Acos
Calcola l'arcocoseno per i valori di colonna.
AcosDegree
Calcola l'arcocoseno dei valori di colonna, in gradi.
Acosh
Calcola l'arcocoseno iperbolico dei valori di colonna.
Acot
Calcola l'arcocotangente dei valori di colonna.
AcotDegrees
Calcola l'arcocotangente dei valori di colonna, in gradi.
Acoth
Calcola l'arcocotangente iperbolico dei valori di colonna.
Acsc
Calcola l'arcocosecante dei valori di colonna.
AcscDegrees
Calcola l'arcocosecante dei valori di colonna, in gradi.
Asec
Calcola l'arcosecante dei valori di colonna.
AsecDegrees
Calcola l'arcosecante dei valori di colonna, in gradi.
Asech
Calcola l'arcosecante iperbolico dei valori di colonna.
Asin
Calcola l'arcoseno dei valori di colonna.
AsinDegrees
Calcola l'arcoseno dei valori di colonna, in gradi.
Asinh
Calcola l'arcoseno iperbolico per i valori della colonna.
Atan
Calcola l'arcotangente dei valori di colonna.
AtanDegrees
Calcola l'arcotangente dei valori di colonna, in gradi.
Atanh
Calcola l'arcotangente iperbolico dei valori di colonna.
Cis
Restituisce una funzione con valori complessi fatta di seno e coseno con la definizione cis θ = cos θ + isin θ.
Cos
Calcola il coseno dei valori di colonna.
CosDegrees
Calcola il coseno per i valori della colonna, in gradi.
Cosh
Calcola il coseno iperbolico per i valori della colonna.
Cot
Calcola la cotangente per i valori di colonna.
CotDegrees
Calcola la cotangente per i valori di colonna, in gradi.
Coth
Calcola la cotangente iperbolica per i valori di colonna.
Csc
Calcola il cosecanere per i valori di colonna.
CscDegrees
Calcola il cosecanere per i valori di colonna, in gradi.
Csch
Calcola il cosecane iperbolico per i valori di colonna.
DegreesToRadians
Converte i gradi in radianti.
Sec
Calcola la secante dei valori di colonna.
aSecDegrees
Calcola la secante per i valori di colonna, in gradi.
aSech
Calcola il seme iperbolico dei valori di colonna.
Sign
Restituisce il segno dei valori di colonna.
Sin
Calcola il seno dei valori della colonna.
Sinc
Calcola il valore seno-coseno dei valori della colonna.
SinDegrees
Calcola il seno per i valori della colonna, in gradi.
Sinh
Calcola il seno iperbolico dei valori della colonna.
Tan
Calcola la tangente dei valori di colonna.
TanDegrees
Calcola la tangente per l'argomento, in gradi.
Tanh
Calcola la tangente iperbolica dei valori di colonna.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Operazioni su più colonne
Prestare attenzione quando si seleziona più di una colonna come secondo operatore. I risultati sono facili da comprendere se l'operazione è semplice, ad esempio aggiungendo una costante a tutte le colonne.
Si supponga che il set di dati abbia più colonne e che il set di dati sia stato aggiunto a se stesso. Nei risultati ogni colonna viene aggiunta a se stessa, come indicato di seguito:
Num1 | Num2 | Num3 | Add(Num1_Num1) | Add(Num2_Num2) | Add(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Se è necessario eseguire calcoli più complessi, è possibile concatenare più istanze di Applica operazione matematica. È possibile ad esempio aggiungere due colonne tramite un'istanza di Apply Math Operation, quindi usare un'altra istanza di Apply Math Operation per dividere la somma per una costante in modo da ottenere la media.
In alternativa, usare uno dei moduli seguenti per eseguire tutti i calcoli contemporaneamente, usando uno script SQL, R o Python:
- Execute R Script (Esegui script R)
- Execute Python Script (Esegui script Python)
- Apply SQL Transformation (Applica trasformazione SQL)
Funzioni unarie e binarie
In un'operazione unaria si creano calcoli basati sui valori di colonna senza fare riferimento ad altre colonne o costanti.
Ad esempio, è possibile troncare i valori della colonna in base a un determinato grado di precisione, arrotondare i valori per eccesso o per difetto o trovare valori limite massimi o minimi.
Un esempio di un'operazione unaria è rappresentato da Abs(X)
, dove X è la colonna fornita come input.
In un'operazione binaria si specificano due set di valori. Il primo argomento deve essere sempre una colonna o un set di colonne, mentre il secondo argomento può essere un numero specificato come costante o un'altra colonna.
Un esempio di operazione binaria che usa due colonne è rappresentato da Subtract(X,Y)
, dove X è la prima colonna selezionata e Y è la seconda colonna.
Un esempio di uso di operazione binaria che combina una colonna e una costante è rappresentato da Subtract(X,mean)
, dove si digita la media della colonna come costante sottraendola poi da ogni valore della colonna X.
Gestione dei numeri nelle colonne categoriche
Il supporto per i valori categorici presentati come numeri dipende dalla funzione e dal numero di argomenti accettati dalla funzione.
Se l'operazione include numeri designati come colonne categoriche, è possibile applicare un'operazione unaria ai valori di dati categorici.
Se a una colonna di categoria viene applicata un'operazione unaria, i valori dei dati categorici della colonna di input possono essere trasformati in valori di dati categorici uguali associati della colonna di output. In questo caso, i valori vengono uniti, in modo che il numero di valori di dati categorici nell'output sia sempre minore del numero di valori nell'input.
Se un'operazione binaria viene applicata a una colonna categorica e a un'altra colonna, il comportamento previsto è il seguente:
Se l'altra colonna è di tipo dense, la colonna di output è categorica.
I valori di dati categorici presentati nell'input vengono persi.
La colonna di output include solo i valori presenti nei dati della colonna di output.
Se l'altra colonna è di tipo sparse, la colonna di output è sparse.
Se entrambi gli argomenti di un'operazione binaria sono colonne di tipo sparse, la colonna risultante contiene zeri in background in tutte le posizioni in cui entrambe le colonne di input contengono zeri in background.
Elaborazione di colonne di tipo sparse
Nelle operazioni unarie, tutti gli elementi delle colonne di tipo sparse che corrispondono agli zeri di sfondo vengono lasciati non elaborati.
Nelle operazioni binarie, se un argomento è una colonna di tipo sparse e l'altro argomento è una colonna densa, la colonna risultante è di tipo sparse con tutti gli zeri di sfondo propagati dall'input della colonna di tipo sparse.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Set di dati | Tabella dati | Set di dati di input |
Output
Nome | Tipo | Descrizione |
---|---|---|
Set di dati di risultati | Tabella dati | Set di dati di risultati |