New-AzureHDInsightPigJobDefinition

Definisce un nuovo processo Pig per un servizio HDInsight.

Nota

I cmdlet a cui si fa riferimento in questa documentazione sono per la gestione delle risorse di Azure legacy che usano le API di Azure Service Manager (ASM). Questo modulo di PowerShell legacy non è consigliato durante la creazione di nuove risorse perché ASM è pianificato per il ritiro. Per altre informazioni, vedere Ritiro di Azure Service Manager.

Il modulo Az PowerShell è il modulo PowerShell consigliato per la gestione delle risorse di Azure Resource Manager (ARM) con PowerShell.

Sintassi

New-AzureHDInsightPigJobDefinition
   [-Arguments <String[]>]
   [-File <String>]
   [-Files <String[]>]
   [-Query <String>]
   [-StatusFolder <String>]
   [-Profile <AzureSMProfile>]
   [<CommonParameters>]

Descrizione

Questa versione di Azure PowerShell HDInsight è deprecata. Questi cmdlet verranno rimossi entro il 1° gennaio 2017. Usare la versione più recente di Azure PowerShell HDInsight.

Per informazioni su come usare il nuovo HDInsight per creare un cluster, vedere Creare cluster basati su Linux in HDInsight con Azure PowerShell (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/). Per informazioni su come inviare processi usando Azure PowerShell e altri approcci, vedere Inviare processi Hadoop in HDInsight (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/). Per informazioni di riferimento su Azure PowerShell HDInsight, vedere Cmdlet di Azure HDInsight.

New-AzureHDInsightPigJobDefinition definisce un processo Pig per un servizio Azure HDInsight.

Esempio

Esempio 1: Definire un nuovo processo Pig

PS C:\>$0 = '$0';
PS C:\> $QueryString =  "LOGS = LOAD 'wasb:///example/data/sample.log';" + "LEVELS = foreach LOGS generate REGEX_EXTRACT($0, '(TRACE|DEBUG|INFO|WARN|ERROR|FATAL)', 1) as LOGLEVEL;" + "FILTEREDLEVELS = FILTER LEVELS by LOGLEVEL is not null;" + "GROUPEDLEVELS = GROUP FILTEREDLEVELS by LOGLEVEL;" + "FREQUENCIES = foreach GROUPEDLEVELS generate group as LOGLEVEL, COUNT(FILTEREDLEVELS.LOGLEVEL) as COUNT;" + "RESULT = order FREQUENCIES by COUNT desc;" + "DUMP RESULT;"
PS C:\> $PigJobDefinition = New-AzureHDInsightPigJobDefinition -Query $QueryString

Il primo comando dichiara un valore stringa e quindi archivia nella variabile $0.

Il secondo comando crea una query di processo Pig e quindi la archivia nella variabile $QueryString.

Il comando finale crea una definizione di processo Pig che usa la query in $QueryString e quindi archivia la definizione del processo nella variabile $PigJobDefinition.

Parametri

-Arguments

Specifica una matrice di argomenti per un processo Pig. Gli argomenti vengono passati a ogni attività come argomenti della riga di comando.

Tipo:String[]
Alias:Args
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False

-File

Specifica il percorso di un file contenente una query da eseguire. È possibile usare questo parametro anziché il parametro Query .

Tipo:String
Alias:QueryFile
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False

-Files

Specifica una raccolta di file associati a un processo Pig.

Tipo:String[]
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False

-Profile

Specifica il profilo di Azure da cui viene letto questo cmdlet. Se non si specifica un profilo, questo cmdlet legge dal profilo predefinito locale.

Tipo:AzureSMProfile
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False

-Query

Specifica una query del processo Pig.

Tipo:String
Alias:QueryText
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False

-StatusFolder

Specifica il percorso della cartella che contiene output standard e output degli errori per un processo, inclusi il codice di uscita e i log attività.

Tipo:String
Posizione:Named
Valore predefinito:None
Necessario:False
Accettare l'input della pipeline:False
Accettare caratteri jolly:False