New-AzureHDInsightPigJobDefinition
Define un nuevo trabajo de Pig para un servicio de HDInsight.
Nota:
Los cmdlets a los que se hace referencia en esta documentación son para administrar recursos de Azure heredados que usan las API de Azure Service Management (ASM). Este módulo heredado de PowerShell no se recomienda al crear nuevos recursos, ya que ASM está programado para la retirada. Para más información, consulte Retirada de Azure Service Manager.
El módulo Az de PowerShell es el módulo de PowerShell recomendado para administrar recursos de Azure Resource Manager (ARM) con PowerShell.
Sintaxis
New-AzureHDInsightPigJobDefinition
[-Arguments <String[]>]
[-File <String>]
[-Files <String[]>]
[-Query <String>]
[-StatusFolder <String>]
[-Profile <AzureSMProfile>]
[<CommonParameters>]
Description
Esta versión de HDInsight de Azure PowerShell está en desuso. Estos cmdlets se quitarán el 1 de enero de 2017. Use la versión más reciente de HDInsight de Azure PowerShell.
Para obtener información sobre cómo usar el nuevo HDInsight para crear un clúster, consulte Creación de clústeres basados en Linux en HDInsight mediante Azure PowerShell (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/). Para obtener información sobre cómo enviar trabajos mediante Azure PowerShell y otros enfoques, consulte Envío de trabajos de Hadoop en HDInsight (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/). Para obtener información de referencia sobre HDInsight de Azure PowerShell, consulte Cmdlets de Azure HDInsight.
New-AzureHDInsightPigJobDefinition define un trabajo de Pig para un servicio de Azure HDInsight.
Ejemplos
Ejemplo 1: Definición de un nuevo trabajo de Pig
PS C:\>$0 = '$0';
PS C:\> $QueryString = "LOGS = LOAD 'wasb:///example/data/sample.log';" + "LEVELS = foreach LOGS generate REGEX_EXTRACT($0, '(TRACE|DEBUG|INFO|WARN|ERROR|FATAL)', 1) as LOGLEVEL;" + "FILTEREDLEVELS = FILTER LEVELS by LOGLEVEL is not null;" + "GROUPEDLEVELS = GROUP FILTEREDLEVELS by LOGLEVEL;" + "FREQUENCIES = foreach GROUPEDLEVELS generate group as LOGLEVEL, COUNT(FILTEREDLEVELS.LOGLEVEL) as COUNT;" + "RESULT = order FREQUENCIES by COUNT desc;" + "DUMP RESULT;"
PS C:\> $PigJobDefinition = New-AzureHDInsightPigJobDefinition -Query $QueryString
El primer comando declara un valor de cadena y, a continuación, almacena en la variable $0.
El segundo comando crea una consulta de trabajo de Pig y, a continuación, la almacena en la variable $QueryString.
El comando final crea una definición de trabajo de Pig que usa la consulta en $QueryString y, a continuación, almacena la definición del trabajo en la variable $PigJobDefinition.
Parámetros
-Arguments
Especifica una matriz de argumentos para un trabajo de Pig. Los argumentos se pasan a cada tarea como argumentos de la línea de comandos.
Tipo: | String[] |
Alias: | Args |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |
-File
Especifica la ruta de acceso a un archivo que contiene una consulta que se va a ejecutar. Puede usar este parámetro en lugar del parámetro Query .
Tipo: | String |
Alias: | QueryFile |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |
-Files
Especifica una colección de archivos asociados a un trabajo de Pig.
Tipo: | String[] |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |
-Profile
Especifica el perfil de Azure del que lee este cmdlet. Si no especifica un perfil, este cmdlet lee del perfil predeterminado local.
Tipo: | AzureSMProfile |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |
-Query
Especifica una consulta de trabajo de Pig.
Tipo: | String |
Alias: | QueryText |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |
-StatusFolder
Especifica la ubicación de la carpeta que contiene salidas estándar y salidas de error para un trabajo, incluido su código de salida y los registros de tareas.
Tipo: | String |
Posición: | Named |
Valor predeterminado: | None |
Requerido: | False |
Aceptar entrada de canalización: | False |
Aceptar caracteres comodín: | False |