Hadoop Pig Task

適用対象: SQL Server Azure Data Factory の SSIS 統合ランタイム

Hadoop Pig Task は、Hadoop クラスターで Pig スクリプトを実行するために使用します。

Hadoop Pig Task を追加するには、デザイナーにドラッグ アンド ドロップします。 その後タスクをダブルクリックするか、右クリックして [編集]をクリックし、 [Hadoop Pig タスク エディター] ダイアログ ボックスを表示します。

Hadoop Pig タスク エディター

オプション

[Hadoop Pig Task Editor] (Hadoop Pig Task エディター) ダイアログ ボックスで、次のオプションを構成します。

フィールド 説明
Hadoop 接続 既存の Hadoop 接続マネージャーを指定するか、新しい Hadoop 接続マネージャーを作成します。 この接続マネージャーは、WebHCat サービスがホストされる場所を示します。
[SourceType] クエリのソースの種類を指定します。 使用できる値は、 ScriptFileDirectInputです。
InlineScript [SourceType] の値が DirectInputの場合は、Pig スクリプトを指定します。
[HadoopScriptFilePath] [SourceType] の値が ScriptFileの場合は、Hadoop 上のスクリプト ファイルのパスを指定します。
[TimeoutInMinutes] タイムアウト値を分単位で指定します。 タイムアウトが経過するまでに完了していない場合、Hadoop ジョブが停止します。 Hadoop ジョブを非同期的に実行するようにスケジュールを設定するには、0 を指定します。

関連項目

Hadoop 接続マネージャー