Azure Data Lake Analytics タスク

適用対象: SQL Server Azure Data Factory の SSIS 統合ランタイム

Data Lake Analytics タスクを使用して、U-SQL ジョブを Azure Data Lake Analytics サービスに送信できます。 このタスクは、SQL Server Integration Services (SSIS) Feature Pack for Azure のコンポーネントです。

一般的な背景については、「Azure Data Lake Analytics」をご覧ください。

重要

Azure Data Lake Analytics は 2024 年 2 月 29 日に廃止されます。 詳細については、このお知らせを参照してください。

タスクの構成

パッケージに Data Lake Analytics タスクを追加するには、タスクを SSIS ツールボックスからデザイナー キャンバスにドラッグします。 次に、タスクをダブルクリックするか、タスクを右クリックして [編集] を選択します。 [Azure Data Lake Analytics Task Editor](Azure Data Lake Analytics タスク エディター) ダイアログ ボックスが開きます。 プロパティは、SSIS デザイナーを使用して、またはプログラムによって設定できます。

全般ページの構成

[全般] ページを使ってタスクを構成し、タスクが送信する U-SQL スクリプトを指定します。 U-SQL 言語について詳しくは、U-SQL 言語のリファレンスをご覧ください。

基本構成

タスクの名前と説明を指定できます。

U-SQL の構成

U-SQL の構成には、SourceType と、SourceType の値に基づく動的なオプションの、2 つの設定があります。

SourceType は U-SQL スクリプトのソースを指定します。 スクリプトは、SSIS パッケージの実行中に、Data Lake Analytics アカウントに送信されます。 このプロパティのオプションは次のとおりです。

説明
DirectInput (直接入力) インライン エディターを使用して U-SQL スクリプトを指定します。 この値を選択すると、動的オプション [USQLStatement] が表示されます。
[FileConnection] U-SQL スクリプトを含むローカルな .usql ファイルを指定します。 この値を選択すると、動的オプション [FileConnection] が表示されます。
変数 U-SQL スクリプトを含む SSIS 変数を指定します。 この値を選択すると、動的オプション [SourceVariable] が表示されます。

SourceType 動的オプションでは、U-SQL クエリのスクリプトの内容を指定します。

SourceType 動的オプション
SourceType = DirectInput 送信する U-SQL クエリを、オプション ボックスに直接入力します。または、参照ボタン [...] をクリックし、 [Enter U-SQL Query](U-SQL クエリの入力) ダイアログ ボックスで U-SQL クエリを入力します。
SourceType = FileConnection 既存のファイル接続マネージャーを選択するか、<新しい接続...> を選択して新しいファイル接続を作成します。 関連情報については、「ファイル接続マネージャー」と「ファイル接続マネージャー エディター」をご覧ください。
SourceType = Variable 既存の変数を選択するか、<新しい変数...> を選択して新しい変数を作成します。 関連情報については、「Integration Services (SSIS) の変数」と「変数の追加」をご覧ください。

ジョブの構成

ジョブの構成では、U-SQL ジョブの送信のプロパティを指定します。

  • AzureDataLakeAnalyticsConnection: U-SQL スクリプト送信先の Data Lake Analytics アカウントを指定します。 定義済みの接続マネージャーの一覧から接続を選択します。 新しい接続を作成するには、<[新しい接続]> を選択します。 関連情報については、「Azure Data Lake Analytics 接続マネージャー」をご覧ください。

  • JobName: U-SQL ジョブの名前を指定します。

  • AnalyticsUnits: U-SQL ジョブの分析ユニット数を指定します。

  • Priority: U-SQL ジョブの優先順位を指定します。 これは 0 から 1000 までの値に設定できます。 数値が小さいほど、優先順位は高くなります。

  • RuntimeVersion: U-SQL ジョブの Data Lake Analytics ランタイム バージョンを指定します。 既定では、"default" に設定されます。 通常、このプロパティを変更する必要はありません。

  • Synchronous: このブール値では、タスクがジョブの実行の完了を待つかどうかを指定します。 値を true に設定する場合、タスクはジョブの完了後に成功とマークされます。 値を false に設定する場合、タスクはジョブが準備フェーズを通過した後に成功とマークされます。

    説明
    True タスクの結果は、U-SQL ジョブの実行結果に基づきます。 ジョブの成功 > タスクの成功。 ジョブの失敗 > タスクの失敗。 タスクの成功または失敗 > タスクの完了。
    False タスクの結果は、U-SQL ジョブの送信と準備の結果に基づきます。 ジョブの送信に成功し、準備フェーズを通過した > タスクの成功。 ジョブの送信に失敗、または準備フェーズでジョブが失敗した > タスクの失敗。 タスクの成功または失敗 > タスクの完了。
  • TimeOut: ジョブ実行のタイムアウト時間を秒単位で指定します。 タイムアウトしたジョブはキャンセルされ、失敗としてマークされます。 Synchronous が false に設定されている場合、このプロパティは使用できません。

パラメーター マッピング ページの構成

[Azure Data Lake Analytics Task Editor](Azure Data Lake Analytics タスク エディター) ダイアログ ボックスの [パラメーター マッピング] ページを使用して、U-SQL スクリプトのパラメーター (U-SQL 変数) に変数をマップします。

  • 変数名:[追加] を選択してパラメーター マッピングを追加したら、システム変数またはユーザー定義の変数を一覧から選択します。 または、<新しい変数...> を選択して、[変数の追加] ダイアログ ボックスを使用して新しい変数を追加できます。 詳細については、「Integration Services (SSIS) の変数」を参照してください。

  • [パラメーター名]: U-SQL スクリプトのパラメーター/変数名を指定します。 パラメーター名が @ 記号で始まっていることを確認します (例: @Param1)。

U-SQL スクリプトにパラメーターを渡す方法の例を次に示します。

U-SQL スクリプトのサンプル

@searchlog =
    EXTRACT UserId          int,
            Start           DateTime,
            Region          string,
            Query           string,
            Duration        int,
            Urls            string,
            ClickedUrls     string
    FROM @in
    USING Extractors.Tsv(nullEscape:"#NULL#");

@rs1 =
    SELECT Start, Region, Duration
    FROM @searchlog
WHERE Region == "en-gb";

@rs1 =
    SELECT Start, Region, Duration
    FROM @rs1
    WHERE Start <= DateTime.Parse("2012/02/19");

OUTPUT @rs1   
    TO @out
      USING Outputters.Tsv(quoting:false, dateTimeFormat:null);

入力と出力のパスは @in および @out パラメーターで定義されています。 U-SQL スクリプトの @in および @out パラメーターの値は、パラメーター マッピングの構成に従って動的に渡されます。

変数名 パラメーター名
ユーザー: Variable1 @in
ユーザー: Variable2 @out

式ページの構成

[全般] ページの構成のすべてのプロパティをプロパティ式として割り当てて、実行時のプロパティの動的な更新を有効にできます。 関連情報については、「パッケージでプロパティ式を使用する」をご覧ください。

参照