データラングリングを使用してデータを準備する

[アーティクル]
05/15/2024

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータサイエンス、リアルタイム分析、ビジネスインテリジェンス、レポートまで、あらゆるものをカバーしています。無料で新しい試用版を開始する方法について説明します。

データファクトリのデータラングリングを使用すると、対話型の Power Query マッシュアップを ADF でネイティブに構築し、ADF パイプライン内で大規模に実行することができます。

Power Query アクティビティを作成する

Azure Data Factory に Power Query を作成するには、2 つの方法があります。 1 つの方法は、プラス記号アイコンをクリックし、ファクトリリソースペインで [Power Query] を選択することです。

ファクトリリソースペインでの Power Query を示すスクリーンショット。

もう 1 つの方法は、パイプラインキャンバスのアクティビティウィンドウで行います。 Power Query アコーディオンを開き、Power Query アクティビティをキャンバスにドラッグします。

データラングリングオプションを強調表示したスクリーンショット。

Power Query データラングリングアクティビティを作成する

Power Query マッシュアップのソースデータセットを追加します。既存のデータセットを選択するか、新しいデータセットを作成することができます。マッシュアップを保存した後、パイプラインを作成し、Power Query データラングリングアクティビティをそのパイプラインに追加し、シンクデータセットを選択して、データを格納する場所を ADF に通知できます。 1 つ以上のソースデータセットを選択できますが、現時点では 1 つのシンクのみが許可されます。シンクデータセットの選択は省略可能ですが、少なくとも 1 つのソースデータセットが必要です。

ラングリング

[作成] をクリックして、Power Query Online マッシュアップエディターを開きます。

まず、マッシュアップエディターのデータセットソースを選択します。

Power Query ソース。

Power Query の作成が完了したら、それを保存し、パイプラインを作成できます。マッシュアップをアクティビティとしてパイプラインに追加する必要があります。これは、シンクデータセットを作成または選択してデータを格納する場合です。また、シンクデータセットの右側の 2 つ目のボタンをクリックすることで、シンクデータセットのプロパティを設定できます。 1 つの出力ファイルのみ取得する場合は、必ず [最適化] の下の [partition option] (パーティションオプション) を [単一パーティション] に変更してください。

Power Query シンク。

コーディング不要のデータ準備を使用して、ラングリング Power Query を作成します。使用できる関数の一覧については、変換関数に関するページを参照してください。 ADF は、M スクリプトをデータフロースクリプトに変換し、Azure Data Factory データフロー Spark 環境を使用して大規模に Power Query を実行できるようにします。

データラングリング Power Query を作成するためのプロセスを示すスクリーンショット。

Power Query データラングリングアクティビティの実行と監視

Power Query アクティビティのパイプラインデバッグ実行を実行するには、パイプラインキャンバスの [デバッグ] をクリックします。パイプラインを発行すると、 [Trigger Now](今すぐトリガー) によって、最後に発行されたパイプラインのオンデマンド実行が実行されます。 Power Query パイプラインは、既存のすべての Azure Data Factory トリガーを使用してスケジュールできます。

Power Query データラングリングアクティビティを追加する方法を示すスクリーンショット。

[モニター] タブにアクセスして、トリガーされた Power Query アクティビティの実行の出力を視覚化します。

トリガーされたラングリング Power Query アクティビティの実行の出力を示すスクリーンショット。

マッピングデータフローの作成方法について確認します。

次の方法で共有

データラングリングを使用してデータを準備する

Power Query アクティビティを作成する

Power Query データラングリングアクティビティを作成する

Power Query データラングリングアクティビティの実行と監視

フィードバック

その他のリソース

次の方法で共有

データ ラングリングを使用してデータを準備する

Power Query アクティビティを作成する

Power Query データ ラングリング アクティビティを作成する

Power Query データ ラングリング アクティビティの実行と監視

関連するコンテンツ

フィードバック

その他のリソース

データラングリングを使用してデータを準備する

Power Query データラングリングアクティビティを作成する

Power Query データラングリングアクティビティの実行と監視