モジュール 1: Data Factory を使用してパイプラインを作成する

このモジュールは、パイプラインのコピー アクティビティを使用して、ソース ストアから Data Lakehouse の Bronze テーブルに生データを取り込むのに 10 分かかります。

モジュール 1 の大まかな手順は次のとおりです。

  1. データ パイプラインを作成します。
  2. パイプラインのコピー アクティビティを使用して、Data Lakehouse にサンプル データを読み込みます。

データ パイプラインを作成する

  1. アクティブなサブスクリプションを持つ Microsoft Fabric テナント アカウントが必要です。 無料アカウントを作成します。

  2. Microsoft Fabric が有効になっているワークスペースがあることを確認します。ワークスペースを作成します。

  3. Power BIにサインインします。

  4. 画面の左下にある既定の Power BI アイコンを選択し、Data Factory エクスペリエンスに切り替えます。

    Data Factory エクスペリエンスの選択を示すスクリーンショット。

  5. データ パイプライン を選択し、パイプライン名を指定します。 [作成] を選択します。

    新しいデータ パイプラインを作成するためのボタンが選択されている Data Factory のスタート ページのスクリーンショット。

    新しいパイプラインに名前を付けるダイアログを示すスクリーンショット。

パイプラインのコピー アクティビティを使用して Data Lakehouse にサンプル データを読み込む

手順 1: コピー アシスタントを使用してコピー アクティビティを構成する。

「コピー データ アシスタント」 を選択して、コピー アシスタントツールを開きます。

新しいパイプラインの開始ページからの [データのコピー] アクティビティの選択を示すスクリーンショット。

手順 2: コピー アシスタントで設定を構成する。

  1. [データ のコピー] ダイアログボックスが表示され、最初の手順 [データ ソースの選択] が強調表示されます。 ダイアログの上部にあるオプションから サンプル データ を選択し、NYC タクシー - 緑の選択します。

    [データ ソースの選択] タブのコピー アシスタントでの NYC Taxi - Green データの選択を示すスクリーンショット。

  2. データ ソースのプレビューは、[データ ソースへの接続] ページの横に表示されます。 確認し、次へを選択します。

    NYC Taxi - Green サンプル データセットのプレビュー データを示すスクリーンショット。

  3. コピー アシスタントの [データの宛先の選択] ステップで、[Lakehouse] を選択し、[次へ] を選択します。

    データのコピー アシスタントの [データ 宛先の選択] タブで Lakehouse 宛先の選択を示すスクリーンショット。

  4. データ変換先の構成ページに表示される [新しい Lakehouse の作成] を選択し、新しい Lakehouse の名前を入力します。 次 次の をもう一度選択します。

    コピー アシスタントの [データ変換先の構成] ページを示すスクリーンショット。[新しい Lakehouse の作成] オプションを選択し、Lakehouse 名を指定します。

  5. 次に、Select で Lakehouse の宛先の詳細を構成し、フォルダー パスまたはテーブルにマップします。 ページ。 ルート フォルダーテーブル を選択し、テーブル名を指定して、 上書きアクション 選択します。 [テーブルの上書き] アクションを選択した後に表示される [パーティションを有効にする] チェックボックスをオンにしないでください。

    データ コピー アシスタントの [フォルダー パスまたはテーブルの選択とマップ] ステップの [データ宛先に接続] タブを示すスクリーンショット。

  6. 最後に、コピー データ アシスタントの [確認と保存] ページで、構成を確認します。 このチュートリアルでは、次の手順でアクティビティを手動で実行するため、[データ転送をすぐに開始] チェック ボックスをオフにします。 次に、[OK]を選択します。

    [確認と保存] ページの [データのコピー] アシスタントを示すスクリーンショット。

手順 3: コピー アクティビティの結果を実行して表示する。

  1. パイプライン エディターで [ 実行] タブを選択します。 次に、実行 ボタンを選択し、プロンプトが表示されたら 保存して実行 を選んで、コピーアクティビティを実行します。

    [実行] ボタンが強調表示された [パイプラインの実行] タブを示すスクリーンショット。

    [保存して実行] ボタンが強調表示されている [保存して実行] ダイアログを示すスクリーンショット。

  2. 実行を監視し、パイプライン キャンバスの下にある 出力 タブで結果を確認できます。 実行の詳細ボタン (実行中のパイプラインの実行にマウス ポインターを合わせると表示される "眼鏡" アイコン) を選択して、実行の詳細を表示します。

    パイプラインの [出力] タブの [実行の詳細] ボタンを示すスクリーンショット。

  3. 実行の詳細には、1,508,501 行の読み取りと書き込みが表示されます。

    パイプライン実行におけるデータコピーの詳細のスクリーンショット。

  4. [期間の内訳] セクションを展開すると、Copy アクティビティの各段階の期間が表示されます。 コピーの詳細を確認した後、[閉じる] を選択します。

    コピー アクティビティの実行時間の内訳を示すスクリーンショット。

この最初のモジュールでは、Microsoft Fabric の Data Factory を使用した最初のデータ統合に関するエンド ツー エンドのチュートリアルで、次の方法を学習しました。

  • データ パイプラインを作成します。
  • コピー アクティビティをパイプラインに追加します。
  • サンプル データを使用し、新しいテーブルにデータを格納する Data Lakehouse を作成します。
  • パイプラインを実行し、その詳細と期間の内訳を表示します。

次のセクションに進み、データフローを作成します。

モジュール 2: Data Factory のデータフローを使用してデータを変換する