パイプラインにデータ変換ストアド プロシージャを含める
CREATE EXTERNAL TABLE AS SELECT
(CETAS) ステートメントをストアド プロシージャにカプセル化すると、繰り返し実行する必要がある可能性があるデータ変換の運用化が容易になります。 Azure Synapse Analytics と Azure Data Factory では、データ レイク ファイルをホストする Azure Data Lake Store Gen2 ストレージ アカウントやサーバーレス SQL プールなど、"リンク サービス" に接続するパイプラインを作成できます。これにより、データ抽出、変換、読み込み (ETL) パイプライン全体の一部としてストアド プロシージャを呼び出すことができます。
たとえば、次のアクティビティを含むパイプラインを作成できます。
- データ レイク内の変換されたデータのターゲット フォルダーが既に存在する場合、それを削除する削除アクティビティ。
- サーバーレス SQL プールに接続し、CETAS 操作をカプセル化するストアド プロシージャを実行するストアド プロシージャ アクティビティ。
データ変換用のパイプラインを作成すると、特定の時刻または特定のイベント (ソース ストレージの場所に追加される新しいファイルなど) に基づいて、操作をスケジュールできます。
ヒント
パイプラインでストアド プロシージャ アクティビティを使用する方法の詳細については、Azure Data Factoryドキュメントの「Azure Data Factory または Synapse Analytics での SQL Server ストアド プロシージャ アクティビティを使用してデータを変換する」を参照してください。