CDC ソースを使用した変更データ抽出

適用対象: SQL Server Azure Data Factory の SSIS Integration Runtime

重要

CDC 制御タスク、CDC ソース、CDC スプリッターなどの CDC フロー コンポーネントは非推奨となりました。 詳細については、お知らせを参照してください。

CDC ソースを追加して構成するには、パッケージに 1 つ以上のデータ フロー タスクと 1 つの CDC 制御タスクがあらかじめ含まれている必要があります。

CDC 制御タスクの操作の詳細については、「 CDC 制御タスク」を参照してください。

CDC ソースの詳細については、「 CDC ソース」を参照してください。

CDC ソースを使用して変更データを抽出するには

  1. SQL Server Data Toolsで、目的のパッケージが含まれている SQL Server 2019 Integration Services (SSIS) プロジェクトを開きます。

  2. ソリューション エクスプローラーで、パッケージをダブルクリックして開きます。

  3. [データ フロー] タブをクリックし、次に [ツールボックス] で、CDC ソースをデザイン画面にドラッグします。

  4. CDC ソースをダブルクリックします。

  5. [CDC ソース エディター] ダイアログ ボックスの [接続マネージャー] ページで、一覧から既存の ADO.NET 接続マネージャーを選択するか、 [新規作成] をクリックして新しい接続を作成します。 読み取る変更テーブルが含まれる SQL Server データベースへの接続であることが必要です。

  6. 変更を処理する [CDC テーブル] を選択します。

  7. 読み取る CDC テーブルの CDC キャプチャ インスタンス の名前を選択または入力します。

    キャプチャされたソース テーブルには、スキーマの変更によりテーブル定義のシームレスな遷移を処理するためのキャプチャされたインスタンスが 1 ~ 2 個含まれることがあります。 キャプチャ対象のソース テーブルに複数のキャプチャ インスタンスが定義されている場合は、ここで使用するキャプチャ インスタンスを選択してください。 [スキーマ].[テーブル] という形式のテーブルの既定のキャプチャ インスタンス名は <スキーマ>_<テーブル> ですが、使用される実際のキャプチャ インスタンス名は異なる可能性があります。 読み取り元の実際のテーブルは、cdc .<キャプチャ インスタンス>_CT という形式の CDC テーブルです。

  8. 処理上のニーズに最も適した処理モードを選択します。 オプションは次のとおりです。

    • [すべて] : [更新前] の値なしで、現在の CDC 範囲内の変更を返します。

    • [古い値を含むすべて] : 古い値 ( [更新前] ) を含め、現在の CDC 処理範囲内の変更を返します。 更新操作ごとに、2 つの行 (更新前の値の行と更新後の値の行) が存在することになります。

    • [差分] : 現在の CDC 処理範囲内で変更された、ソース行あたり 1 つの変更行のみを返します。 ソース行が複数回更新された場合は、変更が結合されたうえで生成されます (たとえば、挿入と更新が 1 回の更新として、または更新と削除が 1 回の削除として、結合されたうえで生成されることがあります)。 [差分] 変更処理モードで作業する場合は、1 つのソース行が複数の出力に出現するため、変更を削除、挿入、および更新の各出力に分割し、並行処理することができます。

    • [更新マスクを含む差分]: このモードは通常の [差分] モードと似ていますが、__$<column-name>_Changed という名前のパターンを持つブール型の列も追加されます。これは、現在の変更行の変更された列を示します。

    • [結合を含む差分] : このモードは通常の [結合] モードと似ていますが、挿入操作と更新操作が 1 つの結合操作 (UPSERT) に結合されます。

  9. 現在の CDC コンテキストの CDC 状態を保持する SSIS 文字列パッケージ変数を選択します。 CDC 状態変数の詳細については、「 状態変数の定義」を参照してください。

  10. __$reprocessing という特別な出力列を作成する場合は、 [再処理インジケーター列を含める] チェック ボックスをオンにします。 CDC 処理範囲が初期処理範囲 (初期読み込みの期間に対応する LSN の範囲) と重なる場合か、CDC 処理範囲が前の実行でのエラーの後に再処理される場合、この列の値は true になります。 このインジケーター列を使用すると、SSIS 開発者は変更を再処理するときに、エラーを別々に処理できます (たとえば、非既存行の削除やキーの重複により失敗した挿入などの操作を無視できます)。

    詳細については、「 CDC ソースのカスタム プロパティ」を参照してください。

  11. 外部列と出力列間のマッピングを更新するには、 [列] をクリックし、 [外部列] 一覧にある別の列を選択します。

  12. 必要に応じて、 [出力列] 一覧の値を削除し、出力列の値を更新します。

  13. エラー出力を構成するには、 [エラー出力] をクリックします。

  14. [プレビュー] をクリックすると、CDC ソースによって抽出されるデータを最大 200 行表示できます。

  15. [OK] をクリックします。

参照

[CDC ソース エディター] ([接続マネージャー] ページ)
[CDC ソース エディター] ([列] ページ)
[CDC ソース エディター] ([エラー出力] ページ)