Copy アクティビティで Azure Cosmos DB for NoSQL を構成する

この記事では、データ パイプラインのコピー アクティビティを使用して、Azure Cosmos DB for NoSQL との間でデータをコピーする方法について説明します。

サポートされている構成

コピー アクティビティの下の各タブの構成については、それぞれ次のセクションを参照してください。

全般

[全般設定] タブを構成するには、全般設定のガイダンスを参照してください。

ソース

コピー アクティビティの [ソース] タブの Azure Cosmos DB for NoSQL では、次のプロパティがサポートされています。

Screenshot showing source tab.

次の 3 つのプロパティが必要です。

  • [データ ストアの種類]: [外部] を選択します。
  • [接続]: 接続リストから Azure Cosmos DB for NoSQL 接続を選択します。 接続が存在しない場合は、[新規] を選択して新しい Azure Cosmos DB for NoSQL 接続を作成します。
  • [コンテナー]: 使用するコンテナーを選択します。 [編集] を選択して、コンテナー名を手動で入力します。

[詳細設定] では、次のフィールドを指定できます。

  • [クエリの使用]: 使用クエリとして [テーブル] または [クエリ] を選択できます。 次の一覧で、各設定の構成について説明します。

    • [テーブル]: [テーブル] で指定したテーブルからデータを読み取ります。

    • [クエリ]: データを読み取る Azure Cosmos DB クエリを指定します。

      Screenshot showing query.

  • [ページ サイズ:] クエリ結果のページあたりのドキュメント数。 既定値は "-1" で、これはサービス側の動的ページ サイズが最大 1000 まで使用されることを意味します。

  • [Detect datetime](datetime の検出): ドキュメント内の文字列値から datetime を検出するかどうか。 使用可能な値: true (既定値)、false。

  • [Preferred regions](優先リージョン): Azure Cosmos DB からデータを取得するときに接続するリージョンの優先リスト。 [新規] を選択した後、ドロップダウン リストから優先リージョンを 1 つ選択します。

    Screenshot showing preferred regions.

  • [追加の列]: ソース ファイルの相対パスまたは静的値を格納するための追加のデータ列を追加します。 後者では式がサポートされています。 詳細については、「コピー中に列を追加する」を参照してください。

    Screenshot showing additional columns.

宛先

コピー アクティビティの [コピー先] タブの Azure Cosmos DB for NoSQL では、次のプロパティがサポートされています。

Screenshot showing destination tab.

次の 3 つのプロパティが必要です。

  • [データ ストアの種類]: [外部] を選択します。
  • [接続]: 接続リストから Azure Cosmos DB for NoSQL 接続を選択します。
  • [コンテナー]: [参照] を選択して、コピーするファイルを選択するか、パスを手動で入力します。

[詳細設定] では、次のフィールドを指定できます。

  • [Write behavior](書き込み動作): コピー先がファイルベースのデータ ストアからのファイルである場合に書き込み動作を定義します。 ドロップダウン リストから [動的なコンテンツの追加][挿入]、または [Upsert](アップサート) を選択できます。

    • [動的なコンテンツの追加]: [動的なコンテンツの追加] ウィンドウを開きます。 これにより、式ビルダーが開き、サポートされているシステム変数、アクティビティの出力、関数、およびユーザー指定の変数またはパラメーターから式を作成できます。 式言語について詳しくは、式と関数に関するページを参照してください。

    • [挿入]: ソース データに挿入がある場合は、このオプションを選択します。

    • [Upsert](アップサート): アップサートの動作は、同じ ID を持つドキュメントが既に存在する場合に、そのドキュメントを置き換えることです。それ以外の場合はドキュメントを挿入します。

      Screenshot showing write behavior.

  • [書き込みバッチ タイムアウト]: タイムアウトする前に一括挿入操作の完了を待つ時間です。指定できる値は Timespan です。 たとえば "00:30:00" (30 分) を指定できます。

  • [Write batch size](書き込みバッチ サイズ): SQL テーブルに挿入するバッチあたりの行数を指定します。 使用可能な値は整数 (行数) です。 既定では行のサイズに基づいて、サービスにより適切なバッチ サイズが動的に決定されます。

  • [最大コンカレント接続数]: アクティビティの実行中にデータ ストアに対して確立されるコンカレント接続数の上限。 コンカレント接続を制限する場合にのみ、値を指定します。

  • [パフォーマンス メトリック分析を無効にする]: この設定では、コピーのパフォーマンスの最適化と推奨事項のために、DTU、DWU、RU などのメトリックのコレクションを制御します。 この動作に不安がある場合は、この機能をオフにします。

マッピング

[マッピング] タブの構成については、「[マッピング] タブでマッピングを構成する」を参照してください。

設定

[設定] タブの構成については、「[設定] タブで他の設定を構成する」を参照してください。

テーブルの概要

次の表に、Azure Cosmos DB for NoSQL のコピー アクティビティの詳細を示します。

ソース テーブル

名前 Description Value 必須 JSON スクリプト プロパティ
データ ストアの種類 データ ストアの種類。 外部品目番号 はい /
接続 ソース データ ストアへの実際の接続。 <接続> はい つながり
コンテナー ソース データのコンテナー。 <ソースのコンテナー> はい container
fileName
[クエリの使用] 使用クエリとして [テーブル] または [クエリ] を選択できます。 [テーブル]
[クエリ]
いいえ type
ページ サイズ クエリ結果のページあたりのドキュメント数。 既定値は "-1" で、これはサービス側の動的ページ サイズが最大 1000 まで使用されることを意味します。 <ページ サイズ> いいえ PageSize
[Delete datetime](datetime の削除): ソース データ ストア上のファイルは、コピー先ストアに移動された直後に削除されます。 ファイルの削除はファイルごとに行われるので、コピー操作が失敗した場合、一部のファイルが既にコピー先にコピーされソースからは削除されているが、他のファイルはまだソース ストアにあることがわかります。 選択または選択解除 いいえ detectDatetime
[Preferred regions](優先リージョン) Azure Cosmos DB からデータを取得するときに接続するリージョンの優先リスト。 [新規] を選択した後、ドロップダウン リストから優先リージョンを 1 つ選択します。 <優先リージョン> いいえ preferredRegions
追加の列 ソース ファイルの相対パスまたは静的値を格納するための追加のデータ列を追加します。 後者では式がサポートされています。 詳細については、「コピー中に列を追加する」を参照してください。 <最大コンカレント接続数> いいえ additionalColumns

[ターゲット テーブル]

名前 Description Value 必須 JSON スクリプト プロパティ
データ ストアの種類 データ ストアの種類。 外部品目番号 はい /
接続 コピー先データ ストアへの接続。 <接続> はい つながり
コンテナー コピー先データのコンテナー。 <ソースのコンテナー> はい container
fileName
[Write behavior](書き込み動作) Azure Cosmos DB にデータを書き込む方法を示します。 使用可能な値は、Insert、Upsert です。 upsert の動作は、同じ ID を持つドキュメントが既に存在する場合に、そのドキュメントを置き換えることです。それ以外の場合はドキュメントを挿入します。 [動的なコンテンツの追加]
[挿入]
[Upsert](アップサート)
いいえ writeBehavior
[書き込みバッチ タイムアウト] タイムアウトする前に一括挿入操作の完了を待つ時間です。指定できる値は期間です。 たとえば "00:30:00" (30 分) を指定できます。 TimeSpan いいえ writeBatchTimeout
[Write batch size](書き込みバッチ サイズ) SQL テーブルに挿入するバッチあたりの行数。 使用可能な値は integer (行数) です。 既定では行のサイズに基づいて、サービスにより適切なバッチ サイズが動的に決定されます。 <行数>
(整数)
いいえ writeBatchSize
最大コンカレント接続数 アクティビティの実行中にデータ ストアに対して確立されたコンカレント接続数の上限。 コンカレント接続を制限する場合にのみ、値を指定します。 <最大コンカレント接続数> いいえ maxConcurrentConnections
[パフォーマンス メトリック分析を無効にする] この設定では、コピーのパフォーマンスの最適化と推奨事項のために、DTU、DWU、RU などのメトリックのコレクションを制御します。 この動作に不安がある場合は、この機能をオフにします。 選択または選択解除 いいえ disableMetricsCollection