Настройка Azure Cosmos DB для NoSQL в действии копирования

В этой статье описывается, как использовать действие копирования в конвейере данных для копирования данных из Azure Cosmos DB для NoSQL.

Поддерживаемая конфигурация

Для настройки каждой вкладки в действии копирования перейдите к следующим разделам соответственно.

Общие

Ознакомьтесь с руководством по общим параметрам, чтобы настроить вкладку "Общие параметры".

Оригинал

Следующие свойства поддерживаются для Azure Cosmos DB для NoSQL на вкладке "Источник " действия копирования.

Screenshot showing source tab.

Требуются следующие три свойства:

  • Тип хранилища данных: выберите "Внешний".
  • Подключение. Выберите подключение Azure Cosmos DB для NoSQL из списка подключений. Если подключение отсутствует, создайте новое подключение Azure Cosmos DB для NoSQL, нажав кнопку "Создать".
  • Контейнер. Выберите контейнер, который требуется использовать. Нажмите кнопку "Изменить", чтобы ввести имя контейнера вручную.

В разделе "Дополнительно" можно указать следующие поля:

  • Используйте запрос: в качестве запроса можно выбрать таблицу или запрос. В следующем списке описана конфигурация каждого параметра.

    • Таблица: считывает данные из таблицы, указанной в таблице.

    • Запрос. Указывает запрос Azure Cosmos DB для чтения данных.

      Screenshot showing query.

  • Размер страницы: число документов на страницу результата запроса. По умолчанию используется значение "-1", то есть для использования динамического размера страницы на стороне службы до 1000.

  • Определение даты и времени. Определение даты и времени из строковых значений в документах. Допустимые значения: true (по умолчанию), false.

  • Предпочтительный регион: предпочтительный список регионов для подключения при получении данных из Azure Cosmos DB. Выберите один предпочтительный регион из раскрывающегося списка после выбора "Создать".

    Screenshot showing preferred regions.

  • Дополнительные столбцы: добавление дополнительных столбцов данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего. Дополнительные сведения см. в описании "Добавление дополнительных столбцов во время копирования".

    Screenshot showing additional columns.

Назначение

Следующие свойства поддерживаются для Azure Cosmos DB для NoSQL на вкладке "Назначение " действия копирования.

Screenshot showing destination tab.

Требуются следующие три свойства:

  • Тип хранилища данных: выберите "Внешний".
  • Подключение. Выберите подключение Azure Cosmos DB для NoSQL из списка подключений.
  • Контейнер. Выберите "Обзор" , чтобы выбрать файл, который требуется скопировать, или указать путь вручную.

В разделе "Дополнительно" можно указать следующие поля:

  • Поведение записи: определяет поведение записи, когда назначение является файлами из файлового хранилища данных. В раскрывающемся списке можно выбрать "Добавить динамическое содержимое", "Вставка" или "Upsert ".

    • Добавление динамического содержимого: откройте панель "Добавить динамическое содержимое". Откроется построитель выражений, где можно создавать выражения из поддерживаемых системных переменных, выходных данных действий, функций и пользовательских переменных или параметров. Для получения сведений о языке выражений перейдите к выражениям и функциям.

    • Вставка. Выберите этот параметр, если исходные данные вставляются.

    • Upsert: поведение upsert заключается в замене документа, если документ с тем же идентификатором уже существует; в противном случае вставьте документ.

      Screenshot showing write behavior.

  • Время ожидания пакетной вставки: время ожидания завершения операции вставки пакета до истечения времени ожидания. Допустимые значения: Timespan. Например, 00:30:00 (30 минут).

  • Размер пакета записи: укажите количество строк для вставки в таблицу SQL на пакет. Допустимое значение — целое число (число строк). По умолчанию эта служба динамически определяет соответствующий размер пакета в зависимости от размера строки.

  • Максимальное число одновременных подключений: верхний предел одновременных подключений, установленных в хранилище данных во время выполнения действия. Указывайте значение только при необходимости ограничить количество одновременных подключений.

  • Отключить аналитику метрик производительности: этот параметр управляет коллекцией метрик, таких как DTU, DWU, RU и т. д. для оптимизации производительности копирования и рекомендаций. Если вы обеспокоены этим поведением, отключите эту функцию.

Сопоставление

Для конфигурации вкладки "Сопоставление" перейдите к разделу "Настройка сопоставлений" на вкладке "Сопоставление".

Настройки

Для конфигурации вкладки Параметры перейдите к разделу "Настройка других параметров" на вкладке "Параметры".

Сводка таблицы

В следующих таблицах содержатся дополнительные сведения о действии копирования в Azure Cosmos DB для NoSQL.

Исходная таблица

Имя Описание Значение Обязательное поле Свойство скрипта JSON
Тип хранилища данных Тип хранилища данных. Внешний Да /
Соединение Подключение к исходному хранилищу данных. <подключение> Да подключение
Контейнер Контейнер исходных данных. <контейнер источника> Да Контейнер
fileName
Использование запроса В качестве запроса можно выбрать таблицу или запрос . Таблица
Запрос
No type
Размер страницы Число документов на страницу результата запроса. По умолчанию используется значение "-1", то есть для использования динамического размера страницы на стороне службы до 1000. <размер страницы> No Pagesize
Удаление даты и времени Файлы в исходном хранилище данных будут удалены сразу после перемещения в целевое хранилище. Удаление файла выполняется для каждого файла, поэтому при сбое действия копирования следует отметить, что некоторые файлы уже скопированы в место назначения и удалены из источника, а другие все еще находятся в исходном хранилище. Выбранный или отмена выбора No detectDatetime
Предпочтительный регион Предпочтительный список регионов для подключения при получении данных из Azure Cosmos DB. Выберите один предпочтительный регион из раскрывающегося списка после выбора "Создать". <предпочитаемые регионы> No preferredRegions
Дополнительные столбцы Добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего. Дополнительные сведения см. в описании "Добавление дополнительных столбцов во время копирования". <максимальное число одновременных подключений> No additionalColumns

Целевая таблица

Имя Описание Значение Обязательное поле Свойство скрипта JSON
Тип хранилища данных Тип хранилища данных. Внешний Да /
Соединение Подключение к целевому хранилищу данных. <подключение> Да подключение
Контейнер Контейнер целевых данных. <контейнер источника> Да Контейнер
fileName
Поведение записи Описывает способ записи данных в Azure Cosmos DB. Допустимые значения: insert и upsert. Поведение upsert — замена документа, если документ с таким идентификатором уже существует. В противном выполняется вставка документа. Добавление динамического содержимого
Вставка
Upsert
No writeBehavior
Время ожидания пакетной службы Дождитесь завершения операции пакетной вставки до истечения времени ожидания. Допустимые значения — Timespan. Например, 00:30:00 (30 минут). timespan No writeBatchTimeout
Размер пакета записи Количество строк для вставки в таблицу SQL на пакет. Допустимое значение: целое число (количество строк). По умолчанию эта служба динамически определяет соответствующий размер пакета в зависимости от размера строки. <количество строк >
(целое число)
No writeBatchSize
Максимальное число одновременных подключений Верхний предел одновременных подключений, установленных для хранилища данных при выполнении действия. Указывайте значение только при необходимости ограничить количество одновременных подключений. <максимальное число одновременных подключений> No maxConcurrentConnections
Отключение аналитики метрик производительности Этот параметр управляет коллекцией метрик, таких как DTU, DWU, RU и т. д. для оптимизации производительности копирования и рекомендаций. Если вы обеспокоены этим поведением, отключите эту функцию. Выбранный или отмена выбора No disableMetricsCollection