Прием данных в хранилище с помощью конвейеров данных

Область применения:✅ хранилище в Microsoft Fabric

Конвейеры данных предлагают альтернативу использованию команды COPY через графический пользовательский интерфейс. Конвейер данных — это логическая группировка действий, которые вместе выполняют задачу приема данных. Конвейеры позволяют управлять действиями извлечения, преобразования и загрузки (ETL), а не управлять каждым из них по отдельности.

В этом руководстве вы создадите новый конвейер, который загружает примеры данных в хранилище в Microsoft Fabric.

Примечание.

Некоторые функции из Фабрика данных Azure недоступны в Microsoft Fabric, но концепции взаимозаменяемы. Дополнительные сведения о Фабрика данных Azure и конвейерах в конвейерах и действиях см. в Фабрика данных Azure и Azure Synapse Analytics. Краткое руководство см. в кратком руководстве . Создание первого конвейера для копирования данных.

Создание конвейера данных

  1. Чтобы создать конвейер, перейдите к рабочей области, нажмите кнопку +Создать и выберите конвейер данных. Снимок экрана: верхний раздел рабочей области пользователя с кнопкой

  2. В диалоговом окне "Создать конвейер" укажите имя нового конвейера и нажмите кнопку "Создать".

  3. Вы перейдете в область холста конвейера, где вы увидите три варианта начала работы: добавление действия конвейера, копирование данных и выбор задачи для запуска.

    Снимок экрана: три варианта выбора для начала приема.

    Каждый из этих вариантов предлагает различные альтернативные варианты для создания конвейера:

    • Добавление действия конвейера: этот параметр запускает редактор конвейера, где можно создавать новые конвейеры с нуля с помощью действий конвейера.
    • Копирование данных: этот параметр запускает пошаговый помощник, который помогает выбрать источник данных, назначение и настроить параметры загрузки данных, такие как сопоставления столбцов. При завершении создается новое действие конвейера с задачей копирования данных, уже настроенной для вас.
    • Выберите задачу для запуска: этот параметр запускает набор предопределенных шаблонов, которые помогут вам приступить к работе с конвейерами на основе различных сценариев.

    Выберите параметр "Копировать данные", чтобы запустить помощник по копированию.

  4. Первая страница помощника по копированию данных помогает выбрать собственные данные из различных источников данных или выбрать один из предоставленных примеров для начала работы. В этом руководстве мы будем использовать пример COVID-19 Data Lake . Выберите этот параметр и нажмите кнопку "Далее".

    Снимок экрана: выборка данных или других источников данных.

  5. На следующей странице можно выбрать набор данных, формат исходного файла и просмотреть выбранный набор данных. Выберите Bing COVID-19, формат CSV и нажмите кнопку "Далее".

    Снимок экрана: различные параметры набора данных для примера COVID-19, форматов файлов и сетки с предварительным просмотром данных.

  6. На следующей странице назначения данных можно настроить тип целевой рабочей области. Мы загрузим данные в хранилище в нашей рабочей области, поэтому выберите вкладку "Хранилище" и параметр "Хранилище данных". Выберите Далее.

    Снимок экрана: различные параметры назначения.

  7. Теперь пришло время выбрать хранилище для загрузки данных. Выберите нужное хранилище в раскрывающемся списке и нажмите кнопку "Далее".

    Снимок экрана: раскрывающийся список с выбранным хранилищем.

  8. Последним шагом настройки назначения является указание имени целевой таблицы и настройка сопоставлений столбцов. Здесь можно загрузить данные в новую таблицу или в существующую, указать имена схем и таблиц, изменить имена столбцов, удалить столбцы или изменить их сопоставления. Вы можете принять значения по умолчанию или настроить параметры в соответствии с вашими предпочтениями.

    Снимок экрана: параметры загрузки данных в существующую таблицу или создание новой.

    После завершения проверки параметров нажмите кнопку "Далее".

  9. На следующей странице вы можете использовать промежуточный режим или предоставить дополнительные параметры для операции копирования данных (которая использует команду T-SQL COPY). Просмотрите параметры без их изменения и нажмите кнопку "Далее".

  10. Последняя страница помощника содержит сводку действия копирования. Выберите параметр "Запустить передачу данных немедленно " и нажмите кнопку "Сохранить и запустить".

    Снимок экрана: параметр запуска операции передачи данных немедленно, а также кнопки

  11. Вы направляетесь в область холста конвейера, где для вас уже настроено новое действие копирования данных. Конвейер запускается автоматически. Состояние конвейера можно отслеживать в области вывода :

    Снимок экрана: холст конвейера с действие Copy в центре и состояние выполнения конвейера с текущим состоянием

  12. Через несколько секунд конвейер успешно завершится. Переход к хранилищу позволяет выбрать таблицу для предварительного просмотра данных и убедиться, что операция копирования завершена.

    Снимок экрана: хранилище с выбранной bing_covid_19 таблицей и сеткой с предварительным просмотром данных в таблице.

Дополнительные сведения о приеме данных в хранилище в Microsoft Fabric см. в следующих целях:

Следующий шаг