Руководство по Lakehouse: прием данных в lakehouse
В этом руководстве вы используете более мерные и фактические таблицы из широкой мировой импортеров (WWI) в лейкхаус.
Необходимые компоненты
- Если у вас нет озера, необходимо создать озеро.
Прием данных
В этом разделе описано, как использовать действие копирования данных конвейера Фабрики данных для приема примеров данных из учетной записи хранения Azure в раздел "Файлы " созданного ранее озера.
Выберите рабочие области в области навигации слева и выберите новую рабочую область в меню "Рабочие области". Откроется представление элементов рабочей области.
На ленте рабочей области выберите "+Создать" в конвейере данных.
В диалоговом окне "Создать конвейер" укажите имя в качестве IngestDataFromSourceToLakehouse и нажмите кнопку "Создать". Создается и открывается новый конвейер фабрики данных.
В созданном конвейере фабрики данных выберите действие Конвейера, чтобы добавить действие в конвейер и выбрать " Копировать данные". Это действие добавляет действие копирования данных на холст конвейера.
Выберите только что добавленное действие копирования данных на холсте. Свойства действия отображаются на панели под холстом (возможно, потребуется развернуть область вверх, перетаскивая верхний край). На вкладке "Общие " в области свойств введите "Копирование данных" в Lakehouse в поле "Имя ".
На вкладке "Источник" выбранного действия копирования выберите внешний тип хранилища данных и нажмите кнопку "Создать", чтобы создать новое подключение к источнику данных.
В этом руководстве все примеры данных доступны в общедоступном контейнере хранилища BLOB-объектов Azure. Вы подключаетесь к этому контейнеру для копирования данных из него. На первом экране "Создать подключение" выберите Хранилище BLOB-объектов Azure и нажмите кнопку "Продолжить".
На экране параметров подключения введите следующие сведения и нажмите кнопку "Создать", чтобы создать подключение к источнику данных.
Свойство Значение Имя учетной записи или URL-адрес https://azuresynapsestorage.blob.core.windows.net/sampledata
Connection Создание подключения Имя подключения wwisampledata Тип проверки подлинности Анонимные После создания нового подключения вернитесь на вкладку "Источник " действия копирования данных и по умолчанию выбрано только что созданное соединение. Перед перемещением в параметры назначения укажите следующие свойства.
Свойство Значение Тип хранилища данных Внешняя. Connection wwisampledata Тип пути к файлу Путь к файлу Путь к файлу Имя контейнера (первое текстовое поле): sampledata
Имя каталога (второе текстовое поле): WideWorldImportersDW/parquetРекурсивно Флажок установлен File format Binary На вкладке "Назначение " выбранного действия копирования данных укажите следующие свойства:
Свойство Значение Тип хранилища данных Рабочая область Тип хранилища данных рабочей области Гибридное решение "хранилище и озеро данных" Гибридное решение "хранилище и озеро данных" wwilakehouse Корневая папка Файлы Путь к файлу Имя каталога (первое текстовое поле): wwi-raw-data File format Binary Вы настроили действие копирования данных. Щелкните значок сохранения на верхней ленте (под домашней), чтобы сохранить изменения, и нажмите кнопку "Выполнить", чтобы выполнить конвейер и его действие. Вы также можете запланировать конвейеры для обновления данных в определенных интервалах в соответствии с вашими бизнес-требованиями. В этом руководстве мы запускаем конвейер только один раз, нажав кнопку "Выполнить".
Это действие активирует копирование данных из базового источника данных в указанный lakehouse и может занять до минуты. Вы можете отслеживать выполнение конвейера и его действия на вкладке "Вывод ", которая отображается при щелчке в любом месте на холсте. При необходимости можно выбрать значок очков, который отображается при наведении указателя мыши на имя, чтобы просмотреть сведения о передаче данных.
После копирования данных перейдите в представление элементов рабочей области и выберите новый lakehouse (wwilakehouse), чтобы запустить представление обозревателя .
Убедитесь, что в представлении обозревателя отображаются новые данные wwi-raw-data, а данные для всех таблиц копируются там.
Чтобы загрузить добавочные данные в lakehouse, см . сведения о добавочной загрузке данных из хранилища данных в lakehouse.