Введение в руководство по хранилищу данных
Область применения:✅ конечная точка аналитики SQL и хранилище в Microsoft Fabric
Microsoft Fabric предоставляет единый магазин для всех аналитических потребностей для каждого предприятия. Он охватывает полный спектр служб, включая перемещение данных, озеро данных, проектирование данных, интеграцию данных и обработку данных, аналитику в режиме реального времени и бизнес-аналитику. При использовании Microsoft Fabric нет необходимости объединять разные службы от нескольких поставщиков. Вместо этого клиент пользуется комплексным комплексным продуктом, который легко понять, подключить, создать и работать. Ни один другой продукт на рынке не предлагает широту, глубину и уровень интеграции, которую предлагает Microsoft Fabric. Кроме того, Microsoft Purview по умолчанию включается в каждый клиент для удовлетворения требований соответствия требованиям и управления.
Цель этого руководства
Хотя многие понятия в Microsoft Fabric могут быть знакомы специалистам по анализу данных и аналитики, это может быть сложно применить эти понятия в новой среде. В этом руководстве описаны пошаговые инструкции по комплексному сценарию получения данных до использования данных для создания базового понимания пользовательского интерфейса Microsoft Fabric, различных интерфейсов и точек интеграции, а также профессиональных и гражданских разработчиков Microsoft Fabric.
Учебники не предназначены для эталонной архитектуры, исчерпывающего списка функций и функций или рекомендации по конкретным рекомендациям.
Комплексный сценарий хранилища данных
В качестве необходимых компонентов для этого руководства выполните следующие действия.
- Войдите в учетную запись Power BI Online или если у вас еще нет учетной записи, зарегистрируйтесь для получения бесплатной пробной версии.
- Включите Microsoft Fabric в клиенте.
В этом руководстве вы берете на себя роль разработчика хранилища в вымышленной компании World Importers и выполните следующие действия на портале Microsoft Fabric для создания и реализации комплексного решения для хранилища данных:
- Создайте рабочую область Microsoft Fabric.
- Создание хранилища.
- Прием данных из источника в модель измерения хранилища данных с помощью конвейера данных.
- Создайте таблицы в хранилище.
- Загрузите данные с помощью T-SQL с помощью редактора sql-запросов.
- Клонируйте таблицу с помощью T-SQL с редактором запросов SQL.
- Преобразуйте данные для создания агрегированных наборов данных с помощью T-SQL.
- Перемещение по времени с помощью T-SQL для просмотра данных, как это было показано.
- Используйте редактор визуальных запросов для запроса к хранилищу данных.
- Анализ данных с помощью записной книжки.
- Создание и выполнение запросов между хранилищами с помощью редактора SQL-запросов .
- Создайте отчеты Power BI с помощью режима DirectLake для анализа данных на месте.
- Создайте отчет из Центра данных OneLake.
- Очистка ресурсов путем удаления рабочей области и других элементов.
Сквозная архитектура хранилища данных
Источники данных — Microsoft Fabric упрощает и быстро подключается к Службам данных Azure, другим облачным платформам и локальным источникам данных для приема данных.
Прием . С помощью 200+ собственных соединителей в рамках конвейера Microsoft Fabric и перетаскивания данных с помощью потока данных можно быстро создавать аналитические сведения для вашей организации. Ярлык — это новая функция в Microsoft Fabric, которая позволяет подключаться к существующим данным без необходимости копировать или перемещать их. Дополнительные сведения о функции ярлыка см. далее в этом руководстве.
Преобразование и хранение — Microsoft Fabric стандартизирует формат Delta Lake, что означает, что все подсистемы Microsoft Fabric могут считывать и работать с теми же данными, хранящимися в OneLake, — не требуется дедупликации данных. Это хранилище позволяет создавать хранилище данных или сетку данных на основе вашей организации. Для преобразования можно выбрать низкокодовый или безкодовый интерфейс с конвейерами и потоками данных или использовать T-SQL для первого взаимодействия с кодом.
Использование . Данные из хранилища можно использовать Power BI, ведущий инструмент бизнес-аналитики в отрасли для создания отчетов и визуализации. Каждое хранилище поставляется со встроенной конечной точкой TDS, чтобы легко подключаться к данным и запрашивать данные из других средств отчетности при необходимости. При создании хранилища вторичный элемент, называемый семантической моделью по умолчанию, создается одновременно с тем же именем. Вы можете использовать семантику по умолчанию, чтобы начать визуализацию данных с помощью всего нескольких шагов.
Демонстрационные данные
Для примера данных мы используем образец базы данных WWI. Для комплексного сценария хранилища данных мы создали достаточные данные для просмотра возможностей масштабирования и производительности платформы Microsoft Fabric.
Wide World Importers (WWI) является оптовым импортером товаров и распространителем товаров, работающих из района Сан-Франциско Бей. Как оптовик, клиенты WWI в основном являются компаниями, которые перепродают отдельным лицам. WWI продает розничным клиентам через США включая специализированные магазины, супермаркеты, вычислительные магазины, туристические магазины достопримечательность и некоторые лица. WWI также продает другим оптовикам через сеть агентов, которые способствуют продуктам от имени WWI. Дополнительные сведения о профиле и работе компании см . в примерах баз данных Wide World Importers для Microsoft SQL.
Как правило, данные из транзакционных систем (или бизнес-приложений) можно перенести в промежуточное пространство озера данных или хранилища данных. Однако в этом руководстве мы используем модель измерения, предоставляемую WWI в качестве исходного источника данных. Мы используем его в качестве источника для приема данных в хранилище данных и преобразования его с помощью T-SQL.
Модель данных
Хотя модель WWI-измерений содержит несколько таблиц фактов, в этом руководстве мы сосредоточимся только на fact_sale
таблице и его связанных измерениях, как показано ниже, чтобы продемонстрировать этот комплексный сценарий хранилища данных: