Руководство по принятию решений Microsoft Fabric. Выбор между хранилищем и Lakehouse

Microsoft Fabric предлагает две рабочие нагрузки корпоративного формата, открытые стандартные для хранилища данных: Warehouse и Lakehouse. В этой статье сравниваются две платформы и точки принятия решений для каждого.

Критерий

Схема, содержащая деревья принятия решений для Lakehouse и Warehouse в Microsoft Fabric.

Нет решений для кода или pro Code: как вы хотите разработать?

  • Искра
    • Использование Lakehouse
  • T-SQL
    • Использование хранилища

Потребности в хранилище: требуются ли транзакции с несколькими таблицами?

  • Да
    • Использование хранилища
  • Нет
    • Использование Lakehouse

Сложность данных: какой тип данных вы анализируете?

  • Не знаю
    • Использование Lakehouse
  • Неструктурированные и структурированные данные
    • Использование Lakehouse
  • Структурированные данные только
    • Использование хранилища

Выбор службы кандидатов

Выполните подробную оценку службы, чтобы убедиться, что она соответствует вашим потребностям.

Элемент хранилища в Хранилище данных Fabric Synapse — это хранилище данных корпоративного масштаба с открытым стандартным форматом.

  • Производительность не выполняется с минимальными настройками и развертыванием, конфигурация вычислительных ресурсов или хранилища не требуется. ​
  • Простой и интуитивно понятный интерфейс хранилища для начинающих и опытных специалистов по данным (без/pro кода).
  • Хранилище, ориентированное на озеро, хранит данные в OneLake в открытом формате Delta с простым восстановлением и управлением данными.
  • Полностью интегрирована со всеми рабочими нагрузками Fabric.
  • Загрузка и преобразование данных в масштабе с полными гарантиями транзакций с несколькими таблицами, предоставляемыми подсистемой SQL.
  • Виртуальные хранилища с запросами между базами данных и полностью интегрированным семантическим уровнем.
  • Платформа, готовая к предприятиям, с комплексной производительностью и видимостью использования с встроенным управлением и безопасностью.
  • Гибкость в создании хранилища данных или сетки данных на основе потребностей организации и выбора без кода, низкого кода или T-SQL для преобразований.

Элемент Lakehouse в Fabric Synapse Инжиниринг данных

  • Хранение, управление и анализ структурированных и неструктурированных данных в одном расположении для получения аналитических сведений и принятия решений быстрее и эффективно.
  • Гибкое и масштабируемое решение, позволяющее организациям обрабатывать большие объемы данных всех типов и размеров.
  • Легко прием данных из многих различных источников, которые преобразуются в единый формат Delta
  • Автоматическое обнаружение и регистрация таблиц для полностью управляемого интерфейса для инженеров данных и специалистов по обработке и анализу данных. ​
  • Автоматическая конечная точка аналитики SQL и набор данных по умолчанию, который позволяет T-SQL запрашивать разностные таблицы в озере

Оба включаются в емкости Power BI Premium или Fabric.

Сравнение различных возможностей хранения

В этой таблице сравнивается хранилище с конечной точкой аналитики SQL Lakehouse.

Предложение Microsoft Fabric

Склад

Конечная точка аналитики SQL в Lakehouse


Основные возможности

В T-SQL поддерживаются полные хранилища данных с поддержкой транзакций.

Только чтение, созданная системой конечная точка аналитики SQL для Lakehouse для запросов и обслуживания T-SQL. Поддерживает аналитику таблиц Lakehouse Delta и папок Delta Lake, на которые ссылается ярлыки.


Профиль разработчика

Разработчики SQL или разработчики граждан

Инженер данных или разработчики SQL

Загрузка данных

SQL, конвейеры, потоки данных

Spark, конвейеры, потоки данных, сочетания клавиш


Поддержка разностной таблицы

Считывает и записывает разностные таблицы

Считывает разностные таблицы


Уровень хранения

Формат открытых данных — delta

Формат открытых данных — delta


Рекомендуемый вариант использования

  • Хранилище данных для корпоративного использования
  • Хранилище данных поддержке отдела, подразделения или самостоятельного использования
  • Структурированный анализ данных в T-SQL с таблицами, представлениями, процедурами и функциями и расширенной поддержкой SQL для бизнес-аналитики
  • Изучение и запрос разностных таблиц из lakehouse
  • Промежуточные данные и зона архивации для анализа
  • Архитектура medallion lakehouse с зонами для бронзового, серебряного и золотого анализа
  • Связывание с хранилищем для вариантов использования аналитики предприятия

Интерфейс разработки

  • Редактор хранилища с полной поддержкой приема данных T-SQL, моделирования, разработки и запроса пользовательского интерфейса для приема данных, моделирования и запроса запросов
  • Поддержка чтения и записи для 1-го и 3-го стороннего инструментов
  • Конечная точка аналитики SQL Lakehouse с ограниченной поддержкой T-SQL для представлений, табличных функций и запросов SQL
  • Интерфейсы пользовательского интерфейса для моделирования и запроса
  • Ограниченная поддержка T-SQL для 1-го и 3-го стороннего инструментов

Возможности T-SQL

Полная поддержка DQL, DML и DDL T-SQL, полная поддержка транзакций

Full DQL, No DML, limited DDL T-SQL Support, например SQL Views and TVFs