Зеркальное отображение Snowflake

Зеркальное отображение в Fabric позволяет избежать сложной нагрузки ETL (извлечение нагрузки преобразования) и интегрировать существующие данные хранилища Snowflake с остальными данными в Microsoft Fabric. Вы можете непрерывно реплицировать существующие данные Snowflake непосредственно в OneLake Fabric. В Fabric можно разблокировать мощные бизнес-аналитики, искусственный интеллект, Инжиниринг данных, Обработка и анализ данных и сценарии совместного использования данных.

Руководство по настройке базы данных Snowflake для зеркального отображения в Fabric см. в руководстве по настройке зеркальных баз данных Microsoft Fabric из Snowflake.

Зачем использовать зеркальное отображение в Fabric?

При зеркальном отображении в Fabric вам не нужно объединять разные службы от нескольких поставщиков. Вместо этого вы можете наслаждаться высоко интегрированным, комплексным и простым продуктом, который предназначен для упрощения потребностей аналитики, и построен для открытости и совместной работы между Корпорацией Майкрософт, Snowflake и 1000-ми технологическими решениями, которые могут читать формат таблицы Delta Lake с открытым исходным кодом.

Какие возможности аналитики встроены?

Зеркальные базы данных — это элемент в Хранилище данных Fabric Synapse, отличный от конечной точки хранилища и аналитики SQL.

Схема зеркального отображения базы данных Fabric для Snowflake.

Зеркальное отображение создает три элемента в рабочей области Fabric:

  • Элемент зеркальной базы данных. Зеркальное отображение управляет репликацией данных в OneLake и преобразованием в Parquet в формате, готовом к аналитике. Это позволяет нижестоящим сценариям, таким как проектирование данных, обработка и т. д.
  • Конечная точка аналитики SQL
  • Семантическая модель по умолчанию

Каждая зеркальная база данных имеет автоматически созданную конечную точку аналитики SQL, которая обеспечивает широкий аналитический интерфейс поверх разностных таблиц, созданных процессом зеркального отображения. У пользователей есть доступ к знакомым командам T-SQL, которые могут определять и запрашивать объекты данных, но не управлять данными из конечной точки аналитики SQL, так как это копия только для чтения. В конечной точке аналитики SQL можно выполнить следующие действия:

  • Изучите таблицы, ссылающиеся на данные в таблицах Delta Lake из Snowflake.
  • Не создавайте запросы и представления кода и визуально просматривайте данные без написания строки кода.
  • Разработка представлений SQL, встроенных твФ (табличных функций) и хранимых процедур для инкапсулирования семантики и бизнес-логики в T-SQL.
  • Управление разрешениями для объектов.
  • Запрос данных в других хранилищах и Lakehouse в той же рабочей области.

Помимо Редактор запросов Microsoft Fabric SQL существует широкая экосистема инструментов, которая может запрашивать конечную точку аналитики SQL, включая SQL Server Management Studio, Azure Data Studio и даже GitHubCopilot.

Вопросы безопасности

Чтобы включить зеркальное отображение Fabric, вам потребуются разрешения пользователя для базы данных Snowflake, содержащей следующие разрешения:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Дополнительные сведения см. в документации по Snowflake по контроль доступа привилегиям для таблиц потоковой передачи и необходимых разрешений для потоков.

Внимание

Все детализированные средства безопасности, установленные в исходном хранилище Snowflake, необходимо повторно настроить в зеркальной базе данных в Microsoft Fabric. Дополнительные сведения см. в разделе "Подробные разрешения SQL" в Microsoft Fabric.

Рекомендации по зеркальным затратам Snowflake

Fabric не взимает плату за входящий трафик сетевых данных в OneLake для зеркального отображения. При репликации данных Snowflake в OneLake нет затрат на зеркальное отображение.

Существуют затраты на вычисления Snowflake и облачные запросы при зеркальных отображениях данных: вычислительных ресурсов виртуального хранилища и облачных служб.

  • Плата за вычислительные ресурсы виртуального хранилища Snowflake:
    • Плата за вычисления будет взиматься на стороне Snowflake, если есть изменения данных, которые считываются в Snowflake, и, в свою очередь, зеркально отражаются в Fabric.
    • Все запросы метаданных выполняются за кулисами для проверки изменений данных, не взимается плата за какие-либо вычислительные ресурсы Snowflake; однако запросы, которые создают такие данные, как SELECT * пробуждение хранилища Snowflake и вычислений, будут взиматься.
  • Плата за вычисления служб Snowflake:
    • Несмотря на то, что не взимается плата за вычисления для таких задач, как разработка, запросы метаданных, управление доступом, отображение изменений данных и даже запросов DDL, существуют облачные затраты, связанные с этими запросами.
    • В зависимости от типа выпуска Snowflake вы будете взиматься за соответствующие кредиты за любые расходы на облачные службы.

На следующем снимке экрана вы увидите затраты на вычислительные ресурсы виртуального хранилища и облачные службы для связанной базы данных Snowflake, которая зеркально отображается в Fabric. В этом сценарии большинство вычислительных затрат облачных служб (желтый) исходят из запросов на изменение данных на основе упомянутых ранее точек. Затраты на вычислительные ресурсы виртуального хранилища (синие) идут строго из изменений данных, считываются из Snowflake и зеркально отражаются в Fabric.

Снимок экрана: граф затрат Snowflake.

Дополнительные сведения о затратах на облачные запросы Snowflake см . в документации по Snowflake: общие сведения о затратах.

Следующий шаг