Руководство по настройке зеркальных баз данных Microsoft Fabric из Azure Databricks (предварительная версия)

Зеркальное отображение базы данных в Microsoft Fabric — это корпоративная облачная технология, ноль ETL, SaaS. Это руководство поможет создать зеркальную базу данных из Azure Databricks, которая создает только для чтения реплицированную копию данных Azure Databricks в OneLake.

Необходимые компоненты

  • Создайте или используйте существующую рабочую область Azure Databricks с включенным каталогом Unity.

  • Для схемы в каталоге Unity необходимо иметь EXTERNAL USE SCHEMA привилегии, содержащие таблицы, к которым будет получен доступ из Fabric. Дополнительные сведения см. в разделе "Управление внешним доступом к данным в каталоге Unity".

  • Для задания элементов управления доступом для каталогов, схем и таблиц в Fabric необходимо использовать модель разрешений Fabric.

  • Рабочие области Azure Databricks не должны находиться за частной конечной точкой.

  • Учетные записи хранения, содержащие данные каталога Unity, не могут находиться за брандмауэром.

Создание зеркальной базы данных из Azure Databricks

Выполните следующие действия, чтобы создать новую зеркальную базу данных из каталога Azure Databricks Unity.

  1. Перейдите к https://powerbi.com.

  2. Выберите +Создать , а затем отражайте каталог Azure Databricks.

    Снимок экрана: портал Fabric нового зеркального элемента Azure Databricks.

  3. Выберите существующее подключение, если настроено одно.

    • Если у вас нет существующего подключения, создайте новое подключение и введите все сведения. Вы можете пройти проверку подлинности в рабочей области Azure Databricks с помощью учетной записи организации или субъекта-службы. Чтобы создать подключение, необходимо быть пользователем или администратором рабочей области Azure Databricks.
  4. После подключения к рабочей области Azure Databricks на странице каталога "Выбор таблиц" можно выбрать каталог, схемы и таблицы с помощью списка включения и исключения, который вы хотите добавить и получить доступ из Microsoft Fabric. Выберите каталог и связанные схемы и таблицы, которые необходимо добавить в рабочую область Fabric.

  5. По умолчанию имя элемента будет именем каталога, который вы пытаетесь добавить в Fabric. На странице "Проверка и создание" можно просмотреть сведения и при необходимости изменить имя элемента зеркальной базы данных, которое должно быть уникальным в рабочей области. Нажмите кнопку создания.

  6. Создается элемент каталога Databricks и для каждой таблицы также создается соответствующий ярлык типа Databricks.

    • Схемы, у которых нет таблиц, не отображаются.
  7. Вы также можете просмотреть предварительный просмотр данных при доступе к ярлыку, выбрав конечную точку аналитики SQL. Откройте элемент конечной точки аналитики SQL, чтобы запустить страницу обозревателя и редактора запросов. Вы можете запросить зеркальные таблицы Azure Databricks с помощью T-SQL в редакторе SQL.

Создание ярлыков Lakehouse для элемента каталога Databricks

Вы также можете создавать ярлыки из Lakehouse в элемент каталога Databricks для использования данных Lakehouse и использования записных книжек Spark.

  1. Во-первых, мы создадим лейкхаус. Если у вас уже есть lakehouse в этой рабочей области, можно использовать существующий lakehouse.
    1. Выберите рабочую область в меню навигации.
    2. Выберите +Создать>Lakehouse.
    3. Укажите имя для озера в поле "Имя " и нажмите кнопку "Создать".
  2. В представлении обозревателя озера в меню "Получение данных" в меню lakehouse в разделе "Загрузка данных" в lakehouse нажмите кнопку "Создать ярлык".
  3. Выберите Microsoft OneLake. Выберите каталог. Это элемент данных, созданный на предыдущих шагах. Затем выберите Далее.
  4. Выберите таблицы в схеме и нажмите кнопку "Далее".
  5. Нажмите кнопку создания.
  6. Ярлыки теперь доступны в Lakehouse для использования с другими данными Lakehouse. Записные книжки и Spark также можно использовать для обработки данных для этих таблиц каталога, добавленных из рабочей области Azure Databricks.

Создание семантической модели

Совет

Для лучшего взаимодействия рекомендуется использовать браузер Microsoft Edge для задач семантического моделирования.

Дополнительные сведения о семантической модели Power BI по умолчанию.

Помимо семантической модели Power BI по умолчанию, можно обновить семантику Power BI по умолчанию, если вы решили добавить или удалить таблицы из модели или создать новую семантику модели. Чтобы обновить семантику по умолчанию, выполните следующие действия.

  1. Перейдите к элементу Azure Databricks зеркального отображения в рабочей области.
  2. Выберите конечную точку аналитики SQL из раскрывающегося списка на панели инструментов.
  3. В разделе "Отчеты" выберите "Управление семантической моделью по умолчанию".

Управление связями семантической модели

  1. Выберите макеты моделей из обозревателя в рабочей области.
  2. После выбора макетов модели вы можете представить рисунок таблиц, включенных в семантику модели.
  3. Чтобы создать связи между таблицами, перетащите имя столбца из одной таблицы в другое имя столбца другой таблицы. Всплывающее окно отображается для определения связи и кратности для таблиц.