Защита данных для распространенных архитектур данных
В этой статье представлен обзор настройки безопасности для данных OneLake как для сетки данных, так и для центральных и периферийных архитектур.
Функции безопасности
Microsoft Fabric использует модель безопасности с несколькими уровнями с различными элементами управления, доступными на разных уровнях, чтобы предоставить только минимальные необходимые разрешения. Дополнительные сведения о различных типах безопасности, рассмотренных в этом руководстве, см . в разделе "Модель управления доступом к данным" в OneLake.
Защита сетки данных
Сетка данных — это архитектурная парадигма, которая обрабатывает данные как продукт, а не службу или ресурс. Сетка данных направлена на децентрализованность владения и управления данными в разных доменах и командах, обеспечивая взаимодействие и возможность обнаружения с помощью общей платформы. В архитектуре сетки данных каждая децентрализованная команда управляет владением данными, которые являются частью своего продукта данных. Рекомендации по безопасности, приведенные в этом разделе, сосредоточены на одной группе разработчиков данных, которая настраивает доступ для своей рабочей области. Действия должны повторяться каждой командой продуктов данных в своей рабочей области, так как они обеспечивают доступ для подчиненных пользователей.
Чтобы приступить к созданию сетки данных, используйте функцию домена Microsoft Fabric для тегов рабочих областей в соответствии с соответствующим продуктом данных и владением.
В доменах каждая команда имеет собственную рабочую область или рабочие области. Рабочая область хранит данные, необходимые для создания конечных продуктов данных для потребления. Предоставьте пользователям доступ к рабочей области с помощью ролей рабочей области.
Определите подчиненных потребителей продуктов данных и предоставьте доступ в соответствии с минимальными разрешениями, необходимыми для достижения своих целей. Чтобы обеспечить соответствие пользователей своим целевым интерфейсам, каждый тип нижестоящего пользователя может быть предоставлен доступ к одному элементу данных Fabric. В таблице ниже показаны некоторые распространенные варианты использования для потребителей сетки данных и соответствующих элементов Fabric.
User | Элементы Структуры |
---|---|
Специалисты по обработке и анализу | Записные книжки Apache Spark или lakehouse |
Инженеры данных | Записные книжки Apache Spark, потоки данных или конвейеры |
Бизнес-аналитики | Конечная точка аналитики SQL |
Создатели отчетов | Семантические модели |
Отчет потребителей | Отчеты Power BI |
Защита для концентратора и периферийной сети
Центральная и периферийная архитектура отличаются от сетки данных, имея все сертифицированные продукты данных, управляемые в одном централизованном расположении. Подчиненные потребители менее сосредоточены на создании дополнительных продуктов данных и вместо этого выполняют анализ данных, созданных центральной командой.
Определите подчиненных потребителей и предоставьте доступ в соответствии с минимальными разрешениями, необходимыми для достижения своих целей. Чтобы обеспечить соответствие пользователей своим целевым интерфейсам, каждый тип нижестоящего пользователя может быть предоставлен доступ к одному элементу данных Fabric. В таблице user persona показаны некоторые распространенные варианты использования для концентратора и периферийных элементов, а также соответствующие элементы Fabric.
User | Элементы Структуры |
---|---|
Специалисты по обработке и анализу | Записные книжки Apache Spark или lakehouse |
Бизнес-аналитики | Конечная точка аналитики SQL |
Создатели отчетов | Семантические модели |
Отчет потребителей | Отчеты Power BI |
Роли рабочей области
Назначения ролей рабочей области соответствуют одинаковым рекомендациям как для архитектур концентратора, так и для периферийных и сетки данных. Таблица обязанностей задания описывает роль рабочей области для назначения пользователям на основе функций, выполняемых в рабочей области.
Обязанности по заданию | Роль рабочей области |
---|---|
Владение рабочей областью и управление назначениями ролей | Административный |
Управление назначениями ролей для пользователей, не являющихся администраторами | Элемент |
Создание элементов Fabric и запись данных | Участник |
Создание таблиц и представлений с помощью SQL | Просмотр и разрешения SQL |
Для специалистов по обработке и анализу данных
Специалисты по обработке и анализу данных должны получить доступ к данным в озерном доме для использования с помощью Apache Spark. Для сетки данных и концентратора и периферийной сети пользователи Spark используют данные из отдельной рабочей области, чем те, в которые находятся данные. Это позволяет специалистам по обработке и анализу данных иметь доступ к созданию моделей и экспериментов без добавления загромождений в рабочую область, в которой хранятся данные. Специалисты по обработке и анализу данных также могут использовать другие службы, отличные от Spark, которые подключаются непосредственно к путям данных OneLake, например Azure Databricks или Dremio.
Чтобы подготовить доступ для специалистов по обработке и анализу данных, используйте кнопку общего доступа, чтобы предоставить общий доступ к lakehouse. Выберите поле "Чтение всех Apache Spark" в диалоговом окне. Для лейкхаусов с включенными ролями доступа к данным OneLake предоставьте пользователям доступ, добавив их в роль доступа к данным OneLake. Использование ролей доступа к данным OneLake обеспечивает более точный доступ к данным. Затем инженеры данных могут создавать ярлыки для выбора таблиц или папок в lakehouse.
Для специалистов по обработке данных
Инженеры данных нуждаются в доступе к данным в lakehouse для создания подчиненных продуктов данных. Инженеры данных должны получить доступ к данным в OneLake, чтобы конвейеры или записные книжки могли быть созданы для чтения данных. В истинной модели концентратора и периферийной модели роль инженера данных существует только в уровнях центральной группы концентратора. Однако для сетки данных инженеры данных объединяют продукты данных между доменами для создания новых наборов данных.
Используйте кнопку общего доступа для совместного использования lakehouse с инженерами данных. Установите флажок "Чтение всех Apache Spark" в диалоговом окне. Для лейкхаусов с включенными ролями доступа к данным OneLake предоставьте пользователям доступ, добавив их в роль доступа к данным OneLake. Использование ролей доступа к данным OneLake обеспечивает более точный доступ к данным. Затем инженеры данных могут создавать ярлыки для выбора таблиц или папок в lakehouse.
Для специалистов по бизнес-аналитике
Бизнес-аналитики (иногда называют аналитиками данных) запрашивают данные через SQL для ответа на бизнес-вопросы.
Используйте кнопку общего доступа, чтобы поделиться озером с бизнес-аналитиками. Установите флажок "Чтение всех данных конечной точки SQL" в диалоговом окне. Этот параметр предоставляет бизнес-аналитикам доступ к данным в конечной точке аналитики SQL Lakehouse, но не для просмотра базовых файлов OneLake.
Доступ к данным можно дополнительно ограничить для этих пользователей, определив безопасность на уровне строк или столбцов непосредственно в SQL.
Создатели отчетов
Создатели отчетов создают отчеты Power BI для других пользователей.
Используйте кнопку общего доступа, чтобы предоставить общий доступ к lakehouse создателям отчета. Установите флажок "Сборка отчетов" в поле семантической модели по умолчанию в диалоговом окне. Это разрешение позволяет создателям отчетов создавать отчеты с помощью семантической модели, связанной с lakehouse. Эти пользователи не могут получить доступ к данным в OneLake или получить полный доступ к конечной точке аналитики SQL.
Отчет потребителей
Потребители отчетов — это бизнес-лидеры или руководители, которые просматривают данные в отчете Power BI для принятия решений.
Предоставление общего доступа к отчету потребителям с помощью кнопки "Общий доступ". Не установите флажки для предоставления доступа к отчету, но не видите ни одного из базовых данных. Чтобы запретить пользователям получать доступ к конечной точке аналитики SQL и просматривать таблицы, убедитесь, что разрешения SQL не определены, которые предоставляют доступ для этих пользователей.
Вы также можете совместно использовать данные с потребителями отчетов с помощью приложения. Приложения позволяют пользователям получать доступ к предварительно определенному отчету или набору отчетов без доступа к базовой рабочей области. Обратите внимание, что для отчетов в режиме прямого озера пользователям потребуется общий доступ к базовому lakehouse для просмотра данных.