Что такое семантическая связь?
Семантическая связь — это функция, которая позволяет установить связь между семантических моделей и Synapse Обработка и анализ данных в Microsoft Fabric. Использование семантической ссылки поддерживается только в Microsoft Fabric.
Для Spark 3.4 и более поздних версий семантическая ссылка доступна в среде выполнения по умолчанию при использовании Fabric и не требуется устанавливать ее.
Для Spark 3.3 или ниже или для обновления до последней версии семантической ссылки выполните следующую команду:
%pip install -U semantic-link
Основными целями семантической связи являются:
- Упрощение подключения к данным.
- Включите распространение семантической информации.
- Простая интеграция с установленными средствами обработки и анализа данных, например записными книжками.
Семантическая связь помогает сохранять знания о семантике данных в стандартизированном режиме, который может ускорить анализ данных и уменьшить ошибки.
Поток данных семантической связи
Поток данных семантической связи начинается с семантических моделей, содержащих данные и семантические сведения. Семантическая связь мостит разрыв между Power BI и интерфейсом Synapse Обработка и анализ данных.
Семантическая связь позволяет использовать семантические модели из Power BI в интерфейсе Synapse Обработка и анализ данных для выполнения таких задач, как подробный статистический анализ и прогнозное моделирование с помощью методов машинного обучения. Выходные данные обработки и анализа данных можно хранить в OneLake с помощью Apache Spark и приема сохраненных выходных данных в Power BI с помощью Direct Lake.
Возможность подключения к Power BI
Семантическая модель служит одной табличной объектной моделью , которая предоставляет надежные источники для семантических определений, таких как меры Power BI. Семантическая связь подключается к семантической модели в следующих экосистемах, что упрощает работу специалистов по обработке и анализу данных в системе, с которыми они наиболее знакомы.
- Экосистема Pandas Python через библиотеку Python SemPy.
- Экосистема Apache Spark через собственный соединитель Spark. Эта реализация поддерживает различные языки, включая PySpark, Spark SQL, R и Scala.
Приложения семантической информации
Семантическая информация в данных включает в себя категории данных Power BI, такие как адрес и почтовый индекс, связи между таблицами и иерархические сведения.
Эти категории данных содержат метаданные, которые семантическая связь распространяется в среду Synapse Обработка и анализ данных для обеспечения новых возможностей и поддержания происхождения данных.
Ниже приведены примеры приложений семантической связи:
- Интеллектуальные предложения встроенных семантических функций.
- Инновационная интеграция для расширения данных с помощью мер Power BI с помощью надстроек.
- Средства проверки качества данных на основе связей между таблицами и функциональными зависимостями в таблицах.
Семантическая связь — это мощный инструмент, позволяющий бизнес-аналитикам эффективно использовать данные в комплексной среде обработки и анализа данных.
Семантическая связь упрощает совместную работу между специалистами по обработке и анализу данных и бизнес-аналитиками, устраняя необходимость повторного выполнения бизнес-логики, внедренной в меры Power BI. Этот подход гарантирует, что обе стороны могут эффективно и продуктивно работать, максимизируя потенциал их аналитических сведений на основе данных.
Структура данных FabricDataFrame
FabricDataFrame — это основная структура данных, которая использует семантику для распространения семантической информации из семантических моделей в среду Synapse Обработка и анализ данных.
Класс FabricDataFrame
:
- Поддерживает все операции pandas.
- Подклассы pandas DataFrame и добавляют метаданные, такие как семантическая информация и происхождение.
- Предоставляет семантические функции и метод меры надстройки, которые позволяют использовать меры Power BI в работе по обработке и анализу данных.
Связанный контент
- Ознакомьтесь со справочной документацией по пакету семантической ссылки Python (SemPy)
- Руководство. Очистка данных с помощью функциональных зависимостей
- Подключение Power BI с семантической связью и Microsoft Fabric
- Изучение и проверка данных с помощью семантической ссылки
- Изучение и проверка связей в семантических моделях