Что такое семантическая связь?

Семантическая связь — это функция, которая позволяет установить связь между семантических моделей и Synapse Обработка и анализ данных в Microsoft Fabric. Использование семантической ссылки поддерживается только в Microsoft Fabric.

  • Для Spark 3.4 и более поздних версий семантическая ссылка доступна в среде выполнения по умолчанию при использовании Fabric и не требуется устанавливать ее.

  • Для Spark 3.3 или ниже или для обновления до последней версии семантической ссылки выполните следующую команду:

    %pip install -U semantic-link
    

Основными целями семантической связи являются:

  • Упрощение подключения к данным.
  • Включите распространение семантической информации.
  • Простая интеграция с установленными средствами обработки и анализа данных, например записными книжками.

Семантическая связь помогает сохранять знания о семантике данных в стандартизированном режиме, который может ускорить анализ данных и уменьшить ошибки.

Поток данных семантической связи начинается с семантических моделей, содержащих данные и семантические сведения. Семантическая связь мостит разрыв между Power BI и интерфейсом Synapse Обработка и анализ данных.

Схема, демонстрирующая поток данных из Power BI в записные книжки в Synapse Обработка и анализ данных и обратно в Power BI.

Семантическая связь позволяет использовать семантические модели из Power BI в интерфейсе Synapse Обработка и анализ данных для выполнения таких задач, как подробный статистический анализ и прогнозное моделирование с помощью методов машинного обучения. Выходные данные обработки и анализа данных можно хранить в OneLake с помощью Apache Spark и приема сохраненных выходных данных в Power BI с помощью Direct Lake.

Возможность подключения к Power BI

Семантическая модель служит одной табличной объектной моделью , которая предоставляет надежные источники для семантических определений, таких как меры Power BI. Семантическая связь подключается к семантической модели в следующих экосистемах, что упрощает работу специалистов по обработке и анализу данных в системе, с которыми они наиболее знакомы.

Приложения семантической информации

Семантическая информация в данных включает в себя категории данных Power BI, такие как адрес и почтовый индекс, связи между таблицами и иерархические сведения.

Эти категории данных содержат метаданные, которые семантическая связь распространяется в среду Synapse Обработка и анализ данных для обеспечения новых возможностей и поддержания происхождения данных.

Ниже приведены примеры приложений семантической связи:

  • Интеллектуальные предложения встроенных семантических функций.
  • Инновационная интеграция для расширения данных с помощью мер Power BI с помощью надстроек.
  • Средства проверки качества данных на основе связей между таблицами и функциональными зависимостями в таблицах.

Семантическая связь — это мощный инструмент, позволяющий бизнес-аналитикам эффективно использовать данные в комплексной среде обработки и анализа данных.

Семантическая связь упрощает совместную работу между специалистами по обработке и анализу данных и бизнес-аналитиками, устраняя необходимость повторного выполнения бизнес-логики, внедренной в меры Power BI. Этот подход гарантирует, что обе стороны могут эффективно и продуктивно работать, максимизируя потенциал их аналитических сведений на основе данных.

Структура данных FabricDataFrame

FabricDataFrame — это основная структура данных, которая использует семантику для распространения семантической информации из семантических моделей в среду Synapse Обработка и анализ данных.

Схема, показывющая поток данных из соединителей в семантические модели в FabricDataFrame на семантические функции.

Класс FabricDataFrame:

  • Поддерживает все операции pandas.
  • Подклассы pandas DataFrame и добавляют метаданные, такие как семантическая информация и происхождение.
  • Предоставляет семантические функции и метод меры надстройки, которые позволяют использовать меры Power BI в работе по обработке и анализу данных.