¿Qué es el vínculo semántico?

Vínculo semántico es una característica que permite establecer una conexión entre modelos semánticos y Ciencia de datos de Synapse en Microsoft Fabric. El uso del vínculo semántico solo se admite en Microsoft Fabric.

  • Para Spark 3.4 y versiones posteriores, el vínculo semántico está disponible en el entorno de ejecución predeterminado al usar Fabric y no es necesario instalarlo.

  • Para Spark 3.3 y versiones anteriores, o para actualizar a la versión más reciente del vínculo semántico, ejecute el siguiente comando:

    %pip install -U semantic-link
    

Los objetivos principales del vínculo semántico son:

  • Facilitar la conectividad de datos.
  • Habilitar la propagación de información semántica.
  • Integrarse perfectamente con las herramientas establecidas que usan los científicos de datos, como los cuadernos.

El vínculo semántico le ayuda a conservar el conocimiento del dominio sobre la semántica de datos de una manera estandarizada que puede acelerar el análisis de datos y reducir los errores.

El flujo de datos del vínculo semántico comienza con modelos semánticos que contienen datos e información semántica. El vínculo semántico puentea la brecha entre Power BI y la experiencia de Synapse Ciencia de datos.

Diagrama que muestra el flujo de datos de Power BI a cuadernos de ciencia de datos de Synapse y de vuelta a Power BI.

El vínculo semántico le permite usar modelos semánticos de Power BI en la experiencia de Synapse Ciencia de datos para realizar tareas como el análisis estadístico detallado y el modelado predictivo con técnicas de aprendizaje automático. Puede almacenar la salida del trabajo de Ciencia de datos en OneLake mediante Apache Spark e ingerir la salida almacenada en Power BI mediante Direct Lake.

Conectividad de Power BI

Un modelo semántico sirve como modelo de objetos tabular único, lo que proporciona un origen confiable para las definiciones semánticas, como las medidas de Power BI. El vínculo semántico se conecta a modelos semánticos en los siguientes ecosistemas, lo que facilita a los científicos de datos trabajar en el sistema con el que están más familiarizados.

Aplicaciones de información semántica

La información semántica de los datos incluye categorías de datos de Power BI, como dirección y código postal, relaciones entre tablas e información jerárquica.

Estas categorías de datos componen los metadatos que vínculo semántico propaga en el entorno de Synapse Ciencia de datos para permitir nuevas experiencias y mantener el linaje de datos.

Algunas aplicaciones de ejemplo de vínculo semántico incluyen:

Vínculo semántico es una herramienta eficaz que permite a los analistas de negocios usar datos de forma eficaz en un entorno completo de ciencia de datos.

Vínculo semántico facilita la colaboración sin problemas entre científicos de datos y analistas de negocios mediante la eliminación de la necesidad de volver a implementar la lógica de negocios insertada en medidas de Power BI. Este enfoque garantiza que ambas partes puedan trabajar de forma eficaz y productiva, maximizando el potencial de sus conclusiones controladas por datos.

Estructura de datos FabricDataFrame

FabricDataFrame es la estructura de datos principal que usa vínculo semántico para propagar la información semántica de los modelos semánticos al entorno de Synapse Ciencia de datos.

Diagrama que muestra el flujo de datos desde conectores de modelos semánticos a FabricDataFrame a funciones semánticas.

La clase FabricDataFrame:

  • Admite todas las operaciones de pandas.
  • Realiza subclases de DataFrame de Pandas y agrega metadatos, como información semántica y linaje.
  • Expone funciones semánticas y el método de add-measure que le permiten usar medidas de Power BI en el trabajo de ciencia de datos.