O que é link semântico?

O link semântico é um recurso que permite estabelecer uma conexão entre modelos semânticos e o Synapse Data Science no Microsoft Fabric. O uso de link semântico é suportado apenas no Microsoft Fabric.

  • Para o Spark 3.4 e superior, o link semântico está disponível no tempo de execução padrão ao usar o Fabric e não há necessidade de instalá-lo.

  • Para o Spark 3.3 ou inferior, ou para atualizar para a versão mais recente do link semântico, execute o seguinte comando:

    %pip install -U semantic-link
    

Os principais objetivos da ligação semântica são:

  • Facilite a conectividade de dados.
  • Permitir a propagação de informações semânticas.
  • Integre-se perfeitamente com ferramentas estabelecidas que os cientistas de dados usam, como notebooks.

O link semântico ajuda a preservar o conhecimento do domínio sobre semântica de dados de uma forma padronizada que pode acelerar a análise de dados e reduzir erros.

O fluxo de dados de link semântico começa com modelos semânticos que contêm dados e informações semânticas. A ligação semântica preenche a lacuna entre o Power BI e a experiência Synapse Data Science.

Um diagrama que mostra o fluxo de dados do Power BI para blocos de anotações no Synapse Data Science e de volta para o Power BI.

O link semântico permite que você use modelos semânticos do Power BI na experiência Synapse Data Science para executar tarefas como análise estatística aprofundada e modelagem preditiva com técnicas de aprendizado de máquina. Você pode armazenar a saída do seu trabalho de ciência de dados no OneLake usando o Apache Spark e ingerir a saída armazenada no Power BI usando o Direct Lake.

Conectividade do Power BI

Um modelo semântico serve como um único modelo de objeto tabular que fornece fontes confiáveis para definições semânticas, como medidas do Power BI. O link semântico se conecta a modelos semânticos nos ecossistemas a seguir, facilitando o trabalho dos cientistas de dados no sistema com o qual estão mais familiarizados.

  • Ecossistema Python pandas , através da biblioteca Python SemPy.
  • Ecossistema Apache Spark, através do conector nativo do Spark. Esta implementação suporta várias linguagens, incluindo PySpark, Spark SQL, R e Scala.

Aplicações da informação semântica

As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas.

Essas categorias de dados compreendem metadados que o link semântico se propaga no ambiente Synapse Data Science para permitir novas experiências e manter a linhagem de dados.

Alguns exemplos de aplicações de ligação semântica incluem:

  • Sugestões inteligentes de funções semânticas integradas.
  • Integração inovadora para aumentar dados com medidas do Power BI, usando medidas adicionais.
  • Ferramentas para validação da qualidade de dados com base nas relações entre tabelas e dependências funcionais dentro de tabelas.

O link semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente abrangente de ciência de dados.

O link semântico facilita a colaboração perfeita entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial de seus insights orientados por dados.

Estrutura de dados FabricDataFrame

FabricDataFrame é a principal estrutura de dados que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente Synapse Data Science.

Um diagrama que mostra o fluxo de dados de conectores para modelos semânticos para FabricDataFrame para funções semânticas.

A classe FabricDataFrame:

  • Suporta todas as operações de pandas.
  • Subclasses do Pandas DataFrame e adiciona metadados, como informações semânticas e linhagem.
  • Expõe funções semânticas e o método add-measure que permite usar medidas do Power BI no trabalho de ciência de dados.