O que é link semântico?
O link semântico é um recurso que permite estabelecer uma conexão entre modelos semânticos e o Synapse Data Science no Microsoft Fabric. O uso de link semântico é suportado apenas no Microsoft Fabric.
Para o Spark 3.4 e superior, o link semântico está disponível no tempo de execução padrão ao usar o Fabric e não há necessidade de instalá-lo.
Para o Spark 3.3 ou inferior, ou para atualizar para a versão mais recente do link semântico, execute o seguinte comando:
%pip install -U semantic-link
Os principais objetivos da ligação semântica são:
- Facilite a conectividade de dados.
- Permitir a propagação de informações semânticas.
- Integre-se perfeitamente com ferramentas estabelecidas que os cientistas de dados usam, como notebooks.
O link semântico ajuda a preservar o conhecimento do domínio sobre semântica de dados de uma forma padronizada que pode acelerar a análise de dados e reduzir erros.
Fluxo de dados de link semântico
O fluxo de dados de link semântico começa com modelos semânticos que contêm dados e informações semânticas. A ligação semântica preenche a lacuna entre o Power BI e a experiência Synapse Data Science.
O link semântico permite que você use modelos semânticos do Power BI na experiência Synapse Data Science para executar tarefas como análise estatística aprofundada e modelagem preditiva com técnicas de aprendizado de máquina. Você pode armazenar a saída do seu trabalho de ciência de dados no OneLake usando o Apache Spark e ingerir a saída armazenada no Power BI usando o Direct Lake.
Conectividade do Power BI
Um modelo semântico serve como um único modelo de objeto tabular que fornece fontes confiáveis para definições semânticas, como medidas do Power BI. O link semântico se conecta a modelos semânticos nos ecossistemas a seguir, facilitando o trabalho dos cientistas de dados no sistema com o qual estão mais familiarizados.
- Ecossistema Python pandas , através da biblioteca Python SemPy.
- Ecossistema Apache Spark, através do conector nativo do Spark. Esta implementação suporta várias linguagens, incluindo PySpark, Spark SQL, R e Scala.
Aplicações da informação semântica
As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas.
Essas categorias de dados compreendem metadados que o link semântico se propaga no ambiente Synapse Data Science para permitir novas experiências e manter a linhagem de dados.
Alguns exemplos de aplicações de ligação semântica incluem:
- Sugestões inteligentes de funções semânticas integradas.
- Integração inovadora para aumentar dados com medidas do Power BI, usando medidas adicionais.
- Ferramentas para validação da qualidade de dados com base nas relações entre tabelas e dependências funcionais dentro de tabelas.
O link semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente abrangente de ciência de dados.
O link semântico facilita a colaboração perfeita entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial de seus insights orientados por dados.
Estrutura de dados FabricDataFrame
FabricDataFrame é a principal estrutura de dados que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente Synapse Data Science.
A classe FabricDataFrame
:
- Suporta todas as operações de pandas.
- Subclasses do Pandas DataFrame e adiciona metadados, como informações semânticas e linhagem.
- Expõe funções semânticas e o método add-measure que permite usar medidas do Power BI no trabalho de ciência de dados.