O que é espelhamento em malha?

Como uma solução de replicação de dados, o Mirroring in Fabric é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. Você pode replicar continuamente seu conjunto de dados existente diretamente no OneLake do Fabric, incluindo dados do Banco de Dados SQL do Azure, Azure Cosmos DB, Azure Databricks e Snowflake.

Com os dados mais atualizados em um formato consultável no OneLake, agora você pode usar todos os diferentes serviços no Fabric, como executar análises com o Spark, executar blocos de anotações, engenharia de dados, visualizar por meio de Relatórios do Power BI e muito mais.

O espelhamento no Fabric permite que os usuários desfrutem de um produto altamente integrado, completo e fácil de usar, projetado para simplificar suas necessidades de análise. Criado para abertura e colaboração entre a Microsoft e soluções tecnológicas que podem ler o formato de tabela Delta Lake de código aberto, o Mirroring é uma solução turnkey de baixo custo e baixa latência que permite criar uma réplica de seus dados no OneLake que pode ser usada para todas as suas necessidades analíticas.

As tabelas Delta podem ser usadas em qualquer lugar do Fabric, permitindo que os usuários acelerem sua jornada no Fabric.

Por que usar o espelhamento na malha?

Hoje, muitas organizações têm dados operacionais ou analíticos de missão crítica em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extract Transform Load), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes e em constante mudança
  • Atrito entre pessoas, processos e tecnologia
  • Longos tempos de espera para criar pipelines de dados e processos para dados criticamente importantes
  • Não há liberdade para usar as ferramentas que você precisa para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos - BI, IA, integração, engenharia e até mesmo aplicativos

O espelhamento no Fabric oferece uma experiência fácil para acelerar o tempo de implantação de insights e decisões e para quebrar silos de dados entre soluções de tecnologia:

  • Replicação quase em tempo real de dados em um data lake SaaS, com análise integrada para BI e IA

A plataforma Microsoft Fabric é construída sobre uma base de Software as a Service (SaaS), que leva a simplicidade e a integração a um nível totalmente novo. Para saber mais sobre o Microsoft Fabric, consulte O que é o Microsoft Fabric?

O espelhamento cria três itens no espaço de trabalho do Fabric:

Além do Editor de Consultas SQL do Microsoft Fabric, há um amplo ecossistema de ferramentas, incluindo o SQL Server Management Studio, o Azure Data Studio e até mesmo o GitHubCopilot.

O compartilhamento permite facilitar o controle e o gerenciamento de acesso, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Atualmente, estão disponíveis as seguintes bases de dados externas:

Plataforma Replicação quase em tempo real Tutorial ponto a ponto
Bancos de dados espelhados do Microsoft Fabric do Azure Cosmos DB (visualização) Sim Tutorial: Azure Cosmos DB
Bancos de dados espelhados do Microsoft Fabric do Azure Databricks (visualização) Sim Tutorial: Azure Databricks
Bancos de dados espelhados do Microsoft Fabric do Banco de Dados SQL do Azure (visualização) Sim Tutorial: Banco de Dados SQL do Azure
Bancos de dados espelhados do Microsoft Fabric do Snowflake Sim Tutorial: Floco de neve

Como funciona a replicação quase em tempo real do espelhamento?

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacionais. Você escolhe se deseja replicar um banco de dados inteiro ou tabelas individuais e o espelhamento manterá automaticamente seus dados sincronizados. Uma vez configurados, os dados serão replicados continuamente no OneLake para consumo de análise.

A seguir estão os princípios fundamentais do espelhamento:

  • Habilitar o espelhamento na malha é simples e intuitivo, sem a necessidade de criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar com hospedagem, manutenção ou gerenciamento da replicação da conexão espelhada.

Partilhar

O compartilhamento facilita o controle e o gerenciamento de acesso, enquanto os controles de segurança, como RLS (segurança em nível de linha) e OLS (segurança em nível de objeto), entre outros, garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um banco de dados espelhado sem dar acesso ao espaço de trabalho e ao restante de seus itens. Quando alguém compartilha um banco de dados espelhado, também concede acesso ao ponto de extremidade de análise SQL e ao modelo semântico padrão associado.

Acesse a caixa de diálogo Compartilhamento com o botão Compartilhar ao lado do nome do banco de dados espelhado na visualização Espaço de trabalho . Os bancos de dados espelhados compartilhados podem ser encontrados por meio do hub de dados OneLake ou da seção Compartilhado comigo no Microsoft Fabric.

Para obter mais informações, consulte Compartilhar seu depósito e gerenciar permissões.

Consultas entre bases de dados

Com os dados do seu banco de dados espelhado armazenados no OneLake, você pode escrever consultas entre bancos de dados, unindo dados de bancos de dados espelhados, armazéns e pontos de extremidade de análise SQL do Lakehouses em uma única consulta T-SQL. Para obter mais informações, consulte Escrever uma consulta entre bancos de dados.

Por exemplo, você pode fazer referência à tabela a partir de bancos de dados espelhados e armazéns usando nomenclatura de três partes. No exemplo a seguir, use o nome de três partes para ContosoSalesTable se referir no depósito ContosoWarehouse. De outros bancos de dados ou depósitos, a primeira parte da convenção de nomenclatura SQL padrão de três partes é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Engenharia de dados com seus dados de banco de dados espelhados

O Microsoft Fabric fornece vários recursos de engenharia de dados para garantir que seus dados sejam facilmente acessíveis, bem organizados e de alta qualidade. No Fabric Data Engineering, você pode:

  • Crie e gerencie seus dados como Spark usando uma lakehouse
  • Projete pipelines para copiar dados para sua casa no lago
  • Usar definições de trabalho do Spark para enviar trabalho em lote/streaming para o cluster do Spark
  • Usar blocos de anotações para escrever código para ingestão, preparação e transformação de dados

Ciência de dados com seus dados de banco de dados espelhados

O Microsoft Fabric oferece Synapse Data Science para capacitar os usuários a concluir fluxos de trabalho de ciência de dados de ponta a ponta com a finalidade de enriquecimento de dados e insights de negócios. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde a exploração, preparação e limpeza de dados até a experimentação, modelagem, pontuação de modelos e fornecimento de insights preditivos para relatórios de BI.

Os usuários do Microsoft Fabric podem acessar cargas de trabalho de Ciência de Dados. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e notebooks de aprendizado de máquina. Eles também podem importar Blocos de Anotações existentes na página inicial de Ciência de Dados.