Link do Azure Synapse para feed de alterações SQL

Aplica-se a: SQL Server 2022 (16.x) Banco de Dados SQL do Azure Azure Synapse Analytics

Este artigo inclui detalhes sobre como funciona o feed de alterações do Link do Azure Synapse para SQL, um novo recurso do SQL Server 2022 (16.x) e do Banco de Dados SQL do Azure.

O QL Server 2022 (16.x) apresenta um novo recurso que permite a conectividade entre tabelas do SQL Server e a plataforma do Microsoft Azure Synapse, chamada Link do Azure Synapse para SQL. O Link do Azure Synapse para o SQL fornece feeds de alteração automática que capturam as alterações no SQL Server e as carregam no Azure Synapse Analytics.

Esse recurso não está disponível no momento para a Instância Gerenciada de SQL do Azure.

Observação

Habilitar o Link do Azure Synapse Analytics para SQL criará um usuário de banco de dados changefeed, um esquema changefeed e várias tabelas dentro do esquema em seu banco de dados de origem changefeed. Não altere nenhum desses objetos – eles são gerenciados pelo sistema.

Zona de destino

Para obter mais informações sobre a zona de destino para o Link do Azure Synapse para SQL Server, consulte Link do Azure Synapse para SQL Server zona de destino.

Embora o Link do Azure Synapse para SQL Server envolva recursos do Azure provisionados pelo usuário, inclusive uma conta de armazenamento do Azure Data Lake Storage (ADLS) Gen2, o Link do Azure Synapse para Banco de Dados SQL do Azure é totalmente gerenciado, incluindo o provisionamento da zona de destino, e usa processos de detecção de alterações semelhantes, conforme descritos neste artigo. Para obter mais informações, consulte Link do Azure Synapse para Banco de Dados SQL do Azure.

Para o SQL Server, o Local de armazenamento do Azure da zona de destino é gerenciado pelo cliente e visível, mas não é recomendado nem tem suporte para consumir ou modificar os arquivos na zona de destino.

Recurso de feed de alterações

Um administrador de SQL Server pode habilitar o Link do Azure Synapse em uma tabela vazia ou que já contenha dados. A tabela de origem deve ter uma chave primária.

Se estiver em uma tabela que já contenha dados, o Link do Azure Synapse propagará a zona de destino com um instantâneo completo inicial da tabela de origem. Quando uma tabela de SQL Server existente que contém dados é adicionada ao Link do Azure Synapse, um instantâneo completo do conjunto inicial de dados é gerado. O arquivo de instantâneo inicial é um arquivo de formato .parquet que é transmitido para a zona de destino no ADLS Gen2.

O Link do Azure Synapse dá suporte ao envio de alterações de tabelas de origem de baixa latência para a zona de destino no Armazenamento do Azure. O feed de alterações usa um arquivo CSV para publicar essas alterações em Azure Synapse. Esse formato tabular se alinha naturalmente à gravação de alterações de dados granulares de linha em uma cadência alta (na ordem dos segundos). A maioria dos arquivos CSV deve ser relativamente pequena.

Captura de alterações

A captura de alterações para o Link do Azure Synapse é semelhante à tecnologia CDA (captura de dados de alterações). A origem de dados de alterações é o log de transações do SQL Server. O feed de alterações lê o log e adiciona informações sobre alterações à zona de destino.

O CDC funciona coletando o log de transações para capturar todas as modificações realizadas em uma ou mais tabelas de origem.

  • No CDA, os dados de alteração são preenchidos internamente em uma tabela de irmãos no banco de dados.
  • No Link do Azure Synapse, os dados são lidos diretamente do log de transações do banco de dados, são armazenados em cache na memória e, eventualmente, são gravados na zona de destino no Armazenamento do Azure.

Se ocorrer uma interrupção de armazenamento, poderá fazer com que a zona de destino fique indisponível, o que bloqueará as publicações para essa zona de destino. Semelhante ao comportamento se o agente de leitor de log do CDA do SQL Server falhar ou não estiver em execução, o log de transações do banco de dados de origem não poderá ser truncado. No caso de uma interrupção prolongada do armazenamento ou de uma alteração na configuração do armazenamento que o torne inacessível, interrompa o Link do Azure Synapse por meio do Synapse Studio.

Suporte de alta disponibilidade

O Link do Azure Synapse para o SQL Server é compatível com grupos de disponibilidade Always On e FCI (instâncias de cluster de failover).

Se um instantâneo inicial estiver em andamento e for interrompido por qualquer motivo, o processo inicial de exportação do instantâneo será reiniciado. Esse será o caso se um SQL Server falhar na FCI ou no grupo de disponibilidade síncrono.

Bancos de dados espelhados do Fabric

O recurso Banco de Dados Espelhado do Fabric usa tecnologia de feed de alterações semelhante ao Link do Azure Synapse e compartilha alguns objetos do sistema. Para saber mais, veja: