Introdução ao Azure Synapse Link para o SQL Server 2022

Este artigo é um guia passo a passo para começar a usar o Azure Synapse Link para SQL Server 2022. Para obter uma visão geral, consulte Azure Synapse Link for SQL Server 2022.

Pré-requisitos

  • Antes de começar, consulte Criar um novo espaço de trabalho do Azure Synapse para obter o Azure Synapse Link for SQL. O tutorial atual é criar o Azure Synapse Link for SQL em uma rede pública. Este artigo pressupõe que você selecionou Desabilitar rede virtual gerenciada e Permitir conexões de todos os endereços IP ao criar um espaço de trabalho do Azure Synapse. Se você quiser configurar o Azure Synapse Link para SQL Server 2022 com segurança de rede, consulte também Configurar o Azure Synapse Link para SQL Server 2022 com segurança de rede.

  • Crie uma conta do Azure Data Lake Storage Gen2, que é diferente da conta criada com o espaço de trabalho do Azure Synapse Analytics. Você usará essa conta como a zona de aterrissagem para preparar os dados enviados pelo SQL Server 2022. Para obter mais informações, consulte Criar uma conta do Azure Data Lake Storage Gen2.

  • Verifique se o banco de dados do SQL Server 2022 tem uma chave mestra criada.

    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<a new password>'
    

Crie seu pool dedicado SQL do Azure Synapse de destino

  1. Abra o Synapse Studio.

  2. Abra o hub Gerenciar , vá para pools SQL e selecione Novo.

    Captura de tela que mostra como criar um novo pool dedicado SQL do Azure Synapse a partir do Synapse Studio.

  3. Insira um nome de pool exclusivo, use as configurações padrão e crie o pool dedicado.

  4. No hub de dados, em Espaço de trabalho, seu novo banco de dados SQL do Azure Synapse deve ser listado em Bancos de dados. No seu novo banco de dados SQL do Azure Synapse, selecione Novo script SQL e, em seguida, selecione Script vazio.

    Captura de tela que mostra como criar um novo script SQL vazio do Synapse Studio.

  5. Para criar a chave mestra para o banco de dados SQL do Azure Synapse de destino, cole o script a seguir e selecione Executar.

    CREATE MASTER KEY
    

Criar um serviço vinculado para seu banco de dados SQL Server 2022 de origem

  1. Selecione o botão Gerenciar hub e, em seguida, selecione Serviços vinculados.

    Vá para serviços vinculados do Synapse Studio.

  2. Pressione Novo, selecione SQL Server e selecione Continuar.

    Captura de tela que mostra como criar um serviço vinculado do SQL Server.

  3. Na caixa Nome, digite o nome do serviço vinculado do SQL Server 2022.

    Captura de tela que mostra onde inserir os nomes do servidor e do banco de dados para se conectar.

    Nota

    Somente o Serviço Vinculado na versão herdada é suportado.

  4. Ao escolher o tempo de execução de integração, selecione seu tempo de execução de integração auto-hospedado. Se o seu espaço de trabalho do Azure Synapse não tiver um tempo de execução de integração auto-hospedado disponível, crie um.

  5. (Opcional) Para criar um tempo de execução de integração auto-hospedado para se conectar ao SQL Server 2022 de origem, faça o seguinte:

    a. Selecione Novo.

    Captura de tela que mostra como criar um novo tempo de execução de integração auto-hospedado.

    b. Selecione Auto-hospedado e, em seguida, selecione Continuar.

    c. Na caixa Nome, digite o nome do tempo de execução de integração auto-hospedado e selecione Criar.

    Captura de tela que mostra onde inserir um nome para o tempo de execução de integração auto-hospedado.

    Um tempo de execução de integração auto-hospedado agora está disponível em seu espaço de trabalho do Azure Synapse.

    d. Siga as instruções para baixar, instalar e usar a chave para registrar seu agente de tempo de execução de integração em sua máquina Windows, que tem acesso direto à sua instância do SQL Server 2022. Para obter mais informações, consulte Criar um tempo de execução de integração auto-hospedado - Azure Data Factory e Azure Synapse.

    Captura de tela que mostra onde baixar, instalar e registrar o tempo de execução da integração.

    e. Selecione Fechar.

    Obtenha o status do tempo de execução da integração.

    f. Vá para a página de monitoramento e verifique se o tempo de execução da integração auto-hospedada está em execução selecionando Atualizar para obter o status mais recente do tempo de execução da integração.

  6. Continue a inserir as informações restantes para seu serviço vinculado, incluindo nome do SQL Server, Nome do banco de dados, Tipo de autenticação, Nome de usuário e Senha para se conectar à sua instância do SQL Server 2022.

    Nota

    Recomendamos que você habilite a criptografia nessa conexão. Para fazer isso, adicione a Encrypt propriedade com um valor de como uma propriedade de true conexão adicional. Também defina a propriedade como ou true false, dependendo da configuração do Trust Server Certificate servidor. Para obter mais informações, consulte Habilitar conexões criptografadas com o mecanismo de banco de dados.

  7. Selecione Testar conexão para garantir que seu tempo de execução de integração auto-hospedado possa acessar sua instância do SQL Server.

  8. Selecione Criar.

    Seu novo serviço vinculado será conectado à instância do SQL Server 2022 disponível em seu espaço de trabalho.

    Captura de tela que mostra onde exibir a conexão de serviço vinculado.

    Nota

    O serviço vinculado que você cria aqui não é dedicado ao Azure Synapse Link for SQL. Ele pode ser usado por qualquer usuário do espaço de trabalho que tenha as permissões apropriadas. Reserve um tempo para entender o escopo dos usuários que podem ter acesso a esse serviço vinculado e suas credenciais. Para obter mais informações sobre permissões nos espaços de trabalho do Azure Synapse, consulte Visão geral do controle de acesso do espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

Criar um serviço vinculado para se conectar à sua zona de aterrissagem no Azure Data Lake Storage Gen2

  1. Vá para sua conta recém-criada do Azure Data Lake Storage Gen2, selecione Controle de Acesso (IAM), selecione Adicionar e selecione Adicionar atribuição de função.

    Captura de tela do painel 'Controle de acesso (IAM)' da conta do Data Lake Storage Gen2.

  2. Selecione Colaborador de Dados de Blob de Armazenamento para a função escolhida, selecione Identidade gerenciada e, em Membros, selecione seu espaço de trabalho Sinapse do Azure. Adicionar essa atribuição de função pode levar alguns minutos.

    Captura de tela que mostra como adicionar uma atribuição de função.

    Nota

    Certifique-se de que concedeu permissões de identidade gerida ao espaço de trabalho do Azure Synapse para a conta de armazenamento do Azure Data Lake Storage Gen2 que é utilizada como zona de aterragem. Para obter mais informações, consulte Conceder permissões a uma identidade gerenciada em um espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

  3. Abra o hub Gerenciar em seu espaço de trabalho do Azure Synapse e vá para Serviços vinculados.

    Captura de tela que mostra como ir para o serviço vinculado.

  4. Selecione Novo e, em seguida, selecione Azure Data Lake Storage Gen2.

  5. Efetue o seguinte procedimento:

    a. Na caixa Nome, digite o nome do serviço vinculado para sua zona de destino.

    b. Em Método de autenticação, insira Identidade gerenciada.

    c. Selecione o nome da conta de armazenamento, que já foi criada.

  6. Selecione Testar Conexão para garantir que você possa acessar sua conta do Azure Data Lake Storage Gen2.

  7. Selecione Criar.

    Seu novo serviço vinculado será conectado à conta do Azure Data Lake Storage Gen2.

    Captura de tela que mostra o novo serviço vinculado ao Azure Data Lake Storage Gen2.

    Nota

    O serviço vinculado que você cria aqui não é dedicado ao Azure Synapse Link for SQL. Ele pode ser usado por qualquer usuário do espaço de trabalho que tenha as permissões apropriadas. Reserve um tempo para entender o escopo dos usuários que podem ter acesso a esse serviço vinculado e suas credenciais. Para obter mais informações sobre permissões nos espaços de trabalho do Azure Synapse, consulte Visão geral do controle de acesso do espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

  1. No Synapse Studio, abra o hub Integrar .

  2. No painel Integrar, selecione o sinal de adição (+) e, em seguida, selecione Ligação à ligação.

    Captura de ecrã que mostra o botão 'Ligação de ligação'.

  3. Insira seu banco de dados de origem:

    a. Para Tipo de origem, selecione SQL Server.

    b, Para seu serviço vinculado de origem, selecione o serviço que se conecta à sua instância do SQL Server 2022.

    c. Para Nomes de tabela, selecione nomes de sua instância do SQL Server a serem replicados para seu pool SQL do Azure Synapse.

    d. Selecione Continuar.

    Captura de tela que mostra onde inserir os detalhes do banco de dados de origem.

  4. Em Synapse SQL Dedicated Pools, selecione um nome de banco de dados de destino.

  5. Selecione Continuar.

  6. Insira as configurações de conexão do link:

    a. Em Nome da conexão do link, digite o nome.

    b. Para Contagem de núcleos para a computação de conexão de link, insira o número de núcleos. Esses núcleos serão usados para a movimentação de dados da origem para o destino. Recomendamos que você comece com um pequeno número e aumente a contagem conforme necessário.

    c. Em Serviço vinculado, selecione o serviço que se conectará à sua zona de destino.

    d. Insira o nome do contêiner do Azure Data Lake Storage Gen2 ou o nome do contêiner/pasta como um caminho de pasta da zona de aterrissagem para preparar os dados. O contêiner deve ser criado primeiro.

    e. Insira seu token de assinatura de acesso compartilhado do Azure Data Lake Storage Gen2. O token é necessário para que o feed de alterações SQL acesse a zona de aterrissagem. Se sua conta do Azure Data Lake Storage Gen2 não tiver um token de assinatura de acesso compartilhado, você poderá criar um selecionando Gerar token.

    f. Selecione OK.

    Captura de tela que mostra onde inserir as configurações de conexão do link.

    Nota

    O número de núcleos selecionados aqui é alocado ao serviço de ingestão para processar o carregamento e as alterações de dados. Eles não afetam a confiruação do pool SQL dedicado de destino. Se não for possível conectar-se à zona de aterrissagem usando o token SAS gerado devido à limitação do seu armazenamento, você pode tentar usar o token SAS de delegação para se conectar à zona de aterrissagem também.

  7. Com a nova conexão do Azure Synapse Link aberta, agora você pode atualizar o nome da tabela de destino, o tipo de distribuição e o tipo de estrutura.

    Nota

    • Considere o uso da tabela de heap para o tipo de estrutura quando seus dados contiverem varchar(max), nvarchar(max) e varbinary(max).
    • Verifique se o esquema em seu pool dedicado SQL do Azure Synapse já foi criado antes de iniciar a conexão de link. O Azure Synapse Link for SQL criará tabelas automaticamente sob seu esquema no pool SQL do Azure Synapse.
  8. Na lista suspensa Ação na tabela de destino existente, escolha a opção mais apropriada para o seu cenário se a tabela já existir no destino.

    • Soltar e recriar tabela: A tabela de destino existente será descartada e recriada.
    • Falha na tabela não vazia: Se a tabela de destino contiver dados, a conexão de link para a tabela determinada falhará.
    • Mesclar com dados existentes: os dados serão mesclados na tabela existente.

    Nota

    Se você quiser mesclar várias fontes no mesmo destino escolhendo "Mesclar com dados existentes", verifique se as fontes contêm dados diferentes para evitar conflitos e resultados inesperados.

  9. Especifique se deseja habilitar a consistência da transação entre tabelas.

    • Quando essa opção está habilitada, uma transação que abrange várias tabelas no banco de dados de origem é sempre replicada para o banco de dados de destino em uma única transação. Isso, no entanto, criará sobrecarga na taxa de transferência geral da replicação.
    • Quando a opção estiver desabilitada, cada tabela replicará as alterações em seu próprio limite de transação para o destino em conexões paralelas, melhorando assim a taxa de transferência geral da replicação.

    Nota

    Quando você quiser habilitar a consistência da transação entre tabelas, verifique também se os níveis de isolamento de transação no pool SQL dedicado do Synapse é READ COMMITTED SNAPSHOT ISOLATION.

  10. Selecione Publicar tudo para salvar a nova conexão de link com o serviço.

Selecione Iniciar e aguarde alguns minutos para que os dados sejam replicados.

Nota

Uma conexão de link será iniciada a partir de uma carga inicial completa do seu banco de dados de origem, seguida por feeds de alteração incrementais por meio do recurso de feed de alterações no SQL Server 2022. Para obter mais informações, consulte Azure Synapse Link for SQL change feed.

Você pode monitorar o status de sua conexão do Azure Synapse Link, ver quais tabelas estão sendo copiadas inicialmente (instantâneo) e ver quais tabelas estão no modo de replicação contínua (replicação).

  1. Vá para o hub Monitor do seu espaço de trabalho do Azure Synapse e selecione Vincular conexões.

  2. Abra a conexão de link iniciada e visualize o status de cada tabela.

  3. Selecione Atualizar na vista de monitorização da sua ligação para observar quaisquer atualizações ao estado.

    Monitore a conexão vinculada.

Consultar os dados replicados

Aguarde alguns minutos e, em seguida, verifique se o banco de dados de destino tem a tabela e os dados esperados. Consulte os dados disponíveis em seu repositório de destino do pool dedicado SQL do Azure Synapse. Agora você também pode explorar as tabelas replicadas em seu pool dedicado SQL do Azure Synapse de destino.

  1. No hub de dados, em Espaço de trabalho, abra o banco de dados de destino.

  2. Em Tabelas, clique com o botão direito do rato numa das tabelas de destino.

  3. Selecione Novo script SQL e, em seguida, selecione As 100 principais linhas.

  4. Execute esta consulta para exibir os dados replicados em seu pool dedicado SQL do Azure Synapse de destino.

  5. Você também pode consultar o banco de dados de destino usando o Microsoft SQL Server Management Studio (SSMS) ou outras ferramentas. Use o ponto de extremidade dedicado SQL para seu espaço de trabalho como o nome do servidor. Este nome é geralmente <workspacename>.sql.azuresynapse.net. Adicione Database=databasename@poolname como um parâmetro de cadeia de conexão extra ao se conectar via SSMS ou outras ferramentas.

Para adicionar ou remover tabelas no Synapse Studio, faça o seguinte:

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação de ligação que pretende editar e, em seguida, abra-a.

  3. Efetue um dos seguintes procedimentos:

    • Para adicionar uma tabela, selecione Nova tabela.
    • Para remover uma tabela, selecione o ícone da lixeira ao lado dela.

    Captura de tela do painel de conexão de link para adicionar ou remover tabelas.

    Nota

    Você pode adicionar ou remover tabelas diretamente quando uma conexão de link estiver em execução.

Para interromper a conexão do Azure Synapse Link no Synapse Studio, faça o seguinte:

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação de ligação que pretende editar e, em seguida, abra-a.

  3. Selecione Parar para interromper a conexão do link e ele interromperá a replicação de seus dados.

    Captura de tela do painel para interromper uma conexão de link.

    Nota

    • Se você reiniciar uma conexão de link depois de interrompê-la, ela será iniciada a partir de uma carga inicial completa do seu banco de dados de origem e feeds de alteração incremental seguirão.
    • Se você escolher "Mesclar com dados existentes" como a ação na tabela de destino existente, quando você parar a conexão de link e reiniciá-la, as exclusões de registro na origem durante esse período não serão excluídas no destino. Nesse caso, para garantir a consistência dos dados, considere usar pausa/retomada em vez de parar/iniciar ou limpar as tabelas de destino antes de reiniciar a conexão de link.

Girar o token de assinatura de acesso compartilhado para a zona de aterrissagem

Um token de assinatura de acesso compartilhado é necessário para que o feed de alterações SQL obtenha acesso à zona de aterrissagem e envie dados por push para lá. Ele tem uma data de validade, então você precisa girar o token antes dessa data. Caso contrário, o Azure Synapse Link não conseguirá replicar os dados da instância do SQL Server para o pool dedicado SQL do Azure Synapse.

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação de ligação que pretende editar e, em seguida, abra-a.

  3. Selecione Girar token.

    Captura de tela que mostra onde girar um token de assinatura de acesso compartilhado.

  4. Para obter o novo token de assinatura de acesso compartilhado, selecione Gerar automaticamente ou Inserir manualmente e, em seguida, selecione OK.

    Captura de tela que mostra como obter um novo token de assinatura de acesso compartilhado.

    Nota

    Se não for possível conectar-se à zona de aterrissagem usando o token SAS gerado devido à limitação do seu armazenamento, você pode tentar usar o token SAS de delegação para se conectar à zona de aterrissagem também.

Próximos passos

Se você estiver usando um banco de dados diferente do SQL Server 2022, consulte: