Usar o Azure Synapse Analytics com análises em escala de nuvem

Artigo
10/07/2023

O Azure Synapse Analytics é o serviço de análise integrado e provisionado que acelera o tempo de insight em armazéns de dados e sistemas de big data. O Azure Synapse Analytics reúne:

As melhores tecnologias SQL usadas no armazenamento de dados corporativo.
Tecnologias Spark usadas para big data.
Pipelines para aplicação de dados (alinhado à fonte) e extrair, transformar e carregar (ETL) ou extrair, carregar e transformar (ELT).

O Azure Synapse studio é uma ferramenta no Azure Synapse que fornece uma experiência unificada para gerenciamento, monitoramento, codificação e segurança. O Synapse studio tem integração profunda com outros serviços do Azure, como Power BI, Azure Cosmos DB e Azure Machine Learning.

Nota

Esta seção tem como objetivo descrever as configurações prescritas que são específicas para análises em escala de nuvem. É um elogio à documentação oficial do Azure Synapse Analytics.

Descrição geral

Durante a configuração inicial de uma zona de aterrissagem de dados, você pode implantar um único espaço de trabalho do Azure Synapse Analytics para uso por todos os analistas e cientistas de dados. Você pode criar mais espaços de trabalho para integrações de dados ou produtos de dados específicos.

Você pode precisar de espaços de trabalho adicionais do Azure Synapse Analytics se seu produto de dados precisar fornecer acesso aos dados padronizados com segurança em nível de linha e coluna. Você pode fornecer esses espaços de trabalho com pools do Azure Synapse. As equipes de produtos de dados podem precisar de seu próprio espaço de trabalho para criar produtos de dados e um espaço de trabalho separado que é apenas para equipes de produto com acesso de desenvolvimento com escopo.

Configuração do Azure Synapse Analytics

A primeira etapa na implantação do Azure Synapse Analytics é configurar um espaço de trabalho do Azure Synapse que esteja conectado a uma conta do Azure Purview.

Rede do Azure Synapse Analytics

Uma zona de aterrissagem de dados cria espaços de trabalho com uma rede virtual gerenciada pelo Azure Synapse Analytics. A comunicação com o Azure Synapse acontece por meio dos três pontos de extremidade expostos: pool SQL, SQL sob demanda e o ponto de extremidade de desenvolvimento.

No nível da rede, a análise em escala de nuvem usa pontos de extremidade privados gerenciados pela sinapse. Esses pontos de extremidade garantem que todo o tráfego entre a rede virtual da zona de aterrissagem de dados e os espaços de trabalho do Azure Synapse seja movido inteiramente pela rede de backbone da Microsoft.

Controle de acesso a dados do Azure Synapse

Use listas de controle de acesso com a passagem do Microsoft Entra no Azure Synapse Analytics para gerenciar o acesso aos arquivos no data lake.

Para dados em que você precisa restringir colunas e linhas retornadas, recomendamos a segurança em nível de linha e coluna para restringir o acesso a dados nas tabelas no pool dedicado ou sem servidor do Azure Synapse SQL. A segurança em nível de linha e a segurança em nível de coluna são implementadas no nível do banco de dados e além das funções do banco de dados.

Por exemplo, a segurança em nível de linha garante que os usuários em um aplicativo de dados específico (alinhado à fonte) ou produto de dados vejam apenas seus próprios dados. Mesmo que a tabela contenha dados para toda a empresa.

Você pode combinar segurança em nível de linha com segurança em nível de coluna para restringir o acesso a colunas com dados confidenciais. Dessa forma, a segurança em nível de linha e a segurança em nível de coluna aplicam a lógica de restrição de acesso na camada de banco de dados em vez da camada de aplicativo. A permissão é avaliada sempre que o acesso aos dados é tentado a partir de qualquer camada.

Nota

O pool SQL sem servidor do Azure Synapse dá suporte à segurança em nível de coluna para modos de exibição e não para tabelas externas. No caso de tabelas externas, pode-se criar uma visualização lógica em cima da tabela externa e aplicar segurança em nível de coluna. No caso de segurança em nível de linha, modos de exibição personalizados podem ser usados como uma solução alternativa.

Para obter mais informações, consulte Controle de acesso a dados do Azure Synapse Analytics.

Controle de acesso a dados do Azure Synapse no Azure Data Lake

Ao implantar um espaço de trabalho do Azure Synapse Analytics, você precisa de uma conta do Armazenamento do Azure Data Lake da assinatura ou usando manualmente a URL da conta de armazenamento. A conta de armazenamento especificada é definida como principal para o espaço de trabalho implantado do Azure Synapse armazenar seus dados. O Azure Synapse armazena dados em um contêiner que inclui tabelas do Apache Spark e logs de aplicativos do Spark em uma pasta chamada /synapse/{workspaceName}. Ele também tem um contêiner para gerenciar quaisquer bibliotecas que você optar por instalar.

Gorjeta

Recomendamos o uso de um contêiner dedicado na camada de desenvolvimento ou na conta do data lake três . Esse contêiner é usado como armazenamento principal para armazenar metadados do Spark.

Consulte o controle de acesso a dados do Azure Synapse Analytics para obter recomendações sobre como configurar o acesso a dados.

Próximos passos

Lista de verificação de preparação do Azure Purview para análise em escala de nuvem

Partilhar via