Calcular a contagem de blob e o tamanho total por contêiner usando o inventário do Armazenamento do Azure

Este artigo usa o recurso de inventário de Armazenamento de Blobs do Azure e o Azure Synapse para calcular a contagem de blob e o tamanho total de blobs por contêiner. Esses valores são úteis ao otimizar o uso de blob por contêiner.

Pré-requisitos

Nenhuma

Habilitar relatórios de inventário

A primeira etapa desse método é habilitar relatórios de inventário em sua conta de armazenamento. Talvez seja necessário aguardar até 24 horas após habilitar os relatórios de inventário para que seu primeiro relatório seja gerado.

Quando você tiver um relatório de inventário para analisar, conceda a si mesmo acesso de leitura ao contêiner onde o arquivo CSV de relatório reside atribuindo a si mesmo a função de Leitor de Dados de Blob de Armazenamento . Certifique-se de usar o endereço de e-mail da conta que você está usando para executar o relatório. Para saber como atribuir uma função do Azure a um usuário com o controle de acesso baseado em função do Azure (Azure RBAC), siga as instruções fornecidas em Atribuir funções do Azure usando o portal do Azure.

Nota

Para calcular o tamanho do blob a partir do relatório de inventário, certifique-se de incluir o campo Esquema Content-Length na definição da regra.

Criar uma área de trabalho do Azure Synapse

Em seguida, crie um espaço de trabalho do Azure Synapse onde você executará uma consulta SQL para relatar os resultados do inventário.

Criar a consulta SQL

Depois de criar seu espaço de trabalho do Azure Synapse, execute as etapas a seguir.

  1. Navegar para https://web.azuresynapse.net.

  2. Selecione a guia Desenvolver na borda esquerda.

  3. Selecione o sinal de adição grande (+) para adicionar um item.

  4. Selecione Script SQL.

    Captura de tela do script SQL selecionado para criar uma nova consulta.

Executar a consulta SQL

Siga os passos abaixo:

  1. Adicione a seguinte consulta SQL em seu espaço de trabalho do Azure Synapse para ler o arquivo CSV de inventário.

    Para o bulk parâmetro, use a URL do arquivo CSV do relatório de inventário que você deseja analisar.

    SELECT LEFT([Name], CHARINDEX('/', [Name]) - 1) AS Container,
            COUNT(*) As TotalBlobCount,
            SUM([Content-Length]) As TotalBlobSize
    FROM OPENROWSET(
        bulk '<URL to your inventory CSV file>',
        format='csv', parser_version='2.0', header_row=true
    ) AS Source
    GROUP BY LEFT([Name], CHARINDEX('/', [Name]) - 1)
    
  2. Nomeie sua consulta SQL no painel de propriedades à direita.

  3. Publique sua consulta SQL pressionando CTRL+S ou selecionando o botão Publicar tudo .

  4. Selecione o botão Executar para executar a consulta SQL. A contagem de blob e o tamanho total por contêiner são relatados no painel Resultados .

    Captura de tela da saída da execução do script para calcular a contagem de blob e o tamanho total.