Trabalhar com valores duplicados

Você pode trabalhar com conjuntos duplicados de valores por meio de transformações que podem remover duplicatas de seus dados. Ou você pode filtrar seus dados para mostrar apenas duplicatas, para que possa se concentrar nelas.

Aviso

O Power Query diferencia maiúsculas de minúsculas. Ao trabalhar com valores duplicados, o Power Query considera o caso do texto, o que pode levar a resultados indesejados. Como solução alternativa, os usuários podem aplicar uma transformação em maiúsculas ou minúsculas antes de remover duplicatas.

Para este artigo, os exemplos usam a tabela a seguir com as colunas ID, Category e Total.

Captura de ecrã da tabela de exemplo inicial que contém as colunas ID, Categoria e Total.

Remover duplicados

Uma das operações que você pode executar é remover valores duplicados da tabela.

  1. Selecione as colunas que contêm valores duplicados.

  2. Vá para a guia Página Inicial .

  3. No grupo Reduzir linhas, selecione Remover linhas.

  4. No menu suspenso, selecione Remover duplicatas.

    Captura de ecrã a mostrar a localização da opção Remover duplicados em Remover linhas.

Aviso

Não há garantia de que a primeira instância de um conjunto de duplicatas será escolhida quando as duplicatas forem removidas. Para saber mais sobre como preservar a classificação, vá para Preservar classificação.

Remover duplicados de várias colunas

Neste exemplo, você deseja identificar e remover as duplicatas usando todas as colunas da tabela.

Captura de tela da tabela inicial com duplicatas em várias colunas enfatizadas.

Você tem quatro linhas que são duplicadas. Seu objetivo é remover essas linhas duplicadas para que haja apenas linhas exclusivas em sua tabela. Selecione todas as colunas da tabela e, em seguida, selecione Remover duplicatas.

O resultado dessa operação dá-lhe a tabela que procura.

Captura de ecrã da tabela final com duplicados removidos de todas as colunas.

Nota

Esta operação também pode ser executada com um subconjunto de colunas.

Remover duplicados de uma única coluna

Neste exemplo, você deseja identificar e remover as duplicatas usando apenas a coluna Categoria da tabela.

Captura de ecrã da tabela inicial que identifica duplicados na coluna Categoria.

Você deseja remover essas duplicatas e manter apenas valores exclusivos. Para remover duplicados da coluna Categoria , selecione-a e, em seguida, selecione Remover duplicatas.

O resultado dessa operação dá-lhe a tabela que procura.

Captura de ecrã da tabela final com duplicados removidos da coluna Categoria.

Manter duplicados

Outra operação que você pode executar com duplicatas é manter apenas as duplicatas encontradas em sua tabela.

  1. Selecione as colunas que contêm valores duplicados.

  2. Vá para a guia Página Inicial .

  3. No grupo Reduzir linhas, selecione Manter linhas.

  4. No menu suspenso, selecione Manter duplicatas.

    Captura de ecrã a mostrar a localização da opção Manter duplicados em Manter linhas.

Manter duplicados de várias colunas

Neste exemplo, você deseja identificar e manter as duplicatas usando todas as colunas da tabela.

Captura de ecrã da tabela inicial para manter duplicados de várias colunas.

Você tem quatro linhas que são duplicadas. Seu objetivo neste exemplo é manter apenas as linhas duplicadas na tabela. Selecione todas as colunas na tabela e, em seguida, selecione Manter duplicados.

O resultado dessa operação dá-lhe a tabela que procura.

Captura de ecrã da tabela final apenas com linhas duplicadas de várias colunas.

Manter duplicados de uma única coluna

Neste exemplo, você deseja identificar e manter as duplicatas usando apenas a coluna id da tabela.

Tabela inicial para manter duplicatas de uma única coluna.

Neste exemplo, você tem várias duplicatas e deseja manter apenas essas duplicatas da tabela. Para manter duplicatas da coluna id , selecione a coluna id e, em seguida, selecione Manter duplicatas.

O resultado dessa operação dá-lhe a tabela que procura.

Tabela final com apenas linhas duplicadas de uma única coluna.

Ferramentas de criação de perfil de dados