ragfica.pages.dev

Como remover duplicatas mantendo o CPF mais recente

Remover duplicatas mantendo apenas o registro mais recente é um desafio comum em processamento de dados, especialmente quando se trabalha com cadastros que possuem múltiplas entradas para o mesmo CPF. Este método utiliza fórmulas do Excel para identificar e filtrar os registros mais atuais de forma automática e confiável.

Pré-requisitos

Passo 1: Adicionar uma coluna de rank

A primeira etapa é criar uma coluna que classifique cada registro do mesmo CPF pela data, atribuindo "1" ao mais recente. Utilize a função COUNTIFS para contar quantos registros do mesmo CPF têm data maior ou igual à data atual.

=COUNTIFS($A$2:$A$1000, A2, $B$2:$B$1000, ">="&B2)

Esta fórmula deve ser aplicada na nova coluna (por exemplo, coluna C) e copiada para todas as linhas do seu conjunto de dados. Ela conta quantos CPFs iguais ao da linha atual têm data maior ou igual, efetivamente ranqueando do mais recente (1) para o mais antigo.

Com a coluna de rank criada, filtre a tabela para mostrar apenas os registros onde o rank é igual a 1. Isso pode ser feito usando o Filtro do Excel ou uma Tabela Dinâmica.

=FILTRO(A2:D1000, C2:C1000=1)

Se você não tiver o Filtro Dinâmico (disponível no Excel 365), pode usar uma Tabela Dinâmica ou simplesmente aplicar um Filtro Automático na coluna de rank e selecionar apenas o valor "1".

Passo 3: Remover linhas duplicadas

Após filtrar os registros mais recentes, selecione a tabela filtrada, copie e cole como valores em uma nova planilha. Em seguida, use a ferramenta "Remover Duplicatas" do Excel para eliminar quaisquer linhas restantes que possam ter o mesmo CPF (isso é uma etapa de segurança, pois o método anterior já deveria ter resolvido a duplicidade).

Data > Remover Duplicatas

Exemplo Prático

CPF Data Informações Rank
123.456.789-00 01/01/2024 Info A 2
123.456.789-00 15/03/2024 Info B 1
987.654.321-00 10/02/2024 Info C 1
123.456.789-00 20/12/2023 Info D 3

Após aplicar o filtro para Rank = 1, a tabela resultante manterá apenas os registros mais recentes para cada CPF:

CPF Data Informações
123.456.789-00 15/03/2024 Info B
987.654.321-00 10/02/2024 Info C

Conclusão

Com este método, você automatiza a tarefa de remover duplicatas mantendo o CPF mais recente em segundos, evitando erros manuais e garantindo a integridade dos seus dados. A combinação da função COUNTIFS com filtros simples oferece uma solução robusta e de fácil implementação para qualquer conjunto de dados.