Corrigir CEPs com dígitos faltantes pode ser uma tarefa tediosa e propensa a erros quando feita manualmente. Com um script Python, você automatiza o processo de forma rápida e confiável, garantindo que todos os CEPs do seu dataset tenham o formato correto de 8 dígitos.
Para manipular dados e salvar o resultado, precisamos das bibliotecas pandas e numpy.
import pandas as pd
import numpy as np
Carregue seu arquivo CSV ou Excel em um DataFrame do pandas. Ajuste o nome do arquivo e a coluna conforme seu dataset.
df = pd.read_csv('ceps.csv')
# ou para Excel:
# df = pd.read_excel('ceps.xlsx')
Crie uma função que verifica o tamanho do CEP e adiciona zeros à esquerda se necessário, garantindo 8 dígitos.
def corrigir_cep(cep):
cep_str = str(cep).replace('-', '').replace('.', '').strip()
if len(cep_str) < 8:
return cep_str.zfill(8)
return cep_str[:8]
Aplique a função criada à coluna de CEPs do seu DataFrame.
df['CEP_Corrigido'] = df['CEP'].apply(corrigir_cep)
Exporte o DataFrame com os CEPs corrigidos para um novo arquivo CSV ou Excel.
df.to_csv('ceps_corrigidos.csv', index=False)
# ou para Excel:
# df.to_excel('ceps_corrigidos.xlsx', index=False)
Veja como o script transforma CEPs incompletos em formato padrão de 8 dígitos:
| CEP Original | CEP Corrigido |
|---|---|
| 12345 | 00012345 |
| 678 | 00000678 |
| 1234567 | 01234567 |
| 12.345-678 | 12345678 |
Com este script Python, você corrige automaticamente CEPs com dígitos faltantes em segundos, garantindo consistência e precisão nos seus dados. A automação elimina erros manuais e poupa tempo valioso em processos de limpeza de dados.