Processar dezenas ou centenas de arquivos CSV manualmente é uma tarefa tediosa e propensa a erros. Automatizar a remoção do cabeçalho com um script Python é a solução mais rápida, precisa e escalável para manter a consistência dos seus dados.
O script abaixo lê todos os arquivos CSV de uma pasta, remove a primeira linha (cabeçalho) e salva os arquivos processados em uma nova pasta chamada 'output'.
import os
import glob
import csv
# Cria a pasta de saída se não existir
os.makedirs('output', exist_ok=True)
# Itera sobre todos os arquivos CSV na pasta atual
for file_path in glob.glob('*.csv'):
with open(file_path, 'r', newline='', encoding='utf-8') as f:
reader = csv.reader(f)
rows = list(reader)
# Remove o cabeçalho (primeira linha)
if rows:
data_without_header = rows[1:]
# Salva o novo arquivo sem cabeçalho
output_path = os.path.join('output', file_path)
with open(output_path, 'w', newline='', encoding='utf-8') as f:
writer = csv.writer(f)
writer.writerows(data_without_header)
print("Processamento concluído! Arquivos salvos na pasta 'output'.")
Abra o terminal, navegue até a pasta onde estão os arquivos CSV e execute o comando abaixo. O script processará todos os arquivos da pasta e criará uma nova pasta 'output' com os arquivos sem cabeçalho.
python remover_cabecalho.py
Veja como os dados são transformados pelo script:
| Arquivo Original (input.csv) | Arquivo Processado (output/input.csv) |
|---|---|
Nome,Idade,Cidade |
João Silva,30,São Paulo |
João Silva,30,São Paulo |
Ana Costa,25,Rio de Janeiro |
Ana Costa,25,Rio de Janeiro |
Com este script Python, você remove cabeçalhos de centenas de arquivos CSV em segundos, garantindo precisão e economizando horas de trabalho manual.