ragfica.pages.dev

Como remover cabeçalho de múltiplos arquivos CSV de uma vez?

Processar dezenas ou centenas de arquivos CSV manualmente é uma tarefa tediosa e propensa a erros. Automatizar a remoção do cabeçalho com um script Python é a solução mais rápida, precisa e escalável para manter a consistência dos seus dados.

Pré-requisitos

Passo 1: Criar o script Python

O script abaixo lê todos os arquivos CSV de uma pasta, remove a primeira linha (cabeçalho) e salva os arquivos processados em uma nova pasta chamada 'output'.

import os
import glob
import csv

# Cria a pasta de saída se não existir
os.makedirs('output', exist_ok=True)

# Itera sobre todos os arquivos CSV na pasta atual
for file_path in glob.glob('*.csv'):
    with open(file_path, 'r', newline='', encoding='utf-8') as f:
        reader = csv.reader(f)
        rows = list(reader)

    # Remove o cabeçalho (primeira linha)
    if rows:
        data_without_header = rows[1:]

        # Salva o novo arquivo sem cabeçalho
        output_path = os.path.join('output', file_path)
        with open(output_path, 'w', newline='', encoding='utf-8') as f:
            writer = csv.writer(f)
            writer.writerows(data_without_header)

print("Processamento concluído! Arquivos salvos na pasta 'output'.")

Passo 2: Executar o script

Abra o terminal, navegue até a pasta onde estão os arquivos CSV e execute o comando abaixo. O script processará todos os arquivos da pasta e criará uma nova pasta 'output' com os arquivos sem cabeçalho.

python remover_cabecalho.py

Exemplo Prático

Veja como os dados são transformados pelo script:

Arquivo Original (input.csv) Arquivo Processado (output/input.csv)
Nome,Idade,Cidade João Silva,30,São Paulo
João Silva,30,São Paulo Ana Costa,25,Rio de Janeiro
Ana Costa,25,Rio de Janeiro

Conclusão

Com este script Python, você remove cabeçalhos de centenas de arquivos CSV em segundos, garantindo precisão e economizando horas de trabalho manual.