TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Como converter uma tabela de PDF para Excel

Esta é clássica: você está navegando pela internet e encontra uma tabela enorme, que pode render matéria, mas ela está em formato PDF (Adobe Acrobat), ou seja, um formato fechado, que não permite edição e é difícil de transformar para outros formatos. Mas você precisa converter a tabela de modo a poder analisar seu conteúdo com auxílio de uma planilha eletrônica ou de um banco de dados. Aí vem a pergunta que não quer calar: como transformar uma tabela de PDF para Excel? Há várias respostas possíveis, nenhuma totalmente satisfatória. Praticamente, cada um tem seu jeito de fazer isso. Eis o meu:

Normalmente, as marcações do PDF impedem que que você simplesmente selecione o conteúdo do PDF, copie e cole (ctrl A + ctrl C + ctrl V) no Excel (ou em outra planilha eletrônica). A planilha não reconhece corretamente as tabulações e acaba quebrando as linhas no lugar errado, além de juntar células que deveriam estar separadas. Dá mais trabalho para arrumar do que para digitar o conteúdo.

Uma saída é recorrer a sites que fazem a conversão do formato PDF para outros formatos. O problema é que nem sempre essas conversões saem como a encomenda. Muitas delas ficam no meio do caminho entre o desastre completo e o meia-boca. É preciso testar caso a caso e ver se vale a pena usar a versão convertida. O PDF Online converte o PDF em um arquivo de formato RTF (texto formatado). Daí você tem que abri-lo em um editor de texto, selecionar o conteúdo, copiar e colar no Excel. Às vezes funciona, às vezes não. Já o PDF to Excel promete converter tudo direitinho, mantendo até o “look and feel” das tabelas. Na prática, você vai entender porque o site ainda mantém a palavra Beta ao lado do nome. Pior, eles prometem mandar o resultado da conversão por e-mail. Conto como ficou meu último teste de conversão quando ele chegar…

Resta então o bom e velho trabalho braçal. O jeito menos difícil é apertar a tecla “alt” (no mac, use tecla maçã) ao clicar para selecionar o conteúdo da tabela PDF. Isso vai permitir que você selecione as colunas uma a uma, em vez das linhas. Daí você copia e cola, coluna por coluna, no Excel. Funciona direitinho, mas é demorado. Especialmente porque só dá para selecionar o conteúdo da coluna de uma página de cada vez. Se você estiver convertendo uma tabela com 10 colunas e 10 páginas, vai ter que repetir a operação 100 vezes.

Tem uma dica melhor? Por favor, conte-nos, deixando um comentário.

About these ads

Written by Jose Roberto de Toledo

22/07/2009 at 19:47

Publicado em Reportagem com Auxílio do Computador

Tagged with ,

2 Respostas

Subscribe to comments with RSS.

  1. O PDF Converter (http://www.freepdfconvert.com) costuma funcionar quando o arquivo não tem muitas páginas.

    Felipe

    24/07/2009 at 21:26

  2. Tente este: Portable PdfGrabber 4.0. Na maior parte dos casos, funciona.

    Buscando no Google há várias fontes de download. Algumas estão contaminadas com vírus…

    Até mais,

    André Braga

    22/07/2009 at 19:59


Os comentários estão desativados.

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.

Junte-se a 51 outros seguidores

%d blogueiros gostam disto: