TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Arquivo para julho 22nd, 2009

Como converter uma tabela de PDF para Excel

Esta é clássica: você está navegando pela internet e encontra uma tabela enorme, que pode render matéria, mas ela está em formato PDF (Adobe Acrobat), ou seja, um formato fechado, que não permite edição e é difícil de transformar para outros formatos. Mas você precisa converter a tabela de modo a poder analisar seu conteúdo com auxílio de uma planilha eletrônica ou de um banco de dados. Aí vem a pergunta que não quer calar: como transformar uma tabela de PDF para Excel? Há várias respostas possíveis, nenhuma totalmente satisfatória. Praticamente, cada um tem seu jeito de fazer isso. Eis o meu:

Normalmente, as marcações do PDF impedem que que você simplesmente selecione o conteúdo do PDF, copie e cole (ctrl A + ctrl C + ctrl V) no Excel (ou em outra planilha eletrônica). A planilha não reconhece corretamente as tabulações e acaba quebrando as linhas no lugar errado, além de juntar células que deveriam estar separadas. Dá mais trabalho para arrumar do que para digitar o conteúdo.

Uma saída é recorrer a sites que fazem a conversão do formato PDF para outros formatos. O problema é que nem sempre essas conversões saem como a encomenda. Muitas delas ficam no meio do caminho entre o desastre completo e o meia-boca. É preciso testar caso a caso e ver se vale a pena usar a versão convertida. O PDF Online converte o PDF em um arquivo de formato RTF (texto formatado). Daí você tem que abri-lo em um editor de texto, selecionar o conteúdo, copiar e colar no Excel. Às vezes funciona, às vezes não. Já o PDF to Excel promete converter tudo direitinho, mantendo até o “look and feel” das tabelas. Na prática, você vai entender porque o site ainda mantém a palavra Beta ao lado do nome. Pior, eles prometem mandar o resultado da conversão por e-mail. Conto como ficou meu último teste de conversão quando ele chegar…

Resta então o bom e velho trabalho braçal. O jeito menos difícil é apertar a tecla “alt” (no mac, use tecla maçã) ao clicar para selecionar o conteúdo da tabela PDF. Isso vai permitir que você selecione as colunas uma a uma, em vez das linhas. Daí você copia e cola, coluna por coluna, no Excel. Funciona direitinho, mas é demorado. Especialmente porque só dá para selecionar o conteúdo da coluna de uma página de cada vez. Se você estiver convertendo uma tabela com 10 colunas e 10 páginas, vai ter que repetir a operação 100 vezes.

Tem uma dica melhor? Por favor, conte-nos, deixando um comentário.

Escrito por Jose Roberto de Toledo

22/07/2009 em 19:47

Publicado em Reportagem com Auxílio do Computador

Etiquetado com ,

Para achar os funcionários públicos federais em cargos de confiança

Dica para facilitar a vida de quem busca funcionários públicos do Executivo federal via Siorg (Sistema de Informações Organizacionais do Governo Federal), mesmo sem saber o nome do ocupante do cargo:

1) Na página do Siorg, clique em Titular/cargo
2) Na página que abrir, deixe o campo “titular” em branco
3) No campo “Cargo”, selecione uma função, como, por exemplo, “ministro de estado”
4) clique em “Consulta órgãos”

Não posso garantir que os resultados (organizados em páginas) trarão todos os ocupantes daquele cargo no governo federal, mas mostrarão um bom número deles.

Outra possibilidade é baixar a lista (aparentemente) completa” do funcionalismo, embora de modo bem trabalhoso:
1) Na página do Siorg, clique em Titular/cargo
2) Na página que abrir, deixe o campo “titular” em branco
3) Deixe o campo “Cargo” também em branco (não é para selecionar “Todos”, mas deixar em branco mesmo)
4) clique em “Consulta órgãos”

O resultado trará 1.542 páginas. Curiosamente, o primeiro funcionário que aparece não é Lula, mas o ministro Jorge Felix, do Gabinete de Segurança Institucional da PR.

Se você tem um interesse específico, como descobrir o telefone de um ministro ou do presidente, vá em Titular/Cargo e escreva, por exemplo, “Lula”, antes de clicar em pesquisar. Na página de resultado, clique no nome do presidente e, sem seguida, em “endereço”. O resultado será a tela abaixo.

Picture 25

Escrito por Jose Roberto de Toledo

22/07/2009 em 13:16

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.