TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Relações carnais entre bancos de dados

A tendência para os interessados no que os norte-americanos batizaram de database journalism é cruzar intimamente bases de dados públicas e, dessa relação, fazer surgir uma base nova. Os marxistas chamariam isso de síntese dialética digital. Os analistas de sistemas, de bancos de dados relacionais. Um editor de capa do saudoso NP tascaria um “sexo entre bancos de dados”.

Nome à parte, o fato é que não basta mais ao jornalista se acomodar como intermediário da informação. A função de atravessador está com os dias contados, diante da desintermediação entre fonte e público propiciada pelas novas tecnologias. Nenhum jornalista brasileiro chega nem perto do número de seguidores de Mano Menezes no Twitter, por exemplo.

Tampouco bastará limitar-se à publicação de bases de dados públicas, parcialmente ou na íntegra. Há cinco anos, o jornalista Fernando Rodrigues ganhou um merecido Prêmio Esso de Melhor Contribuição à Imprensa por um site chamado “Controle Público”. Ele tornava acessível a qualquer cidadão as declarações de bens dos políticos candidatos, pacientemente coletadas junto aos 27 tribunais regionais eleitorais e depois digitadas. Hoje o site nem existe mais (foi substituído pelo www.politicosdobrasil.com.br), e o próprio TSE se incumbe da tarefa de tornar essas informações públicas.

Resta ao repórter fazer nexos, ligar fatos aparentemente distintos. Uma maneira é cruzar bases de dados com o auxílio de programas de computador. Se as bases são muito grandes (têm muitas linhas e/ou colunas), é necessário um gerenciador de bancos de dados como o FileMaker ou o Access. Através de um campo-chave comum (em geral, um código ou um número, como CPF ou CNPJ), eles são capazes de vincular duas ou mais bases de dados diferentes.

Para bases menores, dá para fazer essa conexão no Excel. Suponha que você queira somar os recursos federais recebidos empreiteira por empreiteira nos últimos cinco anos. O jeito é colocar as tabelas de cada ano, que terão ao menos um campo em comum (o CNPJ), em uma mesma planilha. Depois, classifique a tabela conjunta por esse campo, de modo a agrupar as linhas com o mesmo CNPJ. Isso feito, selecione uma célula da tabela e clique em Dados/Subtotais. Na janela que abrirá, programe para que “a cada mudança na coluna CNPJ”, o Excel use a função “soma” para adicionar um subtotal na coluna “valor”. Aí você pode reclassificar a tabela com os subtotais para fazer o ranking das empreiteiras no período.

Obviamente, essa técnica não se aplica em todas as situações. Mesmo assim, vale a pena experimentar. Ela pode ser útil quando você menos espera. É melhor você já saber do que ficar tateando na hora do fechamento.

Anúncios

Written by Jose Roberto de Toledo

25/07/2009 às 11:02

2 Respostas

Subscribe to comments with RSS.

  1. Caro Toledo,

    Tudo bem? Parabéns pelo blogue. Fiquei convencido a começar a estudar e formar um banco de dados com apenas duas leituras aqui. Obrigado por partilhar. Abraço.

    André Tavares

    28/07/2009 at 11:22

    • Fico feliz.

      zerotoledo

      28/07/2009 at 16:01


Os comentários estão desativados.

%d blogueiros gostam disto: