TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Posts Tagged ‘banco de dados

Inscreva-se para novo curso online de RAC

O Knight Center for Journalism in the Americas abriu inscrições para mais um curso online de introdução à Reportagem com Auxílio do Computador (RAC). São quatro semanas de ensino à distância, cobrindo quatro grandes tópicos: busca avançada na internet, uso de bases de dados online e offline, planilha eletrônica (Excel) aplicada ao jornalismo e um roteiro para criar o seu próprio banco de dados usando softwares gratuitos. Duas coisas importantes: o curso é grátis e é em português (não tem outro no idioma lusitano).

O curso de RAC à distância tem três grandes vantagens sobre cursos presenciais curtos: 1) você pode fazer o curso na hora que bem entender, inclusive de madrugada (as aulas são em vídeo, powerpoint e texto), 2) você pode praticar o que aprendeu imediatamente fazendo exercícios com correção automática, 3) através dos fóruns online, você tira dúvidas com os instrutores e faz contatos com jornalistas de todo o Brasil (as resposta às perguntas costumam vir em minutos, no máximo em horas).

Picture 37

O Knight Center está encerrando um curso de RAC por estes dias. Participaram intensamente jornalistas profissionais dos Pampas à Amazônia, além de brasileiros radicados nos EUA, Alemanha e Bolívia. Um dos subprodutos do curso foi este banco de dados, elaborado por uma das participantes, com links explicativos sobre dezenas de sites úteis para apurar informações para reportagens.

O Knight Center está baseado na Universidade do Texas, em Austin. É comandado por um veterano jornalista brasileiro, Rosental Calmon Alves (no Twitter, @rosental). O instrutor do curso serei eu, com auxílio da jornalista Vanessa Higgins.

Para se inscrever, preencha este formulário online e torça para ser selecionado para uma das 70 vagas. Para saber mais sobre o Knight Center e sobre o curso, visite a página deles na internet.

Written by Jose Roberto de Toledo

29/08/2009 at 7:16

Links, websites para IPyS Colpin

Websites citados por Lise Olsen (IRE, USA), Giannina Segnini (La Nación, Costa Rica) e José Roberto de Toledo (Abraji, Brasil) en “Qué Hay de Nuevo en la Investigación por Computadora” – IPyS Colpin (Conferencia Latinoamericana de Periodismo de Investigación) – Lima, 18/08/2009:

Sitios útiles y trucos para aprovechar de las técnicas de

Periodismo Asistido por Computadora (PAC)

Lise Olsen, reportera de investigación

The Houston Chronicle

Miembro de la junta directiva de Investigative Reporters and Editors,

(713) 362-7462

lise.olsen@chron.com

Giannina Segnini, Jefa de Redacción

La Nación de Costa Rica

(506) 2247-4265

gsegnini@nacion.com

José Roberto Toledo

ABRAJI y director de Prima Pagina, Brasil

Leia o resto deste post »

Written by Jose Roberto de Toledo

18/08/2009 at 10:25

Jornalismo investigativo sem alarde

Quem não leu deveria ler “Sergio Rosa e o Mundo dos Fundos”, de Consuelo Dieguez, publicada na edição 35 da Piauí (ainda nas bancas; a versão online só está aberta para assinantes). É uma reportagem de fundo (sem trocadilho), disfarçada de perfil “do presidente do maior fundo de pensão da América Latina, Previ, a caixa de previdência dos funcionários do Banco do Brasil, que tem um patrimônio de R$ 121 bilhões”. Através de suas sete páginas é possível compreender quem é quem no grande jogo político-financeiro em curso no Brasil, quais suas conexões e interesses.

É um ótimo resumo para quem passeia distraído pelo noticiário sem se dar conta dos nexos entre siglas e nomes que ocuparam e ocupam tantas manchetes: operações Xeque-mate e Satiagraha, mensalão, Gamecorp, Telemar, Brasil Telecom, Grupo Opportunity, Citi, Telecom Itália, Andrade Gutierrez, PT, PSDB, OSI, CVM, STJ, STF, Polícia Federal, Abin, Vale do Rio Doce, Embraer, Petrobras, CPFL, Brasil Foods, além de dezenas de pessoas que vão do presidente da República a obscuros lobistas, todos atolados nos fundos das relações de poder no Brasil.

download_capa_ago_09_800_600

O melhor: o texto é agradável de ler. Em vez de um relatório esquemático, que seria o maior risco da matéria, o leitor é conduzido pela teia de relações pessoais, societárias e políticas sem fazer esforço. Claro que os experts farão ressalvas. Claro que já houve dezenas de outras matérias que trataram do tema, algumas mais profundamente e no calor dos fatos _notadamente a série de reportagens produzida por Bob Fernandes desde Carta Capital até Terra Magazine ao longo dos últimos 10 ou 12 anos.

O valor maior dessa reportagem disfarçada de perfil é entregar de bandeja ao seu leitor um resumo, um quem-é-quem de uma das disputas mais sintéticas do que é a política e o capitalismo no Brasil, e as transformações por que vem passando nos últimos anos. Aliás, se já não está pensando, Piauí e editora Alvinegra deveriam pensar em lançar em livro os melhores perfis publicados ao longo dos últimos três anos, como os de Dilma Rousseff (por Luiz Maklouf Carvalho), José Dirceu (por Daniela Pinheiro) e Fernando Henrique Cardoso (por João Moreira Salles).

Se você, jornalista, está interessado em montar um banco de dados para ajudá-lo em suas futuras reportagens, catalogar e indexar os nomes e siglas citados no texto escrito por Consuelo Dieguez lhe darão um ótimo começo. Só falta acrescentar CPFs e CNPJs aos personagens.

Written by Jose Roberto de Toledo

11/08/2009 at 15:02

Relações carnais entre bancos de dados

A tendência para os interessados no que os norte-americanos batizaram de database journalism é cruzar intimamente bases de dados públicas e, dessa relação, fazer surgir uma base nova. Os marxistas chamariam isso de síntese dialética digital. Os analistas de sistemas, de bancos de dados relacionais. Um editor de capa do saudoso NP tascaria um “sexo entre bancos de dados”.

Nome à parte, o fato é que não basta mais ao jornalista se acomodar como intermediário da informação. A função de atravessador está com os dias contados, diante da desintermediação entre fonte e público propiciada pelas novas tecnologias. Nenhum jornalista brasileiro chega nem perto do número de seguidores de Mano Menezes no Twitter, por exemplo.

Tampouco bastará limitar-se à publicação de bases de dados públicas, parcialmente ou na íntegra. Há cinco anos, o jornalista Fernando Rodrigues ganhou um merecido Prêmio Esso de Melhor Contribuição à Imprensa por um site chamado “Controle Público”. Ele tornava acessível a qualquer cidadão as declarações de bens dos políticos candidatos, pacientemente coletadas junto aos 27 tribunais regionais eleitorais e depois digitadas. Hoje o site nem existe mais (foi substituído pelo www.politicosdobrasil.com.br), e o próprio TSE se incumbe da tarefa de tornar essas informações públicas.

Resta ao repórter fazer nexos, ligar fatos aparentemente distintos. Uma maneira é cruzar bases de dados com o auxílio de programas de computador. Se as bases são muito grandes (têm muitas linhas e/ou colunas), é necessário um gerenciador de bancos de dados como o FileMaker ou o Access. Através de um campo-chave comum (em geral, um código ou um número, como CPF ou CNPJ), eles são capazes de vincular duas ou mais bases de dados diferentes.

Para bases menores, dá para fazer essa conexão no Excel. Suponha que você queira somar os recursos federais recebidos empreiteira por empreiteira nos últimos cinco anos. O jeito é colocar as tabelas de cada ano, que terão ao menos um campo em comum (o CNPJ), em uma mesma planilha. Depois, classifique a tabela conjunta por esse campo, de modo a agrupar as linhas com o mesmo CNPJ. Isso feito, selecione uma célula da tabela e clique em Dados/Subtotais. Na janela que abrirá, programe para que “a cada mudança na coluna CNPJ”, o Excel use a função “soma” para adicionar um subtotal na coluna “valor”. Aí você pode reclassificar a tabela com os subtotais para fazer o ranking das empreiteiras no período.

Obviamente, essa técnica não se aplica em todas as situações. Mesmo assim, vale a pena experimentar. Ela pode ser útil quando você menos espera. É melhor você já saber do que ficar tateando na hora do fechamento.

Written by Jose Roberto de Toledo

25/07/2009 at 11:02

Pesquise as empresas que têm financiamento do BNDES

O BNDES é o principal braço do governo federal para financiar empresas. Sua mais recente lista de operações mostra que apenas entre abril de 2008 e março passado o banco fechou contratos de financiamento, diretos e indiretos, num total de R$ 48,3 bilhões para grandes companhias. O site da instituição publica, a cada trimestre, um balanço dos últimos 12 meses de operações de financiamento. Mas os arquivos estão em formato PDF e foram divididos por áreas e tipos de operação. Para facilitar, juntei tudo em um só banco de dados. Para pesquisar, clique em “search” e aplique os filtros que quiser nos campos que vão se abrir. Para reordenar a tabela, clique no cabeçalho da coluna pela qual quer fazer a classificação e escolha “sort”.

O jornalisticamente mais interessante é cruzar essa base de dados com outras, como por exemplo, financiadores de campanha, empresas que têm problemas com a Receita Federal, ou mesmo a lista do trabalho escravo do Ministério do Trabalho (já fiz esse cruzamento e não achei nenhuma correspondência). A base de financiados do BNDES também é uma boa fonte de informação sobre CNPJs das principais empresas do país.

A cerca de 15 meses da sucessão presidencial, é por essa época que começam a se formar alianças fundamentais para o destino da eleição. Uma das mais importantes é entre presidenciáveis e grupos econômicos que vão dar o apoio financeiro necessário para sustentar a campanha eleitoral. Alguns setores tendem a apoiar o candidato governista, não por serem politicamente conservadores ou progressistas, mas pelos interesses que têm em jogo. Chamados de heróis pelo presidente Lula, os usineiros parecem tender mais para Dilma do que para Serra. Reclamam da política ambiental do tucano e temem mudanças de rumo na economia. Ajuda também o fato de o setor ter levantado R$ 5,3 bilhões nos últimos 12 meses junto ao BNDES.

MAKING OF

Para montar o banco de dados com as operações do BNDES, copiei e colei no Excel, coluna por coluna, as tabelas que estavam em PDF no site do banco. Com os dados organizados, criei um aplicativo no Zoho Creator colando os dados da tabela de Excel.

Written by Jose Roberto de Toledo

24/07/2009 at 8:25

Pesquise e cruze a lista do trabalho escravo do MTb

Uma boa fonte para investigações é a chamada lista do trabalho escravo, do Ministério do Trabalho. A cada seis meses, a lista é atualizada com pessoas e empresas autuadas por manter trabalhadores em condições análogas ao de escravidão. A última versão saiu esta semana. Para facilitar a vida dos jornalistas, transformei a lista de PDF em um banco de dados consultável, no Zoho. Clique aqui para pesquisar na lista atualizada. Na página que abrir, você poderá:

  • reordenar os nomes por ordem alfabética, data de entrada no cadastro de autuados, número de empregados libertados pela fiscalização do MTb ou pela UF; basta você clicar no cabeçalho da coluna e, colocando o cursor sobre a palavra “sort”, escolher a ordem ascendente ou descendente.
  • filtrar pela data de entrada no cadastro.
  • copiar o CPF/CNPJ da coluna “busca#” e usar esse número para cruzar informações em outras bases de dados, como a de inscritos na dívida da união, tentar obter uma certidão negativa da Receita e por aí vai.

Se preferir, pode consultar a lista original, em PDF, aqui.

Rugendas_-_Chatimens_domestiques

Castigos impostos aos escravos, aos olhos de Rugendas

A lista contém os CPFs e CNPJs, além dos nomes, de pessoas e empresas autuadas pelo Ministério do Trabalho por empregar gente em condições análogas ao trabalho escravo. Data de atualização: 22 de julho de 2009. Segundo o ministério, “a atualização semestral do cadastro consiste basicamente na inclusão de empregadores cujos autos de infração não estejam mais sujeitos aos recursos na esfera administrativa (decisão definitiva, pela subsistência) e da exclusão daqueles que, ao longo de dois anos, contados de sua inclusão no Cadastro, logram êxito em sanar irregularidades identificadas pela inspeção do trabalho e atenderem aos requisitos previstos na Portaria n°. 540 de 15.10.2004.”

Written by Jose Roberto de Toledo

23/07/2009 at 19:56

Se até o Gay Talese faz…

O próximo livro do jornalista Gay Talese será uma reportagem sobre seu próprio casamento. Até aí é apenas inusitado, embora em se tratando do deus vivo do jornalismo literário possamos apostar que valerá a leitura. O jornalista está, provavelmente, usando seu casamento como exemplo para contar a história das transformações das relações pessoais nos EUA no último meio século. Mas isso é tema para críticos. O que justifica a publicação desta história neste blog é o método que Talese está usando para escrever o livro: escrutinando um banco de dados.

gaytalese2

Não é qualquer BD. É o BD que ele montou ao longo dos últimos 50 anos com tudo que diz respeito ao seu casamento: do relato de cada briga ao registro de cada conta de luz, passando pelas experiências extraconjugais de ambas as partes.

Não cabe aqui a polêmica sobre se isso é ou não uma exposição indevida de sua vida privada e da de sua família. Interessa, neste espaço, que Talese tenha se preocupado em guardar todos esses pedacinhos de história de forma a poder recuperá-los depois. Que tenha montado um arquivo de algo tão banal quanto o dia-a-dia da vida de casado. Será que ele já previra, 50 anos atrás, que viria a escrever esse livro-reportagem sobre o próprio casamento? Improvável. Deve ter começado a guardar por não saber prever se um dia poderia usar ou não esse material jornalisticamente. Na dúvida…

historia_4

Isso nos remete a outro jornalista de primeiro time. Elio Gaspari é um aficcionado dos arquivos e bancos de dados. Mantém um apartamento apenas para abrigar o arquivo que herdou do general Golbery do Couto e Silva sobre os atos da ditadura. Além disso, alimenta diariamente dois bancos de dados eletrônicos (ele usa um software chamado FileMaker). Num, põe todas suas entrevistas, conversas em off, leituras de jornais, revistas e de tudo o que achar relevante. Já beira as 100 mil fichas. Noutro está todo o material de sua pesquisa sobre a ditadura militar e que resultou na publicação de quatro livros inescapáveis sobre o tema.

Qual a semelhança entre Talese e Gaspari, afora a profissão e a origem italiana? Ambos sabem e praticam o segredo de uma boa narrativa: os detalhes que conferem precisão, sabor e cheiro à história. Se você não estiver escrevendo ficção, vai precisar de um belo arquivo ao qual recorrer para fornecer esses detalhes. Ele vai propiciar sinapses que sua memória não é capaz de fazer sozinha. Vai ligar pontos que pareciam distantes. Como diria Gisele Bundchen: só tem quem guarda.

Logo, se Gay Talese e Elio Gaspari se preocupam em montar bancos de dados para melhorar seu trabalho, por que raios você acha que não precisa?

Written by Jose Roberto de Toledo

17/07/2009 at 17:19

Publicado em banco de dados

Tagged with ,