TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Posts Tagged ‘busca avançada

PAUTA: São Paulo perde migrantes e Salvador ganha

A Grande São Paulo perdeu seu poder de atração de imigrantes de outros estados do país. Há menos moradores não-paulistas vivendo na Grande São Paulo hoje do que no início da década. Entre 2001 e o ano passado, a redução foi de 9,4%. Mesmo assim, 3 em cada 10 habitantes dos 39 municípios da Região Metropolitana de São Paulo nasceram em outros estados.

A tendência de regressão da migração é nacional, mas mais forte nas metrópoles. Em todo o país, cerca de 16% dos brasileiros não moram na mesma cidade em que nasceram, um decréscimo de 2,3% em comparação a sete anos antes. Outras regiões metropolitanas experimentaram refluxos ainda mais dramáticos de migrantes, como Belém e Recife.

Ao mesmo tempo, as grandes Salvador, Fortaleza e Porto Alegre assistiram a um crescimento significativo dos migrantes de outros estados 15%, 11% e 8%, respectivamente.

Uma boa história a ser contada é identificar quem está deixando de migrar (ou está voltando para seus estados natais), por quais motivos, se está fazendo isso sozinho ou com a família, se são empregados ou desempregados, se os programas de transferência de renda têm papel nesse fenômeno. É possível responder a essas questões entrevistando especialistas e, principalmente, os dados da PNAD 2008.

O melhor lugar para pesquisar é no SIDRA, do IBGE, principalmente nas tabelas 355, 1840, 1850, 1854 e 2857. Pela tabela dá para saber quantos mineiros moram no Amapá, ou quantos gaúchos vivem no Ceará (e ver quais contingentes estão aumentando e quais estão diminuindo).

View this document on Scribd

Written by Jose Roberto de Toledo

18/09/2009 at 22:45

Saiba como escarafunchar os dados da PNAD 2008

Como você sabe, saíram os dados da PNAD 2008. Quem estiver com pressa ou preguiça, pode ficar apenas no release do IBGE, que é sempre amplo. Quem quiser ir mais fundo e escavar suas próprias pautas, pode, depois de ler o release, ir à página da PNAD no site SIDRA, também do IBGE. Lá, além dos dados de 2008, é possível consultar a série histórica desde 2001 para alguns indicadores e aplicar filtros.

A PNAD é, depois do Censo, a pesquisa mais importante feita pelo IBGE. Embora não chegue ao nível municipal, é o mais amplo e diversificado panorama socioeconômico do Brasil. Para os jornalistas, é uma mina de reportagens à procura de bons garimpeiros. Mas achar ouro requer tempo e energia. Por isso, é importante entrevistar os dados, exportando as tabulações do site para uma planilha eletrônica tipo Excel. E lá, usar o beabá da estatística descritiva para extrair manchetes.

Por exemplo, jornalistas de veículos regionais podem calcular as taxas de desemprego (o mais correto é chamar de taxa de desocupação, mas o leitor não merece) para seus estados e regiões metropolitanas. Vai dar um pouco de trabalho, mas é um ótimo exercício de RAC.

Começa-se montando uma tabela da População Economicamente Ativa (PEA) por UF aqui (tabela 1864) . Selecione, pela ordem: 1) Pessoas de 10 anos ou mais de idade, 2) Economicamente Ativa, 3) 2001 a 2008 (usando a tecla shift para selecionar mais de um ano), que devem ficar nas colunas, 4) Unidade da Federação: Tudo (devem ficar nas linhas). Deixe o resto como está e peça para visualizar o resultado, ou gere um arquivo em formato .CSV para abrir direto no Excel.

O passo seguinte é montar uma tabela igual, mas apenas com a população ocupada, aqui (tabela 1868). Selecione, pela ordem: 1) Pessoas de 10 anos ou mais de idade que procuraram trabalho na semana de referência, 2) Condição de ocupação: Desocupadas, 3) 2001 a 2008 (usando a tecla shift para selecionar mais de um ano), que devem ficar nas colunas, 4) Unidade da Federação: Tudo (devem ficar nas linhas). Deixe o resto como está e peça para visualizar o resultado, ou gere um arquivo em formato .CSV para abrir direto no Excel.

No Excel, coloque ambas as tabelas em uma mesma aba de um mesmo arquivo e renomeie-a como “original”, para saber que esses são os dados como você os copiou e antes de manipulá-los. Crie uma cópia dessa aba, e batize-a de “trabalho”. É nela que você vai fazer os cálculos.

Para nossa matéria, vamos comparar os dados de três anos: 2002, 2007 e 2008. Por que? 2002 foi o último ano do governo FHC, 2007 é o ano de referência mais próximo e 2008 reflete a situação pré-crise financeira. O primeiro passo é ocultar as colunas dos demais anos na planilha “trabalho” (clique com o botão da direita do mouse sobre o nome da coluna [A, C…] e marque “ocultar”).

Insira duas colunas em branco, uma entre 2002 e 2007 e outra entre 2007 e 2008. No cabeçalho dessas colunas em branco escreva “taxa 2002”, “taxa 2007” e “taxa 2008”, respectivamente. Na célula imediatamente abaixo, correspondente à linha “Brasil”, você vai escrever a fórmula de cálculo da taxa de desocupação:

=Cx/Cy, onde “Cx” corresponde à célula onde está o número de brasileiros desocupados que procuraram emprego em 2002 e “Cy” corresponde à célula onde está o número da PEA do Brasil em 2002.

Aperte “enter” no teclado e transforme a célula em porcentagem (clique com o botão da direita e escolha Formatar Célula). O resultado tem que dar 9,2%. Copie e cole a fórmula nas células abaixo para descobrir as taxas das UFs. Repita a operação com as colunas de 2007 e 2008.

Se analisar os resultados corretamente, descobrirá que as taxas de desemprego podem ser mais de três vezes maiores em certos Estados do que em outros, que enquanto em algumas UFs o desemprego caiu 41% de 2007 para 2008, em outras a taxa aumentou 39%, que Lula vai bater bumbo dizendo que reduziu em mais de 20% a taxa de desemprego que recebeu de FHC (cuidado aí, porque os efeitos da crise só aparecerão na PNAD 2009, se houver).

Abaixo, as tabelas elaboradas ao longo deste exercício; se quiser os resultados, vá à pág. 9:

View this document on Scribd

Isso é só um exemplo das centenas de matérias que podem ser feitas escarafunchando os dados da PNAD 2008. Pegue seus equipamentos e comece a cavoucar.

Written by Jose Roberto de Toledo

18/09/2009 at 16:07

Inscreva-se para novo curso online de RAC

O Knight Center for Journalism in the Americas abriu inscrições para mais um curso online de introdução à Reportagem com Auxílio do Computador (RAC). São quatro semanas de ensino à distância, cobrindo quatro grandes tópicos: busca avançada na internet, uso de bases de dados online e offline, planilha eletrônica (Excel) aplicada ao jornalismo e um roteiro para criar o seu próprio banco de dados usando softwares gratuitos. Duas coisas importantes: o curso é grátis e é em português (não tem outro no idioma lusitano).

O curso de RAC à distância tem três grandes vantagens sobre cursos presenciais curtos: 1) você pode fazer o curso na hora que bem entender, inclusive de madrugada (as aulas são em vídeo, powerpoint e texto), 2) você pode praticar o que aprendeu imediatamente fazendo exercícios com correção automática, 3) através dos fóruns online, você tira dúvidas com os instrutores e faz contatos com jornalistas de todo o Brasil (as resposta às perguntas costumam vir em minutos, no máximo em horas).

Picture 37

O Knight Center está encerrando um curso de RAC por estes dias. Participaram intensamente jornalistas profissionais dos Pampas à Amazônia, além de brasileiros radicados nos EUA, Alemanha e Bolívia. Um dos subprodutos do curso foi este banco de dados, elaborado por uma das participantes, com links explicativos sobre dezenas de sites úteis para apurar informações para reportagens.

O Knight Center está baseado na Universidade do Texas, em Austin. É comandado por um veterano jornalista brasileiro, Rosental Calmon Alves (no Twitter, @rosental). O instrutor do curso serei eu, com auxílio da jornalista Vanessa Higgins.

Para se inscrever, preencha este formulário online e torça para ser selecionado para uma das 70 vagas. Para saber mais sobre o Knight Center e sobre o curso, visite a página deles na internet.

Written by Jose Roberto de Toledo

29/08/2009 at 7:16

Links, websites para IPyS Colpin

Websites citados por Lise Olsen (IRE, USA), Giannina Segnini (La Nación, Costa Rica) e José Roberto de Toledo (Abraji, Brasil) en “Qué Hay de Nuevo en la Investigación por Computadora” – IPyS Colpin (Conferencia Latinoamericana de Periodismo de Investigación) – Lima, 18/08/2009:

Sitios útiles y trucos para aprovechar de las técnicas de

Periodismo Asistido por Computadora (PAC)

Lise Olsen, reportera de investigación

The Houston Chronicle

Miembro de la junta directiva de Investigative Reporters and Editors,

(713) 362-7462

lise.olsen@chron.com

Giannina Segnini, Jefa de Redacción

La Nación de Costa Rica

(506) 2247-4265

gsegnini@nacion.com

José Roberto Toledo

ABRAJI y director de Prima Pagina, Brasil

Leia o resto deste post »

Written by Jose Roberto de Toledo

18/08/2009 at 10:25

Para armazenar páginas da web

Às vezes você quer guardar uma página da web para colocar num PowerPoint ou para consultar depois, offline. Ou você tem um blog e quer fazer um arquivo de todo o seu conteúdo, mas mantendo a cara do site. Os usos e situações podem variar, mas é bom saber que há uma maneira fácil e eficiente de transformar uma página de web em PDF: http://html-pdf-converter.com/. A dica é do Alon Feuerweker, que usou a ferramenta para PDFar todo o seu BlogdoAlon.

Written by Jose Roberto de Toledo

14/08/2009 at 21:13

Publicado em Jornalismo Investigativo

Tagged with ,

Dez perguntas sobre RAC para Lise Olsen, diretora do IRE (EUA)

“O Brasil é um dos países líderes em jornalismo investigativo no mundo”. A frase seria cabotina se dita por um brasileiro. Mas quem a formulou tem experiência e conhecimento sobre o assunto -o que só aumenta a importância da declaração.

LISE OLSEN_IRE_H CHRONICLE

Integrante do conselho diretor do Investigative Reporters and Editors (IRE), a Abraji dos EUA (eia pretensão), Lise Olsen é repórter investigativa do Houston Chronicle, um dos maiores jornais dos EUA. Lise teve um papel fundamental na disseminação das técnicas de Reportagem com Auxílio do Computador (RAC) na América Latina. Esteve à frente do IRE do México entre 1996 e 1998 e deu cursos de RAC em mais de uma dezena de países, inclusive o Brasil, ainda na segunda metade dos anos 90.

Por causa de seu pioneirismo no RAC brasileiro nasceu a ideia de iniciar por Lise esta que, espero, seja a primeira de uma série de entrevistas com jornalistas que são paradigmas do uso do computador como uma ferramenta de apuração e/ou organização e análise de informações.

1 – Como você começou a trabalhar com RAC e por que?

Lise Olsen – Eu logo fiquei excitada com o poder do uso de documentos para expor segredos e corrupção. Em 1994, eu comecei a aprender RAC depois de perceber que o computador nos permitiria analisar milhares ou mesmo milhões de dados muito mais rapidamente do que resgatando um fichário de cada vez de um arquivo físico. Mas, é claro, eu ainda faça as duas coisas (RAC e pesquisa a arquivos de papel).

2 – Desde que você começou, quais foram as principais mudanças ocorridas nas técnicas de RAC?

Lise – A principal mudança foi a explosão da internet. São tantas bases de dados disponíveis na web hoje me dia que  eu fico surpresa que ainda haja algum repórter que não tenha se dado conta de que é necessário saber técnicas de RAC. Também se tornou muito comum para repórteres que fazem investigações usar planilhas eletrônicas. Nos velhos tempos, apenas os repórteres de economia e negócios sabiam lidar com elas. E hoje todo mundo está “blogando”, e montando bases de dados interativas e mapas, tornando nossas investigações mais interativas e acessíveis para o público do que jamais foram.

3 – Como você se mantém atualizada sobre as novas tendências de RAC?

Lise – Eu frequento as conferências organizadas pelos grupos mais avançados como o IRE, o Knight Center for Journalism in the Americas e, quando tenho sorte, da Abraji (Associação Brasileira de Jornalismo Investigativo) e do IPyS (Instituto Prensa y Sociedad, do Peru) na América do Sul. E frequentemente peço conselhos a amigos que se especializaram em diferentes aspectos do RAC, como pesquisa de notícias, mapeamento, estatística e programação.

Leia o resto deste post »

Written by Jose Roberto de Toledo

14/08/2009 at 4:45

Quem é o aluno e quem é o professor?

Estou lecionando, como diriam meus pais, para um curso on-line de RAC do Knight Center for Journalism in the Americas. Concluímos a segunda semana do curso, e já estou satisfeito, porque aprendi mais com os meus supostos alunos nesse período do que, provavelmente, eles com seu pretenso professor. Compartilho com vocês uma pequena parte dos seus ensinamentos.

Fabiana Uchinaka, repórter do UOL, descobriu um site de consulta a empresas nos EUA que é mais abrangente do que os que eu conhecia: www.corporationwiki.com. É muito fácil de usar: apenas um campo de busca, onde se pode pesquisar pelo nome dos sócios, das empresas e o que mais houver na ficha das corporações. Sua base abrange quase todos os 50 Estados norte-americanos, mais alguns canadenses. A página de resultados mostra o endereço da empresa mapeado pelo Google Maps, nomes dos sócios e um visualizador de relações (mostra as conexões entre pessoas e entre pessoas e empresas). O site também dá links para serviços pagos que aumentam as informações disponíveis sobre aquela pessoa, mas cobram caro por isso.

Mas se você quiser mais detalhes sobre a empresa que está pesquisando, como por exemplo ver os seus documentos de registro em formato PDF, e der sorte de a empresa ter sede na Flórida, o www.sunbiz.org ainda é mais completo.

Rafael Paiva, repórter de O Dia, deu quatro ótimas sugestões de mecanismos de busca alternativos ao Google. Em suas palavras:

http://www.sputtr.com – Índice de buscadores. Muito bom.

http://www.picsearch.com – Busca de fotos com interface mais limpa que a do Google.

http://www.blinkx.com – Busca vídeos nos principais indexadores como Youtube, Google e alguns sites. Bom para pesquisar vídeos.

http://www.pipl.com –  Busca “pessoas” online. A ferramenta fornece perfis encontrados em sites como flicker, Myspace, Amazon, Facebook, Linkedin e Via6. Bom para buscar perfil na web.”

Dos quatro, este último foi o que mais impressionou. O Pipl busca informações sobre pessoas em várias bases públicas predeterminadas, o que limita as opções de pesquisa por um lado, mas otimiza os resultados. Descobrir o que uma pessoa tem em sua wishlist (lista de desejos) na Amazon.com, por exemplo, é um prato cheio para quem está escrevendo um perfil sobre ela. O Pipl mostra.

Written by Jose Roberto de Toledo

05/08/2009 at 3:29