TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Archive for the ‘Reportagem com Auxílio do Computador’ Category

Íntegra da pesquisa do Latinobarômetro sobre a imagem dos EUA no Brasil e América Latina

Clique aqui para ver o relatório em formato PDF: Pesquisa_EUA_X_Brasil

Written by Jose Roberto de Toledo

18/03/2011 at 21:11

Dicas de links

Written by Jose Roberto de Toledo

13/12/2010 at 8:31

Como o Google Earth pode ajudar numa cobertura

O Google Eye atualizou as imagens de satélite após o terremoto devastador no Haiti. Com a ajuda do Google Earth, é possível comparar as imagens antes e depois do desastre. O resultado é chocante, pois mostra a extensão do estrago na capital do país. Com apenas um clique, o usuário alterna entre a imagem de como era e o que restou da cidade. Mostra ainda que há bairros muito mais atingidos do que outros.

Para ver, clique aqui para baixar o arquivo. Se já tiver o Google Earth instalado no seu computador, basta dar um duplo clique no arquivo que acaba de baixar que ele vai abrir no programa. Aí, no menu do lado esquerdo você verá um item chamado “Haiti Earthquake”. Se a caixinha ao lado desse nome estiver marcada, você estará vendo as imagens pós-terremoto. Se não, a cena de como era antes do desastre. Use os comandos do programa para dar zoom e aproximar as imagens.

Abaixo, alguns exemplos de antes e depois do terremoto:

1) Área da alfândega de Port-au-Prince

Antes

Depois

2) Área do Palácio Presidencial

Antes

Depois

3) Área da Catedral

Antes

Depois

Written by Jose Roberto de Toledo

14/01/2010 at 19:28

10 anos depois, de volta ao impresso (mas com pé na web)

Envie pelo Twitter

Envie pelo Twitter

 

Comecei hoje a contribuir com o Estadão. Dez anos após deixar a Folha, volto ao jornalismo impresso e diário. Mas mantenho um pé na web, para onde migrei, junto com a torcida do Corinthians, em 2000. A contribuição para o Estadão é temática: escreverei sobre pesquisas e as eleições de 2010, tanto para o jornal de papel quanto para sua versão on-line. O primeiro texto “impresso” é este aqui. Tomando a 99ª pesquisa CNT/Sensus como gancho, analiso o comportamento do eleitorado e as chances dos candidatos.

Durante o período de colaboração para o Estadão, procurarei manter este blog atualizado na medida da minha disponibilidade de tempo. Pretendo não misturar os assuntos. Lá o conteúdo, e aqui, quando for pertinente, o “making of”.

Assim, eis algumas dicas sobre análise de pesquisa eleitoral:

1) Não se perca no mar de números, tente enxergar as grandes tendências. Elas são mais importantes do que as pequenas oscilações.

2) Use sempre a margem de erro, não apenas quando ela lhe convém. É fato: quando somamos a margem de erro de uma pesquisa com a da anterior, raramente há uma oscilação que possa ser considerada estatisticamente significativa. Se a margem for de dois pontos, ela precisa superar quatro pontos para poder se falar em alta ou queda. A margem de erro é proporcional ao tamanho da amostra (mas o tamanho da amostra não é proporcional ao tamanho do universo pesquisado).

3) A terceira dica é para ajudar a cumprir a segunda. Como é difícil haver notícia de uma pesquisa para outra, é mais proveitoso buscar tendências com pelo menos três pontos com a mesma direção na curva. Por exemplo: o candidato A oscila de 10% para 12% e em seguida para 15%, em três pesquisas consecutivas. Apesar de as variações de uma pesquisa para outra terem ocorrido dentro da margem de erro, pode-se falar em uma tendência de crescimento, porque a soma das variações supera a soma da margem de erro (de dois pontos, no caso). Isso só vale se não houver nenhuma variação em sentido oposto entre as pesquisas analisadas.

4) Sempre preste atenção na pesquisa espontânea, principalmente nas fases iniciais da campanha eleitoral. Ela tende a ser mais significativa do que a estimulada quando os percentuais de não sabe/não respondeu/branco/nulo somados superam 50%. É sinal de que o eleitor ainda não está preocupado com o assunto que lhe é proposto pela pesquisa. Nesses casos, as intenções de voto sinalizam mais um recall (memória) do que um propósito firme de sufragar aquele candidato.

5) Compare, tudo e todos: intenção de voto com avaliação do governante, pesquisas diferentes, eleições passadas e presentes, eleitores ricos e pobres, eleitoras e eleitores, jovens e velhos. Procure padrões de comportamento. Eles são mais importantes que as exceções.

6) Sempre leia o questionário original da pesquisa e confira a sequência das perguntas. A ordem das questões altera o produto: após responder a uma questão que obriga-o a emitir um juízo de valor sobre um dos candidatos o eleitor estará propício a manter esse juízo na hora de indicar sua intenção de voto. Se falou mal, dificilmente admitirá a possibilidade de votar nele.

7) Divulgue a metodologia da pesquisa: número de entrevistas, universo a que diz respeito a amostra, margem de erro, universo de confiança, data de campo da pesquisa, quem contratou a pesquisa e tudo o mais que possa influenciar os resultados.

8 ) Não compare diretamente resultados de cenários eleitorais diferentes. Se na pesquisa anterior havia mais candidatos ou eles não eram exatamente os mesmos da pesquisa mais recente, não se pode dizer que um candidato tenha caído ou subido de uma pesquisa para outra. As intenções de voto são sempre relativas, nunca absolutas. Elas dependem de quem está no páreo. Se os cavalos mudam, mudam também os resultados.

9) Lembre-se: enquetes feitas pela internet ou pesquisas feitas pelo telefone no Brasil não representam o total do eleitorado, porque nem todos os eleitores têm acesso a esses meios de comunicação. Além disso, não há controle rígido sobre a amostra de respondentes, e os mais interessados tendem a participar mais, distorcendo o resultado. Amostra boa é uma amostra que represente corretamente o universo pesquisado. Uma amostra estatisticamente controlada com duas mil entrevistas em todo o Brasil vale mais do que uma amostra com 100 mil respostas feita pela internet.

10) Mesmo as pesquisas científicas, baseadas em critérios estatísticos rígidos, estão sujeitas a um certo grau de incerteza e imprecisão. Uma pesquisa com margem de erro máxima de 3 pontos percentuais e intervalo de confiança de 95% indica que em 95 de cada 100 pesquisas feitas, a intenção de voto de um candidato que tem metade do eleitorado ficará entre 47% e 53%. Nas outras cinco, o erro será maior do que esse. Assim sendo, pequenas oscilações só devem ser vistas como sinal de mudança do eleitorado se forem constantes. Tampouco me parece relevante usar casa decimal depois da vírgula para tratar de intenção de voto. No texto do Estadão, arredondei todos os valores divulgados pelo Sensus.

Written by Jose Roberto de Toledo

24/11/2009 at 0:15

Comparado a quê? Eis a questão

Em meio a tantas balas perdidas, o secretário de Segurança Pública fluminense, José Mariano Beltrame, fez um achado: “O Rio de Janeiro não é violento. O Rio de Janeiro tem núcleos de violência. Temos índices de criminalidade em determinadas áreas do Rio de Janeiro que são europeus. O Rio de Janeiro não pode receber um programa que seja o mesmo do Oiapoque ao Chuí (vide o blog Caso de Polícia)”.

Procurando bem, sempre é possível achar uma estatística que prove o que você quer. Afinal, como dizia o outro, “bem torturados, os números revelam qualquer coisa”. O secretário deve estar se referindo aos índices de criminalidade de um bairro da Zona Sul (as tais “determinadas áreas”) e comparando-os ao de um continente, o europeu. É covardia.

Não se deve comparar uma média heterogênea e ampla, como a da Europa, com a de um bairro pequeno e homogêneo, como a Urca. No limite, o raciocínio do secretário vai levá-lo a comparar o nível de criminalidade do Barra Shopping com o de Washington DC e concluir que é muito mais arriscado viver na Casa Branca do que na Rocinha.

Em favor do secretário, diga-se que ele não inventou essa chicana estatística. É muito comum os jornalistas usarmos esse recurso para enfatizar uma diferença e ganhar uma manchete. Você já deve ter lido algum título mais ou menos assim: “Bairro paulistano tem qualidade de vida suíça”. Diferenças climáticas e paisagísticas a parte, qualquer comparação de parte com o todo é uma manipulação. Não fosse assim, os rankings de qualidade de vida, criminalidade, IDH, PIB per capita etc seriam todos uma bagunça, misturando países, cidades, continentes, bairros.

É aceitável referir, em um contexto bem explicado, à semelhança entre os índices de violência de um bairro e os de um país, mas apenas como um parâmetro, para ilustrar se esse número é alto ou baixo, não como uma comparação direta.

Tome-se o caso dos homicídios. O que interessa é saber qual o risco que um morador de determinada área corre de morrer assassinado e compará-lo com o de outras áreas semelhantes. Podem ser bairros versus bairros, distritos versus distritos, cidades versus cidades, ou países versus países. Em todos esses casos, trata-se de um cálculo estimado, baseado em uma média e sujeito a erros.

Tanto menor a margem de erro quanto maior for a homogeneidade do universo em estudo. Se você quiser saber qual o seu risco pessoal de tomar um tiro fatal, divida quantos moradores do seu bairro, sexo e faixa etária foram mortos a bala ao longo de um ano pelo número de moradores desse mesmo bairro que sejam do seu sexo e estejam na sua faixa etária. Se você morar no centro paulistano, na República, terá um risco cerca de 20 vezes  maior de ser assassinado do que ser morar nos Jardins.

O mesmo vale para o Rio. Morar na Barra é mais seguro do que morar no Complexo do Alemão. Mas, na média, o risco de um carioca morrer assassinado é 2,4 vezes maior do que o de um paulistano (2007, Datasus). E nem sempre foi assim: em 2000, na média, um morador do Rio tinha menos chances de ser assassinado do que um morador de São Paulo. Talvez fosse mais seguro se o secretário se ocupasse em explicar essa estatística.

Written by Jose Roberto de Toledo

05/11/2009 at 17:40

PAUTA: São Paulo perde migrantes e Salvador ganha

A Grande São Paulo perdeu seu poder de atração de imigrantes de outros estados do país. Há menos moradores não-paulistas vivendo na Grande São Paulo hoje do que no início da década. Entre 2001 e o ano passado, a redução foi de 9,4%. Mesmo assim, 3 em cada 10 habitantes dos 39 municípios da Região Metropolitana de São Paulo nasceram em outros estados.

A tendência de regressão da migração é nacional, mas mais forte nas metrópoles. Em todo o país, cerca de 16% dos brasileiros não moram na mesma cidade em que nasceram, um decréscimo de 2,3% em comparação a sete anos antes. Outras regiões metropolitanas experimentaram refluxos ainda mais dramáticos de migrantes, como Belém e Recife.

Ao mesmo tempo, as grandes Salvador, Fortaleza e Porto Alegre assistiram a um crescimento significativo dos migrantes de outros estados 15%, 11% e 8%, respectivamente.

Uma boa história a ser contada é identificar quem está deixando de migrar (ou está voltando para seus estados natais), por quais motivos, se está fazendo isso sozinho ou com a família, se são empregados ou desempregados, se os programas de transferência de renda têm papel nesse fenômeno. É possível responder a essas questões entrevistando especialistas e, principalmente, os dados da PNAD 2008.

O melhor lugar para pesquisar é no SIDRA, do IBGE, principalmente nas tabelas 355, 1840, 1850, 1854 e 2857. Pela tabela dá para saber quantos mineiros moram no Amapá, ou quantos gaúchos vivem no Ceará (e ver quais contingentes estão aumentando e quais estão diminuindo).

View this document on Scribd

Written by Jose Roberto de Toledo

18/09/2009 at 22:45

Saiba como escarafunchar os dados da PNAD 2008

Como você sabe, saíram os dados da PNAD 2008. Quem estiver com pressa ou preguiça, pode ficar apenas no release do IBGE, que é sempre amplo. Quem quiser ir mais fundo e escavar suas próprias pautas, pode, depois de ler o release, ir à página da PNAD no site SIDRA, também do IBGE. Lá, além dos dados de 2008, é possível consultar a série histórica desde 2001 para alguns indicadores e aplicar filtros.

A PNAD é, depois do Censo, a pesquisa mais importante feita pelo IBGE. Embora não chegue ao nível municipal, é o mais amplo e diversificado panorama socioeconômico do Brasil. Para os jornalistas, é uma mina de reportagens à procura de bons garimpeiros. Mas achar ouro requer tempo e energia. Por isso, é importante entrevistar os dados, exportando as tabulações do site para uma planilha eletrônica tipo Excel. E lá, usar o beabá da estatística descritiva para extrair manchetes.

Por exemplo, jornalistas de veículos regionais podem calcular as taxas de desemprego (o mais correto é chamar de taxa de desocupação, mas o leitor não merece) para seus estados e regiões metropolitanas. Vai dar um pouco de trabalho, mas é um ótimo exercício de RAC.

Começa-se montando uma tabela da População Economicamente Ativa (PEA) por UF aqui (tabela 1864) . Selecione, pela ordem: 1) Pessoas de 10 anos ou mais de idade, 2) Economicamente Ativa, 3) 2001 a 2008 (usando a tecla shift para selecionar mais de um ano), que devem ficar nas colunas, 4) Unidade da Federação: Tudo (devem ficar nas linhas). Deixe o resto como está e peça para visualizar o resultado, ou gere um arquivo em formato .CSV para abrir direto no Excel.

O passo seguinte é montar uma tabela igual, mas apenas com a população ocupada, aqui (tabela 1868). Selecione, pela ordem: 1) Pessoas de 10 anos ou mais de idade que procuraram trabalho na semana de referência, 2) Condição de ocupação: Desocupadas, 3) 2001 a 2008 (usando a tecla shift para selecionar mais de um ano), que devem ficar nas colunas, 4) Unidade da Federação: Tudo (devem ficar nas linhas). Deixe o resto como está e peça para visualizar o resultado, ou gere um arquivo em formato .CSV para abrir direto no Excel.

No Excel, coloque ambas as tabelas em uma mesma aba de um mesmo arquivo e renomeie-a como “original”, para saber que esses são os dados como você os copiou e antes de manipulá-los. Crie uma cópia dessa aba, e batize-a de “trabalho”. É nela que você vai fazer os cálculos.

Para nossa matéria, vamos comparar os dados de três anos: 2002, 2007 e 2008. Por que? 2002 foi o último ano do governo FHC, 2007 é o ano de referência mais próximo e 2008 reflete a situação pré-crise financeira. O primeiro passo é ocultar as colunas dos demais anos na planilha “trabalho” (clique com o botão da direita do mouse sobre o nome da coluna [A, C…] e marque “ocultar”).

Insira duas colunas em branco, uma entre 2002 e 2007 e outra entre 2007 e 2008. No cabeçalho dessas colunas em branco escreva “taxa 2002”, “taxa 2007” e “taxa 2008”, respectivamente. Na célula imediatamente abaixo, correspondente à linha “Brasil”, você vai escrever a fórmula de cálculo da taxa de desocupação:

=Cx/Cy, onde “Cx” corresponde à célula onde está o número de brasileiros desocupados que procuraram emprego em 2002 e “Cy” corresponde à célula onde está o número da PEA do Brasil em 2002.

Aperte “enter” no teclado e transforme a célula em porcentagem (clique com o botão da direita e escolha Formatar Célula). O resultado tem que dar 9,2%. Copie e cole a fórmula nas células abaixo para descobrir as taxas das UFs. Repita a operação com as colunas de 2007 e 2008.

Se analisar os resultados corretamente, descobrirá que as taxas de desemprego podem ser mais de três vezes maiores em certos Estados do que em outros, que enquanto em algumas UFs o desemprego caiu 41% de 2007 para 2008, em outras a taxa aumentou 39%, que Lula vai bater bumbo dizendo que reduziu em mais de 20% a taxa de desemprego que recebeu de FHC (cuidado aí, porque os efeitos da crise só aparecerão na PNAD 2009, se houver).

Abaixo, as tabelas elaboradas ao longo deste exercício; se quiser os resultados, vá à pág. 9:

View this document on Scribd

Isso é só um exemplo das centenas de matérias que podem ser feitas escarafunchando os dados da PNAD 2008. Pegue seus equipamentos e comece a cavoucar.

Written by Jose Roberto de Toledo

18/09/2009 at 16:07