TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Archive for the ‘Jornalismo Investigativo’ Category

Os números de 2010 – metablog

Os duendes das estatísticas do WordPress.com analisaram o desempenho deste blog em 2010 e apresentam-lhe aqui um resumo de alto nível da saúde do seu blog:

Healthy blog!

O Blog-Health-o-Meter™ indica: Uau.

Números apetitosos

Imagem de destaque

Cerca de 3 milhões de pessoas visitam o Taj Mahal todos os anos. Este blog foi visitado cerca de 39,000 vezes em 2010. Se este blog fosse o Taj Mahal, eram precisos 5 dias para que essas pessoas o visitassem.

Em 2010, escreveu 14 novo artigo, aumentando o arquivo total do seu blog para 76 artigos. Fez upload de 30 imagens, ocupando um total de 23mb. Isso equivale a cerca de 3 imagens por mês.

The busiest day of the year was 12 de abril with 431 views. The most popular post that day was Ferramentas para analisar o discurso de políticos e candidatos.

De onde vieram?

Os sites que mais tráfego lhe enviaram em 2010 foram twitter.com, google.com.br, blogs.estadao.com.br, search.conduit.com e journalismcourses.org

Alguns visitantes vieram dos motores de busca, sobretudo por pesquisa presidencial 2010, corrida presidencial 2010, converter pdf para excel, pnad 2009 e ultima pesquisa presidencial 2010

Atracções em 2010

Estes são os artigos e páginas mais visitados em 2010.

1

Ferramentas para analisar o discurso de políticos e candidatos abril, 2010
9 comentários

2

Gráfico da corrida presidencial – todos os institutos – março 2010 março, 2010
3 comentários

3

Como converter uma tabela de PDF para Excel julho, 2009
2 comentários

4

Gráfico de evolução da intenção de voto para presidente março, 2010

5

Saiba como escarafunchar os dados da PNAD 2008 setembro, 2009
1 comentário

Written by Jose Roberto de Toledo

02/01/2011 at 21:35

Dicas de links

Written by Jose Roberto de Toledo

13/12/2010 at 8:31

O 5º Congresso da Abraji, segundo seus participantes (via Twitter)

Este slideshow necessita de JavaScript.

Written by Jose Roberto de Toledo

01/08/2010 at 16:12

Ferramentas para analisar o discurso de políticos e candidatos

Publiquei nesta segunda no Vox Publica uma comparação quantitativa dos discursos de José Serra e Dilma Rousseff ao se lançarem pré-candidatos à sucessão presidencial. Se quiser saber como esse material foi produzido, siga os passos:

1) obtenha as íntegras escritas dos discursos a serem analisados

2) instale um programa contador de palavras no seu computador. Se usar Mac, sugiro o Word Counter

3) jogue os discursos no contador de palavras e peça para ele fazer as seguintes coisas, separadamente para cada discurso: contá-las, produzir uma tabela de frequência de palavras e gerar um quadro estatístico de legibilidade

4) copie a tabela de frequência dos dois discursos e cole no Excel, um embaixo do outro

5) crie uma nova coluna no Excel (nomeie-a “candidatos”) e preencha-a em todas as linhas onde houver palavras com o nome do candidato que as disse

6) para compatibilizar as mesmas palavras ditas por Serra e Dilma, lado a lado, selecione toda a tabela, clique em “Dados/Tabela dinâmica” no menu superior do Excel

7) siga os passos e crie uma tabela dinâmica com “palavras” nas linhas, “candidatos” nas colunas e a soma das vezes que as palavras foram citadas no conteúdo

8 ) copie as colunas “palavras”, “Serra” e “Dilma” da tabela dinâmica para uma outra planilha do Excel

9) crie novas colunas que vão ajudá-lo a filtrar as palavras (são milhares): tamanho (use a função NÚM.CARACT [LEN, em inglês] para contar quantos caracteres tem cada palavra), verbos, substantivos etc

10) filtre e classifique a tabela segundo o que você quer descobrir: quais palavras cada candidato falou mais, quais as formas pronominais que mais empregaram, os verbos etc

11) copie e cole o produto de suas filtragens em outra planilha, criando assim pequenas tabelas sintéticas com suas conclusões

12) transforme as tabelas sintéticas em gráficos, usando o próprio Excel ou o ManyEyes. Este é melhor para elaborar gráficos de matriz, comparando em círculos proporcionais ao número de citações as palavras ditas pelos candidatos individualmente

O resultado poderá ser um gráfico como este:

Written by Jose Roberto de Toledo

12/04/2010 at 4:59

Publicado em Jornalismo Investigativo

Tagged with

A rede neural, a memória e as eleições

Alguns colegas não entenderam o que eu quis dizer com “rede neural” em uma nota sobre pesquisas eleitorais no blog Vox Publica. Uns me ligaram para perguntar, outros fizeram graça. Sei pouco sobre o funcionamento do cérebro, apenas o que um problema familiar me fez ler a respeito. Mas vale um esforço de explicação.

Redes neurais são a infra-estrutura da memória, sua contrapartida física. Cada evento armazenado por nossos cérebros se inscreve em uma rede de neurônios, em camadas superpostas. O que significa que um neurônio ou conjunto deles pode pertencer a mais de uma rede neural, a mais de uma memória. Quando dizemos “isso me lembra aquilo”, estamos fazendo uma associação de ideias que compartilham parte de uma mesma rede neural.

Sempre que vejo o número 27 lembro de minha mãe. Ela nasceu em um dia 27 de 1927 e dizia que era seu número de sorte. Assim como muitos de nós associam o 21 à Embratel, o 11 ao futebol, o 13 ao PT, o 40 a Ali Babá… São memórias por associação, redes neurais interligadas.

Nessa fase da campanha eleitoral, a prioridade de Luiz Inácio Lula da Silva é criar uma associação de seu nome ao de Dilma Rousseff. Inscrever “Dilma” em uma rede superposta a “Lula” na cabeça do eleitor. O presidente tem tentado isso de várias maneiras, como repetir dezenas de vezes o nome da ex-ministra em seus pronunciamentos públicos.

Os simpatizantes do PT já estabeleceram essa associação e apontam o nome de Dilma nos cartões de pesquisa que estimulam a intenção de voto. Mas grande parte do eleitorado sem preferência partidária ainda não tem essa associação fixada. E não transforma a boa avaliação que faz do governo Lula em intenção de voto na candidata petista.

Quando um pesquisador pergunta qual cargo Dilma exerceu, ele está estimulando a memória do eleitor. Os que se lembrarem que ela foi ministra, em muitos casos, se recordarão que Dilma foi ministra de Lula. Se a pergunta seguinte for em qual candidato o entrevistado pretende votar para presidente, é possível que eleitores que aprovam Lula e associaram Dilma ao seu ministério fiquem mais propensos a apontar o nome da petista no cartão com o nome dos presidenciáveis.

É impossível sabermos se a proporção dos que associarão a rede neural “Dilma” à rede neural “Lula” é grande o suficiente para inflar a intenção de voto na candidata do PT. Mas apenas o risco de que influencie o resultado da pesquisa já deveria ser suficiente para o instituto reordenar a ordem das perguntas e afastar essa possibilidade.

Aprendi que a memória é um conjunto físico de redes superpostas ao tentar compreender o processo de demência senil. Aos 70 anos minha mãe começou a repetir-se continuamente. Os médicos diagnosticaram Alzheimer.

Desde então, camadas de memória cada vez mais profundas vêm sendo apagadas pela doença, do presente em direção ao passado mais remoto. Foram-se, pela ordem, a lembrança dos filhos, do marido, dos pais, de si própria. Como definiu meu pai, que cuida dela diariamente há 13 anos, “é uma morte em vida”.

A memória é o que define nossa identidade. E as redes neurais são as estruturas que a tornam possível.

Written by Jose Roberto de Toledo

09/04/2010 at 11:51

Um fato, vários gráficos e múltiplas interpretações

Eis alguns exercícios sobre como apresentar em um gráfico os resultados e as tendências das pesquisas de intenção de voto estimulada dos principais institutos, na eleição presidencial de 2010.

Conforme o método escolhido, muda sensivelmente a percepção sobre as tendências da eleição. Usando a mesma metodologia de cálculo da curva de tendência, a polinominal (adequada a situações como uma corrida eleitoral, em que os candidatos flutuam ao sabor dos acontecimentos), é possível mostrar um avanço consistente de Dilma Rousseff (polinômio com ordem 2) ou uma recuperação da vantagem por José Serra (polinômio com ordem 3), apenas mudando-se um parâmetro do cálculo -no caso, o número de vales/picos.

Por isso, prefiro um método menos popular entre os cientistas políticos, mas mais fácil de ser compreendido pelos leigos: a média móvel das últimas três pesquisas, representada pelos gráficos 1 e 2.

O gráfico 1 (abaixo) é o tradicional, acrescido de uma linha de tendência tracejada que representa a média das últimas cinco pesquisas para cada candidato. A margem de erro é representada por um traço preto perpendicular à linha de intenção de voto.

O gráfico 2 (abaixo) apresenta apenas os pontos de cada candidato em cada pesquisa, e as únicas linhas são as de tendência, calculada segundo a média das últimas três pesquisas. A margem de erro é representada pelo tamanho da circunferência de cada ponto (sobreposições indicam empate técnico).

O gráfico 3 (abaixo) é igual ao 2, com a diferença de que o método usado para calcular a linha de tendência é outro: um polinômio de ordem 2, ou seja, com apenas um vale/pico.

O gráfico 4 (abaixo) é idêntico ao anterior, com a única diferença de que a linha de tendência é calculada com um polinômio de ordem 3, ou seja, com dois vales/picos.

Written by Jose Roberto de Toledo

27/03/2010 at 12:56

Estudo de Marcus Figueiredo sobre avaliação de pesquisas eleitorais

Estudo apresentado pelo professor Marcus Figueiredo (IUPERJ) durante Congresso da Abep (Associação Brasileira de Empresas de Pesquisa) em 22 de março de 2010. Mostra o percentual de acerto das pesquisas eleitorais brasileiras e as compara com as norte-americanas. Apresenta ainda métodos de projeção dos resultados.

Apresentação – Marcus Figueiredo – ABEP 2010

Written by Jose Roberto de Toledo

25/03/2010 at 12:29