TOLEDOL, o blog sobre RAC

Reportagem com Auxílio do Computador (RAC) e jornalismo investigativo

Íntegra da pesquisa do Latinobarômetro sobre a imagem dos EUA no Brasil e América Latina

Clique aqui para ver o relatório em formato PDF: Pesquisa_EUA_X_Brasil

Written by Jose Roberto de Toledo

18/03/2011 at 21:11

Publicado em Reportagem com Auxílio do Computador

Etiquetado com

Os números de 2010 – metablog

Os duendes das estatísticas do WordPress.com analisaram o desempenho deste blog em 2010 e apresentam-lhe aqui um resumo de alto nível da saúde do seu blog:

Healthy blog!

O Blog-Health-o-Meter™ indica: Uau.

Números apetitosos

Imagem de destaque

Cerca de 3 milhões de pessoas visitam o Taj Mahal todos os anos. Este blog foi visitado cerca de 39,000 vezes em 2010. Se este blog fosse o Taj Mahal, eram precisos 5 dias para que essas pessoas o visitassem.

Em 2010, escreveu 14 novo artigo, aumentando o arquivo total do seu blog para 76 artigos. Fez upload de 30 imagens, ocupando um total de 23mb. Isso equivale a cerca de 3 imagens por mês.

The busiest day of the year was 12 de abril with 431 views. The most popular post that day was Ferramentas para analisar o discurso de políticos e candidatos.

De onde vieram?

Os sites que mais tráfego lhe enviaram em 2010 foram twitter.com, google.com.br, blogs.estadao.com.br, search.conduit.com e journalismcourses.org

Alguns visitantes vieram dos motores de busca, sobretudo por pesquisa presidencial 2010, corrida presidencial 2010, converter pdf para excel, pnad 2009 e ultima pesquisa presidencial 2010

Atracções em 2010

Estes são os artigos e páginas mais visitados em 2010.

1

Ferramentas para analisar o discurso de políticos e candidatos abril, 2010
9 comentários

2

Gráfico da corrida presidencial – todos os institutos – março 2010 março, 2010
3 comentários

3

Como converter uma tabela de PDF para Excel julho, 2009
2 comentários

4

Gráfico de evolução da intenção de voto para presidente março, 2010

5

Saiba como escarafunchar os dados da PNAD 2008 setembro, 2009
1 comentário

Written by Jose Roberto de Toledo

02/01/2011 at 21:35

Dicas de links

Written by Jose Roberto de Toledo

13/12/2010 at 8:31

O 5º Congresso da Abraji, segundo seus participantes (via Twitter)

Este slideshow necessita de JavaScript.

Written by Jose Roberto de Toledo

01/08/2010 at 16:12

Ferramentas para analisar o discurso de políticos e candidatos

Publiquei nesta segunda no Vox Publica uma comparação quantitativa dos discursos de José Serra e Dilma Rousseff ao se lançarem pré-candidatos à sucessão presidencial. Se quiser saber como esse material foi produzido, siga os passos:

1) obtenha as íntegras escritas dos discursos a serem analisados

2) instale um programa contador de palavras no seu computador. Se usar Mac, sugiro o Word Counter

3) jogue os discursos no contador de palavras e peça para ele fazer as seguintes coisas, separadamente para cada discurso: contá-las, produzir uma tabela de frequência de palavras e gerar um quadro estatístico de legibilidade

4) copie a tabela de frequência dos dois discursos e cole no Excel, um embaixo do outro

5) crie uma nova coluna no Excel (nomeie-a “candidatos”) e preencha-a em todas as linhas onde houver palavras com o nome do candidato que as disse

6) para compatibilizar as mesmas palavras ditas por Serra e Dilma, lado a lado, selecione toda a tabela, clique em “Dados/Tabela dinâmica” no menu superior do Excel

7) siga os passos e crie uma tabela dinâmica com “palavras” nas linhas, “candidatos” nas colunas e a soma das vezes que as palavras foram citadas no conteúdo

8 ) copie as colunas “palavras”, “Serra” e “Dilma” da tabela dinâmica para uma outra planilha do Excel

9) crie novas colunas que vão ajudá-lo a filtrar as palavras (são milhares): tamanho (use a função NÚM.CARACT [LEN, em inglês] para contar quantos caracteres tem cada palavra), verbos, substantivos etc

10) filtre e classifique a tabela segundo o que você quer descobrir: quais palavras cada candidato falou mais, quais as formas pronominais que mais empregaram, os verbos etc

11) copie e cole o produto de suas filtragens em outra planilha, criando assim pequenas tabelas sintéticas com suas conclusões

12) transforme as tabelas sintéticas em gráficos, usando o próprio Excel ou o ManyEyes. Este é melhor para elaborar gráficos de matriz, comparando em círculos proporcionais ao número de citações as palavras ditas pelos candidatos individualmente

O resultado poderá ser um gráfico como este:

Written by Jose Roberto de Toledo

12/04/2010 at 4:59

Publicado em Jornalismo Investigativo

Etiquetado com

A rede neural, a memória e as eleições

Alguns colegas não entenderam o que eu quis dizer com “rede neural” em uma nota sobre pesquisas eleitorais no blog Vox Publica. Uns me ligaram para perguntar, outros fizeram graça. Sei pouco sobre o funcionamento do cérebro, apenas o que um problema familiar me fez ler a respeito. Mas vale um esforço de explicação.

Redes neurais são a infra-estrutura da memória, sua contrapartida física. Cada evento armazenado por nossos cérebros se inscreve em uma rede de neurônios, em camadas superpostas. O que significa que um neurônio ou conjunto deles pode pertencer a mais de uma rede neural, a mais de uma memória. Quando dizemos “isso me lembra aquilo”, estamos fazendo uma associação de ideias que compartilham parte de uma mesma rede neural.

Sempre que vejo o número 27 lembro de minha mãe. Ela nasceu em um dia 27 de 1927 e dizia que era seu número de sorte. Assim como muitos de nós associam o 21 à Embratel, o 11 ao futebol, o 13 ao PT, o 40 a Ali Babá… São memórias por associação, redes neurais interligadas.

Nessa fase da campanha eleitoral, a prioridade de Luiz Inácio Lula da Silva é criar uma associação de seu nome ao de Dilma Rousseff. Inscrever “Dilma” em uma rede superposta a “Lula” na cabeça do eleitor. O presidente tem tentado isso de várias maneiras, como repetir dezenas de vezes o nome da ex-ministra em seus pronunciamentos públicos.

Os simpatizantes do PT já estabeleceram essa associação e apontam o nome de Dilma nos cartões de pesquisa que estimulam a intenção de voto. Mas grande parte do eleitorado sem preferência partidária ainda não tem essa associação fixada. E não transforma a boa avaliação que faz do governo Lula em intenção de voto na candidata petista.

Quando um pesquisador pergunta qual cargo Dilma exerceu, ele está estimulando a memória do eleitor. Os que se lembrarem que ela foi ministra, em muitos casos, se recordarão que Dilma foi ministra de Lula. Se a pergunta seguinte for em qual candidato o entrevistado pretende votar para presidente, é possível que eleitores que aprovam Lula e associaram Dilma ao seu ministério fiquem mais propensos a apontar o nome da petista no cartão com o nome dos presidenciáveis.

É impossível sabermos se a proporção dos que associarão a rede neural “Dilma” à rede neural “Lula” é grande o suficiente para inflar a intenção de voto na candidata do PT. Mas apenas o risco de que influencie o resultado da pesquisa já deveria ser suficiente para o instituto reordenar a ordem das perguntas e afastar essa possibilidade.

Aprendi que a memória é um conjunto físico de redes superpostas ao tentar compreender o processo de demência senil. Aos 70 anos minha mãe começou a repetir-se continuamente. Os médicos diagnosticaram Alzheimer.

Desde então, camadas de memória cada vez mais profundas vêm sendo apagadas pela doença, do presente em direção ao passado mais remoto. Foram-se, pela ordem, a lembrança dos filhos, do marido, dos pais, de si própria. Como definiu meu pai, que cuida dela diariamente há 13 anos, “é uma morte em vida”.

A memória é o que define nossa identidade. E as redes neurais são as estruturas que a tornam possível.

Written by Jose Roberto de Toledo

09/04/2010 at 11:51

Um fato, vários gráficos e múltiplas interpretações

Eis alguns exercícios sobre como apresentar em um gráfico os resultados e as tendências das pesquisas de intenção de voto estimulada dos principais institutos, na eleição presidencial de 2010.

Conforme o método escolhido, muda sensivelmente a percepção sobre as tendências da eleição. Usando a mesma metodologia de cálculo da curva de tendência, a polinominal (adequada a situações como uma corrida eleitoral, em que os candidatos flutuam ao sabor dos acontecimentos), é possível mostrar um avanço consistente de Dilma Rousseff (polinômio com ordem 2) ou uma recuperação da vantagem por José Serra (polinômio com ordem 3), apenas mudando-se um parâmetro do cálculo -no caso, o número de vales/picos.

Por isso, prefiro um método menos popular entre os cientistas políticos, mas mais fácil de ser compreendido pelos leigos: a média móvel das últimas três pesquisas, representada pelos gráficos 1 e 2.

O gráfico 1 (abaixo) é o tradicional, acrescido de uma linha de tendência tracejada que representa a média das últimas cinco pesquisas para cada candidato. A margem de erro é representada por um traço preto perpendicular à linha de intenção de voto.

O gráfico 2 (abaixo) apresenta apenas os pontos de cada candidato em cada pesquisa, e as únicas linhas são as de tendência, calculada segundo a média das últimas três pesquisas. A margem de erro é representada pelo tamanho da circunferência de cada ponto (sobreposições indicam empate técnico).

O gráfico 3 (abaixo) é igual ao 2, com a diferença de que o método usado para calcular a linha de tendência é outro: um polinômio de ordem 2, ou seja, com apenas um vale/pico.

O gráfico 4 (abaixo) é idêntico ao anterior, com a única diferença de que a linha de tendência é calculada com um polinômio de ordem 3, ou seja, com dois vales/picos.

Written by Jose Roberto de Toledo

27/03/2010 at 12:56

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.

Junte-se a 45 outros seguidores