Íntegra da pesquisa do Latinobarômetro sobre a imagem dos EUA no Brasil e América Latina
Clique aqui para ver o relatório em formato PDF: Pesquisa_EUA_X_Brasil
Os números de 2010 – metablog
Os duendes das estatísticas do WordPress.com analisaram o desempenho deste blog em 2010 e apresentam-lhe aqui um resumo de alto nível da saúde do seu blog:

O Blog-Health-o-Meter™ indica: Uau.
Números apetitosos
Cerca de 3 milhões de pessoas visitam o Taj Mahal todos os anos. Este blog foi visitado cerca de 39,000 vezes em 2010. Se este blog fosse o Taj Mahal, eram precisos 5 dias para que essas pessoas o visitassem.
Em 2010, escreveu 14 novo artigo, aumentando o arquivo total do seu blog para 76 artigos. Fez upload de 30 imagens, ocupando um total de 23mb. Isso equivale a cerca de 3 imagens por mês.
The busiest day of the year was 12 de abril with 431 views. The most popular post that day was Ferramentas para analisar o discurso de políticos e candidatos.
De onde vieram?
Os sites que mais tráfego lhe enviaram em 2010 foram twitter.com, google.com.br, blogs.estadao.com.br, search.conduit.com e journalismcourses.org
Alguns visitantes vieram dos motores de busca, sobretudo por pesquisa presidencial 2010, corrida presidencial 2010, converter pdf para excel, pnad 2009 e ultima pesquisa presidencial 2010
Atracções em 2010
Estes são os artigos e páginas mais visitados em 2010.
Ferramentas para analisar o discurso de políticos e candidatos abril, 2010
9 comentários
Gráfico da corrida presidencial – todos os institutos – março 2010 março, 2010
3 comentários
Como converter uma tabela de PDF para Excel julho, 2009
2 comentários
Gráfico de evolução da intenção de voto para presidente março, 2010
Saiba como escarafunchar os dados da PNAD 2008 setembro, 2009
1 comentário
Dicas de links
BRASIL – governo federal
Gastos públicos, CPF de servidores, quadro de servidores, convênios e empresas punidas
Emissão de certidões negativas na Receita
Consulta à entrega de IRPF na Receita
Busca no protocolo de processos no governo federal
Consulta de empréstimos a empresas pelo BNDES
Prestação de contas das eleições de 2010
Para encontrar imóvies em faixa da Marinha
Dados sobre mortalidade no Brasil
…
EUA
Para encontrar propriedades na Flórida
Para encontrar sócios de empresas na Flórida
Para encontrar propriedades em Nova York
Para encontrar registros públicos nos EUA
Para encontrar informações sobre empresas nos EUA
…
Recursos online
Para montar e sincronizar seu banco de dados textual e de arquivos: Evernote
Para fazer infográficos: Manyeyes
Para montar nuvens de palavras e analisar discurso: Wordle
Para montar e sincronizar suas planilhas, apresentações e formulários: Google Docs
Para fazer as mesmas coisas que o Google Docs e outras mais: Zoho
O 5º Congresso da Abraji, segundo seus participantes (via Twitter)
Este slideshow necessita de JavaScript.
Ferramentas para analisar o discurso de políticos e candidatos
Publiquei nesta segunda no Vox Publica uma comparação quantitativa dos discursos de José Serra e Dilma Rousseff ao se lançarem pré-candidatos à sucessão presidencial. Se quiser saber como esse material foi produzido, siga os passos:
1) obtenha as íntegras escritas dos discursos a serem analisados
2) instale um programa contador de palavras no seu computador. Se usar Mac, sugiro o Word Counter
3) jogue os discursos no contador de palavras e peça para ele fazer as seguintes coisas, separadamente para cada discurso: contá-las, produzir uma tabela de frequência de palavras e gerar um quadro estatístico de legibilidade
4) copie a tabela de frequência dos dois discursos e cole no Excel, um embaixo do outro
5) crie uma nova coluna no Excel (nomeie-a “candidatos”) e preencha-a em todas as linhas onde houver palavras com o nome do candidato que as disse
6) para compatibilizar as mesmas palavras ditas por Serra e Dilma, lado a lado, selecione toda a tabela, clique em “Dados/Tabela dinâmica” no menu superior do Excel
7) siga os passos e crie uma tabela dinâmica com “palavras” nas linhas, “candidatos” nas colunas e a soma das vezes que as palavras foram citadas no conteúdo
8 ) copie as colunas “palavras”, “Serra” e “Dilma” da tabela dinâmica para uma outra planilha do Excel
9) crie novas colunas que vão ajudá-lo a filtrar as palavras (são milhares): tamanho (use a função NÚM.CARACT [LEN, em inglês] para contar quantos caracteres tem cada palavra), verbos, substantivos etc
10) filtre e classifique a tabela segundo o que você quer descobrir: quais palavras cada candidato falou mais, quais as formas pronominais que mais empregaram, os verbos etc
11) copie e cole o produto de suas filtragens em outra planilha, criando assim pequenas tabelas sintéticas com suas conclusões
12) transforme as tabelas sintéticas em gráficos, usando o próprio Excel ou o ManyEyes. Este é melhor para elaborar gráficos de matriz, comparando em círculos proporcionais ao número de citações as palavras ditas pelos candidatos individualmente
O resultado poderá ser um gráfico como este:
A rede neural, a memória e as eleições
Alguns colegas não entenderam o que eu quis dizer com “rede neural” em uma nota sobre pesquisas eleitorais no blog Vox Publica. Uns me ligaram para perguntar, outros fizeram graça. Sei pouco sobre o funcionamento do cérebro, apenas o que um problema familiar me fez ler a respeito. Mas vale um esforço de explicação.
Redes neurais são a infra-estrutura da memória, sua contrapartida física. Cada evento armazenado por nossos cérebros se inscreve em uma rede de neurônios, em camadas superpostas. O que significa que um neurônio ou conjunto deles pode pertencer a mais de uma rede neural, a mais de uma memória. Quando dizemos “isso me lembra aquilo”, estamos fazendo uma associação de ideias que compartilham parte de uma mesma rede neural.
Sempre que vejo o número 27 lembro de minha mãe. Ela nasceu em um dia 27 de 1927 e dizia que era seu número de sorte. Assim como muitos de nós associam o 21 à Embratel, o 11 ao futebol, o 13 ao PT, o 40 a Ali Babá… São memórias por associação, redes neurais interligadas.
Nessa fase da campanha eleitoral, a prioridade de Luiz Inácio Lula da Silva é criar uma associação de seu nome ao de Dilma Rousseff. Inscrever “Dilma” em uma rede superposta a “Lula” na cabeça do eleitor. O presidente tem tentado isso de várias maneiras, como repetir dezenas de vezes o nome da ex-ministra em seus pronunciamentos públicos.
Os simpatizantes do PT já estabeleceram essa associação e apontam o nome de Dilma nos cartões de pesquisa que estimulam a intenção de voto. Mas grande parte do eleitorado sem preferência partidária ainda não tem essa associação fixada. E não transforma a boa avaliação que faz do governo Lula em intenção de voto na candidata petista.
Quando um pesquisador pergunta qual cargo Dilma exerceu, ele está estimulando a memória do eleitor. Os que se lembrarem que ela foi ministra, em muitos casos, se recordarão que Dilma foi ministra de Lula. Se a pergunta seguinte for em qual candidato o entrevistado pretende votar para presidente, é possível que eleitores que aprovam Lula e associaram Dilma ao seu ministério fiquem mais propensos a apontar o nome da petista no cartão com o nome dos presidenciáveis.
É impossível sabermos se a proporção dos que associarão a rede neural “Dilma” à rede neural “Lula” é grande o suficiente para inflar a intenção de voto na candidata do PT. Mas apenas o risco de que influencie o resultado da pesquisa já deveria ser suficiente para o instituto reordenar a ordem das perguntas e afastar essa possibilidade.
Aprendi que a memória é um conjunto físico de redes superpostas ao tentar compreender o processo de demência senil. Aos 70 anos minha mãe começou a repetir-se continuamente. Os médicos diagnosticaram Alzheimer.
Desde então, camadas de memória cada vez mais profundas vêm sendo apagadas pela doença, do presente em direção ao passado mais remoto. Foram-se, pela ordem, a lembrança dos filhos, do marido, dos pais, de si própria. Como definiu meu pai, que cuida dela diariamente há 13 anos, “é uma morte em vida”.
A memória é o que define nossa identidade. E as redes neurais são as estruturas que a tornam possível.
Um fato, vários gráficos e múltiplas interpretações
Eis alguns exercícios sobre como apresentar em um gráfico os resultados e as tendências das pesquisas de intenção de voto estimulada dos principais institutos, na eleição presidencial de 2010.
Conforme o método escolhido, muda sensivelmente a percepção sobre as tendências da eleição. Usando a mesma metodologia de cálculo da curva de tendência, a polinominal (adequada a situações como uma corrida eleitoral, em que os candidatos flutuam ao sabor dos acontecimentos), é possível mostrar um avanço consistente de Dilma Rousseff (polinômio com ordem 2) ou uma recuperação da vantagem por José Serra (polinômio com ordem 3), apenas mudando-se um parâmetro do cálculo -no caso, o número de vales/picos.
Por isso, prefiro um método menos popular entre os cientistas políticos, mas mais fácil de ser compreendido pelos leigos: a média móvel das últimas três pesquisas, representada pelos gráficos 1 e 2.
O gráfico 1 (abaixo) é o tradicional, acrescido de uma linha de tendência tracejada que representa a média das últimas cinco pesquisas para cada candidato. A margem de erro é representada por um traço preto perpendicular à linha de intenção de voto.
O gráfico 2 (abaixo) apresenta apenas os pontos de cada candidato em cada pesquisa, e as únicas linhas são as de tendência, calculada segundo a média das últimas três pesquisas. A margem de erro é representada pelo tamanho da circunferência de cada ponto (sobreposições indicam empate técnico).
O gráfico 3 (abaixo) é igual ao 2, com a diferença de que o método usado para calcular a linha de tendência é outro: um polinômio de ordem 2, ou seja, com apenas um vale/pico.
O gráfico 4 (abaixo) é idêntico ao anterior, com a única diferença de que a linha de tendência é calculada com um polinômio de ordem 3, ou seja, com dois vales/picos.
Estudo de Marcus Figueiredo sobre avaliação de pesquisas eleitorais
Estudo apresentado pelo professor Marcus Figueiredo (IUPERJ) durante Congresso da Abep (Associação Brasileira de Empresas de Pesquisa) em 22 de março de 2010. Mostra o percentual de acerto das pesquisas eleitorais brasileiras e as compara com as norte-americanas. Apresenta ainda métodos de projeção dos resultados.
Todos os discursos de Lula em Israel (março/2010)
Lula falou muito de Brasil em Israel. “Brasil” foi a palavra mais usada pelo presidente nos oito pronunciamentos que fez durante a viagem, nada menos do que 84 vezes. Em segundo lugar, Lula usou mais frequentemente “Israel”: 59 vezes.
O lado comercial da viagem ficou patente pela quantidade de vezes que aparece a palavra “empresários” no discurso presidencial. Mais do que “paz”: 41 a 35 vezes cada uma.
Além de “Brasil” 84 vezes, Lula disse 26 vezes “brasileiros”. Clique na imagem abaixo para ver o contexto em que “Brasil” foi citado. Você pode trocar a palavra “Brasil” por outras citadas pelo presidente para entender seu contexto e contar as menções.
Making of
Para reproduzir esse levantamento, ou usar essa técnica para outras análises, crie uma conta no Manyeyes. É de graça. Depois, vá à fonte dos discursos que quer analisar e copie as íntegras. Neste caso, a fonte foi a Presidência da República. Junte tudo em um só documento de texto, selecione, copie e cole dentro do Manyeyes na seção “upload data sets”. Depois de criada a base de dados, clique em “visualize” para escolher a melhor forma de visualizar os dados. Neste caso, montei primeiro a “nuvem de palavras” para poder depois escolher as mais citadas na visualização tipo “word tree”.
Gráfico da corrida presidencial – todos os institutos – março 2010
O gráfico abaixo mostra que não devemos ignorar margens de erro ao analisar o desempenho dos candidatos. Reforça também que é mais importante olharmos as tendências do que as oscilações momentâneas. Como eu aponto no blog vox publica, no Estadão, as pesquisas do Ibope têm divergido das dos outros institutos no que se refere a José Serra. Um mostra o tucano estável, os demais apontam queda.
Apesar de os institutos usarem metodologias distintas, o fenômeno que eles medem, a intenção de voto do eleitor, é o mesmo. Logo, no longo prazo, todos devem mostrar a mesma coisa. Afinal, não é porque muda a marca do termômetro que a febre deve ser diferente.

A diferença entre Ibope e Datafolha no que se refere ao percentual de Serra está dentro da margem de erro: no Datafolha o tucano poderia ter entre 30% e 34%, enquanto no Ibope ele pode ter entre 33% e 37%. Além disso, as pesquisas foram feitas com cerca de dez dias de intervalo. O que importa são as tendências. Se isolarmos cada instituto, Serra apresenta queda no Datafolha e no Vox Populi. No Ibope, embora tenha oscilado sempre para baixo, a diferença percentual entre as pesquisas está dentro da margem de erro.
Abaixo, vê-se o mesmo gráfico, acrescido das linhas de tendência de cada candidato, calculada pela média móvel das últimas cinco pesquisas. Percebe-se a queda de Serra, o crescimento de Dilma Rousseff, a queda de Ciro Gomes e a estabilidade de Marina Silva.
Logo, ou Ibope está demorando para detectar uma queda de Serra, ou os demais institutos estão no limite inferior da oscilação do tucano, identificando uma queda maior do que a real. Não é possível ser categórico para apontar uma resposta a essa questão. Só as próximas pesquisas poderão dizer qual a tendência correta.







