Diariamente somos bombardeados com dados estatísticos sobre praticamente todos os tipos de coisas. É muito comum um mesmo dado ser interpretado de maneiras diferentes dependendo de quem faz a análise. Isto pode ocorrer por causa de alguns vícios de linguagem, ou talvez, o indivíduo que interpreta a informação não seja bem intencionado, ou ainda, pelo fato de nossa intuição ser altamente determinística. Nesta página irei dissertar de maneira introdutória sobre o uso da teoria das probabilidades no cotidiano. No final desta página eu  apresentarei alguns conceitos matemáticos básicos para a teoria das probabilidades.

Os equívocos que mencionei são muito mais comuns do que aparentam, mesmo profissionais que fazem pesquisa na área de estatística costumam cometer erros triviais quando estes não estão formulados dentro de um contexto profissional. O livro A lógica do cisne negro, mencionam o exemplo de uma pesquisa feita pelo psicólogo Danny Kahnman em 1971. Nesta pesquisa, professores de estatística eram questionados sobre questões estatísticas que não haviam sido redigidas como questões estatísticas. Uma destas perguntas é descrita mais ou menos como: em uma cidade existem apenas dois hospitais um grande e um pequeno. Em um dia específico 60% dos bebês nascidos em um dos hospitais é menino. A pergunta é : em qual dos hospitais é mais provável que isto tenha ocorrido? Vou deixar esta pergunta em aberto ( para que o leitor tente responde-la sozinho) por enquanto, e irei retornar a ela no final desta página.

Agora vou citar alguns exemplos de dados estatísticos que ouvimos no nosso dia-a-dia. Considere as seguintes frases que provavelmente você já deve ter ouvido algumas vezes:

————————————————————————————

  1. Estudo revela que x % dos canceres de pulmão esta relacionada ao consumo de café.
  2.  O período normal para uma criança começar a andar é entre 10 e 18 meses.
  3.  O teste de qualidade garante que o novo desinfetante remove 99% das bactérias.
  4. 9 em cada 10 dentistas usam smile.
  5. Governador declara que paga aos professores um salário acima da média nacional.
  6. Cientista descobrem novo medicamento que cura a doença z com 99% de eficácia.

————————————————————————————

Todas estas frases podem ser verdadeiras, no entanto elas podem (propositalmente ou não) ainda assim, induzir-nos a erros de interpretação. Aqui irei aplicar estes conceitos para algumas questões da vida cotidiana, como nas frases acima, com exceção da 3 e da 6 onde dediquei uma página inteira. Boa parte da inspiração para escrever este texto veio do livro Como mentir com estatística.

1. Estudo revela que x % dos canceres de pulmão esta relacionada ao consumo de cafeina.

Calma! A frase acima foi inventada por min de forma aleatória. O fato de dois fenômenos estarem correlacionados não sugere necessariamente que um cause o outro. Correlação não é causação! 

Por exemplo, talvez o leitor já tenha ouvido falar que homens casados  tendem a viver x anos a mais que homens solteiros. Isso pode dar a entender que o casamento causa  uma vida mais longa. Mas considere o seguinte: ora, é notório que homens saudáveis e ricos tendem a viver mais do que homens não saudáveis e pobres. E, homens saudáveis e ricos também tem maiores chances de se casarem do que homens não saudáveis e pobres. Logo, talvez a causa da vida mais longa seja o bom cuidado com a saúde e a riqueza e não o casamento por ele mesmo.

Uma outra pesquisa poderia indicar por exemplo, que x%  das pessoas com câncer são carecas. Mesmo que  seja x > 50, raspar a cabeça não vai aumentar em x% suas chances de desenvolver um câncer.  Neste link há alguns exemplos cômicos de correlação versus causação.

2. O período normal para uma criança começar a andar é entre 10 e 18 meses.

Aqui temos um problema que esta mais relacionado com linguística do que propriamente com matemática.  Muitos pais podem ficar preocupados pelo fato de o filho não aprender a andar ou falar dentro do período normal.

Matematicamente o termo normal na frase acima significa: “mais comum”, ou semelhantemente, “mais frequente”. O erro esta em associar a palavra normal a desejável ou natural. O fato de um evento ser raro não significa que ele não seja natural e em muitos caso o “raro” é ate visto como desejável, como é o caso de olhos azuis/verdes em algumas partes do mundo.

4. 9 em cada 10 dentistas usam smile.

Este tipo de informação é muito comum nos produtos que compramos em supermercados. O livro Como mentir com estatística, menciona o exemplo irônico de que 10 em cada 10 coiotes escolhem ACME, em menção ao desenho do Coiote e do Papa-léguas. O fato de o coiote sempre escolher os produtos ACME não significa que ele prefere estes produtos, no caso do desenho ele tinha somente esta opção.

Da mesma forma, a frase acima pode nos induzir ao erro de achar que os produtos smile são melhores que os seus concorrentes. Por mais que seja verdadeira a proporção dita acima, a maior procurar não significa maior preferência. As razões para isso podem ser varias, menor preço, maior oferta, melhor marketing, etc.

5. Governador declara que os professores do seu estado ganham acima da média nacional.

Aqui vemos uma clara tentativa de autopromoção. Veja que isso pode nos induzir a pensar que o desempenho deste governador é acima da média em comparação ao demais governadores, pelo menos para esta questão. Porém, apenas este dado isolado não significa necessariamente um ponto positivo para o governador. Analisemos.

Suponha que um determinado país tenha 10 estados. Nomeados em ordem alfabética de A até J, veja a tabela a seguir.

ABCDEFGHIJ
111111591010
3444445444
1111665667

Vamos analisar três situações distintas em relação ao salário dos professores. Na tabela acima, estariam as relações dos salários (em unidades de milhar) dos professores em cada estado. Cada linha representa um cenário diferente. Se você somar os elementos de cada linha e dividir pelo número total de estados vai encontrar que, nas três situações a média salarial dos professores é exatamente igual a 4 mil. Suponha que o estado do governador da frase acima seja o estado G.  Analisemos individualmente cada linha da tabela.

  • Para o primeiro cenário, o que governador diz realmente nos induz a pensar que ele tenha um desempenho um pouco melhor que os demais, uma vez que,  o salário pago em seu estado é o 4 maior. No entanto, é muito inferior ao 3 primeiros. 
  • No segundo cenário, o governador esta precisando contratar melhor seu marqueteiros! Ora, uma propaganda muito melhor seria não apenas dizer que paga acima da média como também paga o maior salário do país.
  • O terceiro cenário é o mais negativo para o governador. Ele continua pagando acima da média, no entanto, seu estado esta na 6ª posição entre os estados com melhores salários.

Observe a diferença de informação entre o primeiro e o terceiro ponto. A posição dos estados com melhor salário é bastante diferente.   

————————————————————————————

Photo by Lukas from Pexels

Agora irei finalmente apresentar a resposta para a pergunta deixada em aberto no início deste texto. Muitos dos estatístico que responderam a pesquisa ( lembre-se do caráter não formal com que as questões eram apresentadas) cometeram o erro de dizer que o hospital maior teria maiores chances de ser o hospital que teve 60% de meninos em um dia específico. Na verdade, o que podemos esperar é que grandes amostragens sejam mais estáveis, no sentido de que estas flutuam menos em relação à média. Portanto, o hospital grande deve ter chances menores do que o hospital pequeno de sair da média “normal” de 50% entre meninos e meninas.

Para finalizar, como falei no início deste texto o papel da intuição e do inconsciente também são bastante importantes para a análise dos dados estatísticos. No livro Subliminar,o autor Leonard Mlodinow relata, entre outras coisas,  que todos os anos nos estados unidos dezenas de milhares de vítimas e/ou testemunhas fazem um exame de reconhecimento para identificar os autores de um crime.

Já sabendo da possibilidade dos testemunhos estarem errados os policiais inserem entre os suspeitos indivíduos que sabidamente são inocentes do crime em questão, por exemplo, outros policiais, detentos, etc. A experiência mostra que de 20 a 25% das vezes as testemunhas apontam apontam como criminosos estes indivíduos. Isto mostra o quanto podemos estar enganados sobre nossa capacidade de associar a memória com a realidade. Para uma descrição mais profunda leia o livro!

Minha intenção com este texto é estimular o leitor o interesse sobre a área. Todo cuidado na interpretação dos dados estatísticos é pouco, e não é nenhum demérito ocasionalmente errar trivialidades (até os profissionais erram!). Caso o eleitor tenha interesse, recomendo a leitura desta postagem sobre a estatística aplicada às loterias.

Mega-Sena: entre na rede e fique riquíssimo!

Caso tenha alguma crítica por favor comente no espaço abaixo. Obrigado pela leitura.

Deixe um comentário

Tendência