quinta-feira, 1 de julho de 2010

Que dizem as estatísticas?



Imagine-se no lugar de um paciente que, em uma consulta de rotina, acaba de receber do seu médico particular um diagnóstico nada alentador. Um tipo raro de câncer, com nome esquisito e cura, ainda, desconhecida, por exemplo. Depois de ouvir evasivas e palavras de esperança em tratamentos ditos experimentais, é natural que você, sendo uma pessoa relativamente esclarecida, ao chegar em casa, busque uma consulta com o oráculo do momento: São Google. E o que o oráculo dos novos tempos diz, provavelmente, não ajudará muito. Não sendo você um especialista da área médica, inclusive, nesse caso, ao se deparar com informações tipo " é incurável, com uma mediana de mortalidade de apenas oito meses após a descoberta", a situação pode ficar ainda pior, tirando-lhe de vez qualquer expectativa.
Após alguns minutos de hesitação, recomenda-se cautela com qualquer conclusão apressada sobre a provável data da sua morte. Inclusive por que, mesmo entre pessoas que cursaram uma disciplina de estatística descritiva, poucas têm capacidade de avaliar o que esse valor (ou outro qualquer) de mediana realmente significa. Temos, em geral, uma visão errônea das chamadas medidas de tendência central, cujas mais comuns são a média e a mediana (há também a moda). No caso da média aritmética, somam-se todos os itens e divide-se o resultado pelo número de itens. No exemplo, seriam somados todos os tempos de vida dos pacientes desde que tiveram esse tipo de câncer diagnosticado e dividido pelo número de casos, resultando nos oito meses referidos. Por sua vez, a mediana representa o ponto situado exatamente na metade da curva de distribuição de tempo de vida dos pacientes amostrados. E significa que a metade das pessoas que tem esse tipo de doença diagnosticado vive menos que oito meses e a outra metade mais.
O importante é tentar identificar quais as suas chances de viver mais. Aí podem entrar questões como a idade, o diagnóstico precoce da doença, a possibilidade de contar com tratamento médico adequado (de preferência o melhor que existe), a sua vontade de viver, etc. A forma da distribuição dessa estatística, tempo de vida após diagnóstico, também é fundamental, incluindo-se as medidas de variação ou dispersão dos dados. Em geral, esse tipo de distribuição não é simétrico, ou seja, igualmente arranjada nos dois lados do valor central, a exemplo da curva normal ou de Gauss, que tem forma de sino. Nesse caso, sob o ponto de vista do paciente fictício, o ideal é que seja assimétrica e distorcida para a direita. É evidente que é importante também ter consciência que muitas circunstâncias podem alterar esse tipo de distribuição, mudando radicalmente as conclusões. No caso, se fosse uma distribuição normal, com baixos valores de dispersão em torno da média, você poderia, com tranqulidade, marcar a data do seu funeral para daqui a oito meses.
O texto em questão foi baseado no ensaio "The median isn´t the message", elaborado por Etephen Jay Gould, em tons autobiográficos, quando, em 1982 teve o diagnóstico de um mesotelioma, um tipo raro de câncer geralmente associado com exposição a amianto. Gould, depois de pedir a melhor literatura sobre a doença em questão para o médico, dirigiu-se à biblioteca da Universidade Harvard e, ao se deparar com referências que não poderiam ser mais claras, tipo "mesothelioma is incurable, with a median mortality of only eight months after discovery", não entendeu por que o médico somente muito a contragosto lhe indicou alguns livros sobre o assunto. Ele, em vez de se aterrorizar com o que acabara de ler, teve suas esperanças renovadas. Afinal, um cientista do calibre de Sthefen Jay Gould sabia muito bem interpretar o significado de uma mediana. Ele viria a morrer em 10 de maio de 2002. Muito tempo a mais que a expectativa de vida de oitos meses, como um interprete mais apressado (e não qualificado em estatística) poderia supor. Para a felicidade de Gould, ele, de fato, estava no lado direto da curva.
Sobre estatísticas e suas interpretações, vale lembrar a referência sarcástica de Mark Twain (Samuel Langhorne, 1835-1910), quando salienta que há três espécies de mentira, cada uma pior que a anterior (há quem atribua essa assertiva a Disraeli). São elas: qualquer mentira, mentiras maldosas e estatísticas.

Gilberto Cunha.

Comente o texto aqui ou no dihitt.

Um comentário: