Estatística Bayesiana num mundo pós-modernista
No meu último texto escrevi sobre o pós-modernismo e a sua rejeição da crença de que existe uma verdade universal e absoluta. Hoje vou explorar um pouco mais este tema à luz do que sei dos fundamentos de Inferência Estatística.
Em geral, o pós-modernismo argumenta que a verdade está sempre dependente do contexto social e histórico no qual está inserida. Como a realidade é intrinsecamente dinâmica, a verdade é essencialmente fugaz: o que é verdade hoje deixa de o ser amanhã. Na prática, o pós-modernismo apela à subjectividade do pensamento e nega a existência de uma realidade objectiva que possa ser descoberta por métodos científicos. Refuta, também a validade (moral) das grandes narrativas religiosas, uma vez que estas foram redigidas em contextos históricos e sociais muito distantes dos nossos.
Confesso que fiquei apreensivo quando me debrucei sobre este movimento filosófico. Pareceu-me que o pós-modernismo era um género de uma bala disparada contra a própria Universidade e os seus professores. Pensei que, na melhor das hipóteses, os filósofos pós-modernistas tinham encetado uma tentativa de denegrir o uso do nosso intelecto como forma de navegarmos no mundo e de nos relacionarmos com os outros. Na pior das hipóteses, esses filósofos queriam destruir a essência de qualquer conhecimento ou sabedoria colectiva que possa ser transferido para as gerações futuras.
Assim, o pós-modernismo pareceu-me ser um veículo para um pessimismo generalizado e uma irresponsabilidade cognitiva que, eventualmente, nos põe no caminho para a pura alienação do conhecimento e das nossas vidas. Se não há nada que a cognição possa salvar, porque tudo depende de tudo, não percebi de que forma devemos progredir em sociedade.
Se calhar a solução pós-modernista consiste em adotar um atitude de combate perante os outros, ora gritando as nossas opiniões ("Que ganhe quem grita mais alto!"), ora usando a nossa força física ("Que ganhe o mais forte!") Em quaisquer dos casos, não contem comigo. Não tenho esse temperamento.
Ao pensar melhor sobre tudo isto, dei por mim a recordar aquilo que aprendi no curso de Matemática Aplicada e Computação do Instituto Superior Técnico, nomeadamente, quando ingressei no ramo de Probabilidades e Estatística. Essa recordação levou-me às aulas de Inferência Estatística nas quais o meu querido amigo e falecido Professor Daniel Paulino (doravante referido por Daniel) me ensinou os fundamentos da Inferência Clássica (também chamada Inferência Frequencista) e a sua contrapartida Bayesiana.
Ao fazer esse regresso ao passado, consegui fazer alguns paralelos entre a Inferência Bayesiana e as ideias pós-modernistas. Percebi que nem tudo era tão negro no pós-modernismo como tinha pensado inicialmente. Decidi então escrever este texto para discutir um paralelo mais virado para os fundamentos da Inferência Estatística e um outro mais virado para um aspecto sócio-cultural da comunidade Bayesiana.
Pós-modernismo e a natureza do parâmetro
Em Estatística, o parâmetro define-se como uma quantidade desconhecida da população que se pretende investigar, por exemplo, a altura média da população portuguesa ou a percentagem de jovens portugueses até aos 16 anos com mais 1.90m de altura. Numa linguagem mais filosófica, o parâmetro é a "verdade" que se quer descobrir da população.
O busílis da questão é saber como descobrir essa "verdade" sem precisar de estudar a população toda (1). Por palavras mais técnicas, a questão consiste em saber como estimar esse parâmetro a partir de uma amostra (representativa) de indivíduos escolhidos ao acaso da população. Para responder a esta questão, é preciso recordar o que se entende por método científico.
O método científico está normalmente dividido em cinco grandes etapas:
- Formulação do problema em estudo;
- Proposta de uma hipótese (ou solução) para a resolução do problema;
- Experimentação onde se recolhem dados para avaliar a razoabilidade da hipótese proposta;
- Análise dos dados propriamente dita onde se realizam inferências a partir dos dados observados;
- Interpretação e discussão dos dados à luz do que se sabe sobre a problema em análise.
Ora, se o método científico é visto conceptualmente como um processo iterativo, então pode-se admitir que a experimentação é passível de ser replicada sob mesmas condições. Essa suposição leva a seguinte interpretação estatística:
Uma amostra particular da população é uma entre todas as amostras que poderiam ter sido obtidas por repetição sucessiva da experimentação (ou recolha de dados).
Como tal, a probabilidade de observar uma determinada amostra pode ser definida pela frequência de se obter essa amostra particular dentro de todas as amostras possíveis. Esta é uma das ideias fulcrais da Inferência Clássica. Por consequência, a estimação do parâmetro pode ser realizada através da maximização dessa probabilidade. Como o leitor pode subentender das frases acima, esta abordagem à Inferência Estatística pressupõe que o parâmetro é desconhecido, mas é considerado fixo. Ou seja, o seu verdadeiro valor pode ser descoberto através da aplicação do processo iterativo subjacente ao método científico.
Em oposição, a Inferência Bayesiana parte do pressuposto de que o parâmetro será sempre desconhecido (3) e portanto o seu conhecimento será sempre parcial e incerto. O nome dado à esta abordagem advém do uso do Teorema de Bayes para efeitos inferenciais. Para esse uso, é preciso essencialmente especificar a distribuição a priori do parâmetro desconhecido e o modelo estatístico que possa descrever razoavelmente o mecanismo de recolha dos dados. A distribuição a priori do parâmetro deve ser especificada de acordo com o conhecimento que o investigador tem antes da recolha dos dados da população em estudo. A conjugação da distribuição a priori do parâmetro com a informação proveniente dos dados recolhidas da população através do Teorema de Bayes dá origem à distribuição a posteriori do parâmetro. Se se efetuar uma nova recolha de dados da população, então a distribuição a posteriori do parâmetro passa a ser a nova distribuição a priori na nova análise de dados. A análise repete-se por uma nova aplicação do Teorema de Bayes. Assim sendo, a Inferência Bayesiana consegue captar o estado do conhecimento (incerto) sobre um determinado parâmetro numa população em constante mudança ou em condições experimentais (dificilmente) repetíveis.
Pelo que escrevi acima, as inferências Bayesianas serão sempre dependentes do contexto específico em que os dados se inserem. Assim sendo, a Inferência Bayesiana parece ser a resposta estatística às críticas pós-modernista de como lidar com a noção de verdade num mundo em constante movimento.
Esta revelação trouxe-me um pouco de alívio ao futuro da Ciência. Afinal de contas, o pós-modernismo refute a verdade universal e absoluta mas, ao mesmo tempo, temos em mão uma ferramenta estatística extremamente poderosa para analisar o mundo em que a verdade é algo fluída. Contudo, esse alívio durou pouco como vão poder ler numa das minhas notas finais do texto. Mas antes disso, vou trazer-vos um parte divertida do mundo Bayesiano.
Pós-modernismo e os míticos Valencia Meetings
No seu auge na década de 70 do século passado, o movimento pós-modernismo traduziu-se numa explosão criativa e irreverente dentro da cultura pop ocidental, rompendo com muitos tabus artísticos, nomeadamente, de natureza religiosa. Leiam-se por exemplo os contos "A visita" ou "A redenção" do cineasta espanhol Pedro Almodôvar compilados no recente livro "O Último Sonho", livro este que já tinha feito referência no meu último texto. Um outro exemplo foi o nascimento do Rock pesado e do Metal que ainda hoje aprecio. Relembro a ousadia dos espectáculos e a excentricidade de bandas tais como Twisted Sister, Kiss, Alice Cooper, Black Sabbath ou mesmo os Queen. Não que essa minha lembrança tivesse resultado de uma vivência consciente dessa década, uma vez que nasci em 1975. A lembrança veio em segunda mão com a leitura de revistas de música e a visualização de vídeos da MTV durante a minha adolescência.
E ao lembrar-me desses exemplos culturais pós-modernistas, dei por mim a pensar nos míticos Encontros de Valência (Valencia Meetings) que o Daniel, um acérrimo defensor da Estatística Bayesiana, me contou inúmeras vezes. Para ele, estes encontros eram as melhores e as mais divertidas conferências na área da Estatística.
Para quem não os conhece, os Encontros de Valência decorreram entre 1979 e 2010, de quatro em quatro anos na região Valenciana da nossa vizinha Espanha. Tive a oportunidade de ter estado presente no último encontro (Valencia Meeting IX) com um grande contigente português proveniente do Centro de Estatística e Aplicações da Universidade de Lisboa (o Daniel, obviamente, os Profs. Antónia Amaral Turkman, Giovani Silva, Lisete Sousa, Marília Antunes, Paulo Soares entre outros). Os Encontros eram considerados como a reunião máxima dos estatísticos a trabalharem em Inferência Bayesiana.
Quando comparados com os congressos científicos tradicionais, os Encontros pautavam pela sua originalidade. Primeiro, tinham uma estrutura bem mais relaxada com muitas sessões de posters após o jantar que decorriam ao ritmo que a noite, o calor de verão e o vinho espanhol permitiam. Segundo, a componente social da conferência era super divertida, para não dizer extravagante. Só para terem uma ideia dessa componente, transcrevo em baixo um pequeno excerto do Professor José Bernardo, um dos fundadores e organizadores dos Encontros, onde ele retrata a parte social do Valencia Meeting I num artigo histórico sobre esses encontros:
After the conference dinner, George Box sang “There’s No Theorem Like Bayes’ Theorem,” a parody of “There’s No Business Like Show Business” by Irving Berlin. This a capella (without any instrumental accompaniment) performance was the genesis of the Valencia cabarets, a tradition that has continued and expanded in every subsequent Bayesian meetings
Sim, George E. P. Box mencionado acima é o estatístico da famosa frase: 'all models are wrong, but some are useful". Para terem uma ideia mais concreta desses cabarets, sugiro que assistam a este vídeo gravado no último Valencia Meeting IX em que estive presente. No vídeo vão poder ver uma paródia ao êxito musical dos Aqua "Barbie Girl". Memorável!
Posto isto, parece-me que a originalidade dos Valencia Meetings veio exatamente dos seus organizadores e participantes terem abraçado um espirito e ousadia pós-modernista. Neste aspecto, o pós-modernismo teve o seu lado positivo dando origem a ideias novas de fazermos as coisas, nomeadamente, conferências científicas.
Dois comentários finais
Muito mais haveria para escrever sobre a Inferência Bayesiana e a sua relação com o pós-modernismo. Conto fazê-lo em vários textos do blogue. Para já, não quero maçar o leitor com um texto demasiado denso e muito longo. Contudo, quero deixar dois comentários finais, um mais geral e outro mais pessoal.
Embora tenha percebido a grande vantagem da Inferência Bayesiana no contexto pós-modernista, continuo apreensivo em relação ao futuro da Estatística. Obviamente, a Estatística que eu aprendi foi na sua essência teórica desenvolvida por pessoas que objetivamente viveram noutra época com desafios diferentes dos nossos. Assim sendo, entendo perfeitamente a necessidade de continuar a adaptar a metodologia estatística aos desafios do mundo atual. Contudo, parece-me que estamos a assistir a uma morte lenta da Inferência Estatística que prevejo que acelere com a proliferação dos cursos de Ciência e Dados.
Um sintoma dessa morte lenta veio de dois editoriais da revista Basic and Applied Social Psychology (BASP). O primeiro editorial foi publicado em Fevereiro de 2014 onde o seu novo editor, o Prof David Trafimow, declarou algumas mudanças nas políticas editoriais da revista, sendo a primeira a seguinte:
First, BASP will no longer require inferential statistics procedures on an a priori basis.
Passado um período de graça de cerca de um ano, o mesmo editor agora conjuntamente com um novo editor Dr Michael Marks declararam a adopção de uma política editorial mais radical: rejeitar todos os artigos em que a Inferência Clássica tivesse sido usada e de avaliar caso a caso artigos que utilizassem Inferência Bayesiana (4).
Do meu ponto de vista, a atitude filosófica de Trafimow e Marks é melhor entendida na seguinte frase sobre a Estatística Bayesiana:
The usual problem with Bayesian procedures is that they depend on some sort of Laplacian assumption to generate numbers where none exist.
Como o pós-modernismo refuta a existência objectiva de quase tudo, então posso inferir da frase acima que Trafimow e Marks são adeptos radicais deste movimento filosófico ao ponto de rejeitarem a validade de toda a metodologia Bayesian porque em certa medida esta assenta em números que não tem razão de existirem.
Assim, se indivíduos com responsabilidade científica demonstram estar possuídos por um espírito pós-modernismo desregrado com políticas radicais como as que expus acima, será que a comunidade científica vai continuar a olhar no futuro com bons olhos a Inferência Estatística, Clássica ou Bayesiana?
Como afirmei acima, sou da opinião de que a comunidade científica e por extensão a sociedade em geral estão a caminhar a passos largos para uma rotura sem retorno com a Inferência Estatística. Parece-me que estão abraçando alternativamente o Dadismo (Dataism), uma espécie de religião baseada na ideia de que os dados são tudo o que precisamos para entender o mundo (5). Tenho esta opinião por estar a assistir a uma explosão de artigos publicados dos últimos anos, utilizando técnicas de aprendizagem automática (6). Muitas dessas técnicas são metaforicamente apelidadas de técnicas (ou modelos) de caixa preta nas quais o que mais interessa é ter uma boa previsão para um determinado fenómeno (médico ou social) sem precisar de saber as suas causas e sem questionar se a amostragem é ou não representativa, se é ou não enviesada. Felizmente, existe uma contra-corrente desta análise de dados quase displicente. Essa contra-corrente advoga o uso responsável da aprendizagem automática em que vários conceitos estatísticos mais clássicos (e.g., viés dos dados ou a capacidade da interpretação do modelo) devem ser abordados e resolvidos pelos analistas (7).
Vamos ver como o futuro se revela, mas faço apelo aos estatísticos para estarem atentos e preparados para o que aí vier.
Prof. Daniel Paulino durante o I Encontro Luso-Galaico de Biometria em Braga (14-16/07/2013). |
O meu comentário de cariz pessoal é uma reflexão sobre o Daniel e a amizade que desenvolvi com ele desde o meu tempo de estudante do Instituto Superior Técnico. Embora parte dessa amizade possa ter sido causa das palavras de encorajamento e motivação que recebi dele no início do meu percurso profissional, não acredito que essas palavras tivessem uma força suficientemente grande para o desenvolvimento de uma amizade que perdurou até à sua partida. Essas palavras seriam apenas fragmentos da minha memória passada de um período da minha vida em que tais palavras fortaleceram o meu espírito face à incerteza inerente que acarretou o fim de um curso universitário.
Assim, o grande fruto deste texto sobre o pós-modernismo e Estatística Bayesiana foi ter percebido que a minha amizade com o Daniel cresceu ao longo do tempo sob o jugo de um simples facto. O Daniel foi sempre uma pessoa inspiradora pela sua forma de ser verdadeira, honesta e justa para comigo e com os outros. Concluo então que, o Daniel, embora tenha sido um irreverente pós-modernista na sua forma de ver e viver a Estatística, foi ao mesmo tempo o oposto de um pós-modernista no mundo real, tendo vivido na crença absoluta de que existe uma forma universal de tratar justamente os outros.
Tenho saudades deste meu grande amigo, Daniel. Talvez este texto tenha sido apenas o reflexo dessas saudades.
Notas de rodapé:
(1) O estudo em que se recolhem dados de toda a população são chamados census e normalmente estão a cargo de instituições nacionais como o Instituto Nacional de Estatística cuja missão é produzir estatísticas oficiais.
(2) Esta mesma idea está subjacente ao desenvolvimento de métodos numéricos para a resolução de equações sem solução em forma fechada ou para a resolução de problemas de minimização (ou maximização) de uma determinada função matemática.
(3) A não ser que se realize um census da população. Nesse caso, não há necessidade de aplicar métodos inferenciais, pois têm-se acesso todos os dados da população.
(4) A American Statistical Association não deixou passar o Editorial de Trafiwow e Marks sem resposta, tendo feito uma declaração pública sobre o caso (veja-se Wasserstein e Lazer, 2015). Em Portugal, o Prof João Branco também revisitou o caso ao escrever sobre o futuro da Estatística no boletim de Outono de 2016 da Sociedade Portuguesa de Estatística.
(5) Para o leitor interessado, recomendo a leitura do último capítulo do livro Sapiens onde Yuval Noah Harari faz uma boa descrição do Dadismo.
(6) Deixo aqui a nota de que eu próprio publiquei artigos utilizando técnicas de aprendizagem automática com o intuito de entender melhor as mesmas e as suas vantagens práticas. Um desses artigos pode ser encontrado neste link.
(7) Para o leitor interessado em saber mais sobre a utilização responsável de técnicas de aprendizagem automática, aconselho a leitura do livro "The Hitchhiker's Guide to Responsible Machine Learning" do meu colega e amigo Prof. Przemyslaw Biecek. É um livro bastante relaxado com a curiosidade de conter uma banda desenhada muito apelativa ao público mais jovem.
Comentários