Como interpretar a regra de Bayes? E o “Paradoxo da Ferrari”
Eu gosto de entender o que as fórmulas querem dizer. Ir além de decorar sua definição.
A regra de Bayes é uma dessas que é bem chata de decorar, confusa, e ninguém sabe muito bem para que serve.
Primeiro, o contexto.
Digamos que eu tenha que dar uma probabilidade de um evento ocorrer. Na falta de dados, vou dar um chute qualquer.
Em termos simples, a regra de Bayes serve para melhorar o seu chute através de novas informações.
Algo assim:
Prob_Posterior = Prob_Anterior x (chance sobre prob_marginal)
Vamos detalhar, a seguir, utilizando como apoio o “Paradoxo da Ferrari”.
O paradoxo da Ferrari
Uma vez, um colega veio com uma história bem esquisita.
Digamos que eu veja um homem com uma Ferrari na rua. Se eu chegar para ele, e perguntar, “Cara, você empresta sua Ferrari para eu dar uma volta?”, qual a chance dele deixar?
Esse meu colega argumentava que existiam duas opções: ou ele deixava ou não deixava. Então a chance era de 50%.
Nessa época, eu não conhecia a regra de Bayes e não muito de probabilidades, e não argumentei. Porém, mesmo assim, soou bem esquisito.
Se eu chegar aleatoriamente para uma pessoa e pedir a Ferrari, muito provavelmente a resposta será “não”.
Se ao invés de uma Ferrari, fosse um Gol 1.0, provavelmente a chance seria maior, embora ainda assim tenha mais “nãos” do que “sims”.
A princípio, sem dados alguns, é difícil dar um chute para estimar essas probabilidades.
De forma mais rigorosa, podemos mensurar as probabilidades fazendo pesquisas: vou a campo, pergunto para 1000 pessoas com Ferraris se eles a emprestariam para dar uma volta, e vejo quais as chances. Digamos que o estudo aponte que 1 em 1000 me empreste seu carrão. A partir daí, meu melhor chute vai ser esse:
Prob (sim) = 1/1000.
Aí sim, bem menos do que 50% e mais próximo da realidade.
O paradoxo da Ferrari com mais informações
Agora, suponha que eu seja uma celebridade. Um Leonardo de Caprio, uma Gal Gadot, um Neymar. Se a Gal Gadot fizer a mesma pergunta “Cara, você empresta sua Ferrari para eu dar uma volta?”, as chances de um “sim” seriam extremamente maiores.
Digamos que eu também tenha feito uma pesquisa, e esta aponte 70% de chances de “sim”, sendo celebridade pedindo (suspeito que, no caso do Gol 1.0 com a Gal Gadot pedindo, as chances seriam próximas de 100%!).
Aí, o meu colega chato volta e diz: “Viu, eu não falei que, na média, as chances eram de 50%?” — o que também soa muito estranho, porque não sou uma celebridade e tomaria “não” até no Gol 1.0.
A regra de Bayes vem nos salvar, para que possamos fazer a conta com método.
Exemplificando a Regra de Bayes.
Vamos pegar um universo de 100 mil pessoas.
Digamos que a chance de uma pessoa ser uma celebridade é 1 em 5000.
Portanto, de 100 mil pessoas, há 20 celebridades, e 99.980 pessoas comuns.
Agora, uma pessoa normal tem 1 chance em 1000 de obter um “Sim”. Portanto, das 99.980 pessoas, aproximadamente 100 conseguiriam, caso cada um tentasse uma vez, e 99.880 não conseguiriam.
E, sendo celebridade, 70% conseguiriam. Das 20 celebridades, 14 obteriam “sim”, e 6 obteriam “não”.
A tabela abaixo sumariza todos esses números.
Agora, dadas as informações acima, qual a chance de eu obter um “sim”, dado que sou comum?
Vamos usar a fórmula:
Prob (Sim | Comum) = Prob (Comum | Sim ) * Prob (Sim) / Prob(Comum)
Se não errei nenhuma conta:
Prob (Comum | Sim ) = 100 / 114 (é a probabilidade de eu ser comum, dados todos os “sims”)
Prob ( Sim ) = 114 / 100000 (é a probabilidade de sim, diante do total)
Prob(Comum) = 99980 / 100000 (é a probabilidade de eu ser pessoa comum, no todo)
Portanto:
Prob (Sim | Comum) = (100/114) * (114/100000) / (99980/100000) = 0,001
Ou seja, como a chance do pedinte ser celebridade é rara, isso não afeta em nada as chances. Bate com a intuição, tirando da frente o “paradoxo da Ferrari”. Que me adianta saber que o Cristiano Ronaldo tem muito mais chances de obter um “sim”?
Este é um caso ilustrativo, porém a regra de Bayes pode ser utilizada para condições bem mais complexas.
Portanto, a interpretação é que a regra de Bayes serve para melhorar um cálculo de probabilidade, a partir de informações obtidas a priori. A cada nova informação, melhoro a minha estimativa.
A regra de Bayes é utilizada em modelos estatísticos, problemas matemáticos (como em pesquisa médica), modelos de machine learning e forecast, para citar alguns casos.
Veja também:
A teoria que não morreria: como a lei de Bayes decifrou o código enigma, perseguiu submarinos russos e emergiu triunfante de dois séculos de controvérsias
Originally published at https://ideiasesquecidas.com on January 15, 2023.