

Depois fiquei pensando, pô, deve haver uma maneira mais refinada de testar essa hipótese. Fiz o seguinte. Considere os campeonatos brasileiros A e B. Eles duram menos de um ano, e os times se preparam de modo que as condições devem ser mais uniformes do que no caso das seleções mundiais, cujos jogos são espaçados de 4 anos, e que mesmo durante as preparações mudam muito.
Peguei as primeiras 26 rodadas da série A e da série B. Se você construir o histograma da distribuição de gols feitos por *todos* os times, verá que ele não é bem descrito por uma distribuição de Poisson. Mas isso é compreensível, uma vez que a média de gols varia bastante (de um fator maior que 3) de time para time. O que acontece porém, se você simular um certo número de vezes (digamos 100) as primeiras 26 rodadas utilizando a estatística de Poisson *com a média aritmética observada* para cada time?
A Figura abaixo, mostra o resultado para a série A. Os pontos são as observações (ou seja o número de vezes em que ocorreu 0 gols, 1 gols, 2 gols, etc. O histograma é o modelo.


> wilcox.test(gols[,2],tgols[,2])
Wilcoxon rank sum test with continuity correction
data: gols[, 2] and tgols[, 2]
W = 13621456, p-value = 0.7599
alternative hypothesis: true location shift is not equal to 0
e para a série B:
> wilcox.test(gols[,2],tgols[,2])
Wilcoxon rank sum test with continuity correction
data: gols[, 2] and tgols[, 2]
W = 13602829, p-value = 0.8027
Os valores p- precisam ser bem pequenos para que as distribuições possam ser consideradas diferentes, o que não ocorre nos nossos casos.
O teste K-S (Kolmogorov-Smirnov) é outra maneira não paramétrica de testar se as distribuições são diferentes, e se baseia na máxima distância vertical entre as ecdf (empirical cumulative distribution function).
> ks.test(gols[,2],tgols[,2])
Two-sample Kolmogorov-Smirnov test
data: gols[, 2] and tgols[, 2]
D = 0.0178, p-value = 0.9967
Temos assim, duas maneiras quantitativas de assegurar que a hipótese de que o número de gols marcado por uma equipe de futebol segue a estatística de Poisson é razoável.
Nenhum comentário:
Postar um comentário