Distribuições de probabilidade para análise de proporções

Propaganda
________________________________________________________________________________________
Distribuições de probabilidade para análise de proporções: Uma
aplicação no beisebol.
André Felipe Berdusco Menezes1*, Victor Hugo Nagahama2
1*
Universidade Estadual de Maringá ([email protected]), 2Universidade Estadual de Maringá
Resumo – Diante de diversas medidas existentes para mensurar o desempenho de rebatedores na
Major League Baseball (MLB), o batting average é de fundamental importância no contexto de
escolha e definição de bons jogadores no beisebol. Assim sendo, neste trabalho procuramos
identificar a distribuição que melhor modela o batting average, uma vez que somente a partir de
uma distribuição de probabilidade é possível calcular probabilidades de eventos e determinar
medidas descritivas, tais como média, quantis e variância. As distribuições consideradas foram:
Beta, Kumaraswamy e Simplex, visto que o batting average é obtido pela razão entre o número
de rebatidas válidas (Hits) e o número de vezes no bastão (AB), ou seja, uma variável definida no
intervalo (0,1). As estimativas dos parâmetros foram encontradas pelo método da máxima
verossimilhança. Os testes de aderência Kolmogorov-Smirnov (KS), Aderson-Darling (AD) e
Cramér-von Mises (CVM) indicaram que as distribuições Beta e Simplex se ajustam aos dados,
sendo que essa última obteve os maiores valores-p nos três testes realizados. Por outro lado, na
comparação entre as distribuições os valores de -logL e os critérios de informação AIC e BIC
indicaram que a distribuição Simplex apresentou um melhor ajuste aos dados. Ademais, a
distribuição Simplex forneceu valores baixos para o erro padrão dos parâmetros, sugerindo boas
estimativas. Por fim, determinamos os intervalos de confiança assintótico e bootstrap nãoparamétrico para a média do batting average considerando as distribuições Beta e Simplex.
Palavras-chave: inferência, proporções, batting average, beisebol.
Download