INTRODUÇÃO AS PROBABILIDADES E ESTATÍSTICA EPOCA DE RECURSO - 2011-12 (sem 2) Resolução do 2º teste 1. a) A estimativa de máxima verosimilhança da probabilidade de uma marcação tardia resultar é x 0.1. A distribuição da variável aleatória N que representa o número de sucessos em 4 tentativas independente da marcação é binominal com parâmetro n=4 e p. Assim a probabilidade de haver 4 2 p (1 p) 2 6 p 2 (1 p) 2 . Pela probabilidade da invariância 2 sucessos é igual a P N 2 2 2 2 dos estimadores de máxima verosimilhança a estimativa pedida é igual a 6 0.1 0.9 0.0486 . tem distribuição b) A variável fulcral é neste caso Z (X p) / X (1 X ) /50 que aproximadamente normal com média nula e variância igual a 1 pelo teorema do limite central. Logo, o intervalo de confiança bilateral aleatório ao nível aproximado 95% é (X 1.96 X (1 X ) /50) e o correspondente intervalo numerico é (0.1 1.96 0.1 0.9 /50) (0.1 0.083) ou seja (0.017,0.183). c) O “intervalo de confiança” bilateral aleatório para p baseado na variável fulcral Z (X p) / p(1 p) /n , que tem distribuição aproximadamente normal com média nula e variância igual a 1, ao nível aproximado 99% é (X 2.5758 p(1 p) /n . A sua amplitude é igual a 2 2.5758 p(1 p) /n . Como f (p) p(1 p) tem um máximo para p 0.5 cujo valor é 0.25, essa amplitude é menor ou igual que 2 2.5758 / 4n . Para que o erro na estimação de p seja inferior a 1%, 2.5758 / 4n 0.01ou seja n 128.79 ou n 16586.9 . Logo a dimensão da amostra n deveria ser no mínimo 16.587. 2. Sendo X a variável aleatória que indica o número de recusas em 100 tentativas de marcação, a hipótese nula de X ter distribuição de ao acaso e com reposição, escolhidas pretende-se testar Poisson com valor esperado igual a 2. Supondo verdadeira a hipótese nula, a probabilidade de X tomar os valores 0,1,2,3 ou 4 são: p0 e 2 , p1 p2 2e 2 , p3 4e 2 /3 e p4 1 19e 2 /3 . Então o número esperado de observações em cada uma das classes quando a hipótese nula é válida é E 0 13,53, E1 E2 27.07, E3 18.04 e E4 14.29 . A estatística do teste é o quiquadrado de Pearson, uma vez que se trata de um teste de ajustamento. Esse qui-quadrado tem 4 graus de liberdade uma vez que há 5 classes e não foi estimado nenhum parâmetro. Note-se que a exaustividade está garantida e nenhum dos Ei é inferior a 1 e 80% deles é maior ou igual a 5, pelo que não é necessário nem acrescentarnem agrupar classes. O valor calculado da estatística é igual a 191.214, pelo que o valor-p do teste é inferior a 0.005. Portanto deve se rejeitar a hipótese nula para os níveis de significância usuais. ˆ 2 e ˆ 60 , pelo que a recta de 3. a) os valores estimados dos coeficientes de regressão são 1 0 regressão estimada é yˆ 60 2x . Então a estimativa para o valor esperado de Y quando x=25 é igual a -10. 0 contra a hipótese alternativa b) Testar a significância de regressão é testar a hipótese nula 1 estimada é igual a 27.(7) e o valor observado da estatística do teste supondo 1 0 . A variância verdadeira a hipótese nula é igual a 2 / 27.(7) /(25000 20 35 2 ) 36 . Como essa estatística tem distribuição t-student com 18 graus de liberdade e o quantil 0.975 é 2.101, deve rejeitar-se a hipótese nula ao nível de significância de 5%. c) O coeficiente de determinação é igual a (8000 20 10 35)2 /(25000 20 35)2 (4500 20 100) 0.8 . Isto significa que 80% da variabilidade de Y é explicada pelo modelo de regressão, ou seja a qualidade do modelo é bastante razoável. Tal seria previsível face ao resultado da alínea anterior.