Capítulo 4 Slide 1 Inferência Estatística Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a variância de uma variável aleatória Intervalo de Confiança para a diferença de duas proporções Intervalo de Confiança para a diferença dos valores médios de duas variáveis aleatórias Ana M. Abreu - 2006/07 Resenha Slide 2 As duas maiores áreas de aplicação da inferência estatística envolvem o uso de amostras aleatórias para: (1) estimar o valor de um parâmetro da população ou de um intervalo de valores que esse mesmo parâmetro pode tomar; (2) testar alguma hipótese sobre a população ou, em particular, sobre um certo parâmetro da população. Este capítulo aborda a primeira situação e o capítulo 5 a segunda. Ana M. Abreu - 2006/07 Definições • Estimador Slide 3 é uma fórmula ou um processo que usa os valores da amostra para estimar um parâmetro populacional. • Estimativa ❖ é um valor específico, ou intervalo de valores, usado para aproximar o valor do parâmetro de uma população. • Estimativa pontual ❖ é um valor único usado para aproximar o valor do parâmetro de uma população. A proporção amostral ˆp (“p-chapéu”) é a melhor estimativa pontual da proporção populacional p. A média amostral “x-barra” é a melhor estimativa pontual da média populacional µ. Ana M. Abreu - 2006/07 Definição Slide 4 Grau de confiança / Nível de significância O grau de confiança é habitualmente escrito como 1 - α, onde α é o complementar do grau de confiança, ou seja, é o nível de significância. Assim, dizer que temos um grau de confiança de 0.95 (ou 95%) é o mesmo do que dizer que temos um nível de significância α = 0.05. Do mesmo modo, se 1 - α =0.99 (99%) então α = 0.01. Ana M. Abreu - 2006/07 Notação para proporções Slide 5 p= proporção populacional ˆp = nx proporção amostral (pronuncia-se ‘p-chapéu’) de x sucessos numa amostra de dimensão n qˆ = 1 - pˆ = proporção amostral de insucessos numa amostra de dimensão n Ana M. Abreu - 2006/07 Definição Slide 6 Intervalo de Confiança Um intervalo de confiança (ou intervalo de estimativas) é um intervalo de valores usado para estimar o verdadeiro valor de um parâmetro populacional. O nível de confiança é a probabilidade 1—α α (frequentemente representada através da expressão em percentagem) de que o intervalo de confiança, de facto, contenha o verdadeiro valor do parâmetro. É usual trabalhar com valores na ordem de 90%, 95%, ou 99%. (α = 10%), (α = 5%), (α = 1%) Ana M. Abreu - 2006/07 Definição Slide 7 Valores críticos Um valor crítico é um valor de referência para “separar” os valores das estatísticas amostrais que são prováveis de ocorrer daqueles que não o são. O valor z1- α/2 é um valor crítico pois é um valor de z com a característica de separar a área igual a α/2 na cauda direita da distribuição Normal Standard (Ver Figura 4-1). Ana M. Abreu - 2006/07 Como determinar z1− α/2 α/ para um intervalo de confiança de 95% Slide 8 α =5% α/2 α/ = 2.5% = .025 z1− α/2 zα/2 Valores Críticos Ana M. Abreu - 2006/07 Figura 4-1 Intervalo de Confiança para a proporção de uma população ˆ ˆ p q pˆ ± z 1− α / 2 n Slide 9 pˆ – z 1− α / 2 pˆ qˆ < p < pˆ + z 1− α / 2 n pˆ qˆ n (pˆ – z 1− α / 2 pˆ qˆ pˆ qˆ , p + z 1− α / 2 ˆ n n ) Ana M. Abreu - 2006/07 Procedimento para construir um intervalo de confiança para p Slide 10 1. Verifique que são verdadeiras as seguintes condições: a amostra é uma amostra aleatória são válidas as condições da distribuição binomial, a qual pode ser aproximada pela distribuição Normal (recorde que para a aproximação ser válida tem que se verificar np ≥ 5 e nq ≥ 5). 2. Na tabela correspondente à distribuição Normal, encontre o valor crítico z 1−α2 1−α que corresponde ao nível de confiança pretendido. 3. Calcule pˆ qˆ n Ana M. Abreu - 2006/07 Procedimento para construir um Slide 11 intervalo de confiança para p 4. Use os cálculos já efectuados para determinar o intervalo de confiança na forma, por exemplo, pˆ – z 1− α / 2 pˆ qˆ< p < pˆ + z 1− α / 2 n 5. Apresente os resultados com 3 casas decimais. Ana M. Abreu - 2006/07 pˆ qˆ n Dimensão da amostra para estimar a proporção p Quando se conhece uma estimativa de p, pˆ : 2 z 1α 2 ˆ n=pˆ q d onde d é a diferença máxima entre p e pˆ . Quando não se conhece uma estimativa de p: z 1 1- α 2 n d 4 2 Ana M. Abreu - 2006/07 Slide 12 Estimação da média populacional: σ conhecido Slide 13 Pressupostos 1. O valor do desvio padrão populacional, σ , é conhecido. 2. Uma ou ambas as condições seguintes são satisfeitas: A população tem distribuição Normal ou n>30. Ana M. Abreu - 2006/07 Intervalo de Confiança para a média de uma população Slide 14 x ± z 1− α/2 • σ/ n x – z 1− α / 2 • σ/ n < µ < x + z 1− α / 2• σ/ n (x – z 1− α / 2 • σ/ n , x + z 1− α / 2 • σ/ n) Ana M. Abreu - 2006/07 Procedimento para construir um Intervalo de Confiança para µ Slide 15 quando σ é conhecido 1. Verifique que os pressupostos são válidos. 2. Determine o valor crítico z1− α/2 que corresponde ao nível de significância pretendido. 3. Calcule σ/ n e, em seguida, z 1− α/2 • σ/ n . 4. Calcule x –z 1− α/2 • σ/ n e x + z 1− α/2 • σ/ n . Apresente os valores na forma: x – z 1− α/2 • σ/ n < µ < x + z 1− α/2 • σ/ n 5. Apresente os resultados com 3 casas decimais. Ana M. Abreu - 2006/07 Dimensão da amostra para estimar a média µ n= (z1- α/2) •σ Slide 16 2 d onde d é a diferença máxima entre x e µ. No caso de o valor não dar inteiro, aproxima-se para o inteiro imediatamente a seguir. Ana M. Abreu - 2006/07 Estimação da média populacional: σ desconhecido Slide 17 Pressupostos 1. O valor do desvio padrão populacional, σ, é desconhecido. 2. Uma ou ambas as condições seguintes são satisfeitas: A população tem distribuição Normal ou n>30. Ana M. Abreu - 2006/07 Procedimento para construir um intervalo de confiança para µ Slide 18 quando σ é desconhecido 1. Verifique que os pressupostos são satisfeitos 2. Se n 30, consulte a tabela da distribuição t de Student para encontrar o valor do quantil 1- α/2 da distribuição t de Student com n-1 graus de liberdade. 3. Calcule s / n e, em seguida, t 1− α/2 • s / n . 4. Calcule x –t1− α/2 • s / n e x + t1− α/2 • s / Apresente os valores na forma: n. x – t1− α/2 • s / n < µ < x + t1− α/2 • s / n 5. Apresente os resultados com 3 casas decimais. Ana M. Abreu - 2006/07 Procedimento para construir um intervalo de confiança para µ Slide 19 quando σ é desconhecido 1. Verifique que os pressupostos são satisfeitos 2. Se n>30, consulte a tabela da distribuição Normal para encontrar o valor do quantil 1- α/2. n e, em seguida, z1− α/2 • s / n . 4. Calcule x –z1− α/2 • s / n e x + z1− α/2 • s / n . 3. Calcule s / Apresente os valores na forma: x – z1− α/2 • s / n < µ < x + z1− α/2 • s / n 5. Apresente os resultados com 3 casas decimais. Ana M. Abreu - 2006/07 Estimação da variância populacional: Slide 20 Pressupostos 1. A amostra é uma amostra aleatória. 2. A população deve ter distribuição Normal (mesmo se a amostra for de dimensão grande). Ana M. Abreu - 2006/07 Intervalo de Confiança para a variância de uma população (n-1)s2 χ2(α/2 α/2; α/2 n-1) < σ2 < Slide 21 (n-1)s2 χ2(1-α/2 α/2; α/2 n-1) onde: n é a dimensão da amostra s2 é a variância da amostra χ2(α/2 α/2; α/2 n-1) é o quantil α/2 da distribuição qui- quadrado com n-1 graus de liberdade Ana M. Abreu - 2006/07 Procedimento para construir um intervalo de confiança para σ2 ou σ Slide 22 1. Verifique que os pressupostos são válidos. 2. Consulte a tabela da distribuição χ2 para encontrar 2 os valores críticos χ2(α/2 e χ α/2; (1-α/2 α/2; α/2 n-1) α/2 n-1) . 3. Determine os extremos do intervalo de confiança pretendido usando as seguintes desigualdades: (n-1)s2 χ2(α/2 α/2; α/2 n-1) < σ2 < (n-1)s2 χ2(1-α/2 α/2; α/2 n-1) 4. Se pretender obter um intervalo de confiança para σ, calcule a raiz quadrada dos extremos do intervalo anterior e substitua σ2 por σ. Ana M. Abreu - 2006/07 Notação para Duas Proporções Para a população 1, seja: p1 = proporção populacional n1 = dimensão da amostra x1 = nº de sucessos na amostra ^ p = x1 (a proporção amostral) 1 n1 q^ = 1 – p^ 1 1 ^, Com o mesmo significado temos p2, n2, x2, p^ e q 2 2 mas provenientes da população 2. Ana M. Abreu - 2006/07 Slide 23 Intervalo de Confiança para estimar p1 - Slide 24 p2 ( p^1 – p^ 2 ) ± z 1− α/2 α/ p^1 q^1 p^2 q^2 n1 + n2 Este intervalo só se aplica se as amostras forem grandes, isto é, se n1>30 e n2>30. Ana M. Abreu - 2006/07 Definições Slide 25 Duas Amostras Independentes Os valores de uma amostra aleatória de uma população não estão relacionados ou emparelhados com os valores da outra amostra aleatória proveniente da outra população. Se os valores de uma amostra estiverem relacionados com os valores da outra amostra, as amostras são dependentes. Um exemplo de tais amostras são as designadas por amostras emparelhadas. Ana M. Abreu - 2006/07 Pressupostos Slide 26 1. As duas amostras são independentes. 2. Ambas as amostras são amostras aleatórias. 3. Uma ou ambas as condições seguintes são satisfeitas: As amostras têm dimensão grande (com n1 > 30 e n2 > 30) ou ambas as amostras são provenientes de populações com distribuição Normal. Ana M. Abreu - 2006/07 Intervalo de Confiança Slide 27 Quando σ1 e σ2 são desconhecidos: (x1 – x2) ± z 1− α/2 α/ s2 2 s12 + n2 n1 onde x1 é a média da amostra 1, s12 é a variância da amostra 1 e n1 é a dimensão da amostra 1. Analogamente no que diz respeito a relativamente à amostra 2. Ana M. Abreu - 2006/07 x2, s22 e n2, Intervalo de Confiança Slide 28 Quando σ1 e σ2 são conhecidos: (x1 – x2) ± z 1− α/2 α/ onde x1 é σ +σ n n 2 1 2 2 1 2 a média da amostra 1, da população 1 e n1 é σ 2 é a variância 1 a dimensão da amostra 1. Analogamente no que diz respeito a x2, relativamente à amostra e à população 2. Ana M. Abreu - 2006/07 σ2 2 e n2 , Pressupostos Slide 29 1. As amostras são emparelhadas. 2. As amostras são amostras aleatórias. 3. Uma ou ambas as seguintes condições são satisfeitas: O nº de pares da amostra é grande (n > 30) ou as diferenças entre os pares de valores são provenientes de uma população com distribuição aproximadamente Normal. Ana M. Abreu - 2006/07 Notação para Amostras Emparelhadas Slide 30 µd = valor médio das diferenças resultantes de cada par de indivíduos da população. d = valor médio das diferenças resultantes de cada par de observações (x1-y1=d1, …, xn-yn=dn). sd = desvio padrão das diferenças resultantes de cada par de observações. n = nº de pares de observações. Ana M. Abreu - 2006/07 Intervalo de Confiança d – t1−α/2 sd n < µd < d + t1−α/2 onde t1−α/2 tem n –1 graus de liberdade. Ana M. Abreu - 2006/07 Slide 31 sd n