ESTATÍSTICA AULA 13 Estimação de Parâmetros – Unidade 9 Professor Marcelo Menezes Reis 1 Aulas prévias Planejamento da pesquisa, técnicas de amostragem: generalização. Análise exploratória de dados: organização dos dados. Probabilidade, variável aleatória, modelos. Conceito de inferência estatística, distribuição amostral. 2 Conteúdo desta aula Conceito de estimação de parâmetros. Estimação por ponto: propriedades dos estimadores, estimador de média e de proporção. Estimação por intervalo: de média e de proporção. Tamanho mínimo de amostra para estimação por intervalo. 3 Estimação de parâmetros Parâmetros (medidas populacionais) são desconhecidos. Inviável pesquisar toda a população: retirar amostra aleatória. A partir da amostra estimar os parâmetros: por ponto, por intervalo. 4 Estimação por ponto Há várias estatísticas amostrais (estimadores) disponíveis . Determinar qual é o melhor estimador para o parâmetro de interesse. Estatísticas são variáveis aleatórias: então os estimadores TAMBÉM são variáveis aleatórias. 5 Critérios para escolha de estimadores Parâmetro , estimador T: T é justo se E(T) = . T é consistente se, além de justo, lim n-> V(T) = 0. Se há 2 ou mais estimadores justos de , o mais eficiente é o que apresentar menor variância. 6 Estimação por ponto da média Melhor estimador da média populacional é a média amostral. 2 E( x ) V( x ) n Justo Consistente 7 Estimação por ponto da proporção Melhor estimador da proporção populacional é a proporção amostral. E ( p) (1 ) V ( p) n Justo Consistente 8 ˆ 2 (x x) 2 i n n 1 2 E (ˆ ) n 2 Tendencioso s2 2 ( x x ) i n 1 E (s ) 2 2 Não-tendencioso 9 Estimação por intervalo Estimação por ponto é insuficiente. Chance de “acertar” o valor real do parâmetro? “Pescar com lança...” Serve como referência: pôr um intervalo de confiança em torno da estimativa. “Pescar com rede...” 10 Nível de confiança (1- ) Probabilidade de que o valor do parâmetro esteja dentro do intervalo de confiança. Nível de significância (): probabilidade de que o valor NÃO esteja dentro do intervalo de confiança. Fixado arbitrariamente: espera-se que 1- próximo de 1 (100%). 11 Determinação do intervalo de confiança Consiste em calcular os limites do intervalo. Dependerão do nível de confiança. Dependerão da distribuição amostral do estimador. Dependerão do próprio tamanho da amostra. 12 Para média e proporção Z1 = - Z2 Z1 Z2 P(Z< Z1) = /2 = P(Z> Z2) P(Z>Zcrítico) = /2 13 Limites do intervalo LI = “média” – Zcrítico × “desvio padrão” LS = “média” + Zcrítico × “desvio padrão” Precisão = e0 = Zcrítico × “desvio padrão” 14 Intervalo de confiança para média L I x e0 LS x e 0 P(x e0 x e 0 ) 1 e0 dependerá de alguns aspectos: conhecimento da 2, e do tamanho de amostra. 15 2 conhecida e0 Zcritico n Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. 16 2 desconhecida Usar s (desvio padrão amostral) como estimativa de . Mas, observar o tamanho de amostra: Grandes amostras (n > 30): distribuição normal, usar Zcrítico. Pequenas amostras: distribuição t, usar tn-1, crítico. 17 2 desconhecida, grandes amostras s e 0 Zcritico n Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. 18 2 desconhecida, pequenas amostras s e0 t n 1,critico n Fixar 1 - , obter tn-1crítico, calcular e0, obter os limites e interpretar o resultado. 19 Exemplo 1 Ver 1o exemplo da Unidade 9. Retirou-se uma amostra aleatória de 4 elementos de uma produção de cortes bovinos no intuito de estimar a média do peso do corte. Obteve-se média de 8,2 kg e desvio padrão de 0,4 kg. Supondo população normal.Determinar um intervalo de confiança para a média populacional com 1% de significância. 20 1- = 0,99 x 8,2 s = 0,4 n=4 2 desconhecida, n < 30 => usar t n-1,crítico t3;0,005 = 5,84 21 s 0,4 e0 t n 1,critico 5,84 1,168kg n 4 LI x e0 8,2 1,168 7,032kg LS x e0 8,2 1,168 9,368kg Há 99% de probabilidade de que a verdadeira média populacional do peso de corte esteja entre 7,032 e 9,368 kg. 22 Intervalo de confiança para proporção L I p e0 LS p e 0 P(p e0 p e0 ) 1 Possível aproximar distribuição de p por uma normal se: n × p ≥ 5 E n × (1-p) ≥ 5 23 Intervalo de confiança para proporção p (1 p) e0 Zcritico n Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. 24 Exemplo 2 Ver 2o exemplo Unidade 9. Retirou-se uma amostra aleatória de 1000 peças de um lote. Verificou-se que 35 eram defeituosas. Determinar um intervalo de confiança de 95% para a proporção peças defeituosas no lote. 25 1- = 0,95 n = 1000 p = 0,035 1- p = 0,965 n × p = 35 n × (1-p) = 965 => Usar Zcrítico Zcrítico = 1,96 26 p (1 p) 0,035 0,965 e0 Zcritico 1,96 0,0114 n 1000 LI p e0 0,035 0,0114 0,0236 LS p e0 0,035 0,0114 0,0464 Há 95% de probabilidade de que a verdadeira proporção populacional de defeituosos esteja entre 2,36% e 4,64%. 27 Correção de e0 Se n/N > 0,05, necessário corrigir e0 com o tamanho da população. Nn e0 corrigido e0 N 1 N = tamanho da população 28 Tamanho mínimo de amostra para Estimação por intervalo e0 depende de n. Dilema para o mesmo valor de n: ↑ 1- => ↑ e0 => ↓ precisão. ↓ e0 => ↑ precisão => ↓ 1- . Solução: obter n que satisfaça: Nível de confiança 1- E a precisão e0. 29 Tamanho de amostra para média 2 conhecida 2 desconhecida Zcritico s n e0 2 Zcritico n e0 2 Usar amostra piloto, n* t n 1,critico s n e0 2 30 Tamanho de amostra para proporção 2 Com amostra piloto: Zcritico p (1 p) n e0 Sem amostra piloto, estimativa exagerada, 2 2 p = 1- p = 0,5: Zcritico 1 Zcritico 0,25 n 4 e0 e0 31 Decisão e correção Se n ≤ n*, amostra piloto suficiente. Se n > n*, amostra piloto INSUFICIENTE, coletar mais elementos. Correção de n com tamanho da população: Nn n corrigido Nn 32 Exemplo 3 Ver 3o exemplo da Unidade 9. De acordo com os dados do Exemplo 1. Para estimar a média, com 1% de significância e precisão de 0,2 kg, esta amostra é suficiente 33 1- = 0,99 x 8,2 s = 0,4 n=4 2 desconhecida, n < 30 => usar t n-1,crítico t3;0,005 = 5,84 e0 = 0,2 kg 34 Exemplo 3 2 t n 1,critico s 5,84 0,4 n 136,42 137 elementos e0 0,2 2 Amostra piloto de 4 elementos INSUFICIENTE para a confiança precisão exigidas. Devemos coletar mais 133 elementos. é e 35 Exemplo 4 Ver 4o exemplo da Unidade 9. Para o caso do Exemplo 2. Supondo 99% de confiança e precisão de 1%, esta amostra é suficiente para estimar a proporção populacional 36 1- = 0,99 n = 1000 p = 0,035 1- p = 0,965 n × p = 35 n × (1-p) = 965 => Usar Zcrítico Zcrítico = 2,58 e0 = 0,01 (1%) 37 Exemplo 4 2 Zcritico 2,58 p (1 p) n 0,035 0,965 0,01 e0 2 n 2248,14 2249 elementos Amostra piloto de 1000 elementos é INSUFICIENTE para a confiança e precisão exigidas. Devemos coletar mais 1249 elementos. 38 Empate técnico Opinião LI % LS % Godofredo Astrogildo 31% 37% Filismino Arquibaldo 14% 20% Urraca Hermengarda 13% 19% Salustiano Quintanilha 22% 28% Indecisos 11% 17% 39 Para saber mais Sobre propriedades e características desejáveis de um estimador: BARBETTA, P.A., REIS, M.M., BORNIA, A.C. Estatística para Cursos de Engenharia e Informática. São Paulo: Atlas, 2004, capítulo 7. 40 Tô afim de saber... Sobre estimadores e intervalos de confiança para variância: TRIOLA, M. Introdução à Estatística, Rio de Janeiro: LTC, 1999, capítulo 6. Para entender melhor o conceito de distribuição amostral, e sua relação com estimação de parâmetros, veja o arquivo Estima.xls,no ambiente virtual. 41 Para saber mais Sobre a utilização do Microsoft Excel para realizar estimação por intervalo, veja LEVINE, D. M., STEPHAN, D., KREHBIEL, T. C., BERENSON, M. L. Estatística: Teoria e Aplicações - Usando Microsoft Excel em Português. 5ª ed. – Rio de Janeiro: LTC, 200, capítulo 6. 42 Próxima aula Testes de hipóteses Lógica dos testes de hipóteses. Tipos de hipóteses. 43