1 Estimação de Parâmetros 1. Introdução O objetivo da Estatística é a realização de inferência acerca de uma população, baseadas nas informações amostrais. Como as populações são caracterizados por medidas numéricas descritivas, denominadas parâmetros, a inferência estatística diz respeito à realização de inferência sobre esses parâmetros populacionais. Os métodos utilizados para realização de inferências a respeito dos parâmetros pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro ou pode-se tomar decisões relativas ao mesmo, através de um teste de hipótese. A estimação é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos. Qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Entre as mais comuns, estão a média, variância e proporção populacional. 2. Estimativas pontuais e intervalares As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais. Assim uma média amostral é usada como estimativa de uma média populacional. Tias estimativas chamam-se estimativas pontuais, porque originam única estimativa do parâmetro. A amostragem aleatória apresenta tendência a gerar amostras em que as médias amostrais não são iguais à média da população, embora os valores, em geral, sejam próximos. Em virtude desta variabilidade amostral, é usual incluir uma estimativa intervalares, com um certo nível de confiança (1-) ou de significância , para acompanhar a estimativa pontual. Essa nova estimativa proporciona um intervalo, de possíveis valores do parâmetro, denominado intervalo de confiança. 3. Tipos de intervalo de confiança Intervalo de confiança para a média populacional Pequenas amostras ou 2 desconhecida Considera-se uma amostra pequena quando n Student Onde n-1 ( ) 30 . Neste caso utilizasse a tabela da distribuição t - S S P x t . x t . 1 n n Exemplo: Ex1: Para estimar o tempo médio de atendimento em um restaurante do tipo fast-food, um pesquisador anotou o tempo gasto por 30 garçonetes (uma amostra aleatória) para completar um pedido padrão (consistindo de dois hamburgers, dois pacotes de fritas e duas bebidas). As garçonetes levaram, em média, 78,4 segundos, com desvio padrão de 13,2 segundos, para completar os pedidos. Construa um intervalo de 95% de confiança para o verdadeiro tempo médio para completar um pedido padrão. n 30 x 78 ,4 13 ,2 t 2 ,042 2 13 ,2 13 ,2 P 78 ,4 2 ,045 78 ,4 2 ,045 95% 30 30 13 ,2 13 ,2 P 78 ,4 2 ,045 78 ,4 2 ,045 95% 5 ,477 5 ,477 P 78 ,4 2 ,045 2 ,410 78 ,4 2 ,045 2 ,410 95% P 78 ,4 4 ,928 78 ,4 4 ,928 95% P 73 ,471 83 ,328 95% Interpretação: Com 95% de confiança podemos afirmar que o verdadeiro tempo médio que as garçonetes levam para completar um pedido encontra-se entre 73,479 e 83,321 segundos. Ex2: Para avaliar o peso médio de uma nova safra de limões, o administrador da fazenda obteve os pesos de 25 limões novos (presumivelmente de uma amostra aleatória) encontrando uma média de 115,2 gramas, com desvio padrão de 20,4 gramas. Construa um intervalo de confiança de 98%, para o verdadeiro peso médio dos limões. Ex3: Em um estudo de liberdade condicional com trabalho para presos condenados por crimes não violentos, constatou-se que 19 deles, puderam manter os empregos ganhado uma média de R$ 250,00 por mês com um desvio padrão de R$ 55,00. Construa um intervalo de 99% de confiança para o ganho mensal real dos presidiários. Grandes amostras. Considera-se uma amostra grande quando n Normal >30 Neste caso utilizasse a tabela Z - Distribuição P x Z . x Z . 1 2 2 n n Exemplo: Ex1: Uma amostra aleatória de 40 tambores de um produto químico, utilizado na produção de adubos, tem peso médio de 115 kg e desvio padrão de 5,5 kg. Construa um intervalo de confiança de 95 % para o peso dos tambores. n 40 Z 1 ,96 2 x 115 5 ,5 5 ,5 5 ,5 P 115 1 ,96 115 1 ,96 95% 40 40 5 ,5 5 ,5 P 115 1 ,96 115 1 ,96 95% 6 , 324 6 , 324 P 115 1 ,96 0 ,869 115 1 ,96 0 ,869 95% P 115 1 ,703 115 1 ,703 95% P 113 ,297 116 ,703 95% Interpretação: 3 Com 95% de confiança podemos afirmar que o verdadeiro peso dos tambores de produtos químicos encontra-se entre 113,297 kg e 116,703 kg. Ex2: Uma pesquisa amostral feita em uma zona rural em 1994 mostrou que 250 famílias gastaram, em média, R$35,00 por semana com alimentação, com desvio padrão de R$ 2,50. Como há interesse em especificar, dentro de um intervalo de confiança bastante estreito, a despesa semanal real com alimentação familiar naquela área, construa um intervalo de 90% de confiança. Ex3: O proprietário de uma rede de postos de serviço para caminhões mantém extensos registros de suas várias transações com seus clientes. Se uma amostra aleatória de 118 desses registros acusa uma venda média de 58,22 galões de óleo diesel, com desvio padrão de 4,80 galões. a) Construa um intervalo de confiança de 98% para a média da população que gerou esta amostra b) Construa um intervalo de confiança de 95% para a média da população que gerou esta amostra Intervalo de confiança para a proporção populacional ( p) P p̂0 Z p̂ p p̂0 Z p̂ 1 2 2 onde: p̂0 x n ; p̂ p̂0 q̂0 n e q̂ 0 1 p̂ 0 Exemplo: Ex1: Examinadas 500 peças de uma grande produção encontrou-se 260 defeituosas. Com um grau de confiança de 90% construir um intervalo de confiança para verdadeira proporção de peças defeituosas. P p̂0 Z p̂ p p̂0 Z p̂ 1 2 2 n 500 Z 1 ,64 2 x 260 x 260 p̂0 q̂ 0 0 ,52 0 ,48 p̂ 0 0 ,52 p̂ 0 ,0223 n 500 n 500 q̂ 0 1 p̂ 0 1 0 ,52 0 ,48 P 0 ,52 1 ,64 0 ,0223 p 0 ,52 1 ,64 0 ,0223 90% P 0 ,52 0 ,0365 p 0 ,52 0 ,0365 90% P 0 ,4835 p 0 ,5565 90% P 48 ,35% p 55 ,65% 90% Interpretação: O intervalo de 48,35% a 55,65% contem a verdadeira percentagem de peças defeituosas. 4 Ex2: Para estimar a porcentagem de alunos de um curso favoráveis á modificação do currículo escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis. Construir um intervalo de confiança para a,proporção de todos os alunos favoráveis à modificação, use um = 4% Ex3: Em uma linha de produção de certa peça mecânica, colheu-se uma amostra de 100 itens, constatando-se que 4 peças eram defeituosas. Construir um intervalo de confiança para proporção de peças defeituosas ao nível de 10% de confiança. Intervalo de confiança para variância ( 2 ) Sabe-se que o estimador não-tendencioso de 2 é S 2 e que E( S 2 ) = 2 , enquanto 2 V S 2 2 No entanto, para se construir um intervalo de confiança para 2 é necessário, (n 1) ainda conhecer qual é o comportamento de S 2 , isto é, qual é o modelo teórico (probabilístico) seguido pelo estimador. Assim antes de se construir um intervalo de confiança para a variância populacional é necessário se conhecer um novo modelo probabilístico denominado de quiquadrado e representado por 2 (c grego). Propriedade da distribuição qui-quadrado ­ A distribuição qui-quadrado não é simétrica, ao contrário das distribuições normal e t de Student. ­ A distribuição 2 é assimétrica positiva (possuí uma cauda à direita) e depende do número de graus de liberdade . A figura 1 mostra alguns exemplos de modelos qui-quadrado. Figura1- Algumas distribuições de qui-quadrado. ­ A medida que número de gruas de liberdade aumenta distribuição de qui-quadrado tende a uma distribuição normal, isto pode ser verificado na figura 1. ­ Os valores de qui-quadrado podem ser zero ou positivos; nunca podem ser negativos Tabelas 2 A distribuição está tabelada em função do grau de liberdade n 1 (linha da tabela) e área à sua direita, isto é, P ( 2 c) , com o valor do parâmetro (graus de liberdade) e uma determinada probabilidade (área), a tabela fornece um valor da variável (abscissa) tal que a probabilidade à direita (área) deste valor seja igual a área especificada. O intervalo O comportamento da distribuição de probabilidade, apresentado pela variância amostral S 2 está relacionado com a distribuição 2 (modelo) através do seguinte resultado: (n 1)S 2 , isto é, a variância segue uma distribuição 2 com “n-1” graus de liberdade a 2 menos de uma constante. Neste caso n 1 . n21 5 Suponha que seja fixado um nível de confiança de “1- ” e que 12 e 22 sejam dois valores da distribuição 2 tais que P( n21;1 2 n21; 2 ) 1 2 P( 2 n 1;1 2 2 2 n 1; 2 ) 1 e introduzindo a expressão anterior da variável 2 n1 , tem- se: (n - 1) S 2 P n21;1 n21; = 1 - 2 2 2 1 2 1 P 2 > > 2 = 1- n 1; (n - 1) S 2 n1;1 2 2 tenha uma área (probabilidade) a direita igual a 5% e n21; 2 n 1; 1- α ( ( (n - 1) S 2 (n - 1) S 2 P 2 2 2 = 1 - assim o intervalo de confiança (probabilidade) n 1; n1;1 2 2 de “1- ”para variância da população é dado por: 2 2 n - 1) S ; n - 1) S 2 2 n-1;α n1;1- α 2 2 Ex: Uma amostra de onze elementos extraída de uma população com distribuição normal, forneceu uma variância de S 2 7,08 . Construir um intervalo de 90% de confiança para variância desta população. Solução: Neste caso é necessário inicialmente determinar os valores da distribuição 2 , de modo, que tenha uma área 2 2 (probabilidade) a esquerda igual a 95%. Estes valores são: n21; =3,940 e n21; =18,307. Desta 2 2 ( ( forma, o intervalo para variância será: 11 - 1) 7,08 ; 11 - 1) 7,08 = [3,86; 17,96] ou seja pode-se 18,307 3,940 afirmar com uma certeza de 90% de que este intervalo conterá a variância populacional. Exercícios 1. Um estudo feito por uma companhia aérea mostrou que uma amostra aleatória de 120 de seus passageiros que desembarcaram no aeroporto Kennedy, em vôos provenientes da Europa, gastam em média 24,15 minutos, com S = 3,29 min, para retirar sua bagagem e passar pela alfândega. Construir um intervalo de confiança para o tempo que os passageiros gastam para retirar suas bagagens e passar pela alfândega use um = 2% 2. Em uma pesquisa de opinião, entre 600 pessoas pesquisadas, 240 responderam sim a determinada pergunta. Estimar a percentagem de pessoas com essa mesma opinião na população, dando um intervalo de 95% de confiabilidade. 3. A experiência com trabalhadores de uma indústria indica que o tempo necessário para que um trabalhador, aleatoriamente selecionado, realize uma tarefa é distribuído normalmente com variância 6 de 144 minutos.Uma amostra de 25 trabalhadores forneceu média de 140 min. Determinar os limites de confiança de 90% para média da população de todos os trabalhadores que fazem aquele determinado serviço. 4. Uma votação realizada entre 400 eleitores, escolhidos ao acaso, dentre todos os eleitores de um determinado distrito, indicou que 55% deles são a favor do candidato A Determinar os limites de confiança de 99% para a proporção de todos os eleitores do distrito favoráveis ao candidato A. 5. Uma amostra aleatória de 80 notas de matemática de uma população de 5000 notas apresenta média de 5,5 e desvio padrão de 1,25. Quais os limites de confiança de 98% para a média das 5000 notas. 6. Colhida uma amostra de 12 peças, forneceu os seguintes pesos (g). 10 12 8 9 10 12 11 12 13 15 12 15 Por meio da construção de um intervalo de confiança de 98%, responder se esta amostra satisfaz a especificação pela qual o peso médio deve ser de 12 g. 7. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Encontrar os limites de confiança de 90% para a proporção da população favorável a fluoração. 8. Suponha que as alturas dos alunos de nossa Faculdade tenha uma variância de 100 cm. Foi retirada uma amostra aleatória de 100 alunos obtendo-se média de 1.65 cm. Construir ao nível de significância de 95% o intervalo para a verdadeira altura média dos alunos. 9. Para 6, 6, 7, 8, 9, 9, 9, 10, 11, 12, calcular o I.C. para 2, ao nível de 90%. 10. De uma população normal foi retirada uma amostra de 15 elementos e calculou-se: xi = 8,7 e xi2 = 27,3. Determinar um I.C. de 80% para a variância dessa população. 11. Calcular um I.C. de 96% para a variância da distribuição mostrada a seguir (suposta como normal): Classe Freqüência 2,2 | 6,2 3 6,2 | 10,2 4 10,2 | 14,2 5 14,2 | 18,3 3