Estimação e Intervalo de Confiança Estimação • Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. • A estimação é o processo que consiste no uso de dados da amostra (dados amostrais) para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções etc. Estimação Amostra Média Desvio Padrão Amostra Média Desvio Padrão População Estimativas Pontuais e Intervalares • Chamamos de estimador a quantidade calculada em função dos elementos da amostra, que será usada no processo de estimação do parâmetro desejado. – O estimador é, como vemos, uma estatística. Será, portanto, uma variável aleatória caracterizada por uma distribuição de probabilidade e seus respectivos parâmetros próprios. • Chamaremos de estimativa a cada valor particular assumido por um estimador. Estimativa Pontual • É quando fazemos uma única estimativa (um valor) para um determinado parâmetro populacional. Vejamos os exemplos: Estimativa Intervalar • É quando fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional. • Neste tipo de estimativa temos um intervalo de valores em torno do parâmetro amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. A esse intervalo chamamos intervalo de confiança Estimativa de Médias de uma População • Para efetuar a Estimativa de Médias de uma População utiliza-se desvio padrão da distribuição que constitui a amostra (distribuição amostral), deve-se levar em consideração se o desvio padrão da população é ou não conhecido. • Para desvio padrão populacional conhecido temos: • Estimativa Intervalar da média • Salientamos que a estimativa intervalar da média populacional baseia-se na hipótese de que a distribuição das médias amostrais é normal, daí usarmos a nova variável z. Para grandes amostras (quando n é maior que 30) esta premissa é garantida pelo Teorema do Limite Central; • Para amostras de 30 ou menos elementos, é importante saber que a população submetida à amostragem distribuição-t (Student) Teorema do Limite • As médias das amostras apresentam uma distribuição normal, desde que sejam independentes • Média das médias converge para a média da população µ • Desvio padrão é / n Usando a tabela z • • • • • • z < 0,21 Z < -1,2 P(Z≤ 1,23) = 0,890651 P(Z< 1,02) = 0,153864 P(Z> 1,45) = 0,073529 P (-1,03 < Z < 1,02) = 0,846136 - 0,151505 A tabela (µ = 0, σ =1) • µ = 15, σ =7 • P(X<13) 0,385908 Z = (X - µ) / σ Z = (13 – 15)/7 = 0,29 Cálculo do Intervalo de Confiança • Considerando que uma amostra de cem elementos extraída de uma população aproximadamente normal, cujo desvio padrão é igual a 2, forneceu média de 35,6 (x ), construir intervalos de confiança de 90%, 95% e 99% para a média dessa população. Exemplo 0,5 90 -> 0,45 95 -> 0,475 99 -> 0,495 0,5 Erro admitido num intervalo (erro de estimação) • É a diferença entre a média da amostra e a verdadeira média da população. • Como o intervalo de confiança tem centro na média da amostra, o erro máximo provável que está sendo admitido é igual à metade da amplitude do intervalo. • O erro de estimação pode ser descrito pela relação: Percebemos que quando aumentamos este erro potencial aumenta. Podemos concluir também que maiores amostras (aumenta n) possuem um potencial de erro menor. Distribuição t de Student • Para pequenas amostras a distribuição normal apresenta valores menos precisos, o que nos leva a utilizar um modelo melhor. Distribuição t de Student • Existe um valor de t para cada tamanho de amostra, sendo que à medida que a amostra (n) cresce, a distribuição t de Student se aproxima da distribuição normal. • Para calcular o valor de t a ser usado é necessário ter: – Um nível de confiança desejado: – Qual o número de graus de liberdade a ser utilizado: Exemplo • Sabendo-se que uma amostra tem 25 elementos, que a sua média 150 e desvio padrão igual a 10. Represente um intervalo de confiança em nível de 90%. • Como a amostra é menor que 30 elementos, então iremos usar a distribuição t de Student. Se desejamos um intervalo de confiança de 90%, temos: Valor de t • Para trabalharmos com a tabela, encontramos o número de graus de liberdade, que é: (n-1), logo (25-1)=24. Tabela (24,095)=1,711 Valor de t Determinação do Tamanho da Amostra • O tamanho da amostra depende de 3 fatores, conforme abaixo: – O grau de confiança desejado (z); – Quantidade de dispersão entre os valores individuais da população ( ); – Erro tolerável ou admitido (e). • Formula Exemplo • Qual o tamanho de amostra necessária para se estimar a média de uma população infinita cujo desvio padrão é igual a 4, com 98% de confiança e erro de 0,5?