Estatística Indutiva MÓDULO 7: INTERVALOS DE CONFIANÇA 7.1 Conceitos básicos 7.1.1 Parâmetro e estatística Parâmetro população. é a descrição numérica de uma característica da Estatística é a descrição numérica de uma característica da amostra. Na Estatística Indutiva, fazemos afirmações sobre os parâmetros da população a partir de estatísticas obtidas de amostras da população. Em geral, os valores obtidos da média amostral e do desviopadrão amostral são diferentes dos valores da média populacional e do desviopadrão populacional, respectivamente. 7.1.2 Estimativa pontual e intervalar Estimativa pontual é a estimativa de um único valor para um parâmetro populacional. Estimativa Intervalar é um intervalo de valores para estimar um parâmetro populacional. 7.1.3 Nível de confiança Nível de confiança é a probabilidade de que um intervalo estimado contenha o parâmetro populacional. 7.2 Intervalos de confiança para a média Considerando uma amostra casual simples com n elementos, dizemos que a média dos dados da amostra é uma estimativa da média da população. Para termos uma idéia mais precisa dessa estimativa, devemos encontrar um intervalo de confiança para a média. 7.2.1 Intervalos de confiança para a média (n ≥ 30) Para determinar um intervalo de confiança para a média populacional, devemos primeiramente estabelecer um nível de confiança. Para dado tamanho da amostra: • Quanto maior o nível de confiança, maior será o intervalo. • Quanto maior o intervalo, menor será a precisão da estimativa. 7.2.2 Erro para a média Dado um nível de confiança, o erro (E) da estimativa é a maior distância possível entre a estimativa pontual e o valor do parâmetro a ser estimado. Para calcularmos esse erro, usamos a fórmula: Zc: valor crítico. σ: desvio-padrão populacional. n: número de elementos da amostra. Encontramos o valor crítico na tabela de distribuição normal reduzida. Tabela 1. Distribuição Normal Reduzida. No caso em que n ≥ 30, substituímos σ (desvio-padrão populacional) por s (desvio-padrão amostral). Um intervalo de confiança c para a média populacional μ é dado por: Nesse caso, dizemos que a probabilidade de que o intervalo de confiança contenha a média populacional μ é c. Leitura Complementar: Distribuição Normal: A distribuição normal é amplamente utilizada para modelar medidas biológicas, medidas de produtos fabricados em série, etc. Características da Distribuição Normal I. A variável aleatória pode assumir qualquer valor real. II. O gráfico é uma curva em forma de sino. A curva é simétrica em relação à média ( μ ). III. A área sob a curva normal é igual a 1. Essa área corresponde à probabilidade de a variável aleatória assumir qualquer valor real. Teorema do Limite Central: Quando são retiradas amostras (com 30 ou mais elementos) de uma população qualquer, a distribuição amostral das médias das amostras terá uma distribuição aproximadamente normal, mesmo quando os dados da população não forem normalmente distribuídos. Devemos observar que, quanto maior o tamanho da amostra, melhor será a aproximação. Exemplo 1. Uma amostra aleatória de 40 elementos retirados de uma população aproximadamente normal forneceu média de x =12,45 e desviopadrão s=2,15. Construir um intervalo de confiança de 95% para a média dessa população. Para encontrarmos o erro, utilizamos a fórmula: pois n ≥ 30 e σ ≅ s. c= 95%, então Zc =1,96 (vide tabela anterior). n=40 s=2,15 O intervalo de confiança é dado por: 12,45 - 0,67 < μ < 12,45 + 0,67 11,78 < μ < 13,12. Portanto, com 95% de confiança, podemos dizer que a média populacional está entre 11,78 e 13,12. 7.2.3 Intervalos de confiança para a média (n < 30) Quando desconhecemos o desvio-padrão da população e também não temos acesso a uma amostra com 30 ou mais elementos, construímos um intervalo de confiança para a média utilizando a distribuição t de Student. Leitura Complementar. Distribuição t de Student. As propriedades da curva t são: • • • • A curva tem a forma de um sino. A área total sob a curva é igual a 1. A curva t é simétrica em torno da média. A distribuição t é uma família de curvas; cada uma delas depende de um parâmetro denominado grau de liberdade. Quando usamos a distribuição t para estimar a média populacional, o número de graus de liberdade é igual ao tamanho da amostra menos 1 (g.l.=n-1). A distribuição t é uma família de curvas. Cada uma delas depende de um parâmetro denominado grau de liberdade. Quando utilizamos a distribuição t para estimar a média populacional, o número do grau de liberdade é igual ao tamanho da amostra menos 1. (g.l.=n-1). Para encontrarmos o erro, utilizamos a fórmula: valor de tc é encontrado na tabela da distribuição t. , onde o Tabela 1. Distribuição t. O valor de tc é visualizado na intersecção da linha (que representa o grau de liberdade) e da coluna (que representa o valor de c). Veja, a seguir, o caso em que n=10 (g.l=10-1=9) e c=90%. Exemplo 2. Uma amostra de 10 elementos, extraída de uma população com distribuição normal, forneceu média x =3,45 e desviopadrão s=0,75. Construir um intervalo de confiança de 90% para a média dessa população. Para encontrarmos o erro, utilizamos a fórmula: s=0,75 c=90% n=10 e grau de liberdade=10-1=9. tc = 1,833 (veja a tabela a seguir). O intervalo de confiança é dado por: 3,45 - 0,43 < μ < 3,45 + 0,43 3,02 < μ < 3,88. Portanto, com 90% de confiança, podemos dizer que a média populacional está entre 3,02 e 3,88.