módulo vii - intervalos de confiança

Propaganda
Estatística Indutiva
MÓDULO 7: INTERVALOS DE CONFIANÇA
7.1 Conceitos básicos
7.1.1 Parâmetro e estatística
Parâmetro
população.
é
a
descrição
numérica
de
uma
característica
da
Estatística é a descrição numérica de uma característica da amostra.
Na Estatística Indutiva, fazemos afirmações sobre os parâmetros da
população a partir de estatísticas obtidas de amostras da população.
Em geral, os valores obtidos da média amostral e do desviopadrão
amostral são diferentes dos valores da média populacional e do desviopadrão populacional, respectivamente.
7.1.2 Estimativa pontual e intervalar
Estimativa pontual é a estimativa de um único valor para um
parâmetro populacional.
Estimativa Intervalar é um intervalo de valores para estimar um
parâmetro populacional.
7.1.3 Nível de confiança
Nível de confiança é a probabilidade de que um intervalo estimado
contenha o parâmetro populacional.
7.2 Intervalos de confiança para a média
Considerando uma amostra casual simples com n elementos, dizemos
que a média dos dados da amostra é uma estimativa da média da
população. Para termos uma idéia mais precisa dessa estimativa, devemos
encontrar um intervalo de confiança para a média.
7.2.1 Intervalos de confiança para a média (n ≥ 30)
Para determinar um intervalo de confiança para a média
populacional, devemos primeiramente estabelecer um nível de confiança.
Para dado tamanho da amostra:

Quanto maior o nível de confiança, maior será o intervalo.

Quanto maior o intervalo, menor será a precisão da estimativa.
7.2.2 Erro para a média
Dado um nível de confiança, o erro (E) da estimativa é a maior
distância possível entre a estimativa pontual e o valor do parâmetro a ser
estimado.
Para calcularmos esse erro, usamos a fórmula:
Zc: valor crítico.
: desvio-padrão populacional.
n: número de elementos da amostra.
Encontramos o valor crítico na tabela de distribuição normal
reduzida.
Tabela 1. Distribuição Normal Reduzida.
No caso em que n ≥ 30, substituímos  (desvio-padrão populacional)
por s (desvio-padrão amostral).
Um intervalo de confiança c para a média populacional  é dado por:
Nesse caso, dizemos que a probabilidade de que o intervalo de
confiança contenha a média populacional  é c.
Leitura Complementar:
Distribuição Normal:
A distribuição normal é amplamente utilizada para modelar medidas
biológicas, medidas de produtos fabricados em série, etc.
Características da Distribuição Normal
I. A variável aleatória pode assumir qualquer valor real.
II. O gráfico é uma curva em forma de sino. A curva é simétrica em
relação à média (  ).
III. A área sob a curva normal é igual a 1. Essa área corresponde à
probabilidade de a variável aleatória assumir qualquer valor real.
Teorema do Limite Central:
Quando são retiradas amostras (com 30 ou mais elementos) de uma
população qualquer, a distribuição amostral das médias das amostras terá
uma distribuição aproximadamente normal, mesmo quando os dados da
população não forem normalmente distribuídos.
Devemos observar que, quanto maior o tamanho da amostra, melhor
será a aproximação.
Exemplo 1. Uma amostra aleatória de 40 elementos retirados de uma
população aproximadamente normal forneceu média de x =12,45 e desviopadrão s=2,15. Construir um intervalo de confiança de 95% para a média
dessa população.
Para encontrarmos o erro, utilizamos a fórmula:
pois n ≥ 30 e   s.
c= 95%, então Zc =1,96 (vide tabela anterior).
n=40
s=2,15
O intervalo de confiança é dado por:
12,45 - 0,67 <  < 12,45 + 0,67
11,78 <  < 13,12.
Portanto, com 95% de confiança, podemos dizer que a média
populacional está entre 11,78 e 13,12.
7.2.3 Intervalos de confiança para a média (n < 30)
Quando desconhecemos o desvio-padrão da população e também não
temos acesso a uma amostra com 30 ou mais elementos, construímos um
intervalo de confiança para a média utilizando a distribuição t de Student.
Leitura Complementar.
Distribuição t de Student.
As propriedades da curva t são:




A curva tem a forma de um sino.
A área total sob a curva é igual a 1.
A curva t é simétrica em torno da média.
A distribuição t é uma família de curvas; cada uma delas depende de um
parâmetro denominado grau de liberdade. Quando usamos a distribuição
t para estimar a média populacional, o número de graus de liberdade é
igual ao tamanho da amostra menos 1 (g.l.=n-1).
A distribuição t é uma família de curvas. Cada uma delas depende de
um parâmetro denominado grau de liberdade. Quando utilizamos a
distribuição t para estimar a média populacional, o número do grau de
liberdade é igual ao tamanho da amostra menos 1. (g.l.=n-1).
Para encontrarmos o erro, utilizamos a fórmula:
valor de tc é encontrado na tabela da distribuição t.
, onde o
Tabela 1. Distribuição t.
O valor de tc é visualizado na intersecção da linha (que representa o
grau de liberdade) e da coluna (que representa o valor de c). Veja, a seguir,
o caso em que n=10 (g.l=10-1=9) e c=90%.
Exemplo 2. Uma amostra de 10 elementos, extraída de uma
população com distribuição normal, forneceu média x =3,45 e desviopadrão s=0,75. Construir um intervalo de confiança de 90% para a média
dessa população.
Para encontrarmos o erro, utilizamos a fórmula:
s=0,75
c=90%
n=10 e grau de liberdade=10-1=9.
tc = 1,833 (veja a tabela a seguir).
O intervalo de confiança é dado por:
3,45 - 0,43 <  < 3,45 + 0,43
3,02 <  < 3,88.
Portanto, com 90% de confiança, podemos dizer que a média
populacional está entre 3,02 e 3,88.
Download