Amostra

Propaganda
CAPÍTULO II
Inferência Estatística Paramétrica
Prof. Dr.Miguel Angel Uribe Opazo
1. Introdução
O objetivo da Inferência Estatística é
produzir afirmações sobre uma
determinada característica
da
população,
na
qual
estamos
interessados em estudar, a partir de
informações colhidas de uma parte
dessa população chamada Amostra.
INTRODUÇÃO
• Esta característica pode ser representada por
uma Variável Aleatória.
• Essa Variável Aleatório pode ser discreta ou
continua.
• No caso de variável discreta se tivéssemos
informações completas sobre a função de
probabilidade, ou no caso de variável contínua
se tivéssemos informações completas sobre a
função densidade de probabilidade, não
teríamos necessidade de colher uma
amostra.
INTRODUÇÃO
Toda afirmação desejada seria obtida através da
distribuição da variável aleatória, usando-se as
propriedades estudadas. Mas isso raramente
acontece.
• Podemos admitir, por exemplo, que a altura dos
brasileiros adultos, que ela siga uma distribuição
normal. Mas desconhecemos os parâmetros
que a caracterizam (média e variância)?.
INTRODUÇÃO
• Em outros casos, podemos ter uma idéia
da média e da variância, mas
desconhecemos a forma da curva.
• Então, o uso de uma amostra nos ajudaria
a formar uma opinião sobre o
comportamento da variável na população.
População e Amostra
• População: é o conjunto total de elementos
portadores de, pelo menos, uma característica
em comum, sob investigação.
• Amostra: é um subconjunto representativo da
população que é examinada com o propósito de
tirarmos conclusões sobre a essa população.
• Elemento Amostral: é um elemento da
amostra, na qual será colhidas as informacoes.
Como Selecionar uma Amostra
• A maneira de se obter uma amostra é tão
importante, e existem tantos modos de
fazê-lo,
que
esses
procedimentos
constituem especialidades dentro da
estatística,
sendo
Amostragem
e
Planejamento de experimentos as duas
mais conhecidas.
Como Selecionar uma Amostra
• Poderíamos dividir os procedimentos
científicos de obtenção de dados
amostrais em três grandes grupos:
- Levantamento Amostral;
- Planejamentos de Experimentos;
- Levantamentos observacionais.
Planejamento de Experimento
• Depende do delineamento de experimentos
a utilizar.
• Inteiramente Casualizado
• Blocos ao acaso.
• Quadrado latino.
LEVANTAMENTOS OBSERVACIONAIS
• Através de banco de dados públicos e
privados.
• De revistas científicas.
• De documentos.
Levantamento Amostral
Métodos Probabilísticos
• Exigem que cada elemento da população
possua determinada probabilidade de
ser selecionado.
• Normalmente possuem a mesma
probabilidade. Assim, se N for o tamanho
da população, a probabilidade de cada
elemento ser selecionado será 1/N.
Métodos Probabilísticos
• Trata-se do método que garante cientificamente
a aplicação das técnicas estatísticas de
inferências.
• Somente
com
base
em
amostragens
probabilísticas é que se podem realizar
inferências ou induções sobre a população a
partir do conhecimento da amostra.
• É uma técnica especial para recolher amostras,
que garantem, tanto quanto possível, o acaso
na escolha.
Tipo de Amostragem
Probabilístico
•
•
•
•
•
Amostragem Simples Aleatória
Amostragem Sistemático
Amostragem Estratificado
Amostragem por Conglomerados
Amostragem Múltipla
Amostragem Simples Aleatória
• Também conhecido por amostragem ocasional,
acidental, randônico, elementar.
• Este tipo de amostragem destaca-se por ser um
processo de seleção bastante fácil e muito
usado.
• Neste processo de seleção, todos os elementos
da população têm igual probabilidade de serem
escolhidos (1/N), não só antes de ser iniciado,
como também até completar-se o processo de
coleta.
Procedimento da Escolha da Amostra
•Devem-se enumerar todos os elementos
da população. Se por exemplo nossa
população tem 5000 elementos (N), devese numerá-los de 1 a 5000 ou, como
acontece geralmente, usa-se um número
que já identifica o elemento.
•Devem-se efetuar sucessivos sorteios com
reposição até completar o tamanho da
amostra (n).
Procedimento da Escolha da Amostra
• O processo termina quando for escolhidos
os n elementos da amostra.
• Se o número escolhido sai mais de uma
vez, só será considerada uma vez e
prossegui-se com
o processo até
terminar. Se o número sorteado não
existe na população, simplesmente não se
considera e prossegui-se o processo.
Procedimento da Escolha da Amostra
• Para realizar este sorteio, podemos utilizar
“tábuas de números aleatórios”, programas
computacionais (Excel, Minitab, SPSS) ou
calculadoras.
• Existem calculadoras que têm o comando RAN,
este comando, escolhe aleatoriamente números
entre zero e um. Para a escolha de cada
elemento pode-se utilizar o seguinte método:
Número escolhido = N * (RAN) + 1, sendo N o
número total de elementos da população e
RAN um número aleatório entre zero e um.
Amostragem Sistemático
Trata-se de uma variação da amostragem
simples aleatório, muito conveniente
quando a população está naturalmente
ordenada, e caso as retiradas dos
elementos da amostra seja
feita
periodicamente.
Procedimento da escolha da amostra
por amostragem sistemático
• Seja N o tamanho da população e n o
tamanho da amostra.
• Então,
calcula-se
o
intervalo
de
amostragem N/n ou inteiro mais próximo
“a”.
• Sorteia-se, utilizando a tábua de números
aleatórios, um número x entre 1 e “a”
formando-se a amostra dos elementos
correspondentes aos números:
x, x + a, x + 2a , x+ 3a, ..., x + (n-1)a.
Amostragem Estratificado
• Quando a população é heterogenia, a
amostragem simples e sistemática não
refletem essa heterogeneidade.
• Nesse caso, utiliza-se uma amostragem
denominada estratificada, obtida pela
separação das unidades da população em
grupos distintos (chamados estratos);
Amostragem Estratificado
• Em seguida seleciona-se uma amostra
aleatória simples a partir de cada estrato.
• A amostra completa compõe-se de
agregação das amostras de cada estrato
e, geralmente, a proporcionalidade do
tamanho é mantida na amostra.
Procedimento da Escolha da Amostra
Estratificado
• Estratificar uma população é dividir em L subpopulações homogenias denominados estratos;
• tais Estratos tem Ni elementos (i=1,2,...,L), tais
que:
N = N1 + N2 + ...+ NL,
em que, os estratos são mutuamente exclusivos.
• Após a determinação dos estratos, seleciona-se
uma amostra aleatória de cada sub-população
proporcional ao tamanho do estrato.
Amostragem por Conglomerados
• Algumas populações não permitem,
tornam extremamente difícil que
identifiquem seus elementos.
ou
se
• Não obstante isso, pode ser relativamente
fácil identificar alguns subgrupos da
população.
• Em tais casos, uma amostra aleatória simples
desses subgrupos (conglomerados) pode se
colhida, e uma contagem completa deve ser
feita para o conglomerado sorteado.
Agrupamentos típicos são quarteirões, famílias,
organizações, agências, edifícios etc.
1
2
3 4 5
6
7 8 9 10
11 12 13 14 15
16 17 18 19 20
21 22 23 24 25
Amostragem Múltipla
A amostra é retirada em diversas etapas
sucessivas.
Dependendo dos resultados observados,
etapas suplementares podem ser
dispensadas.
• Existem outros tipos de amostragem não
probabilísticos, que são amostragens em
que há uma escolha deliberada dos
elementos da amostra.
• Este tipo de amostragem não é possível
generalizar os resultados das pesquisas
para a população, pois as amostras nãoprobabilísticas
não
garantem
a
representatividade da população.
Amostragem não
Probabilistico
• amostragem acidental (os elementos vão
aparecendo);
• amostragem intencional (a escolha é de
acordo com determinado critério, é escolhido
intencionalmente um grupo de elementos que
irão compor a amostra);
• amostragem por quotas (define características
que devem ser levadas em conta).
Tamanho da Amostra
• o tamanho da amostra n da seguinte forma:
z
n = ( ) p (1  p ) .

2
Tamanho da Amostra
Tamanho da Amostra
Como se pode notar, f(p) tem a forma de uma parábola com valor máximo alcançado
para p = 1/2, o que corresponde a f(p) = 0,25. Assim, é possível escrever a seguinte
desigualdade:
z
z
( ) 2 p (1  p)  ( ) 2 0,5(1  0,5)


n
.

n´
.
Isto é, o valor de n, que se esta procurando, é sempre menor ou igual a
z 2
n´ = ( ) 0,25 .

Resumo da Tabela Normal Padrão
Coeficiente de confiança
(1-  )100%
99,74
99,00
95,44
95,00
92,82
90,00
85,00
80,00
68,26
Nível de significância
(  )100%
0,26
1,00
4,56
5,00
7,18
10,00
15,00
20,00
31,74
valor
z
3,00
2,58
2,00
1,96
1,80
1,65
1,44
1,28
1,00
Tamanho da Amostra
n*
n
(n*  1)
1
N
Download