θ BBBB θ θ = θ ˆ

Propaganda
Prof. Janete Pereira Amador
1
1. Introdução
O objetivo da Estatística é a realização de inferência acerca de uma população,
baseadas nas informações amostrais. Como as populações são caracterizados por medidas
numéricas descritivas, denominadas parâmetros, a inferência estatística diz respeito à
realização de inferência sobre esses parâmetros populacionais.
Os métodos utilizados para realização de inferências a respeito dos parâmetros
pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro ou pode-se
tomar decisões relativas ao mesmo, através de um teste de hipótese.
A estimação é o processo que consiste em utilizar dados amostrais para estimar os
valores de parâmetros populacionais desconhecidos. Qualquer característica de uma
população pode ser estimada a partir de uma amostra aleatória. Entre as mais comuns,
estão a média, variância e proporção populacional.
Parâmetros ( ): são medidas descritivas da população
θ
Estatísticas ou Estimadores ( ̂ ):são variáveis aleatórias que assumem valores diferentes
para diferentes amostras, são representados por letras romanas.
Parâmetro (população)
Estimador (amostra)
x = média
 = média
S²
= variância
² = variância
S = desvio padrão
 = desvio padrão
P = proporção
 = Proporção
1 Propriedades dos Estimadores
Cada parâmetro a ser estimado, poderá ter diferentes tipos de estimadores. Interessa,
evidentemente, escolher o “melhor” estimador. Qualifica-se com essa designação o
estimador que apresentar as seguintes propriedades.
a) Estimador não tendencioso (justo ou imparcial): Seja X uma variável aleatória
considerada na população, cuja distribuição de probabilidades dependa do parâmetro  e
seja  um estimador desse parâmetro. Diz-se que  é um estimador não tendencioso de 
se:
E( )  , isto é, se o valor médio do estimador for igual ao parâmetro.
b) Estimador eficiente: Sejam  e  , dois estimadores de um mesmo parâmetro “  ”, 
1
2
1
será um estimador mais eficiente do que 2 se V (ˆ1 ) < V (ˆ2 ) , ou seja:
Quanto menor a sua variância mais eficiente será o estimador.
c) Estimador consistente ou coerente: um estimador  é um estimador consistente do
parâmetro  , se além de ser justo sua variância tende para zero quando “n” é
suficientemente grande ( n   ).
- Se E (ˆ)   , isto é,  é justo.
- Se lim n var(ˆ)  0 ,então, ˆ é um estimador consistente de 
Prof. Janete Pereira Amador
2
2 Estimativas Pontuais e Intervalares
A estimação de parâmetros pode ser feita por ponto e por intervalo. No primeiro
caso, a estimativa do parâmetro populacional é feita através de um único valor estimado, ao
passo que, no segundo, constroem-se intervalos de confiança, o qual deverá, com
probabilidade conhecida, conter o valor do parâmetro. Uma suposição fundamental é que o
processo de amostragem seja probabilístico.
2.1 Estimativas pontuais
Estimativas pontuais são utilizadas quando a partir da amostra, procura-se obter um
único valor para o parâmetro. Uma estimativa por ponto é constituída por um valor
numérico simples. Por exemplo, X  30 é uma estimativa por ponto da média
populacional.
Seja X uma população com média  , desvio padrão  e com uma proporção  e seja
(X1, X2, ..., Xn) uma amostra aleatória simples extraída desta população. Então:
­ X é um estimador não-tendencioso e consistente da média da população  .
­ P é um estimador não-tendencioso e consistente da proporção populacional  .
­
S 2 é estimador não-tendencioso e consistente da variância da população  2 .
2.2 Estimativas por intervalo
A estimação por ponto é em geral insuficiente quando se quer determinar um dado
parâmetro. Isso decorre, porque a probabilidade de que a estimativa adotada venha coincidir
com o verdadeiro valor do parâmetro é, em geral, nula ou praticamente nula. Isso se deve ao
fato de que os estimadores são variáveis aleatórias, muitas vezes contínuas; logo, as
estimativas obtidas provavelmente serão distintas do valor do parâmetro. Ou seja, é quase
certo que esteja sendo cometido um erro de estimação, quando for utilizada a estimação por
ponto de um parâmetro populacional.
Devido a esse fato, surge a idéia de se construir um intervalo em torno da estimativa por
ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o
verdadeiro valor do parâmetro. Esse intervalo é chamado de intervalo de confiança para
parâmetro em estudo.
A seguir serão vistos como construir intervalos de confiança para os parâmetros mais usuais.
3.2.1 Tipos de intervalo de confiança
Intervalo de confiança para a média populacional (  )
Caso I – Desvio padrão populacional conhecido n  30
O intervalo de confiança para a média (  ) de uma população é construído em torno
da estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade 1-. de
que o intervalo construído contenha o parâmetro populacional. Desta forma,  será a
probabilidade de que o intervalo obtido não contenha o valor do parâmetro, isto é,  será a
probabilidade de erro. Sabe-se que a média da amostra tem distribuição normal de média
 e desvio padrão 
se a população de onde for extraída a amostra for normal (ou se
n
a amostra for superior a 30 e retirada de qualquer população) de média   e de desvio
Prof. Janete Pereira Amador
3
padrão  , pode-se então utilizar a curva normal para estabelecer os limites para o
intervalo de confiança. Assim o intervalo de confiança (probabilidade) de 1-. para a
média de uma população é dado por:


 
P x  Z  .
   x  Z .
  1  
2
2
n
n

X é a estimativa por ponto da média da população.
 é o desvio padrão da população e
Z 2 é o valor da distribuição normal padrão cuja área à direita é igual a  .
2
Ex: Uma amostra aleatória de 40 tambores de um produto químico, utilizado na produção de
adubos, tem peso médio de 115 kg e desvio padrão de 5,5 kg. Construa um intervalo de
confiança de 95 % para o peso dos tambores.
Solução:
n  40
Z  1,96
2
x  115
  5,5


 
P x  Z  .
   x  Z .
  1  
2
2
n
n


5,5
5,5 
P 115  1,96 
;115  1,96 

40
40 


5,5
5,5 
P 115  1,96 
;115  1,96 
6,324
6,324 

P115  1,96  0,869;115  1,96  0,869
P115  1,703;115  1,703
P113,297kg ;116,703kg  , ou seja, pode-se afirmar com uma certeza de 95% de que este
intervalo conterá a média desta população (tambores de químico).
Caso II - Desvio padrão populacional desconhecido ou se n  30
Quando o desvio padrão da população (  ) é desconhecido é necessário utilizar sua
estimativa “S”. Só que ao substituir o desvio padrão populacional pela sua estimativa,.
torna-se necessário a introdução de uma correção, isso porque “S” é um estimador viciado
para  .Assim, a correção consiste em usar a variável t de Student ao invés de “Z” na
expressão Z
sendo assim, têm-se t
.
σ
S
α2
α2
n
n
Neste caso, o intervalo de confiança com probabilidade “1 -  “ para a média será:
Onde  = n-1
S
S 

P x  t .
   x  t .
  1 
n
n

onde:
X é a estimativa por ponto da média da população;
S é o desvio padrão da amostra e uma estimativa do desvio padrão da população  ;
Prof. Janete Pereira Amador
4
t 2 é o valor da distribuição “t” cuja área à direita é igual a  /2, isto é, é o valor de “t” tal
que P (t  t 2 )   2 ou então P ( t  2  t  t  2 )  1   .
Ex: Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar a
sua média e forneceu os valores X = 50 e s = 10. Qual o intervalo de 95% de confiança para
a média desta população?
Solução:
Tem-se 1 -  = 95%, então  = 5% e  /2 = 2,5%. O coeficiente de confiança que deve
ser buscado na distribuição t com  = n - 1 = 25 - 1 = 24. Esta é a linha da tabela. A coluna
poderá ser o valor  = 5% ou então o valor  /2 = 2,5%, dependendo do tipo de tabela. Em
qualquer caso o que se procura é o valor “t” com grau de liberdade igual a 24, isto é, o valor
t24 tal que:
P ( t  2  t 24  t  2 )  95% este valor corresponde a 2,064. Então o intervalo de confiança
de 95% para média desta população será:


S
S  = 50  2,064  10 ;50  2,064  10 
P  X  t
;X  t
α2
α2
5
5
n
n
45,87;54,1 3 , ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo
conterá a média da população.


Intervalo de confiança para a proporção ( )
Seja p̂0 = proporção amostral que possui uma distribuição do tipo binomial, cuja média é
próprio parâmetro populacional  .
Desta forma o intervalo para proporção populacional será dado por
P pˆ 0  Z    pˆ  p  pˆ 0  Z    pˆ   1  

2
2

onde:
x
e q̂ 0  1  p̂ 0
n
p̂0  q̂0
é uma estimativa do erro padrão, isto é, do desvio padrão amostral.
 p̂ 
n
p̂ 0 
Ex1: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferência por
determinado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um
intervalo de confiança de 95% de probabilidade para o percentual de preferência dos
consumidores em geral para este produto.
Solução:
Tem-se 1 -  = 95%, então  = 5% e  /2 = 2,5%. O coeficiente de confiança que deve ser
buscado na normal padrão é valor Z de Z tal que: P(Z  z 2 )  2,5%  1,96 .
α2
A
estimativa
por
ponto
para
proporção
populacional
será:
.
Então
o
intervalo
de
confiança
de
95%
para
a
P  f n  240 / 400  0,60  60%
proporção populacional será: P pˆ 0  Z    pˆ  p  pˆ 0  Z    pˆ   1  

2
2

Prof. Janete Pereira Amador
5




0,60  1,96 0,60( 1 0,60) ;0,60  1,96 0,60( 1 0,60)   60%  4,80%;60%  4,80% 


400
400
55,20%;64,80% , ou seja pode-se afirmar com uma certeza de 95% de que este intervalo
conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que
preferem o produto pesquisado.
2. Examinadas 500 peças de uma grande produção encontrou-se 260 defeituosas. Com um
grau de confiança de 90% construir um intervalo de confiança para verdadeira proporção
de peças defeituosas.
Exercícios
1. A seguir encontra-se uma amostra de 10 árvores castanheiras todas com 8 anos de
idade numa certa floresta. O diâmetro (polegadas) das árvores foram medidos à uma
altura de 3 pés:
Queremos encontrar um intervalo de confiança de 95% para o verdadeiro diâmetro médio
de todas as árvores castanheiras dessa idade na floresta.
2. Dentre 100 peixes capturados num certo lago, 18 não estavam apropriados para
consumo devido aos níveis de poluição do ambiente. Construa um intervalo de confiança
de 99% para a correspondente verdadeira proporção
3. Para avaliar o peso médio de uma nova safra de limões, obteve-se uma amostra com os
pesos de 25 limões, encontrando-se uma média de 115,2 gramas, com desvio padrão de
20,4 gramas. Construa um intervalo de confiança de 98%, para o verdadeiro peso médio
dos limões.
2. Uma pesquisa feita em uma zona rural em 1994 mostrou que 250 famílias gastaram,
em média, R$35,00 por semana com alimentação, com desvio padrão de R$ 2,50. Como há
interesse em especificar, dentro de um intervalo de confiança bastante estreito, a despesa
semanal real com alimentação familiar naquela área, construa um intervalo de 90% de
confiança.
3. Tendo sido medido o eixo maior de 9 grãos de quartzo de um corpo arenoso em uma
lâmina de arenito, obteve-se um comprimento amostral médio de 1,5mm e um desvio
padrão de 0,3mm. Deseja-se construir um intervalo de confiança para o comprimento
médio dos grãos de quartzo do corpo arenoso.
4. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água
fluorada. Encontrar os limites de confiança de 90% para a proporção da população
favorável a fluoração.
5.
Para estimar a porcentagem de alunos de um curso favoráveis á modificação do
currículo escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis.
Prof. Janete Pereira Amador
6
Construir um intervalo de confiança para a,proporção de todos os alunos favoráveis à
modificação, use um  = 4%
Prof. Janete Pereira Amador
7
1 Introdução
Os métodos utilizados para realização de inferências a respeito dos parâmetros
pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro, através da
estimação de parâmetros ou pode-se tomar decisões relativas ao mesmo, através de um teste
de hipótese paramétrico (teste de significância).
O teste de significância ou teste de hipóteses paramétrico consiste em verificar se a
diferença entre um valor alegado de um parâmetro populacional e o valor de uma estatística
amostral pode ser razoavelmente atribuído a variabilidade amostral ou se a discrepância é
demasiadamente grande para ser encarada assim.
A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos
parâmetros populacionais.
2 Hipótese Estatística
Uma hipótese estatística é uma afirmação que pode ou não ser verdadeira sobre o valor
de um parâmetro ou sobre a distribuição de probabilidade de uma variável aleatória. Em
estatística existem dois tipos de hipótese estatística.
A Hipótese nula “H0” é a hipótese conservadora sempre pode ser expressa por uma
igualdade a zero. Por exemplo: H 0 :    0 ou H 0 :    0  0 .
A Hipótese alternativa “H1” é qualquer hipótese que diferi de uma dada hipótese nula é a
Hipótese experimental. Por exemplo: H 1 :    0 ou H 1 :    0 ou H 1 :    0 .
A Hipótese nula “H0” é uma afirmação que diz que o parâmetro populacional é tal como
especificado (isto é, a afirmação é verdadeira).
A Hipótese alternativa “H1” é uma afirmação que oferece uma alternativa à alegação (Isto
é, o parâmetro é maior ou menor que o valor alegado)
As hipóteses “H0” e “H1” são mutuamente excludentes, aceitando-se uma hipótese como
verdadeira, a outra, automaticamente, será rejeitada. Portanto deve-se tomar cuidado para
não ser cometido erros com relação aceitação e rejeição de “H0” e “H1”.
3 Tipos de Erro
Quando se realiza um teste de hipótese, pode-se cometer dois tipos de erro:
­ Erro tipo I: consiste em rejeitar “H0” quando ela é verdadeira. Pode ser
limitado pela escolha do nível de significância  que probabilidade de
rejeitar “H0” quando essa for verdadeira.
­ Erro tipo II: Consiste em aceitar “H0”, quando ela é falsa.
O nível de significância do  teste (probabilidade de rejeitar “H0” quando essa for
verdadeira) é fixada antes da extração das amostras. Os valores mais comuns para  são:
0.01, 0.05 e 0.10 ou 1%, 5% e 10%. Se por exemplo, ao delinear-se um teste, escolhe-se 
= 0.05 ou 5%, significa que em cerca de 5% rejeitar-se-ia erroneamente H0.
O coeficiente de confiança, indicado por (1 -  ), é a probabilidade de que a hipótese
nula H0 não seja rejeitada quando de fato for verdadeira e não deve ser rejeitada. Em
termos de metodologia do teste de hipóteses, esse coeficiente representa a probabilidade de
Prof. Janete Pereira Amador
8
se concluir que o determinado valor do parâmetro que está sendo testado para hipótese nula
seja plausível.
4 Teste de Hipóteses Unilateral e Bilaterais
Dependendo da hipótese alternativa, os testes são classificados como unilaterais e
bilaterais.
4.1 Teste de hipóteses bilateral
Os testes bilaterais se usam sempre que há divergência crítica em ambas as direções,
tal como ocorreria na fabricação de roupas, onde camisas muito grandes ou muito
pequenas não correspondem à determinação do padrão. Outro exemplo é o caso em que
peças devem ajustar-se uma a outra, como o parafuso e porca. Uma variação excessiva
ocasionará seja um ajuste muito frouxo, de modo que as peças não permanecerão unidas,
ou um ajuste excessivo impedindo a conjugação das peças. Assim por exemplo:
­ H 0 :    0 contra H 1 :    0 é um teste bilateral, esquematicamente:
Valor
tabelado
também
chamado de valor crítico, separa
a região de aceitação H0 (RA H0)
da região de rejeição (RR H0).
4.2 Teste de hipóteses unilateral a direita
O teste unilateral a direita é útil para testar se determinado padrão máximo não foi
excedido Como exemplo seria: teor máximo de gordura permitida em determinado tipo de
leite, radiação emitida por usinas nucleares, número de passas defeituosas de uma remessa
de certa mercadoria, quantidade de poluição atmosférica emitida por uma determinada
fabrica. Assim por exemplo:
H 0 :    0 contra , H 1 :    0 (  0 é o valor suposto para o parâmetro) é um teste
unilateral a direita, esquematicamente:
4.2 Teste de hipóteses unilateral a esquerda
O teste unilateral a esquerda é útil para verificar se determinado padrão mínimo foi
atingido. Como exemplo seria: conteúdo mínimo de gordura no leite, peso líquido de
Prof. Janete Pereira Amador
9
pacotes de determinado produto, vida de um produto tal qual como especificado no
certificado de garantia. Assim por exemplo:
­ H 0 :    0 contra H 1 :    0 é um teste unilateral a esquerda,
esquematicamente:
5 Procedimentos para Realização de um Teste de Hipóteses
Para realizar um teste de hipótese sugere-se seguir as seguintes etapas:
1) Formular as hipóteses;
2) Identificar a estatística do teste;
3) Determinar o nível de significância;
4) Calcular a estatística utilizando os valores amostrais;
5) Comparar as estatística calculada com a estatística tabelada;
6) Concluir.
5.1 Teste de hipóteses para média 
O objetivo do teste de significância para médias é avaliar afirmações feitas a
respeito de médias populacionais. Há basicamente três tipos de afirmação que se podem
fazer a cerca das médias populacionais e cada tipo requer um tipo diferente de avaliação.
Uma afirmação pode dizer respeito a média de uma única população; a avaliação envolve
então um teste de uma amostra. Ou pode-se afirmar que a média de duas populações são
iguais; tem-se então um teste de duas amostras. Finalmente pode-se afirmar que a as
médias de mais de duas populações são iguais, o que envolve um teste de K amostras
Análise de Variância.
5.1.1. Teste de significância de uma amostra para uma média  amostral contra um
valor paramétrico
De acordo com o teorema do limite central, se obtemos amostras grandes (n > 30)
(de qualquer população com qualquer distribuição), a distribuição das médias pode ser
aproximada por uma distribuição normal. Sendo assim, distribuição das médias amostrais
será aproximadamente normal com media  e desvio padrão 
n.

Em um teste de hipóteses, o valor de
corresponde a hipótese nula, e o valor do
desvio padrão populacional deve ser conhecido. Se  é desconhecido e as amostras são
grandes ( n  30 , podemos usar o desvio padrão amostral “S” em substituição σ , porque
grandes amostras aleatórias tendem a representar a população com distribuição normal.
Quando a amostra é pequena n  30 e/ou  2 é desconhecida utilizamos a
distribuição a distribuição t de Student
Prof. Janete Pereira Amador
10
Assim temos:
 Retira-se uma amostra de tamanho n e calcula-se X .
X  0
X  0
 Calcula-se o valor da estatística Z c 
ou t c 

S
n
n
 Sob a hipótese nula, tem-se que Zc possui uma distribuição normal padrão.Portanto,
Rejeita-se H0 se Z c  Z  2 (isto é, se Zc <  Z  2 ou Z c  Z  2 ) ou
Rejeita-se H0 se t c  t 2 , n1 (isto é, se tc< t 2 , n1 ou t 2  t 2 , n 1 )
Aceita-se H0 se Z c  Z  2 (isto é, Z c  Z  2 ), ou
Aceita-se H0 se t c  t 2 , n 1 (isto é, t c  t 2 , n 1 ), onde  é o nível de significância do
teste.
Ex1: Uma máquina automática para encher pacotes de café enche-os segundo uma
distribuição normal, com média  e variância (  2 ) igual a 400g2. A máquina foi regulada
para  = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes para verificar se a
produção está sob controle, isto é, se  = 500g ou não. Se uma dessas amostras
apresentasse uma média amostral de X = 492 g, você pararia ou não a produção para
regular máquina, considerando o nível de significância de 1%?
Solução
Ex: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma
amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão (S) de 3 mg. Ao nível de
5%, os dados refutam ou não a afirmação do fabricante?
Solução:
5.1.2 Teste de significância para a diferença entre duas médias populacionais
independentes.
Os testes de duas amostras são usados para decidir se as médias de duas populações
são iguais. Para a realização do teste exige que as duas amostras sejam independentes, uma
de cada população. Duas amostras são independentes se a amostra extraída de uma das
populações não tem qualquer relação com a amostra extraída da outra.
Esses testes são freqüentemente usados para comparar dois métodos de ensino, duas
marcas, duas cidades, dois distritos escolares, e outros casos análogos.
A estatística utilizada será:
Prof. Janete Pereira Amador
­ Zc 
11
x1  x 2   1   2  .
 12  22

n1 n 2
Quanto às hipóteses temos que:
A hipótese nula pode ser de que as duas populações tem médias iguais.
H 0 : 1   2
Enquanto que as alternativas podem ser:
H 1 : 1   2 ;
H 1 : 1   2 e H1 : 1   2 note que:
H 1 : 1   2 é equivalente a H 1 : 1   2
EX: Um fabricante de pneus faz dois tipos. Para o tipo A,  = 2500 milhas, e para o tipo
B,  = 3000 milhas. Um táxi testou 50 pneus do tipo A e 40 do tipo B, obtendo 24.000
milhas e 2.600 milhas de duração média dos respectivos tipos. Adotando-se um risco
 =4%, testar a hipótese de que a vida média dos dois tipos é a mesma.
Solução:
5.2 Teste de Hipótese para proporção
Os testes para proporções são adequados quando os dados sob análise consistem em
contagens ou freqüências de itens em duas ou mais classes. A finalidade de tais testes é
avaliar afirmações sobre a proporção ou percentagem de uma população. Os testes se
baseiam na premissa de que uma proporção amostral, isto é, x ocorrências em n
observações, ou x/n, será igual a verdadeira proporção populacional. Os testes focalizam
geralmente as diferenças entre um número esperado de ocorrências (supondo-se verdadeira
uma afirmação) e o número efetivamente observado. A diferença é então comparada com a
variabilidade prescrita por uma distribuição amostral baseada na hipótese de que H0 é
realmente verdadeira.
Em muitos aspectos, os testes para proporção se assemelham grandemente aos testes
para médias; apenas, nos testes para proporções, os dados amostrais se apresentam e
termos de contagens, ao invés de medidas. Por exemplo, os testes tanto para médias como
para proporções podem ser usados para avaliar alegações sobre:
­
Um parâmetro de uma única população (teste de uma amostra).
­
Igualdade de parâmetros de duas amostras (teste de duas amostras ).
­
Igualdade de parâmetros de mais de duas amostras (teste de k amostras)
Além disso, para grandes amostras, a distribuição amostral apropriada para testes de
proporções de uma e duas amostras é aproximadamente normal, tal como no caso de
testes para médias de uma e duas amostras.
Prof. Janete Pereira Amador
12
5.2.1 Teste de significância de uma amostra para a proporção 
Seja  a proporção dos elementos de uma população que possuem uma
determinada característica. Por exemplo,  é igual a proporção ou percentagem dos
habitantes, de uma determinada localidade, que possuem automóvel. Se quisermos testar a
hipótese de que essa proporção é igual a determinado valor, contra a alternativa dessa
proporção ser maior de que o valor especificado, lança-se as hipóteses:
H0:  =  0
Contra uma das hipóteses alternativas:
H1 :  >  0
H1 :    0
H1 :    0
Um bom estimador do parâmetro  é a proporção amostral P̂0 , que para grandes
amostras segue uma distribuição aproximadamente normal com média  e a variância
 (1   )
 (1  ) 
ou seja, P ~ N ,
.
n 
n

Portanto pode-se usar a variável normal padronizada.
número de sucessos na amostra
Pˆ  
x
sendo: P̂0 =
=
Zc  0
n
tamanho da amostra
Pˆ  qˆ
0
0
n
  proporção de sucesso a partir da hipótese nula
Para proceder ao teste de hipóteses, como nos casos anteriores, o valor de Zc.
calculado deve ser comparado com o de Z  dado em função de  , o nível de significância
do teste.
“Ex: Um industrial deseja certificar-se de que a fração de mercado que prefere seu produto
ao de seu concorrente é superior a 70%. Para tanto colheu uma amostra aleatória de 165
opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse
resultado, adotado o nível de significância de 5%?”
Solução:
5.2.2 Teste de significância para a diferença entre duas proporções.
Sejam P̂1 e P̂2 as proporções obtidas em duas amostras de tamanho n1 e n2 . Se
quisermos testar a hipótese de que as proporções  1 e  2 das proporções das quais foram
retiradas as amostras são iguais, formula-se as hipóteses de acordo com o tipo de deste que
poderá ser:
Prof. Janete Pereira Amador
13
Teste bicaudal
H0 : 1   2
Teste unicaudal a direita
Teste unicaudal a esquerda
H 0 : 1   2
H0 : 1   2
H1 :  1   2
H1 :  1   2
H1 :  1   2
Para realizar o teste usa-se a variável padronizada:
( P1  P2 )  ( 1   2 )
Z 
, que para grandes amostras segue uma
 1 (1   )
 2 (1   2 )

n1
n2
distribuição aproximadamente normal com média zero e variância 1.
Comparando-se o valor calculado Z (Zcalc) com o valor crítico, obtido na tabela da
distribuição normal padronizada, a um nível dado de significância  , decide-se pela
rejeição ou não de H0.
Deve-se observar que por H0:  1 -  2 = 0 e assim caso esses parâmetros sejam
desconhecidos, pode-se substituí-los pelos valores estimados P̂1 e P̂2 (são os estimadores)
de  na população) no cálculo de Z. Assim:
Pˆ1  Pˆ2
x
x
Zc 
sendo : Pˆ1  1 e Pˆ2  2
n1
n2
Pˆ1  qˆ1 Pˆ2 qˆ2

n1
n2
Ex: Um empresário deseja saber se o percentual de satisfação de seus clientes em relação a
dois produtos oferecidos por sua empresa são similares. Para isso entrevistou 180 pessoas,
das quais 80 disseram estar satisfeitas com o produto A e 100 com o produto B. Use =
5% e conclua a respeito.
Solução:
Exercícios
2. A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800
kg e desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação,
proclama-se que a tensão de ruptura pode ter aumentado. Para testar esta declaração,
ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tensão média de ruptura
de 1850 kg. Pode-se confirmar a declaração ao nível de significância de 0,01?
3. Os resíduos industriais jogados nos rios, muitas vezes, absorvem oxigênio reduzindo
assim o conteúdo do oxigênio necessário à respiração dos peixes e outras formas de
vida aquática. Uma lei estadual exige no mínimo de 5 ppm (partes por milhão) de
oxigênio dissolvido, afim de que o conteúdo de oxigênio seja suficiente para manter
ávida aquática. Seis amostras de água retiradas de um rio, durante a maré baixa,
revelaram os índices (em partes por milhão) de oxigênio dissolvido.
4,9
5,1
4,9
5,5
5,0
4,7
Estes dados são evidência para afirmar que conteúdo de oxigênio é menor que 5
ppm.Teste considerando   5%
Prof. Janete Pereira Amador
14
4. A Debug Company vende um repelente de insetos que alega ser eficiente pelo prazo de
400 horas no mínimo. Uma análise de 9 itens escolhidos aleatoriamente acusou uma
média de eficiência de 380 horas. Teste a hipótese alegação da companhia, contra a
alternativa que a duração é inferior a 400 horas no mínimo, com desvio padrão
amostral de 60 horas. Teste considerando   1%
5. Uma experiência tem mostrado que 40% dos estudantes de uma Universidade
reprovam em pelo menos 5 disciplinas cursadas. Se 40 de 90 estudantes fossem
reprovados em mais de 5 disciplinas, poderíamos concluir quanto a proporção
populacional use   1%
6. Um laboratório farmacêutico afirma que o medicamento Atchim, recentemente
introduzido no mercado, tem uma eficácia de 90% na cura de certa alergia. Numa
amostra aleatória de 200 pacientes sofrendo dessa alergia, registraram-se 160 curas.
Avalie se aquela propaganda do laboratório é legitima. Use   3%
7. Duas técnicas de vendas são aplicadas por dois grupos de vendedores: a técnica A, por
32 vendedores, e a técnica B, por 35 vendedores. Espera-se que a técnica B produza
melhores resultados que a técnica A. No final de um mês, os vendedores de A
venderam uma média de 68 ítens, com uma variância de 50, enquanto que os
vendedores de B venderam uma média de 76 ítens com uma variância de 75. Testar, ao
nível de significância de 5%, se a técnica B é realmente melhor que a técnica A.
8. Queremos testar as resistências de dois tipos de vigas de aço, A e B. Tomando-se nA =
35 vigas do tipo A e nB = 40 vigas do tipo B, obtemos os valores da tabela a seguir.
Testar a hipótese que as resistências médias dos dois tipos de vigas são iguais, ao nível
de significância de 5%.
9. Numa pesquisa sobre possuidores de videocassete, encontram-se 120 das 200 casas
pesquisadas do bairro X e 240 das 500 residências do bairro do bairro Y. Há diferença
significativa entre a proporção de possuidores de vídeo nos dois bairros? Use   10% .
10. Duas amostras foram retiradas de duas escolas de segundo grau de Santa Maria com o
objetivo de estudar a proporção de alunos aprovados e reprovados no PEIS. Os
resultados obtidos são os que seguem.
Escola
Aprovados
Reprovados
Estadual
16
24
Municipal
17
18
a) Teste a hipótese de que a proporção de aprovados é igual nas duas escolas (   1% )
b) A escola estadual, estudada, sempre aprova 35% dos seus estudantes teste a hipótese de
que a proporção de aprovados nesse ano é diferente da proporção histórica (   1% ).
Download