Teste de Hipóteses

Propaganda
TESTE DE HIPÓTES
Trata-se de uma técnica para se fazer
a inferência estatística sobre uma
população a partir de uma amostra
TEORIA POPPERIANA
• NÃO SE PODE PROVAR NADA, APENAS
“DESPROVAR”.
• SÓ APRENDEMOS QUANDO ERRAMOS.
• É MAIS FACIL REFUTAR DO QUE PROVAR
ALGUMA ASSERTIVA.
• OS ESTATÍSTICOS NÃO PERGUNTAM QUAL
É A PROBABILIDADE DE ESTAREM
CERTOS, MAS A PROBABILIDADE DE
ESTAREM ERRADOS. Para fazerem isso
estabelecem um hipótese nula.
PRINCIPAIS CONCEITOS
HIPÓTESE ESTATÍSTICA
Trata-se de uma suposição quanto ao valor de um
parâmetro populacional, ou quanto à natureza da
distribuição de probabilidade de uma variável
populacional.
TESTE DE HIPÓTESE
É uma regra de decisão para aceitar ou rejeitar uma
hipótese estatística com base nos elementos
amostrais
PRINCIPAIS CONCEITOS
TIPOS DE HIPÓTESES
Designa-se por Ho, chamada hipótese nula, a
hipótese estatística a ser testada, e por H1, a hipótese
alternativa.
A HIPÓTESE NULA É UMA ASSERTIVA DE
COMO O MUNDO DEVERIA SER, SE NOSSA
SUPOSIÇÃO ESTIVESSE ERRADA.
A hipótese nula expressa uma igualdade, enquanto a
hipótese alternativa é dada por uma desigualdade.
Ex: Ho -  = 1,65 m
H1 -   1,65 m
TIPOS DE ERRO DE
HIPÓTESE
EXISTEM DOIS TIPOS DE ERRO DE
HIPÓTESE.
Erro tipo 1 - rejeição de uma hipótese verdadeira;
Erro tipo 2 – aceitação de uma hipótese falsa.
As probabilidades desses dois tipos de erros são designadas 
e .
A probabilidade  do erro tipo I é denominada “nível de
significância” do teste.
LÓGICA DO TESTE DE
SIGNIFICÂNCIA
• ATRIBUEM-SE BAIXOS VALORES PARA ,
GERALMENTE 1-10%;
• FORMULA-SE Ho COM A PRETENSÃO DE REJEITÁLA, DAÍ O NOME DE HIPÓTESE NULA;
• SE O TESTE INDICAR A REJEIÇÃO DE Ho TEM-SE
UM INDICADOR MAIS SEGURO DA DECISÃO;
• CASO O TESTE INDIQUE A ACEITAÇÃO DE Ho, DIZSE QUE, COM O NÍVEL DE SIGNIFICÂNCIA , NÃO
SE PODE REJEITAR Ho.
ESTATÍSTICA NÃO
PARAMÉTRICA
São extremamente interessantes para
análises de dados qualitativos.
• As técnicas de estatística não paramétrica são
particularmente adaptáveis aos dados das ciências
do comportamento.
• A aplicação dessas técnicas não exige suposições
quanto à distribuição da população da qual se
tenha retirado amostras para análises.
• Podem ser aplicadas a dados que se disponham
simplesmente em ordem, ou mesmo para estudo
de variáveis nominais.Contrariamente à estatística
paramétrica, onde as variáveis são, na maioria das
vezes, intervalares.
• Exigem poucos cálculos e são aplicáveis para
análise de pequenas amostras.
• Independe dos parâmetros populacionais e
amostrais (média, variância, desvio padrão).
TIPOS DE TESTE
•
•
•
•
•
•
Qui-Quadrado
Teste dos sinais
Teste de Wilcoxon
Teste de Mann-Whitney
Teste da Mediana
Teste de Kruskal-Wallis
QUI-QUADRADO (2)
Testes de Adequação de amostras e
Associação entre variáveis
QUI-QUADRADO (2)
•
•
Teste mais popular
Denominado teste de adequação ou ajustamento.
Usos
1.
Adequação ou Aderência dos dados: freqüência
observada adequada a uma freqüência esperada);
Independência ou Associação entre duas variáveis
Comportamento de uma variável depende de outra.
2.
2 =
( Foi  Fei)2

Fei
i 1
k
QUI-QUADRADO (2)
Restrições ao uso:
Se o número de classes é k=2, a freqüência
esperada mínima deve ser 5;
Se k >2, o teste não deve ser usado se mais de
20% das freqüências esperadas forem
abaixo de 5 ou se qualquer uma delas for
inferior a 1.
ADEQUAÇÃO DOS DADOS
Exemplos:
1. avaliar se uma moeda ou um dado é
honesto;
2. número de livros emprestados em um
biblioteca durante os dias de uma
determinada semana;
3. Tipo de sangue para uma determinada raça
ADEQUAÇÃO DOS DADOS
PROCEDIMENTO
1.
2.
3.
Enunciar as hipóteses (Ho e H1);
Fixar ; escolher a variável 2 com  = (k-1). k é o
número de eventos;
Com auxílio da tabela de 2, determinar RA (região de
aceitação de Ho) e RC (região de rejeição de Ho)
2
ADEQUAÇÃO DOS DADOS
EXEMPLO
Em 100 lances de moeda, observaram-se 65 coroas e 35 caras. Testar se a
moeda é honesta.
1°
Ho- a moeda é honesta;
H1- a moeda não é honesta;
2°
 = 5%; escolhe-se um 2, pois k = 2 e  2-1=1;
3°
Determinação de RA e RC;
2
k
2
Eventos
Cara
Coroa
Freq. observada
35
65
Freq. Esperada
50
50
( Foi  Fei)
= 
Fei
i 1
2 = (35-50)2/50 + (65-50)2/50=9
2tab = 3,84, logo rejeita-se Ho.
A moeda não é honesta.
ADEQUAÇÃO DOS DADOS
• 4 ocorrência de 4 tipos de sangue em uma dada raça
Classes
A
B
AB
O
Freq. Observada
230
470
170
130
Freq. esperada
180
480
200
140
K=4, =3 e  = 2,5%
2 =(230-180)2/180 + (470-480)2/480 + (170-200)2/200 + (130-140)2/140
2calc =16.04
2tab = 9,25
Logo rejeita-se Ho com 2,5% de probabilidade de erro.
ADEQUAÇÃO DOS DADOS
• Número de acidentes na rodovia, de acordo com o dia da semana
Classes
Seg
Ter
Número de acidentes
26
21
Qua Qui Sex Sab Dom
22
17
20
36
33
Freqüência esperada – 1/7 x 175 = 25
Classes
Seg
Ter
Qua Qui Sex Sab Dom
Acidentes Observados
26
21
22
17
20
36
33
Acidentes esperados
25
25
25
25
25
25
25
2calc =12,0
2tab=12,6
Logo aceita-se Ho com 95% de probabilidade de acerto.
INDEPENDÊNCIA OU
ASSOCIAÇÃO ENTRE DUAS
VARIÁVEIS
EXEMPLOS
• Dependência entre sabor de pasta de dente e o
bairro;
• Notas dos alunos e nível salarial;
• Efeito da vacinação em animais;
INDEPENDÊNCIA OU
ASSOCIAÇÃO ENTRE DUAS
VARIÁVEIS
A representação das freqüências observadas é dada por uma tabela de
dupla entrada ou tabela de contingência.
1.
2.
3.
PROCEDIMENTO
Ho: as variáveis são independentes;
H1: as variáveis são dependentes;
Fixar . Escolher a variável qui-quadrado com  = (L-1) x (C-1),
onde L = número de linhas da tabela de contingência e C+ número
de colunas.
Com auxílio da tabela calculam-se RA e RC
INDEPENDÊNCIA OU
ASSOCIAÇÃO
EXEMPLO
Dependência entre bairro e escolha do sabor de pasta de dente
Dados:
Ho: a preferencia pelo sabor independe do
Bairros
Sabor
A
B
C

Limão
70
44
86
200
Chocolate
50
30
45
125
Hortelã
10
6
34
50
Menta
20
20
85
125

150
100
250
500
bairro;
H1: a preferência pelo sabor depende do
bairro
 = 5%
2tab = = (4-1) x (3-1) = 6 graus de liberdade
Freqüência esperada = (soma da linha i) x (soma da coluna J)/(total de observações)
 2=
L

i 1
( Foij  Feij ) 2

Feij
j 1
C
INDEPENDÊNCIA OU
ASSOCIAÇÃO
Tabela de freqüências esperadas
SABOR
BAIRRO
A
B
C
(1)Limão
60
40
100
(2)Chocolate
37.5
25
62.5
(3)Hortelã
15
10
25
(4)Menta
37.5
25
62.5
2cal =37.88
2tab =12.6
Logo rejeita-se Ho
Fe11 = 200 x 150/500 = 60
Fe12 = 200 x 100/500 = 40
Fe13 = 200 x 250/500 = 100
Fe21 = 125 x 150/500 = 37.5
Fe22 = 125 x 100/500 = 25
Fe23 = 125 x 250/500 = 62.5
Fe31 = 50 x 150/500 = 15
Fe32 = 50 x 100/500 = 10
Fe33 = 50 x 250/500 = 25
Fe41 = 125 x 150/500 = 37.5
Fe42 = 125 x 100/500 = 25
Fe43 = 125 x 250/500 = 62,5
TESTE DOS SINAIS
Análise de dados emparelhados
(O mesmo indivíduo é submetido a
duas medidas)
TESTE DOS SINAIS
• É utilizado na análise de dados emparelhados.
Situações em que o pesquisador deseja determinar se
duas condições são diferentes.
• A variável pode ser intervalar ou ordinal.
• O nome do teste dos sinais se deve ao fato de se
utilizar sinais + e – em lugar do dados numéricos.
• A lógica do teste é que as condições podem ser
consideradas iguais quando as quantidades de + e _
forem aproximadamente iguais. Isto é, a proporção
de + equivale 50%, ou seja: p=0,5.
TESTE DOS SINAIS
PROCEDIMENTO
1.
2.
3.
4.
Ho: não há diferença entre os grupos, ou seja: p = 0,5;
H1: há diferença, ou seja: uma das alternativas
a) p  0,5 -Distribuição “z “bicaudal.
b) p  0,5 – Distribuição “z” unicaudal a esquerda.
c) p  0,5 – Distribuição “z” unicaudal a direita.
Fixar . Escolher a distribuição N(0,1) se n>25 ou Binomial se n
25.
Com auxílio da tabela, determinar-se RA e RC (para n > 25),
caso n <25 utiliza-se distribuição binomial.
Cálculo do valor da variável Z
TESTE DOS SINAIS
Exemplo:
Sessenta alunos matricularam-se num curso de inglês. Na primeira aula aplicase um teste que mede o conhecimento da língua. Após seis meses, aplica-se um segundo
teste. Os resultados mostram que 35 alunos apresentaram melhora (35 +), 20 se conduziram
melhor no primeiro teste (20 -) e 5 não apresentaram modificações (5 “0”).
Ho: O curso não alterou (p=0,50)
H1: O curso melhorou o conhecimento de inglês (p > 0,5).
= 5% (variável N(0,1).
Cálculo da variável “Z”.
y  n. p
Zcal =
, onde:
n. p.q.
y - número de sinais positivos (35);
n – tamanho da amostra descontado os empates (60-5=55);
p – 0,5
35  55 x
q – 1-p = 0,5
Zcal =
0,5
55 x(0,5) x(0,5)
Ztab= 1.64, logo rejeita Ho.
= 2,02
Teste de Wilcoxon
• É uma extensão do teste de sinais. É mais
interessante pois leva em consideração a
magnitude da diferença para cada par.
• Exemplo: um processo de emagrecimento
em teste. Cada par no caso é o mesmo
indivíduo com peso antes e depois do
processo.
Teste Mann-Whitney
• É usado para testar se das amostras independentes
foram retiradas de populações com média iguais.
• Trata-se de uma interessante alternativa ao teste
paramétrico para igualdade de médias, pois o teste
não exige considerações sobre a distribuição
populacional. Aplicado à variáveis intervalares e
ordinais.
• Exemplo: a média de vendas de dois shoppings
são diferentes?.
Teste da mediana
• Trata-se de uma alternativa ao teste de
Mann-Whitney. Testa as hipótese se dois
grupos independentes possuem mesma
mediana. Dados ordinais e intervalares.
Teste Kruskal-Wallis
• Trata-se de um teste para decidir se K amostras
(K>2) independentes provêm de populações co
médias iguais.
• Exemplo: testar, no nível de 5% de probabilidade,
a hipótese de igualdade das médias para os três
grupos de alunos que foram submetidos a
esquemas diferentes de aulas. Notas para uma
mesma prova. Aulas com recursos audiovisuais,
aulas expositivas e aulas ensino programado.
Download