testes não -paramétricos

Propaganda
TESTES NÃO - PARAMÉTRICOS
As técnicas da Estatística Não-Paramétrica são, particularmente,
adaptáveis aos dados das ciências do comportamento. A aplicação dessas
técnicas não exige suposições quanto à distribuição da variável populacional. Os
testes não-paramétricos são extremamente interessantes para análises de dados
qualitativos. Na Estatística Paramétrica, para aplicação de teste como o “t” de
Student, a variável em análise precisa ser numérica. Como o próprio nome sugere,
a Estatística Não-Paramétrica independe dos parâmetros populacionais e de suas
respectivas estimativas.
Assim, se a variável populacional analisada não segue uma distribuição
normal e/ou as amostras forem pequenas, pode-se aplicar um teste NãoParamétrico.
Vantagens dos Métodos Não-Paramétricos
1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla
diversidade de situações, porque não exigem populações distribuídas
normalmente.
2. Ao contrário dos métodos Paramétricos, os métodos Não-Paramétricos
podem freqüentemente ser aplicados a dados não-numéricos.
3. Os métodos Não-Paramétricos em geral envolvem cálculos mais simples do
que seus correspondentes Paramétricos, sendo, assim, mais fáceis de
entender.
Desvantagens dos Métodos Não-Paramétricos
1. Os métodos Não-Paramétricos tendem a perder informação, porque os
dados numéricos são freqüentemente reduzidos a uma forma qualitativa.
2. Os testes Não-Paramétricos não são tão eficientes quanto os testes
Paramétricos; assim, com um teste Não-Paramétrico, em geral
necessitamos de uma amostra maior ou maiores diferenças para então
rejeitarmos uma hipótese nula.
1
Teste para Amostras Dependentes (Pareadas)
Teste dos Sinais
É utilizado para análise de amostras dependentes. Logo, esse teste é uma
alternativa para o teste “t” para amostras dependentes. É aplicado em situações
em que o pesquisador deseja determinar se duas condições são diferentes.
O teste do sinal tem pouco poder, pois usa como informação apenas o sinal
das diferenças entre pares. A única pressuposição exigida pelo teste do sinal é a
de que a distribuição da variável seja contínua. Esse teste não faz qualquer
suposição sobre a forma da distribuição das diferenças de médias. É útil nos
trabalhos de pesquisa em que é impossível ou inviável a obtenção de uma
mensuração quantitativa, mas é possível estabelecer postos em relação a cada
um dos dois membros de cada par.
A lógica do teste é que as condições podem ser consideradas iguais
quando as quantidades de "+" e "-" forem aproximadamente iguais.
Procedimento:
a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no par
são iguais;
b) Comparar o valor da primeira medida com o valor da segunda medida, feita no
mesmo par de pessoas, animais ou objetos; atribuir o símbolo “+” para todo par de
observações em que a primeira medida for maior do que a segunda e “-“ quando
acontecer o contrário;
c) Contar o número de “+” e de “-“;
d) Para pequenas amostras utilize:
Distribuição amostral. A probabilidade associada de ocorrência é dada pela
1
distribuição binomial com p = q = .
2
d) Para grandes amostras utilize:
Aproximação da distribuição binomial pela normal. Do mesmo modos: p = q =
1
2
2

(x ± 0,5) - 

z=
n
2
n

2
≈ N ( 0,1)
(x + 0,5) é utilizado quando x <
1
1
n e (x − 0,5) é utilizado quando x > n
2
2
x - número de vezes que o sinal menos freqüente ocorre;
n - tamanho da amostra descontando os empates.
Obs.: Diferenças iguais a zero devem ser ignoradas. Essa solução, porém, só é
satisfeita se houver poucos zeros.
O teste dos sinais é fácil de aplicar e praticamente não exige
pressuposições. Mas possui pouco poder.
Siegel (1977) apresenta um estudo referente ao efeito da ausência do pai no
desenvolvimento das crianças. Dezessete casais foram entrevistados, pais e mães
separadamente, e foi verificado o grau de discernimento quanto à disciplina
paterna após o retorno dos pais ao lar, após uma grande ausência. Buscou-se
então verificar se havia ou não diferença entre os cônjuges. Apesar de serem
esperadas diferenças favoráveis à mãe, tendo em vista a ausência prolongada dos
pais, considerou-se como hipótese inicial (nula) a de não diferença entre os pais.
Além disso, três casais foram eliminados do estudo, tendo em vista que o pai e a
mãe apresentaram graus de discernimento considerados iguais. Assim, os
resultados referentes aos 14 casais restantes, as diferenças no grau de
discernimento (Di) e o sinal destas diferenças, representados por 1 se é positivo e
por 0 se este sinal é negativo, são mostrados na tabela 1.
Verifica-se que para 11 casais o grau de discernimento da mãe é superior ao do
pai, ou seja, existe uma forte evidência de que a suspeita dos psicólogos era
correta em relação ao discernimento da autoridade paterna após o retorno ao lar.
1º Passo: Definição das hipóteses.
3
 H 0 : Não existe diferença

 H 1 : Existe diferença
2º Passo: Definição da estatística de teste.
 1
Supondo H 0 como verdadeira: X ~ Binomial  n; 
 2
3º Passo: Introdução dos dados do problema.
Os dados mostram que apenas 14 casais apresentam diferenças então
1

X ~ Binomial  14;  .
2

p = P ( X ≤ 3) = P( X = 0 ) + P ( X = 1) + P ( X = 1) + P ( X = 3) =
14
14
14
 1
1  1
2 1
3  1
= C140   + C14
  + C14   + C14  
 2
 2
 2
 2
14
= 0,029
4º Passo: Definição do nível de significância e construção da região crítica.
α = 5%
Rejeite H 0 se p ≤ 0,05
5º Passo: Conclusão.
Rejeitamos H 0 utilizando 5% de significância.
O exemplo a seguir é apresentado por Siegel (1977).
Suponha que um pesquisador esteja interessado em avaliar se determinado filme
sobre delinqüência juvenil contribui para modificar a opinião de uma comunidade
sobre quão severa deve ser a punição para tais casos. Para isso extrai-se uma
amostra de tamanho 100 e realiza-se um estudo do tipo “antes e depois”. O
resultado encontra-se resumido no quadro abaixo:
4
1º Passo: Definição das hipóteses.
 H 0 : O filme não produz efeito sistemático

 H 1 : O filme produz efeito sistemático
2º Passo: Definição da estatística de teste.

(x ± 0,5) - 

Supondo H 0 como verdadeira: z =
n
2
n

2
≈ N ( 0,1)
3º Passo: Introdução dos dados do problema.
Os dados mostram que 8 + 7 = 15 adultos não modificaram sua opinião. Logo a
hipótese em estudo se aplica somente aos 85 adultos restantes. Desses 85
adultos 26 modificaram a sua opinião de mais para menos enquanto 59
modificaram de menos para mais.
 85 
(26 + 0,5) -  
1
1
 2  = − 3,47
Z Calculado =
pois x < n, isto é, 26 < 85 = 42,5
2
2
85
2
Ou, do mesmo modo:
Z Calculado
 85 
(59 − 0,5) -  
 2  = 3,47
=
85
2
pois x >
1
1
n, isto é, 59 > 85 = 42,5
2
2
5
4º Passo: Definição do nível de significância e construção da região crítica.
α = 5%
Rejeite H 0 se Z Calculado ≤ − 1,96 ou Z Calculado ≥ 1,96
5º Passo: Conclusão.
Como Z Calculado = 3,47 > 1,96 então rejeitamos H 0 utilizando 5% de significância, ou
seja, rejeitamos a hipótese de que o filme não produz um efeito sistemático.
Teste de Wilcoxon
Trata-se de uma extensão do teste dos sinais. É mais interessante pois leva
em consideração a magnitude da diferença para cada par. O teste de Wilcoxon
exige que a variável em análise seja medida em escala ordinal ou numérica, e a
diferença entre duas observações, feitas no mesmo par, também possa ser
ordenada.
Procedimento:
a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no
par são iguais;
b) Preparação:
• Calcular a diferença entre a primeira e a segunda medida, feitas no
mesmo par, para todos os pares da amostra. Excluir as diferenças
iguais a zero. Isso significa reduzir a amostra se houver diferenças
iguais a zero;
•
Independentemente do sinal, atribuir um posto a cada diferença; em
caso de empates, atribuir a média dos postos empatados;
•
Atribuir sinais nos postos, respeitando os sinais das diferenças;
•
Obter o valor T que representa a menor das somas de postos de
mesmo sinal;
•
Determinar N que é o total das diferenças com sinal.
c) Cálculo da estatística de teste:
Se N ≤ 25 , obter valor crítico através da tabela apropriada. “Valores críticos da T –
Prova de Wilcoxon”
Exemplo da construção da Tabela de valores críticos para N = 8 .
Casos possíveis: 2 8 = 256
6
Distribuição de freqüência.
7
Se N > 25 , determinar a média e o desvio-padrão aproximado da soma dos
postos. Em seguida, obter o valor de z calculado e o valor de z tabelado. Significa
8
portanto, a utilização da aproximação da distribuição binomial pela distribuição
Normal
z calculado =
sendo: µ T =
T-µ T
σT
N ( N + 1)
4
e
σ
T
=
N ( N + 1)(2 N + 1)
24
d) Critério de decisão:
Se N ≤ 25 ,
Rejeite H 0 se um Tcalculado ≤ Ttabela . Ou seja, rejeite H 0 para todos os valores de T
tão pequenos que a probabilidade associada à sua ocorrência sob H 0 não seja
superior a α % .
Se N > 25 ,
Z
< Zα
Z
> Z α
Para um teste bilateral: Rejeite H 0 se claculado
ou calculado
1−
2
2
Z
> Z α
Para um teste unilateral superior: Rejeite H 0 se calculado
1−
2
Z
< Zα
Para um teste unilateral inferior: Rejeite H 0 se calculado
2
Exemplo: Foram ministrados dois testes similares para verificar o aprendizado. O
objetivo é verificar se os dois testes apresentados são equivalentes. Os testes
foram aplicados ao mesmo grupo de alunos; um no início do período letivo e outro
no fim do período. Os resultados dos testes estão no quadro abaixo.
1º Passo: Definição das hipóteses.
 H 0 : Não existe diferença

 H 1 : Existe diferença
9
2º Passo: Preparação e cálculo da estatística de teste.
O valor T representa a menor das somas de postos de mesmo sinal e o valor de N
que é o total das diferenças com sinal.
N=
T=
8
4
3º Passo: Critério de decisão.
Como a amostra apresenta N ≤ 25, o valor crítico é obtido na tabela dos valores
críticos de Wilcoxon.
Como Tcalculado = 4 > Ttabela = 3 nesse caso não se rejeita-se a hipótese das médias
serem iguais utilizando α = 5% . Repare que o p − valor = 2 ⋅ 0,0273 = 0,0547 > 5% . a
probabilidade associada à sua ocorrência sob H 0 é superior a α % , logo não
podemos rejeitar H 0 .
Obs.: Um ou outro empate não atrapalha o resultado, principalmente se a amostra
é grande. Mas se os empates são muitos, não se pode aplicar a estatística de
teste como definida acima. É preciso usar a fórmula com uma correção para os
empates. Os programas computacionais fazem essa correção automaticamente.
10
Testes Não-Paramétricos para Amostras Independentes
Teste de Mann-Whitney
É usado para testar se duas amostras independentes foram retiradas de
populações com médias iguais. Esse teste é, portanto, uma alternativa para o
teste “t” para amostras independentes quando a amostra for pequena e/ou as
pressuposições, exigidas pelo teste “t”, estiverem seriamente comprometidas. A
única exigência do teste de Mann-Whitney é a de que as observações sejam
medidas em escala ordinal ou numérica.
Procedimento
a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no
par são iguais
b) Coloque os dados dos dois grupos em uma única ordenação crescente. Às
observações empatadas atribuir a média dos postos correspondentes;
c) Considerar
n1 = número de casos do grupo 1;
n2 = número de casos do grupo 2;
d) Calcular
= soma dos postos do grupo 1 ;
R2 = soma dos postos do grupo 2 ;
R1
e) Calcular a estatística de Mann-Whitney (U )
n1 ( n1 + 1)
− R1 , ou o que é equivalente:
2
n ( n + 1)
U = n1 n 2 + 2 2
− R2
2
U = n1 n2 +
f) Escolher o menor valor de U, se n < 20 utilizar a tabela de valores críticos
de Mann-Whitney (U ) , caso contrário para ser utilizado no cálculo de z.
z=
U -µ
σ R
R
µ
R
=
n1 ⋅ n2
2
σ
R
=
n1 ⋅ n2 ( n1 + n2 + 1)
12
11
A eficácia da publicidade dos dois produtos concorrentes (Marca X e Marca Y) foi
comparado. Uma pesquisa de mercado realizada em um centro comercial local
ofereceu a cada participante uma xícara de café e depois de degustar cada
participante deu uma nota.
1º Passo: Ordenar as notas:
2º Passo: Calcular
R1 e R2
3º Passo: Calcular Calcular a estatística de Mann-Whitney (U )
12
n1 ( n1 + 1)
6⋅ 7
− R1 = 6 ⋅ 6 +
− 23 = 34 ,
2
2
n ( n + 1)
6⋅ 7
U = n1 n2 + 2 2
− R2 = 6 ⋅ 6 +
− 55 = 2
2
2
U = n1 n2 +
Menor valor de U = 2
4º Passo: Decisão
O valor calculado U = 2 é menos ou igual aos valores da tabela.
Para α = 5% , U Tabela = 5 e para α = 1% , U Tabela = 2
Nesse caso rejeita-se a hipótese nula de igualdade entre as médias populacionais.
Teste Kruskal-Wallis
Trata-se de teste extremamente útil para decidir se k amostras (k > 2)
independentes provêm de populações com médias iguais. Esse teste só deve ser
aplicado se a amostra for pequena e/ou as pressuposições, exigidas para
proceder à Análise de Variância, estiverem seriamente comprometidas. Como o
teste de Mann-Whitney, esse teste também condiciona que a variável em análise
seja medida em escala ordinal ou numérica.
Procedimento
a) Dispor, em ordem crescente, as observações de todos os k grupos, atribuindolhes postos de 1 a n. Caso haja empates, atribuir o posto médio;
b) Determinar o valor da soma dos postos para cada um dos k grupos: Ri, i = 1, 2,
..., k;
c) Escolher uma variável Qui-quadrado com ν = k – 1 (cada amostra deve conter
pelo menos 5 observações);
d) Realizar o teste:
K
( R i ) − 3(N + 1)
12
H=
∑
N(N + 1) i= 1 ni
2
Obs.: Esse teste exige variâncias iguais, por isso não deve ser usado se as
diferentes amostras têm variâncias muito diferentes.
O teste de Kruskal-Wallis é um teste unilateral à direita.
13
Obs.: Quando ocorrem muitos empates, não se deve utilizar a estatística H. É
preciso aplicar uma correção na fórmula. Os aplicativos fazem essa correção
automaticamente. Assim, se mais de um terço dos dados está envolvido em
empates, use um software de estatística.
14
Valores críticos - Teste de Wilcoxon
Fonte: http://www.sussex.ac.uk/Users/grahamh/RM1web/WilcoxonTable2005.pdf
15
Valores críticos - Teste de Mann-Whitney
Fonte:http://www.sussex.ac.uk/Users
16
Download