NA PRÁTICA COMO FUNCIONA OS TESTES DE HIPÓTESES Testes de Hipóteses Não Paramêtricos (B) Paramêtricos (A) Teste T (1) Teste T 2 Amostras Independentes (2) Teste T 2 Amostras Emparelhadas (3) Analise de variância [ANOVA] (4) Teste de Man-Whitney (5) Teste do Sina (6) Teste Não Paramétrico para Amostras Emparelhadas Teste de KruskalWallis (8) Teste de Wilcoxon (7) Testes não paramétricos para proporções Teste Binomial (9) Teste do Qui-quadrado (10) Testes de Hipótese Os testes de hipóteses têm como objectivo decidir, com base na informação fornecida pelos dados de uma amostra, sobre a aceitação ou não de uma dada hipótese. FASES DO PROCESSO: 1. Definição das hipóteses. 2. Identificação da estatística de teste e caracterização da sua distribuição. 3. Definição da regra de decisão, com especificação do nível de significância do teste. 4. Cálculo da estatística de teste e tomada de decisão. (A) Teste Bilateral: H0: μ = 50 H1: μ ≠ 50 (1) condições são satisfeitas: amostra é superior a 30 (n>30). Skewness e Kurtosis Teste de Kolmogorov-Smirnov (K-S): É um teste de aderência à Normal, isto é, testa se uma variável tem -S: Se o nível de significância Sig. for inferior a um determinado valor a então rejeitamos H0 com (1-a)*100% de confiança (normalmente a=0.05 ou a=0.01), e rejeitamos a Normalidade. necessário verificar a normalidade da variável. Se a amostra tem diemnsão inferior a 30, é necessário verificar a normalidade da variável, por exemplo através do teste de K-S. Caso não se verifique a Normalidade, não se deve aplicar o teste T para uma média, uma vez que os pressupostos não são cumpridos. (2) Teste T para duas médias independentes superior a 30 (n>30). malidade: -Smirnov (teste K-S) (3)Teste T para duas amostras emparelhadas antes de ler o resultado do teste-T para duas médias emparelhadas, é necessário testar se as duas variáveis são ou não independentes. elação para variáveis emparelhadas define o teste a utilizar: emparelhadas é adequado. amostras emparelhadas não é adequado. H0: A correlação entre as duas variáveis é nula, ou seja, as variáveis são independentes. H1: A correlação entre as duas variáveis não é nula, ou seja, as variáveis são dependentes. (4) ANOVA - Pressupostos cada grupo é Normal restritiva da aplicação do método não for muito enviesada dentes entre si igual, o teste é robusto à não homocedasticidade (ou homogeneidade das variâncias) -se que os grupos são de dimensão semelhante se: não sejam verificados, temos como opção: -Wallis) No caso da rejeição de H0 pode ser interessante determinar qual o tratamento que levou à rejeição No caso de um factor ordinal: -se a hipótese de um crescimento (ou decrescimento) de acordo com os níveis (análise de tendência - contrastes) -se comparações múltiplas (testes a posteriori ou post-hoc) para determinar os grupos que diferem. No caso de um factor nominal: -se comparações múltiplas (testes a posteriori ou post-hoc) para determinar os grupos que diferem. -se grupos específicos previamente definidos pelo investigador (testes a priori ou planeados) Testes não paramétricos não exigem que os dados sigam uma determinada distribuição verificam -se a variáveis do tipo ordinal ou superior (5)Teste de Mann-Whitney -se para avaliar a relação entre uma variável pelo menos ordinal com uma dicotómica. -Student para duas amostras independentes quando os pressupostos do teste T não são verificados: dimensão das amostras é pequena; -se a normalidade dos dados a perda de eficiência do teste de Mann- Whitney é pequena e localização das duas amostras, em busca de diferenças -se nas ordenações da variável, falando-se portanto em tendência central no lugar de média. H0: As duas populações são iguais em tendência central H1: As duas populações não são iguais em tendência central Testes para comparação populações emparelhadas: (6) Teste do Sinal -se para avaliar a relação entre uma variável pelo menos ordinal com uma dicotómica, quando existe um critério de emparelhamento. -se essencialmente para analisar diferenças entre pré e pós intervenção ou tratamento. -se no sinal da diferença dos dois momentos, não tendo em conta o valor numérico das respostas nem da amplitude da sua diferença. -Student para duas amostras emparelhadas quando os pressupostos do teste T não são verificados: -se no sinal da diferença dos dois momentos, não tendo em conta o valor numérico das respostas nem da sua diferença: compara as observações de acordo com o sinal de (Y – X): aumento; diminuição; H0: P(+) = P(-) = ½ , isto é, a proporção de positivos é igual à proporção de -) , isto é, a proporção de positivos é diferente da proporção de negativos (7)Teste de Wilcoxon -se para avaliar a relação entre uma variável pelo menos ordinal com uma dicotómica, quando existe um critério de emparelhamento. -se essencialmente para analisar diferenças entre pré e pós intervenção ou tratamento. -Student para duas amostras emparelhadas quando os pressupostos do teste T não são verificados: -se nas ordens dos valores absolutos da diferença dos dois momentos, isto é, tem em conta as amplitudes das diferenças. -se nas ordens dos valores absolutos da diferença dos dois momentos, tendo em conta o valor numérico das diferenças entre o “depois” e o compara as observações de acordo com o valor absoluto de Di = |Yi – as variáveis são ordinais ou quantitativas, o teste de Wilcoxon é mais eficiente do que o teste do Sinal uma vez que diferenças maiores têm maior peso. s com apenas 2 níveis, não existe diferença entre o teste de Wilcoxon e o teste do Sinal. A hipótese a testar é portanto: H0: E(X) = E(Y) , isto é, o valor esperado de X é igual ao valor esperado de Y de X não é igual ao valor esperado de Y (8)Teste de Kruskal-Wallis -se para avaliar a relação entre uma variável pelo menos ordinal com uma qualitativa com mais de dois níveis (k níveis). -Whitney para mais de duas amostras (assim como o One-Way-Anova generaliza o teste T para mais de duas amostras independentes). -Way-Anova quando os pressupostos do One-Way-Anova não são verificados igualdade de localização entre três ou mais amostras (k amostras). As hipóteses a testar são : teste baseia-se na soma das ordens dos grupos combinados por ordem crescente -se o teste exacto -se à distribuição Qui-Quadrado com K-1 graus de liberdade H0: As K amostras têm o mesmo parâmetro de localização H1: Pelo menos uma difere Testes não paramétricos para proporções -se a variáveis qualitativas (nominais ou ordinais) . -se para a análise de contagens ou proporções de cada uma das realizações ou classes das variáveis em estudo. de mais de duas populações: -quadrado -Cochran (9)Teste Binomial amostras independentes são normalmente fruto de uma variável qualitativa nominal dicotómica, por exemplo: ima dos 50 anos vs grupo abaixo dos 50 anos) é, se a proporção no 1º grupo é igual a um determinado valor p0, por exemplo: estar se a proporção de homens é idêntica à das mulheres (note-se que é equivalente a testar se proporção de homens é de 0.5, teste bilateral); -se que é equivalente a testar se proporção de homens é superior a 0.5, teste unilateral); inferior a 0.75. distribuição binomial. o no 1º grupo é igual a um determinado valor p0. H0: p = p0 , isto é, a proporção na 1ª categoria é de p0 H1: p proporção na 1ª categoria não é p0 H0: p ≤ p0 , isto é, a proporção na 1ª categoria não é superior a p0 H1: p > p0 , isto é, a proporção na 1ª categoria é superior p0 (10)Teste do Qui-Quadrado riável qualitativa nominal com duas ou mais categorias. hipótese a testar é: base na hipótese nula. -quadrado baseia-se na comparação as frequências esperadas com as frequências observadas em cada grupo. -se também qui-quadrado de aderência, (goodness-of-fit) 𝜒2 H0: A variável segue uma distribuição especificada H1: H0 é falsa Teste do Qui- - Quadrado, é um caso particular e serve para testar se duas ou mais populações (ou grupos) independentes diferem a relativamente a uma determinada característica. -se que os grupos são normalmente resultado de uma variável qualitativa (Por exemplo: género, faixa etária, nacionalidade, etc.) pelas classes de uma variável nominal categorizada, é ou não idêntica. Existe relação entre depressão e estar ou não empregado? Existe relação entre depressão e estado civil? Pressupostos: Nenhuma célula da tabela tem frequência esperada inferior a 1 tem frequência esperada inferior a 5 Carlo. duas variáveis qualitativas. ode ser formulada da seguinte forma: -se que H0 é equivalente a dizer que as duas variáveis em análise são independentes, ou seja, as hipóteses podem ser formuladas das seguinte forma: não empregado? variável “estado civil” H0: Não existem diferenças entre as amostras relativamente à distribuição nas classes da variável, i.e, a distribuição das contagens pelos grupos é independente da variável. H1: Existem diferenças entre os grupos (ou populações de onde foram extraídas as amostras, i.e, a distribuição das contagens pelos grupos não é independente da variável. H0: As variáveis em análise são independentes (ou não estão associadas). H1: As variáveis em análise são dependentes (ou estão associadas). Daniel Cabral 26298 CRIM