Revisões de Estatística Estatística Descritiva Estatística Indutiva ou Inferencial Amostra Representativa Conclusões sobre a população infere amostra aleatória Tipos de dados • • • • Nominal Ordinal Discretos Continuos Apresentação de Dados Nominais • Tabelas de frequências • Gráficos de barras e circulares Apresentação de Dados Ordinais • Mesmas que Nominais • Frequências cumulativas • Mediana • Amplitude e amp. interquartílica Apresentação de Dados – Discretos • Mesmos que variáveis ordinais • Médias • Histograma Apresentação de Dados Contínuos • Medidas de tendência Central e Dispersão: Média±Desvio Padrão Mediana [IQR] / Range • Medidas quantílicas (quartis, decis, percentis) • Medidas de simetria e achatamento Apresentação de Dados Contínuos 20 40 Memory Performance 60 80 100 • Histogramas • Gráficos de Dispersão 40 60 80 Age Verificar Normalidade Parâmetros a verificar: Média = Mediana = Moda Simetria Achatamento Histograma Testes estatísticos 100 E se a distribuição não é normal … QUE FAZER? Usar Testes Não paramétricos Por vezes não há análises adequadas (ex. Regressão Linear) Usar Testes Paramétricos Invocando o Teorema do Limite Central Transformar os dados ( interpretação difícil) Para usar testes paramétricos Ter em conta … O tipo da variável em análise A distribuição dos dados (Normal vs Não Normal) Homogeneidade de variâncias O tamanho da amostra Se existem alternativas não paramétricas Que os testes paramétricos são mais potentes. O que preciso de saber para escolher um teste? Questão? (Diferença: Emparelhado? Nº de grupos?; Associação: 2 ou mais variáveis, …) Tipo de dados: Qualitativos vs Quantitativos Tipo de distribuição Normal vs. Não Normal Comparar 2 médias: Teste t Crítico: Média Variância Figure extracted from Research Methods - Knowledge Base One vs. two-tailed tests Distribuição Normal Normal (Gaussian) Distribution P r o b a b ility D e n s ity 0.25 0.2 0.15 0.1 0.05 0 2 68,27% 3.6 5.2 6.8 8.4 10 11.6 13.2 14.8 16.4 18 95,45% 99,73% Intervalos de Confiança Para médias: P( x − z s ≤µ ≤ x+z n s )=1-α n Para proporções: P( pˆ − z pˆ (1 − pˆ ) pˆ (1 − pˆ ) ≤ p ≤ pˆ + z )=1-α n n Correlação Os parâmetros r2 (coeficiente de determinação) e r (coeficiente de correlação de Pearson) são indicadores da força de associação entre duas variáveis quantitativas. -1 ≤ r ≤ 1 r ≅ -1 r≅1 r≅0 Correlação Para valores de r: <0,2 associação muito baixa 0,2 a 0,39 associação baixa 0,4 a 0,69 associação moderada 0,7 a 0,89 associação alta 0,9 a 1 associação muito alta r2 pode ser interpretado como a proporção da variação da variável dependente (y) que é explicada pela variação da variável independente (x). Correlação Paramétrica R (Pearson) – mede a correlação linear entre as variáveis Não paramétrica Rho (Spearman) Testes de Hipóteses 2 Grupos de Indivíduos diferentes Quantitativ Teste T de Student para a a Mais de 2 Grupos de indivíduos diferentes Antes – Depois Antes – Depois (só 2 medições) (mais de 2 medidas repetidas) Anova de um factor Teste t grupos emparelhado s Anova de 1 factor, medidas repetidas Correlação de Pearson McNemar Q de Cochrane Odds Ratio Teste de Wilcoxon Friedman Correlação de Spearman diferença entre duas médias Nominal Regras de Cochran: X2 Associação entre 2 variáveis - X2 - X2 corrigido - T.E.Fischer Ordinal U de MannWhitney KruskalWallis