Tipos de dados

Propaganda
Revisões de Estatística
Estatística
Descritiva
Estatística
Indutiva ou
Inferencial
Amostra
Representativa
Conclusões
sobre a
população
infere
amostra aleatória
Tipos de dados
•
•
•
•
Nominal
Ordinal
Discretos
Continuos
Apresentação de Dados Nominais
• Tabelas de frequências
• Gráficos de barras e circulares
Apresentação de Dados Ordinais
• Mesmas que Nominais
• Frequências cumulativas
• Mediana
• Amplitude e
amp. interquartílica
Apresentação de Dados –
Discretos
• Mesmos que variáveis ordinais
• Médias
• Histograma
Apresentação de Dados Contínuos
• Medidas de tendência Central e Dispersão:
Média±Desvio Padrão
Mediana [IQR] / Range
• Medidas quantílicas
(quartis, decis, percentis)
• Medidas de simetria
e achatamento
Apresentação de Dados Contínuos
20
40
Memory Performance
60
80
100
• Histogramas
• Gráficos de Dispersão
40
60
80
Age
Verificar Normalidade
Parâmetros a verificar:
Média = Mediana = Moda
Simetria
Achatamento
Histograma
Testes estatísticos
100
E se a distribuição não é normal …
QUE FAZER?
Usar Testes Não paramétricos
Por vezes não há análises adequadas
(ex. Regressão Linear)
Usar Testes Paramétricos
Invocando o Teorema do Limite Central
Transformar os dados
( interpretação difícil)
Para usar testes paramétricos
Ter em conta …
O tipo da variável em análise
A distribuição dos dados (Normal vs Não Normal)
Homogeneidade de variâncias
O tamanho da amostra
Se existem alternativas não paramétricas
Que os testes paramétricos são mais potentes.
O que preciso de saber para escolher
um teste?
Questão? (Diferença: Emparelhado? Nº de grupos?;
Associação: 2 ou mais variáveis, …)
Tipo de dados:
Qualitativos vs Quantitativos
Tipo de distribuição
Normal vs. Não Normal
Comparar 2 médias:
Teste t
Crítico:
Média
Variância
Figure extracted from Research
Methods - Knowledge Base
One vs. two-tailed tests
Distribuição Normal
Normal (Gaussian) Distribution
P r o b a b ility D e n s ity
0.25
0.2
0.15
0.1
0.05
0
2
68,27%
3.6 5.2
6.8
8.4
10 11.6 13.2 14.8 16.4 18
95,45%
99,73%
Intervalos de Confiança
Para médias:
P( x − z
s
≤µ ≤ x+z
n
s
)=1-α
n
Para proporções:
P( pˆ − z
pˆ (1 − pˆ )
pˆ (1 − pˆ )
≤ p ≤ pˆ + z
)=1-α
n
n
Correlação
Os parâmetros r2 (coeficiente de determinação) e r
(coeficiente de correlação de Pearson) são indicadores da
força de associação entre duas variáveis quantitativas.
-1 ≤ r ≤ 1
r ≅ -1
r≅1
r≅0
Correlação
Para valores de r:
<0,2 associação muito baixa
0,2 a 0,39 associação baixa
0,4 a 0,69 associação moderada
0,7 a 0,89 associação alta
0,9 a 1 associação muito alta
r2 pode ser interpretado como a proporção da
variação da variável dependente (y) que é explicada
pela variação da variável independente (x).
Correlação
Paramétrica
R (Pearson)
– mede a correlação linear entre as variáveis
Não paramétrica
Rho (Spearman)
Testes de Hipóteses
2 Grupos de
Indivíduos
diferentes
Quantitativ Teste T de
Student para a
a
Mais de 2
Grupos de
indivíduos
diferentes
Antes –
Depois
Antes –
Depois
(só 2
medições)
(mais de 2
medidas
repetidas)
Anova de
um factor
Teste t
grupos
emparelhado
s
Anova de 1
factor,
medidas
repetidas
Correlação
de Pearson
McNemar
Q de
Cochrane
Odds Ratio
Teste de
Wilcoxon
Friedman
Correlação
de
Spearman
diferença entre
duas médias
Nominal
Regras de
Cochran:
X2
Associação
entre 2
variáveis
- X2
- X2 corrigido
- T.E.Fischer
Ordinal
U de MannWhitney
KruskalWallis
Download