Aula 3 Prof. Renato Vicente

Propaganda
Métodos Quantitativos
PROF. DR. Renato Vicente
Kit Básico de Estatística Descritiva
1. Procure sempre representar seus dados graficamente através
de um histograma ou gráfico de dispersão;
2. Procure por possíveis padrões tais como forma geral do
histograma (simetria, centro, dispersão) ou a presença de
observações muito diferentes da maioria (outliers);
3. Faça um sumário estatístico dos dados, calcule medidas de
dispersão e de posição. Faça um sumário de 5 números (min,
max, q1,q3,mediana) ou calcule a média e o desvio padrão;
4. Se precisar comparar distribuições construa boxplots
Aula 3A
Estatística Descritiva:
Exercícios
Exercício 1: Rendimento de um Plantação
de Milho
Qual taxa de plantas por acre você sugeriria ?
Mil
Plantas/acre
12
16
20
24
28
Rendimento (1000 kg/acre)
3,8
4,2
4,2
3,4
3,0
2,9
3,1
3,3
3,5
3,8
3,0
3,4
3,5
4,0
3,6
3,8
3,8
Exercício 1: Rendimento de um Plantação
de Milho
A. Construímos um gráfico de dispersão
Rendimento (1000 kg/acre)
4,5
4
3,5
3
2,5
2
10
15
20
Mil Plantas/acre
25
30
Exercício 1: Rendimento de um Plantação
de Milho
B. Calculamos as medidas resumo
Mil Plantas/Acre
12
16
20
24
28
Rendimento médio
3,3
3,6
3,7
3,6
3,4
DP
0,44
0,48
0,39
0,32
0,57
Exercício 1: Rendimento de um Plantação
de Milho
C. Costruímos um gráfico com barras de erro
Rendimento (1000 kg/acre)
4,5
4
3,5
3
2,5
2
10
15
20
Mil Plantas/acre
25
30
Exercício 2:Perdas ósseas em lactantes
Lactantes realmente perdem mais cálcio?
Mulheres em fase de
Outras mulheres
amamentação
-4,7 -2,5 -4,9 -2,7 -0,8 2,4 0,0 0,9 -0,2 1,0
-5,3 -8,3 -2.1 -6,8 -4,3 1,7 2,9 -0,6 -1,6 -2,2
2,2 -7,8 -3,1 -1,0 -6,5
-1,8 -5,2 -5,7 -7,0 -0,3
Exercício 2:Perdas ósseas em lactantes
A. Organizam-se rols.
Mulheres em fase de
Outras mulheres
amamentação
-8,3 -7,8 -7,0 -6,8 -6,5 -2,2 -1,6 -0,6 -0,2 0,0
-5,7 -5,3 -5.2 -4,9 -4,7 0,9
-4,3 -3,1 -2,7 -2,5 -2,1
-1,8 -1,0 -0,8 -0,3 2,2
1,0
1,7
2,4
2,9
Exercício 2:Perdas ósseas em lactantes
B. Calculam-se sumários de 5 números
Mulheres em fase de
amamentação
MIN Q1 MED Q3 MAX MIN
Outras mulheres
-8,3
-0,6
-6,1
-4,5 -1,95
2,2
-2,2
Q1 MED Q3 MAX
0,45
1,7
2,9
Exercício 2:Perdas ósseas em lactantes
C. Constrói-se o Box plot básico
+4
PERDA
ÓSSEA
(%)
+2
0
-2
-4
-6
-8
LACTANTES
NÃO-LACTANTES
Aula 3B
Estatística Descritiva:
Exercícios II
Exercício 3: Cestinhas de Basquete
Qual o melhor jogador ?
JOGADOR A
JOGADOR B
15 45 32 16 30 50 12 46 10 20
90 26 52 34 40 0 52 44 10 45
Exercício 3: Cestinhas de Basquete
A. Organizamos o rol
Jogador A: 15 16 26 30 32 34 40 45 52 90
Jogador B: 0 10 10 12 20 44 45 46 50 52
Exercício 3: Cestinhas de Basquete
B. Calculamos sumários de 5 números
A: MIN=15 Q1=21
B: MIN=0
M=33 Q3=48 MAX=90
Q1= 10 M=32 Q3=48 MAX=52
Exercício 3: Cestinhas de Basquete
B. Construimos o box plot basico
100
90
80
70
CESTAS
60
50
40
30
20
10
0
-10
1
2
JOGADOR
Exercício 4: Experimento de Darwin
A fertilização cruzada produz plantas que crescem mais?
Exercício 4: Experimento de Darwin
Calculamos sumários de 5 números.
Fertilizacao Cruzada
Q1
19.75
MIN
12
MEDIANA
21.5
MAX
23.5
Q3
22.1
Auto
16.4
12.8
18
20.4
18.6
Exercício 4: Experimento de Darwin
Construimos o boxplot (no Excel, apenas o esboçamos)
25
20
15
10
5
0
Cruzada
Auto
Exercício 4: Experimento de Darwin
Boxplot no Excel
Curiosamente, não há uma forma de fazer um boxplot que seja
automatizada no Excel. Para construí-lo é necessário seguir os
seguintes passos:
1. Monte uma tabela com o sumário de 5 números na seqüência
indicada abaixo:
SEXO
Q1
MIN
MEDIANA
MAX
Q3
F
1,6
1,52
1,66
1,79
1,7
M
1,72
1,62
1,75
1,9
1,82
Boxplot no Excel
2. Marque a tabela inteira, inclusive os títulos e selecione “Inserir
Gráfico”. Escolha um gráfico de linhas e selecione “Seqüências
em Linhas” ( o padrão é “Seqüências em Colunas”). Conclua a
operação, ajuste a escala e apague as legendas automáticas.
Ao final deste passo você terá obtido:
2
1,9
1,8
1,7
1,6
1,5
1,4
F
M
Boxplot no Excel
3. Selecione qualquer uma das séries, vá a “Formatar seqüências
de dados> Opções”, escolha “Linhas de máximo e mínimo” e
“Barras superiores/inferiores”.
2
1,9
1,8
1,7
1,6
1,5
1,4
F
M
Exercício 5: Vermes e Plantas
Vermes afetam o crescimento e mudas ?
Quant. de
Nematóides
0
1000
5000
10000
Aumento na altura das mudas em
centímetros
10,8
9,1
13,5
9,2
11,1
11,1
8,2
11,3
5,4
4,6
7,4
5,0
5,8
5,3
3,2
7,5
Exercício 5: Vermes e Plantas
Crescimento (cm)
A. Construimos um gráfico de dispersão
16
14
12
10
8
6
4
2
0
0
2000
4000
6000
8000
Quantidade de Nematóides
10000
Exercício 5: Vermes e Plantas
B. Calculamos medidas resumo.
Quantidade
0
1000
5000
10000
10,8
11,1
5,4
5,8
Crescimento cm
9,1
13,5
11,1
8,2
4,6
7,4
5,3
3,2
9,2
11,3
5
7,5
Média
10,7
10,4
5,6
5,5
DP
2,1
1,5
1,2
1,8
Exercício 5: Vermes e Plantas
Crescimento (cm)
C. Construo um gráfico com barras de erro.
16
14
12
10
8
6
4
2
0
0
2000
4000
6000
8000
Quantidade de Nematóides
10000
Aula 3C
Estatística Descritiva:
Correlação
Variável Explicativa e Variável Resposta
Mortes anuais por problemas
cardíacos (a cada 100.000
habitantes)
Vinho é bom para o coração ?
350
300
250
200
150
100
50
0
0
2
4
6
8
Litros anuais de álcool proveniente do vinho por
habitante
A variável resposta mede o resultado de um estudo. A variável
explicativa explica ou influencia a variável resposta.
10
Ranking do PIB (do mais pobre
para o mais rico)
Gráficos de Dispersão: PIB vs IDH
140
120
100
80
60
40
20
0
0
0,2
0,4
0,6
0,8
1
1,2
Índice de Desenvolvimento Humano
São a melhor maneira de visualizar a relação entre duas variáveis quantitativas.
Gráfico de Dispersão 2: Migração de Pássaros
% de aves do ano
anterior que retornaram
Ocupação de Colônias de Pássaros
100
80
60
40
20
0
0
5
10
15
Novos Adultos
20
25
Gráfico de Dispersão 3: Cérebro e Inteligência
QI
Há relação entre o tamanho do cérebro e inteligência ?
130
125
120
115
110
105
100
95
90
85
80
800
900
1000
1100
1200
1300
Volume do Cérebro (cm3)
1400
1500
Gráfico de Dispersão 4: Cérebro e Inteligência, Homens e
Mulheres
Há relação entre o tamanho do cérebro e inteligência ?
130
120
QI
110
100
90
80
800
900
1000
1100
1200
1300
Volume do Cérebro (cm3)
homens
mulheres
1400
1500
Quantificando associações lineares: Correlação de
Pearson
O coeficiente de correlação de Pearson é definido da seguinte maneira:
http://www.stat.tamu.edu/~west/applets/rplot.html
Estudo de Caso: Classificação de um Fóssil
O Archaeopteryx é uma espécie
extinta que possuía penas como um
pássaro mas também possuía
dentes e uma calda parecida com os
répteis. Ele é considerado uma
espécie de elo perdido entre os
répteis e as aves.
Estudo de Caso: Classificação de um Fóssil
Seis fósseis já encontrados possuem características que os ligariam à
espécie Archaeopteryx. No entanto eles
diferem bastante em
tamanho e há dúvidas quanto ao fato de todos representarem a
mesma espécie.
Estudo de Caso: Classificação de um Fóssil
Medimos os comprimentos dos ossos:
Fêmur (cm) 38 56 59 64
74
Úmero (cm) 41 63 70 72
84
Calculemos a correlação entre os comprimentos.
Estudo de Caso: Classificação de um Fóssil
Comprimento do úmero
(cm)
Classificação de fósseis do Archaeopterix
90
80
70
60
50
40
30
30
40
50
60
Comprimento do fêmur (cm)
r = 0,994
70
80
Estudo de Caso2: Há motivação econômica na
guerra do Iraque ?
O cientista político Daniel Drezner argumentou com base no gráfico acima
que Bush não estaria favorecendo empresas que contribuíram em sua
campanha.
Estudo de Caso2: Há motivação econômica na
guerra do Iraque ?
Utilizando os logaritmos das quantidades ao invés das quantidades o
coeficiente de correlação é bem maior r=06017. A correlação linear só
serve para detectar dependências lineares.
Download