Métodos Quantitativos PROF. DR. Renato Vicente Kit Básico de Estatística Descritiva 1. Procure sempre representar seus dados graficamente através de um histograma ou gráfico de dispersão; 2. Procure por possíveis padrões tais como forma geral do histograma (simetria, centro, dispersão) ou a presença de observações muito diferentes da maioria (outliers); 3. Faça um sumário estatístico dos dados, calcule medidas de dispersão e de posição. Faça um sumário de 5 números (min, max, q1,q3,mediana) ou calcule a média e o desvio padrão; 4. Se precisar comparar distribuições construa boxplots Aula 3A Estatística Descritiva: Exercícios Exercício 1: Rendimento de um Plantação de Milho Qual taxa de plantas por acre você sugeriria ? Mil Plantas/acre 12 16 20 24 28 Rendimento (1000 kg/acre) 3,8 4,2 4,2 3,4 3,0 2,9 3,1 3,3 3,5 3,8 3,0 3,4 3,5 4,0 3,6 3,8 3,8 Exercício 1: Rendimento de um Plantação de Milho A. Construímos um gráfico de dispersão Rendimento (1000 kg/acre) 4,5 4 3,5 3 2,5 2 10 15 20 Mil Plantas/acre 25 30 Exercício 1: Rendimento de um Plantação de Milho B. Calculamos as medidas resumo Mil Plantas/Acre 12 16 20 24 28 Rendimento médio 3,3 3,6 3,7 3,6 3,4 DP 0,44 0,48 0,39 0,32 0,57 Exercício 1: Rendimento de um Plantação de Milho C. Costruímos um gráfico com barras de erro Rendimento (1000 kg/acre) 4,5 4 3,5 3 2,5 2 10 15 20 Mil Plantas/acre 25 30 Exercício 2:Perdas ósseas em lactantes Lactantes realmente perdem mais cálcio? Mulheres em fase de Outras mulheres amamentação -4,7 -2,5 -4,9 -2,7 -0,8 2,4 0,0 0,9 -0,2 1,0 -5,3 -8,3 -2.1 -6,8 -4,3 1,7 2,9 -0,6 -1,6 -2,2 2,2 -7,8 -3,1 -1,0 -6,5 -1,8 -5,2 -5,7 -7,0 -0,3 Exercício 2:Perdas ósseas em lactantes A. Organizam-se rols. Mulheres em fase de Outras mulheres amamentação -8,3 -7,8 -7,0 -6,8 -6,5 -2,2 -1,6 -0,6 -0,2 0,0 -5,7 -5,3 -5.2 -4,9 -4,7 0,9 -4,3 -3,1 -2,7 -2,5 -2,1 -1,8 -1,0 -0,8 -0,3 2,2 1,0 1,7 2,4 2,9 Exercício 2:Perdas ósseas em lactantes B. Calculam-se sumários de 5 números Mulheres em fase de amamentação MIN Q1 MED Q3 MAX MIN Outras mulheres -8,3 -0,6 -6,1 -4,5 -1,95 2,2 -2,2 Q1 MED Q3 MAX 0,45 1,7 2,9 Exercício 2:Perdas ósseas em lactantes C. Constrói-se o Box plot básico +4 PERDA ÓSSEA (%) +2 0 -2 -4 -6 -8 LACTANTES NÃO-LACTANTES Aula 3B Estatística Descritiva: Exercícios II Exercício 3: Cestinhas de Basquete Qual o melhor jogador ? JOGADOR A JOGADOR B 15 45 32 16 30 50 12 46 10 20 90 26 52 34 40 0 52 44 10 45 Exercício 3: Cestinhas de Basquete A. Organizamos o rol Jogador A: 15 16 26 30 32 34 40 45 52 90 Jogador B: 0 10 10 12 20 44 45 46 50 52 Exercício 3: Cestinhas de Basquete B. Calculamos sumários de 5 números A: MIN=15 Q1=21 B: MIN=0 M=33 Q3=48 MAX=90 Q1= 10 M=32 Q3=48 MAX=52 Exercício 3: Cestinhas de Basquete B. Construimos o box plot basico 100 90 80 70 CESTAS 60 50 40 30 20 10 0 -10 1 2 JOGADOR Exercício 4: Experimento de Darwin A fertilização cruzada produz plantas que crescem mais? Exercício 4: Experimento de Darwin Calculamos sumários de 5 números. Fertilizacao Cruzada Q1 19.75 MIN 12 MEDIANA 21.5 MAX 23.5 Q3 22.1 Auto 16.4 12.8 18 20.4 18.6 Exercício 4: Experimento de Darwin Construimos o boxplot (no Excel, apenas o esboçamos) 25 20 15 10 5 0 Cruzada Auto Exercício 4: Experimento de Darwin Boxplot no Excel Curiosamente, não há uma forma de fazer um boxplot que seja automatizada no Excel. Para construí-lo é necessário seguir os seguintes passos: 1. Monte uma tabela com o sumário de 5 números na seqüência indicada abaixo: SEXO Q1 MIN MEDIANA MAX Q3 F 1,6 1,52 1,66 1,79 1,7 M 1,72 1,62 1,75 1,9 1,82 Boxplot no Excel 2. Marque a tabela inteira, inclusive os títulos e selecione “Inserir Gráfico”. Escolha um gráfico de linhas e selecione “Seqüências em Linhas” ( o padrão é “Seqüências em Colunas”). Conclua a operação, ajuste a escala e apague as legendas automáticas. Ao final deste passo você terá obtido: 2 1,9 1,8 1,7 1,6 1,5 1,4 F M Boxplot no Excel 3. Selecione qualquer uma das séries, vá a “Formatar seqüências de dados> Opções”, escolha “Linhas de máximo e mínimo” e “Barras superiores/inferiores”. 2 1,9 1,8 1,7 1,6 1,5 1,4 F M Exercício 5: Vermes e Plantas Vermes afetam o crescimento e mudas ? Quant. de Nematóides 0 1000 5000 10000 Aumento na altura das mudas em centímetros 10,8 9,1 13,5 9,2 11,1 11,1 8,2 11,3 5,4 4,6 7,4 5,0 5,8 5,3 3,2 7,5 Exercício 5: Vermes e Plantas Crescimento (cm) A. Construimos um gráfico de dispersão 16 14 12 10 8 6 4 2 0 0 2000 4000 6000 8000 Quantidade de Nematóides 10000 Exercício 5: Vermes e Plantas B. Calculamos medidas resumo. Quantidade 0 1000 5000 10000 10,8 11,1 5,4 5,8 Crescimento cm 9,1 13,5 11,1 8,2 4,6 7,4 5,3 3,2 9,2 11,3 5 7,5 Média 10,7 10,4 5,6 5,5 DP 2,1 1,5 1,2 1,8 Exercício 5: Vermes e Plantas Crescimento (cm) C. Construo um gráfico com barras de erro. 16 14 12 10 8 6 4 2 0 0 2000 4000 6000 8000 Quantidade de Nematóides 10000 Aula 3C Estatística Descritiva: Correlação Variável Explicativa e Variável Resposta Mortes anuais por problemas cardíacos (a cada 100.000 habitantes) Vinho é bom para o coração ? 350 300 250 200 150 100 50 0 0 2 4 6 8 Litros anuais de álcool proveniente do vinho por habitante A variável resposta mede o resultado de um estudo. A variável explicativa explica ou influencia a variável resposta. 10 Ranking do PIB (do mais pobre para o mais rico) Gráficos de Dispersão: PIB vs IDH 140 120 100 80 60 40 20 0 0 0,2 0,4 0,6 0,8 1 1,2 Índice de Desenvolvimento Humano São a melhor maneira de visualizar a relação entre duas variáveis quantitativas. Gráfico de Dispersão 2: Migração de Pássaros % de aves do ano anterior que retornaram Ocupação de Colônias de Pássaros 100 80 60 40 20 0 0 5 10 15 Novos Adultos 20 25 Gráfico de Dispersão 3: Cérebro e Inteligência QI Há relação entre o tamanho do cérebro e inteligência ? 130 125 120 115 110 105 100 95 90 85 80 800 900 1000 1100 1200 1300 Volume do Cérebro (cm3) 1400 1500 Gráfico de Dispersão 4: Cérebro e Inteligência, Homens e Mulheres Há relação entre o tamanho do cérebro e inteligência ? 130 120 QI 110 100 90 80 800 900 1000 1100 1200 1300 Volume do Cérebro (cm3) homens mulheres 1400 1500 Quantificando associações lineares: Correlação de Pearson O coeficiente de correlação de Pearson é definido da seguinte maneira: http://www.stat.tamu.edu/~west/applets/rplot.html Estudo de Caso: Classificação de um Fóssil O Archaeopteryx é uma espécie extinta que possuía penas como um pássaro mas também possuía dentes e uma calda parecida com os répteis. Ele é considerado uma espécie de elo perdido entre os répteis e as aves. Estudo de Caso: Classificação de um Fóssil Seis fósseis já encontrados possuem características que os ligariam à espécie Archaeopteryx. No entanto eles diferem bastante em tamanho e há dúvidas quanto ao fato de todos representarem a mesma espécie. Estudo de Caso: Classificação de um Fóssil Medimos os comprimentos dos ossos: Fêmur (cm) 38 56 59 64 74 Úmero (cm) 41 63 70 72 84 Calculemos a correlação entre os comprimentos. Estudo de Caso: Classificação de um Fóssil Comprimento do úmero (cm) Classificação de fósseis do Archaeopterix 90 80 70 60 50 40 30 30 40 50 60 Comprimento do fêmur (cm) r = 0,994 70 80 Estudo de Caso2: Há motivação econômica na guerra do Iraque ? O cientista político Daniel Drezner argumentou com base no gráfico acima que Bush não estaria favorecendo empresas que contribuíram em sua campanha. Estudo de Caso2: Há motivação econômica na guerra do Iraque ? Utilizando os logaritmos das quantidades ao invés das quantidades o coeficiente de correlação é bem maior r=06017. A correlação linear só serve para detectar dependências lineares.