Estatística Básica AULA Nº. 1 Medidas de Centralização Professores: Edu/Vicente Definições Importantes • Noções de Estatística • Podemos entender a Estatística como sendo o método de estudo de comportamento coletivo, cujas conclusões são traduzidas em resultados numéricos. Podemos, intuitivamente, dizer que: • Estatística é uma forma de traduzir o comportamento coletivo em números. Universo Estatístico ou População Estatística • Conjunto formado por todos os elementos que possam oferecer dados pertinentes ao assunto em questão. • Exemplo 1: Um partido político quer saber a tendência do eleitorado quanto a preferência entre dois candidatos à Presidência da República. O Universo Estatístico é o conjunto de todos os eleitores brasileiros. AMOSTRA • É um subconjunto da população estatística. • Quando o Universo Estatístico é muito vasto ou quando não é possível coletar dados de todos os seus elementos, retira-se desse universo um subconjunto chamado amostra. Os dados são coletados dessa amostra . Exemplo 2 • “Numa pesquisa para saber a intenção de votos para presidente da república, foram ouvidas 400 pessoas...” • Esse grupo de 400 pessoas é uma amostra. • Cada pessoa ouvida nessa pesquisa é uma unidade estatística. • Cada informação numérica obtida nessa pesquisa é um dado estatístico. ROL • É toda seqüência de dados numéricos colocados em ordem não decrescente ou não crescente. • Exemplo 3: Os 5 alunos de uma amostra apresentam as seguintes notas de matemática: • 6; 4; 8; 7; 8 • O rol desses resultados é : • (4; 6; 7; 8; 8 ) ou (8; 8; 7; 6; 4 ). Frequências • Frequência absoluta(F): • É o número de vezes que um determinado valor é observado na amostra. • Frequência total(Ft): • É a soma de todas as frequências absolutas. Frequência Relativa(Fr) F F É o quociente : Fr ou Fr 100% Ft Ft Exemplo 3 • Numa turma foram registradas as idades de todos os 25 alunos. Qual a freqüência absoluta e a freqüência relativa do número de alunos de 14 anos: 15 16 16 15 14 15 17 16 14 14 14 17 15 16 15 16 14 15 15 15 16 15 15 16 17 Solução: Tabela de Frequencias Idade 14 Frequência absoluta 5 Frequência Relativa 15 10 16 7 (10/25).100%=40 % (7/25).100%=28% 17 3 (3/25).100%=12% Total 25 100% (5/25).100%=20% • Resposta: F = 5 e Fr = 20% Medidas de Centralização • Média Aritmética Simples: Considere a seguinte situação: • A tabela a seguir mostra as notas de matemática de um aluno em um determinado ano: Bimestre Nota 1º Bimestre 3,5 2º Bimestre 7,5 3º Bimestre 9,0 4º Bimestre 6,0 A média aritmética dessas notas é dada por: 3,5 7,5 9 6 26 x 6,5 4 4 • Obs.: Ter média 6,5 significa dizer que, apesar de ele ter obtido notas mais altas ou mais baixas em outros bimestres, a soma das notas (26) é a mesma que ele alcançaria se tivesse obtido nota 6,5 em todos os bimestres. Média Aritmética Ponderada • Suponha que, em cada bimestre, os “pesos” sejam: • 1º bimestre: Peso 1 • 2º bimestre: Peso 2 • 3º bimestre: peso 3 • 4º bimestre: peso 4 Logo, a média aritmética ponderada é: 3,5 1 7,5 2 9 3 6 4 Mp 6,95 1 2 3 4 Note que se as notas ocorressem de forma invertida, ou seja, Bimestre Nota 1º Bimestre 6,0 2º Bimestre 9,0 3º Bimestre 7,5 4º Bimestre 3,5 A média ponderada seria: 6 1 9 2 7,5 3 3,5 4 Mp 6,05 1 2 3 4 ou seja, menor que a média anterior. Isso ocorre porque as últimas provas tem pesos maiores. • Analisando as situações anteriores de maneira bem simples, é como se toda avaliação durante o ano tivesse nota máxima 10,0. Desse total, o 1º bimestre vale 1,0; o 2º bimestre vale 2,0; o 3º bimestre vale 3,0 e o 4º bimestre vale 4,0. Considere agora, a seguinte situação: • Cinco baldes contêm 4 litros de água cada um, três outros 2 litros de água, cada um e, ainda, dois outros contém 5 litros de água, cada um. Se toda essa água fosse distribuída igualmente em cada um dos baldes, com quantos litros ficaria cada um? Solução: • A quantidade de litros que ficaria em cada balde é a média aritmética ponderada: 4l 5 2l 3 5l .2 xp 3,6l 53 2 Resp: Cada balde teria 3,6 litros de água. • Ou seja, a quantidade, em litros, de água em cada balde é chamada de média ponderada dos valores 4 litros, 2 litros e 5 litros, com pesos 5; 3 e 2. • Resumindo o “peso” é o número de vezes que o valor se repete. •1) Considere as seguintes situações: Situação 1 Os salários de 5 pessoas que trabalham em uma empresa são: R$700,00 ; R$800,00 ; R$900,00 ; R$1.000,00 e R$5.600,00. O salário médio dessas 5 pessoas é: 700 800 900 1.000 5.600 x 5 9.000 1.800,00 5 Parece lógico que, neste caso, a média aritmética não é a melhor medida de centralização para representar esse conjunto de dados, pois a maioria dos salários é bem menor que R$1.800,00. Em algumas situações a mediana é um número mais representativo. A mediana é o termo central do rol*. Logo, escrevendo o rol* dos dados numéricos dessa situação, temos: (700; 800; 900; 1000; 5600) Logo, o termo central desse rol* é “900”. Então a mediana é igual a 900. (Rol: É toda seqüência de dados numéricos colocados em ordem crescente(ou não decrescente) ou decrescente(ou não crescente)) Situação 2: Se acrescentarmos à lista o salário de R$1.000,00 de outro funcionário, ficaríamos com um número par de dados numéricos: (700; 800; 900;1000;1000; 5600) Nesse caso, a mediana seria a média aritmética dos termos centrais: Logo a mediana é dada por: 900 1000 mediana 950,00 2 Podemos interpretar esse resultado da seguinte maneira: Metade dos funcionários ganha menos de R$950,00 e a outra metade mais de R$950,00. Note que a média aritmética desses valores é: 700 800 900 1.000 1.000 5.600 x 6 10.000 1.666,66 6 ou seja, bem superior ao salário da maioria dos funcionários. Generalizando: Se n é ímpar, a mediana é o termo central do rol. Se n é par, a mediana é a média aritmética dos termos centrais do rol MODA Definição: Em uma amostra cujas freqüências dos elementos não são todas iguais, chama-se moda, que se indica por M , todo elemento de o maior freqüência possível. EX: Na lista de salários do exemplo anterior: (700; 800; 900;1000;1000; 5600) O salário que aparece com maior frequência é o de R$1.000,00. Logo a Moda=R$1.000,00 ou o “salário modal” é de R$1.000,00. Resumindo: Na sequência de salários: (700; 800; 900;1000;1000; 5600) 700 800 900 1.000 1.000 5.600 6 10.000 1.666,66 6 temos: Salário médio: x Salário mediano= 900 1000 950,00 2 Salário Modal = R$1.000,00 Observações importantes sobre moda: Na amostra (3; 3; 4; 7; 7; 7; 9) a moda é Na amostra (1;5; 7; 9; 9; 10; 10; 22) Aqui temos duas modas: ( Mo 7 Mo 9 e M o 10 amostra bimodal) Na amostra (1; 3; 5; 7; 9) não apresenta moda, pois todos os elementos tem a mesma frequência. 2) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo: Salário Frequência R$400,00 5 R$600,00 2 R$1.000,00 2 R$5.000,00 1 O salário médio, o salário mediano e o salário modal são, respectivamente: A) R$1750,00; R$500,00 e R$500,00 B) R$1020,00; R$400,00 e R$500,00 C) R$1750,00; R$500,00 e R$400,00 D) R$1020,00; R$800,00 e R$400,00 E) R$1020,00; R$500,00 e R$400,00 OPÇÃO E 3) ENEM 2009 – Prova cancelada OPÇÃO B 4)ENEM 2009(Prova Cancelada) OPÇÃO C 5) ENEM 2009(Cancelado) Solução: Média 4 : 4 alunos Média 5 :10 alunos Média 6 : 18 alunos Média 7 : 16 alunos Média 8 : 2 alunos Total de alunos: 50 alunos Alunos com média maior ou igual a 6 : 18+16+2 = 36 alunos Percentual de aprovados: 36 100% 72% 50 OPÇÃO E 6) ENEM 2009(Cancelado) Solução: 100 100 100 100 600 kg kg kg kg kg de de de de de milho 1000 litros/kg = 100.000 litros trigo 1500 litros/kg = 150.000 litros arroz 2500 litros/kg = 250.000 litros c.de.p 5000 litros/kg = 500.000 litros c.de.boi 17000 litros/kg=10.200.000 litros Total de litros de água = 11.200.000 litros Total de kg de alimentos = 1000 kg Quantidade média de água por kg: 11.200.000litros 11.200litros / kg 1000kg Opção B 7) A tabela traz as idades, em anos, dos filhos de 5 mães. Mãe Ana Idade dos filhos 7; 12 10; Márcia Cláudia Lúcia Heloísa 11; 15 8; 12 12; 14 9; 12; 15; 16; 18 10; A idade modal desses 15 filhos é inferior à idade média dos filhos de Heloísa em ____ ano(s). a) 4 b) 3 c) 2 d) 1 Solução: Ida de 7 8 9 10 11 12 14 15 16 18 Fre q. 1 1 1 2 1 4 1 2 1 1 Logo idade modal = 12 anos Média dos filhos de Heloísa: = 9 12 15 16 18 x 5 Logo é inferior em 14 – 12 = 2 anos OPÇÃO C = 70 5 = 14 anos 8) ENEM CANCELADO Cidades da Região Norte: Belém(PA):2º Boa Vista(RR): 1º Macapá(AP): 1º Manaus(AM): 2º Palmas(TO): 1º Porto Velho(RO):2º Rio Branco(AC): 1º. Frequência relativa = 3 100% 42,8% 7 OPÇÃO A 9) ENEM Cancelado Solução: 523 milhões/12 meses = 43,58... milhões por mês. 43,58... milhões por mês/ 180 mil trabalhadores= 4358 43,58 10 43,58 10 242 , 00 4 3 18 18 10 180 10 6 6 OPÇÃO: B ENEM 2010 ENEM 2010 A)6 B)6,5 C) 7 D) 7,3 E) 8,5 OPÇÃO: B ENEM 2009 • OPÇÃO: D