1 Professor Mauricio Lutz ESTATÍSTICA BÁSICA 1. Conceito Existem muitas definições propostas por autores, objetivando estabelecer com clareza o que é estatística, como por exemplo: Þ A Estatística é um conjunto de métodos destinados à coleta, organização, resumo, apresentação e análise de dados de observação, bem como da tomada de decisões razoáveis baseadas em tais análises. Þ A Estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos ou de massa. Þ A Estatística é a matemática aplicada aos dados de observação. 2. População (N) Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo ser finita ou infinita. Þ Finita - apresenta um número limitado de observações, que é passível de contagem. Þ Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente esta associada a processos. Exemplo: O governo encomenda ao instituto Brasileiro de Geografia e Estatística (IBGE) uma pesquisa para conhecer o salário médio do brasileiro. O universo estatístico ou população estatística é, neste caso, o conjunto de todos os assalariados brasileiros. 3. Amostra (n) É um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 2 Professor Mauricio Lutz Em termos de critérios de coleta a amostra pode ser classificada, em termos mais amplos como: Þ Amostra probabilística ou aleatória: cada elemento da população tem a mesma probabilidade de ser incluído na amostra. Þ Amostra não-probabilística: cada elemento da amostra é escolhido intencionalmente. Exemplo: Um partido político quer conhecer a tendência dos eleitorados quanto a preferência entre dois candidatos a presidência do Brasil, numa determinada cidade. Para isso, encomenda uma pesquisa a uma empresa especializada. A população estatística, nesse caso, é o conjunto de todos os eleitores brasileiros, mas como quero em uma cidade específica então temos uma amostra. 4. Censo É a coleta exaustiva de informações das "N" unidades populacionais. 5. Experimento Conjunto de procedimentos reprodutíveis que visam a obtenção de informação sobre uma dada realidade, que podem ser determinístico ou aleatório. 5.1 Experimento determinístico É aquele que garantidas as mesmas condições iniciais o resultado será o mesmo. Exemplos: Observar a temperatura de ebulição da água em condições normais de temperatura e pressão, ou soltar sempre um objeto de certa altura e calcular a velocidade com que chega ao solo. 5.2 Experimento aleatório É aquele que mesmo garantindo as condições iniciais é impossível prever com certeza o resultado do mesmo. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 3 Professor Mauricio Lutz Exemplos: O lançamento de uma moeda ou um dado, ou ainda o comportamento de um índice financeiro como o Ibovespa (Bolsa de Valores de São Paulo). 6. Variável É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. As variáveis podem ser classificadas em qualitativas (ou atributos) e quantitativas. 6.1 Variável Qualitativa É o tipo de variável que não pode ser medida numericamente. Podem ser classificadas em: A Þ Ordinal ou por Postos: os elementos têm relação de ordem, de conceito ou de colocação entre eles. Exemplos: De conceito: ótimo, bom, regular De colocação: primeiro, segundo, terceiro B Þ Nominal: os elementos são identificados por um nome. Exemplo: Cor dos olhos: castanho, preto, azul e verde 6.2 Variável Quantitativa Pode ser medida numericamente. Classificam-se em: A Þ Discreta: o valor numérico muda em saltos ou passos, não admitindo valores intermediários entre eles. Exemplos: Número de carros, número de filhos. B Þ Contínua: admite infinitos valores entre elas (dentro de um intervalo). Exemplo: altura. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 4 Professor Mauricio Lutz Observações: Þ Todas as vaiáveis associadas a contagem são discretas. ÞTodas as vaiáveis associadas à medidas que dependem da precisão de um instrumento são contínuas. Þ A variável idade, apesar de geralmente ser representada por valores inteiros, é uma variável contínua pois está relacionada com o tempo, que é variável contínua. Þ Quantia em dinheiro também é considerada uma variável contínua. 7 Normas para apresentação tabular de dados As Normas para apresentação Tabular da Estatística Brasileira é dada pela Resolução nº 886, de 26 de outubro de 1966, onde será apresentado os pontos principais. Uma tabela estatística compõe-se de elementos essenciais e elementos complementares. Os elementos essenciais de uma tabela estatística são: título, corpo, cabeçalho e coluna indicadora. Titulo é a indicação que precede a tabela e que contém a designação do fato observado, o local e a época em que foi registrado. Corpo é o conjunto de colunas e linhas que contém respectivamente, em ordem horizontal e vertical, as informações sobre o fato observado. Casa é o cruzamento de uma coluna com uma linha. As casas não deverão ficar em branco, apresentando sempre um número ou um sinal convencional. Cabeçalho é a parte superior da tabela que especifica o conteúdo das colunas. Coluna indicadora é a parte da tabela que especifica o conteúdo das linhas. Uma tabela pode ter mais de uma coluna indicadora. Os elementos complementares de uma tabela estatística são: fonte, notas e chamadas, e se situam de preferência no rodapé da tabela. Fonte é a indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 5 Professor Mauricio Lutz Notas são informações de natureza geral, destinadas a conceituar ou esclarecer o conteúdo das tabelas, ou a indicar a metodologia adotada na elaboração dos dados. Chamadas são informações de natureza especifica sobre determinadas partes da tabela, destinadas a conceituar ou esclarecer dados. As chamadas são indicadas no corpo da tabela em algarismos arábicos, entre parênteses, à esquerda nas casas e à direita na coluna indicadora. A numeração das chamadas da tabela será sucessiva, de cima para baixo e da esquerda para a direita. A distribuição das chamadas no rodapé na tabela obedecerá à ordem de sua sucessão na tabela, separando-se uma das outras por ponto (.). As chamadas de uma tabela que ocupe mais de uma página devem figurar no rodapé da tabela da ultima página, de acordo com a sucessão da mesma. 7.1 Sinais convencionais – (traço), quando o dado for nulo; ... (três pontos), quando não se dispuser do dado; X (letra x), quando o dado for omitido a fim de evitar a individualização das informações; 0 (zero), quando o valor é muito pequeno para ser expresso pela unidade utilizada; ? (ponto de interrogação). quando temos dúvida quanto à exatidão de determinado valor; 7.2 Apresentação das tabelas As tabelas, excluídos os títulos, serão delimitadas, no alto e em baixo, por traços horizontais grossos, preferencialmente. Recomenda-se não delimitar as tabelas, à direita e à esquerda, por trações verticais. Será facultativo o emprego de traços verticais para separar as colunas no corpo da tabela. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 6 Professor Mauricio Lutz Quando uma tabela, por expressa altura, tiver de ocupar mais de uma página, não será delimitada na parte inferior, repetindo-se o cabeçalho na página seguinte. Neste caso, deve-se usar, no alto do cabeçalho ou dentro da coluna indicadora, a designação contínua ou conclusão, conforme o caso. Exemplo: Pessoal docente lotado na IFF X por categoria funcional e formação acadêmica 1999 Formação Acadêmica Graduação Categoria Funcional Total Substitutos Efetivos Estagiários Bolsistas 100 300 250 90 740 Especialização - ... 10 310 320 Aperfeiçoamento 50 50 30 10 140 Mestrado 10 - 20 40 70 Doutorado (1) (2) 50 (3) 30 20 - 100 Total 210 380 330 450 1370 Fonte: Pró-Reitoria de Recursos Humanos (1) Com e sem curso de mestrado (2) Protegido pela Lei nº 5.540 (3) Livres docentes Após a coleta dos dados e sua apuração necessita-se de métodos de apresentação dos dados. Para tanto um dos instrumentos é a tabela. A filosofia da tabulação obedece ao seguinte critério: Máximo de esclarecimento (informação) num mínimo de espaço. Uma tabela pode ser decomposta em três partes: A Þ Título: é uma apresentação do que a tabela está tentando representar. Deve conter informações suficientes para responder às seguintes questões: i) O que? (referente ao fato); ii) Onde? (referente ao lugar); iii) Quando? (referente ao tempo). Exemplos: Acidentes com morte na RS 509 em 2004 O que? Acidentes com morte; Onde? RS 509; Quando? 2004. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 7 Professor Mauricio Lutz Peso médio dos alunos do Ensino Médio do IFF no ano de 2008 O que? Peso médio dos alunos do Ensino Médio; Onde? IFF; Quando? 2008 B Þ Corpo: é composto de um conjunto de colunas e subcolunas onde são postos os dados coletados. Exemplo: Estimativa de crescimento populacional para a cidade de Porto Alegre 1990 – 2050 Anos População (em 1000 hab.) 1990 10035 2000 12047 2010 13959 2020 15468 2030 17089 2040 18999 2050 20093 Fonte: Secretaria de habitação e transporte de POA C Þ Rodapé: colocam-se todas as legendas que visam esclarecer a interpretação da tabela. Geralmente também é no rodapé que se coloca a fonte dos dados. Exemplo: Número de alunos da rede pública de Alegrete em 2005 Masculino Feminino Total Menores de 15 anos 1568 1379 2947 Maiores de 15 anos 1378 1534 2912 Total 2946 Fonte: Coordenadoria Regional de Ensino 2913 5859 8. Distribuição de freqüências É o tipo de série estatística na qual permanece constante o fato, o local e a época. Os dados são colocados em classes preestabelecidas, registrando a freqüência de ocorrência. Uma distribuição de freqüência pode ser classificada em discreta e intervalar. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 8 Professor Mauricio Lutz 8.1 Distribuição de freqüência discreta ou pontual É uma série de dados agrupados na qual o número de observações está relacionado com um ponto real. Notas de Alunos na Disciplina de Matemática no 1º semestre de 2008 Notas Quantidade 5.4 5 6.3 3 6.5 4 7.0 3 7.2 5 7.8 2 Total Fonte: Secretaria escolar do IFF. 22 8.2 Distribuição de freqüências intervalar Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à classe a que permanece determinado elemento. O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, representado pelo símbolo: . Altura em centímetros de 160 alunos do Curso de Geografia da UFSM - 2003 Altura (cm) Média Quantidade 150 158 154 18 158 166 162 25 166 174 170 20 174 182 178 52 182 190 186 30 190 198 194 15 X 160 Total Fonte: Curso de Geografia 8.3 Elementos de uma distribuição de freqüências 8.3.1 Dados brutos São os valores originais conforme eles foram coletados, não estando ainda prontos para a análise, pois não estão numericamente organizados ou tabelados. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 9 Professor Mauricio Lutz 8.3.2 Rol É uma lista, onde as observações são dispostas em uma determinada ordem, seja ele crescente ou decrescente. O objetivo da ordenação é tornar possível a visualização das variáveis ocorridas, uma vez que os valores extremos são percebidos de imediato, e também facilitar a construção da distribuição de freqüências. 8.3.3 Classe ou classe de freqüência (k) É cada subintervalo (linha) na qual dividimos o fenômeno. Para determinar o número de classes a partir dos dados não tabelados, podemos usar a Fórmula de Sturges, mas deve-se saber que existem outros métodos de determinação do número de classes em uma tabela de freqüência. O que se deseja fazer é apenas comprimir um conjunto de dados em uma tabela, para facilitar a visualização e interpretação dos mesmos. n(k ) = 1 + 3.3 log n , onde “n” é o número de informações. Além da Regra de Sturges, existem outras fórmulas empíricas para resolver o problema para determinação do número de classes [n(k)], há quem prefira n(k ) @ n . 8.3.4 Limite de Classe ( li ou Li ) Uma classe é um subconjunto do Rol limitada inferiormente por um número chamado limite da classe (representado por li ) e superiormente por um outro número chamado limite superior da classe (representado por Li ). 8.3.5 Amplitude total (H) É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, ou a diferença entre o último e o primeiro elemento de um conjunto de dados postos em ordem crescente. H = Ln - l1 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 10 Professor Mauricio Lutz 8.3.6 Amplitude do intervalo de classe (h) É a diferença entre dois limites inferiores ou superiores consecutivos, caso já exista a distribuição de freqüência. h = ln - ln-1 ou h = Ln - Ln -1 Para a determinação da amplitude das classes de uma determinada distribuição de freqüências a ser construída podemos utilizar a seguinte equação: H k A amplitude do intervalo de classe deve ser constante em toda a distribuição de freqüência intervalar. h= 8.3.7 Ponto médio de classe (Xi) É a média aritmética simples do limite inferior com o limite superior de uma mesma classe. Xi = li + Li 2 8.3.8 Freqüência absoluta (fi) É a quantidade de valores em cada classe. n n = å f i = f1 + f 2 + ... + f n i =1 8.3.9 Freqüência acumulada ou freqüência absoluta acumulada (Fi) É o somatório da freqüência absoluta da i-ésima classe com a freqüência absoluta das classes anteriores, ou a freqüência acumulada da classe anterior. n Fi = å f i = n i =1 8.3.10 Freqüência Relativa (fri) É o quociente entre a freqüência absoluta da i-ésima classe com o somatório das freqüências. fri = n fi Obs.: n åf i =1 å fr i =1 i =1 i A soma da coluna de freqüências relativas é sempre igual a 1, que corresponde a 100% e pode ser lida como percentual. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 11 Professor Mauricio Lutz 8.3.11 Freqüência Relativa Acumulada (Fri) É o somatório da freqüência relativa da i-ésima classe com as freqüências relativas das classes anteriores. n Fri = å fri = 1 i =1 Método prático para construção de uma distribuição de freqüências com classe: 1º - Organize os dados brutos em um ROL; 2º - Calcule a amplitude; 3º - Calcule o número de classes através da "Regra de Sturges". Observação: Qualquer regra para determinação do nº de classes da tabela não nos levam a uma decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados. Exemplo: São observados as idades de 20 indivíduos participante de um grupo de estudos de informática, obtendo os seguintes dados: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Determine a distribuição de freqüência. Primeiramente pegamos os dados e colocamos eles em Rol crescente. 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe, para tanto temos que calcular a amplitude, número de classes e intervalo da classe. Amplitude total: H = Ln - l1 = 60 - 41 = 19 Número de classes: n(k ) = 1 + 3.3 log n = 1 + 3.3 log 20 = 5,3 @ 6 Intervalo de classe: h = Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br H 19 = = 3,17 @ 4 k 6 12 Professor Mauricio Lutz Idades dos alunos do grupo de estudo de informática Classes Xi Freqüências (fi) Fi fri (%) Fri (%) 41 45 43 7 7 35 35 45 49 47 3 10 15 50 49 53 51 4 14 20 70 53 57 55 1 15 5 75 57 61 59 5 20 25 100 61 65 63 não é necessário X X X X 20 X 100 X Total Fonte: Secretaria escolar Observe que quando trabalhando com uma distribuição de freqüência com intervalo perdemos um pouco a precisão, pois não sabemos, por exemplo, quanto alunos tem a idade de 45 anos, só sabemos que tem 3 alunos com idades entre 45 e 49 anos. Exercícios 1)Dados o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e elaborar uma tabela de distribuição de freqüências (freqüência, freqüência acumulada, freqüência relativa e freqüência relativa acumulada) . 33 50 61 69 80 35 52 64 71 81 35 53 65 73 84 39 54 65 73 85 41 55 65 74 85 41 55 66 74 88 42 57 66 76 89 45 59 66 77 91 47 60 67 77 94 48 60 68 78 97 2) Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se: a) Construir a distribuição de freqüência; b) Determinar as freqüências relativas; c) determinar as freqüências acumuladas; d) Qual é a amplitude amostral; e) Qual a percentagem de elementos maiores que 5. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 13 Professor Mauricio Lutz 3) Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm): 151 152 161 162 166 166 168 168 169 169 170 170 173 173 176 176 179 179 182 182 Pede-se determinar: 154 163 166 168 169 171 174 176 180 183 155 163 167 168 169 171 174 177 180 184 158 163 167 168 169 171 174 177 180 185 159 164 167 168 170 171 175 177 180 186 159 165 167 168 170 172 175 177 181 187 160 165 167 168 170 172 175 178 181 188 161 165 168 169 170 172 175 178 181 190 a) A amplitude amostral; b) O número de classes; c) A amplitude das classes; d) Os limites das classes; e) As freqüências absolutas das classes; f) As freqüências relativas; g) Os pontos médios das classes; h) A freqüência acumulada. 4) As notas de 32 estudantes de uma classe estão descritas a seguir: 6,0 8,0 2,0 4,0 0,0 7,0 5,0 4,5 2,0 8,5 5,5 4,0 6,5 6,0 5,0 1,0 5,0 4,5 7,0 5,5 3,5 0,0 1,5 3,5 4,0 6,5 5,0 2,5 7,0 6,0 5,0 4,5 Determinar: a) O rol; b) As distribuições de freqüências (variável contínua). c) A maior e a menor notas; d) A amplitude total; e) Qual a porcentagem dos alunos que tiveram nota menor do que 4. f) Qual o limite superior da segunda classe; g) Qual o ponto médio da quarta classe; h) Qual o ponto médio da terceira classe. 5) Os pesos de 40 alunos estão relacionados a seguir: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 161 166 168 169 170 173 176 178 182 190 14 Professor Mauricio Lutz 69 57 72 54 93 68 72 58 64 62 65 76 60 49 74 59 66 83 70 45 60 81 71 67 63 64 53 73 81 50 67 68 53 75 65 58 80 60 63 53 Construir a tabela de distribuição de freqüência , dado log40=1,6. 6) Completar os dados que faltam: Valores Freqüências (fi) 1 4 2 4 3 7 5 5 6 fri (%) 0,08 16 4 7 Fi 0,16 0,14 28 38 7 45 0,14 8 7) Conhecidas as notas de 50 alunos: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 8) Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuição de freqüência sem intervalos de classe Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 15 Professor Mauricio Lutz 9) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: Áreas (m2) 300 Nº de lotes 400 14 500 46 600 58 700 76 800 68 900 62 1000 48 1100 22 1200 6 Com referência a essa tabela, determine: a) A amplitude total; b) O limite superior da quinta classe; c) O limite inferior da oitava classe; d) O ponto médio da sétima classe; e) A amplitude do intervalo da segunda classe; f) A freqüência da quarta classe; g) A freqüência relativa da sexta classe; h) A freqüência acumulada da quinta classe; i) O número de lotes cuja área não atinge 700m2; j) O número de lotes cuja área atinge e ultrapassa 800m2; k) A percentagem dos lotes cuja área não atinge 600m2; l) A percentagem dos lotes cuja área seja maior ou igual a 900m2; m) A percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1000m2. n) A classe do 72º lote; o) Até que classe estão incluídos 60% dos lotes. 10) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº de acidentes 0 1 2 3 4 5 6 7 Nº de motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram nenhum acidente; b) O número de motoristas que sofreram pelo menos 4 acidentes; c) O número de motoristas que sofreram menos de 3 acidentes; d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; e) A percentagem dos motoristas que sofreram no máximo 2 acidentes. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 16 Professor Mauricio Lutz 9 Medidas de posição São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de freqüência. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. As outras medidas de posição são as separatrizes , que englobam, a própria mediana, os quartis e os percentis. 9.1 Media aritmética É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto de dados. 9.1.1 Média para dados não agrupados A média aritmética é definida, para dados não agrupados, ou seja, que não vêem organizados em uma tabela de freqüência como sendo: n X = åX i =1 i , n onde X i é o valor das varias observações e n é o número de observações. Exemplo: Suponha os seguintes dados: 5, 6, 10, 8, 7, 6 n A média para esse exemplo é X = åX i =1 i n 5 + 6 + 10 + 8 + 7 + 6 = 7. 6 = 9.1.2 Média para dados agrupados Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos à média aritmética simples. Quando temos dados agrupados a média é calculada como sendo: n X = å X .f i i =1 n åf i =1 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br i i 17 Professor Mauricio Lutz Exemplo: Altura em centímetros de 160 alunos do Curso de Agropecuária do IFF – Campus Alegrete - 2000 Altura (cm) Xi fi Xi . fi 150 158 154 18 2772 158 166 162 25 4050 166 174 170 20 3400 174 182 178 52 9256 182 190 186 30 5580 190 198 194 15 2910 X 160 27968 Total Fonte: Departamento de registros acadêmicos (2000) n . X= å X .f i i =1 i = n åf i =1 27968 = 174,8 160 i Se agora tivermos dados tabelados com valores ponderados podemos calcular através de: n å X .W X = i i =1 n åW i =1 onde Wi i , i é o peso. Exemplo: Nota do Aluno “A” 1º semestre de 2008 - IFF Notas (Xi ) Pesos(Wi) Xi .Wi 7,8 2 15,6 8,3 3 24,9 9,2 2 18,4 5,8 3 17,4 Total 10 76,3 Fonte: Departamento de registros acadêmicos n X= å X .W i i =1 n åW i =1 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br i i = 76,3 = 7,63 10 18 Professor Mauricio Lutz 9.1.3 Desvio em relação à média É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. di = X i - X Exemplo: Suponha os seguintes dados: 5, 6, 10, 8, 7, 6, sabemos que a media é 7. Logo temos 6 desvios em relação a média que são: d1 = 5 - 7 = -2 ; d 2 = 6 - 7 = -1 ; d 3 = 10 - 7 = 3 ; d 4 = 8 - 7 = 1 ; d 5 = 7 - 7 = 0 ; d 6 = 6 - 7 = -1 9.1.4 Propriedades da média aritmética 1ª propriedade: A soma algébrica dos desvios em relação à média é nula. No exemplo anterior : d1 + d 2 + d 3 + d 4 + d 5 + d 6 = 0 . 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. Se no conjunto de dado {5, 6, 10, 8, 7, 6} somarmos a constante 2 a cada um dos valores da variável temos: (5 + 2) + (6 + 2) + (10 + 2) + (8 + 2) + (7 + 2) + (6 + 2) 6 y=9 y= y = X +2=7+2=9 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante. Se nos dados {5, 6, 10, 8, 7, 6} multiplicarmos a constante 3 a cada um dos valores da variável temos: (5 x3) + (6 x3) + (10 x3) + (8 x3) + (7 x3) + (6 x3) 6 126 y= = 21 6 y= y = X x3 = 7 x3 = 21 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 19 Professor Mauricio Lutz 4ª propriedade: A média aritmética simples deverá estar entre o menor e o maior valor observado. li £ X £ Li 9.2 Media geométrica É a raiz n-ésima do produto de todos eles,representado por dado pela seguinte equação: Xg = n n ÕX i Xg , ou seja, é = n X 1. X 2 ..... X n i -1 Exemplo: Calcular a média geométrica dos dados {1, 4, 16, 64}. X g = 4 1x 4 x16 x64 = 4 4096 = 8 Se tivermos dados tabelados podemos calcular através de: n Xg = å fi i =1 n Õ (X ) i f1 = n ( X 1 ) 1 .( X 2 ) 2 .....( X n ) n f f f i =1 Exemplo: Calcular a média geométrica dos valores da tabela abaixo: Xi fi 1 2 3 4 9 2 27 1 Total 9 X g = 9 12.34.9 2.271 = 9 177147 = 3,83 9.3 Media harmônica Chama-se média harmônica de n números x1, x2, x3,...xn, todos diferentes de zero o numero X h tal que: n n Xh = n = . 1 1 1 1 + + ... + å X1 X 2 Xn i =1 X i Isto é, X h é o inverso da média aritmética dos inversos dos n números. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 20 Professor Mauricio Lutz Exemplos: Calcule a média harmônica de {2, 4, 3}: Xh = n 3 = 1 1 1 1 1 1 1 + + + .. + + + x1 x2 x3 xn 2 4 3 Xh = 3 3 3x12 36 = = = = 2,769 6 + 3 + 4 13 13 13 12 12 Se tivermos dados tabelados podemos calcular através de: n Xh = åf i =1 n i fi åX i =1 f1 + f 2 + ... + f n f f1 f + 2 + ... + n X1 X 2 Xn = i Exemplo: Calcular a média harmônica dos valores da tabela abaixo: Classes fi Xi fi / Xi 1 3 2 2 2/2=1 3 5 4 4 4/4=1 5 7 8 6 8/6=1,33 7 9 4 8 4/8=0,5 9 11 2 10 2/10=0,2 20 X 4,03 Total n Xh = åf i =1 n i fi åX i =1 = 20 = 4,96 4,03 i Obs.: ÞA média harmônica não aceita valores iguais a zero como dados de uma série. ÞA igualdade X g = X h = X só ocorrerá quando todos os valores da série forem iguais. ÞDeve-se observar esta propriedade entre as medias X ³ X g ³ X h Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 21 Professor Mauricio Lutz 9.4 Mediana A mediana ( Md ) de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. 9.4.1 A mediana em dados não tabelados Dada uma série de valores, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 . Se a série dada tiver número par ou ímpar de termos, o valor mediano será o termo de ordem dado pela fórmula: PMd = n +1 2 Exemplos: a) Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } Primeiramente temos que ordenar a serie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 , logo n + 1 9 + 1 10 = = = 5 , ou seja, o 5º elemento da série ordenada será a 2 2 2 mediana. Portanto a mediana será o elemento 2, isto é, Md = 2 . . b) Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } Primeiramente temos que ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } 10 + 1 11 n = 10 , logo a = = 5,5 , ou seja, a mediana será a média aritmética do 5º e 6º 2 2 2+3 termos da série, portanto = 2,5 . 2 Portanto a mediana será 2,5, isto é, Md = 2,5 . .Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 22 Professor Mauricio Lutz Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a X = 10 e Md = 10 ; já em { 5, 7, 10, 13, 65 } a X = 20 e Md = 10 , isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. 9.4.2 A mediana em dados tabelados Temos que considerar dois casos nos dados tabelados, o primeiro sem intervalo de classe e o segundo com intervalo de classe. 9.4.2.1 Sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Quando o somatório das freqüências for par ou ímpar o valor mediano será o termo de ordem dado pela fórmula: PMd æ n ö ç å fi ÷ + 1 = è i =1 ø 2 Exemplos: a) Dada a tabela abaixo determine a mediana. Variável (Xi) Freqüência (fi ) Fi 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 Total 35 X Como o somatório das freqüências foi 35 a fórmula ficará: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 23 Professor Mauricio Lutz æ n ö ç å fi ÷ +1 35 + 1 36 PMd = è i =1 ø = = = 18 , ou seja, o 18º termo é a nossa mediana, portanto 2 2 2 Md = 3 . b) Calcule a mediana dos dados da tabela abaixo. Variável (Xi) Freqüência (fi ) Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 X Como o somatório das freqüências foi 8 a fórmula ficará: PMd æ n ö ç å fi ÷ + 1 8 +1 9 = è i =1 ø = = = 4,5 , ou seja, a mediana se encontra entre o 4º e o 5º 2 2 2 termo e será a média aritmética destes termos, portanto 15 + 16 = 15,5 . Portanto 2 a mediana é Md = 15,5 . 9.4.2.2 Com intervalos de classe Devemos seguir os seguintes passos: a) Determinamos as freqüências acumuladas; n åf b) Calculamos i =1 2 i ; c) Marcamos a classe correspondente à freqüência acumulada, pois tal classe será a classe mediana; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 24 Professor Mauricio Lutz d) Calculamos a mediana pela seguinte fórmula:. æ n ö ç å fi ÷ ç i =1 - F ÷.h ant ç 2 ÷ ç ÷ ø , Md = li + è f i med onde li é o limite inferior da classe mediana; Fant é a freqüência acumulada da classe anterior à classe mediana; h é a amplitude do intervalo da classe mediana e fi med é a freqüência absoluta da classe que contém a mediana. Exemplo: Dada a tabela abaixo determine a mediana. Classes Freqüência (fi ) Fi 50 54 4 4 54 58 9 13 58 62 11 24 62 66 8 32 66 70 5 37 70 74 3 40 40 X Total n åf i 40 = 20 , logo a classe mediana será (58 2 2 isso determinamos li = 58 , Fant = 13 , f i med = 11 e h = 4 . Calculamos i =1 = 62). Com Substituindo esses valores na fórmula, obtemos: æ n ö ç å fi ÷ ç i =1 - F ÷.h ant ç 2 ÷ ç ÷ ø = 58 + (20 - 13)4 Md = li + è f i med 11 7 x4 = 58 + 2,55 = 60,55 11 Esta mediana é estimada, pois não temos os 40 valores da distribuição, isto significa, que tem 20 valores antes e 20 valores depois de 60,55. Md = 58 + Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 25 Professor Mauricio Lutz Emprego da Mediana Þ Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. Þ Quando há valores extremos que afetam de maneira acentuada a média aritmética. Þ Quando a variável em estudo é salário. 9.5 Moda A moda ( Mo ) é, por definição, o valor mais freqüente dos dados. Assim para dados não agrupados ou para tabelas de freqüência de dados discretos basta localizar o valor de maior freqüência, e este será a moda. Se num conjunto de dados existir somente um valor que se repita mais, se dirá que a moda é unimodal, se houver 2 valores que se repitam na mesma quantidade diremos que é bimodal, se houver 3 ou mais valores que se repitam na mesma quantidade diremos que plurimodal ou multimodal. Caso não haja valores que se repitam diremos que é amodal. Exemplos: a) Considere os seguintes dados {1, 4, 5, 4, 3, 2, 5, 7, 1, 5, 5} Primeiramente ordenamos os dados para facilitar a nossa visualização. {1, 1, 2, 3, 4, 4, 5, 5, 5, 5, 7} Portanto neste exemplo a moda é Mo = 5 . b) Considere a seguinte tabela de freqüências para dados discretos. Ocorrências fi Neste caso basta observarmos qual a 0 2 maior freqüência e a moda será o valor que tem esta 2 3 freqüência. No nosso exemplo, a maior freqüência é 3 5 4 4 5 e o valor associado a ela é 3 logo nossa moda é Mo = 3 . Caso tenhamos dados contínuos o cálculo da moda é um pouco mais complicado. Procedemos da seguinte forma: a) Definimos qual a classe que tem maior freqüência. Esta classe é chamada classe modal; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 26 Professor Mauricio Lutz b) Calculamos a moda com a fórmula (moda de Czuber) ìD1 = f Mo - f ant æ D1 ö ÷÷.h Þ í Mo = l Mo + çç , è D1 + D 2 ø îD 2 = f Mo - f pos onde lMo é o limite inferior da classe modal; f Mo é a freqüência absoluta da classe modal; f ant é a freqüência absoluta da classe anterior a classe modal; f pos é a freqüência absoluta da classe posterior a classe modal e h é a amplitude do intervalo de classe. Exemplo: Suponha a seguinte tabela de freqüências Classes fi 0 2 1 2 4 3 4 6 4 6 8 2 Primeiramente localizamos a classe de maior freqüência. A classe é 4 6. A amplitude de classe é 2, logo calculamos a moda através da equação: æ D1 ö æ ö 4-3 ÷÷.h = 4 + çç ÷÷.2 Mo = l Mo + çç è (4 - 3) + (4 - 2 ) ø è D1 + D 2 ø 2 æ 1 ö Mo = 4 + ç ÷.2 = 4 + = 4,67 3 è1+ 2 ø 9.6 Separatrizes Como vimos à mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se baseiam em sua posição na série. Essas medidas – os quartis e os percentis – são juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 27 Professor Mauricio Lutz 9.6.1 Quartis Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis: O primeiro quartil ( Q1 ) é o valor situado de tal modo na série que separa os primeiros 25% dos 75% restantes. O segundo quartil ( Q2 ) é o valor situado de tal modo na série que separa em duas partes iguais, isto é, temos então a mediana. O terceiro quartil ( Q3 ) é o valor situado de tal modo na série que separa os primeiros 75% dos 25% restantes. 9.6.1 Quartis sem intervalo de classes Procedimento no caso de dados brutos: a) Colocam-se os dados em ordem (rol); b) Calcula-se a posição do quartil através da formula: n PQi = i. , 4 onde i é o número do quartil e n é o número de observações; c) O quartil será o valor que ocupa, no rol, a posição calculada anteriormente. 9.6.2 Quartis com intervalo de classes Devemos seguir os seguintes passos: n åf i n a) Calcula-se a posição do quartil a través de PQi = i. i =1 = i. ; 4 4 b) O quartil estará localizado na classe onde, pela primeira vez, Fi ³ PQi , onde Fi é a freqüência absoluta acumulada; c) Para encontrar o valor do quartil aplica-se a seguinte fórmula: (PQi - Fant ).h , Qi = li + f Qi onde li é o limite inferior da classe que contém o respectivo quartil; Fant é a freqüência acumulada da classe anterior à classe que contém o quartil; h é a amplitude do intervalo da classe que contém o quartil e f Qi é a freqüência absoluta da classe que contém o quartil. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 28 Professor Mauricio Lutz Exemplo: Estaturas (cm) fi Fi 150 154 4 4 154 158 9 13 158 162 11 24 162 166 8 32 166 170 5 37 170 174 3 40 40 X Total Ü Q1 Ü Q3 Primeiro quartil Temos: n åf PQ1 = i. i =1 4 Q1 = li + i (P Qi = 1. 40 = 10 4 - Fant ).h f Qi = 154 + (10 - 4)4 = 154 + 24 = 154 + 2,66 = 156,66 9 9 Q1 = 156,66 cm Terceiro quartil Temos: n åf PQ 3 = i. i =1 4 Q3 = li + i (P Qi = 3. 40 = 30 4 - Fant ).h f Qi = 162 + (30 - 24)4 = 162 + 24 = 162 + 3 = 165 8 8 Q3 = 165 cm 9.6.2 Percentis Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos por P1 , P2 , ..., P32 , P99 . É evidente que P50 = Md , P25 = Q1 e P75 = Q3 . Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 29 Professor Mauricio Lutz Para encontrar o valor do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do percentil, a fórmula será: n åf i n PPi = i. i =1 = i. , 100 100 onde i é o número do percentil e n é o número de observações. Para encontrar o valor de percentil quando os dados estão agrupados em classe, a fórmula será: Pi = li + (PPi - Fant ).h , f Pi onde li é o limite inferior da classe que contém o respectivo percentil; Fant é a freqüência acumulada da classe anterior à classe que contém o percentil; h é a amplitude do intervalo da classe que contém o percentil e f Pi é a freqüência absoluta da classe que contém o percentil. Exemplo: Estaturas (cm) fi Fi 150 154 4 4 154 158 9 13 158 162 11 24 162 166 8 32 166 170 5 37 170 174 3 40 40 X Total Ü P8 Oitavo percentil Temos: n PP `8 = i. åf P8 = li + i =1 i 100 = 8. 40 = 3,2 100 (PPi - Fant ).h = 150 + (3,2 - 0)4 = 150 + 12,8 = 150 + 3,2 = 153,2 P8 = 153,2 cm Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br f Pi 4 4 30 Professor Mauricio Lutz Exercícios 1) A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou não aprovado. 2) Calcule para cada uma das distribuições abaixo sua respectiva média. a) b) c) xi Fi xi fri xi fi 2 3 4 5 6 3 9 19 25 28 7 8 9 10 11 1/16 5/18 1/3 2/9 5/48 85 87 88 89 90 5 1 10 3 5 3) Das estaturas de 140 alunos, conseguiu-se a distribuição abaixo. Calcular a média. Estaturas (cm) 145 No de alunos 150 150 2 155 155 10 160 160 27 165 165 38 170 27 170 175 21 175 180 8 180 185 7 4) Dada a distribuição abaixo determine a média Classes 68 Fi 72 8 72 76 20 76 80 35 80 84 40 5) turmas que possuem determinada disciplina em comum apresentam, nessa disciplina: Turma A (40 alunos) – média 6,5 Turma B (35 alunos) – média 6,0 Turma C (35 alunos) – média 4,0 Turma D (20 alunos) – média 7,5 Determine a média geral. 6) Para cada item abaixo, determine a mediana. a)1, 3, 3, 4, 5, 6, 6 b) 1, 3, 3, 4, 6, 8, 8, 9 c) 12, 7, 10, 8, 8 d) 82, 86, 88, 84, 91, 93 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 31 Professor Mauricio Lutz 7) Para cada distribuição determine a mediana: a) xi 73 75 77 79 81 fi b) 2 10 12 5 2 xi 232 235 237 240 Fi 15 40 55 61 8) Para cada distribuição, determine a mediana: a) Classes 1 3 3 3 fi 5 5 5 7 7 8 9 6 22 25 18 fi 25 28 25 28 31 31 30 34 20 9) Para cada série, determine a moda: a) 3, 4, 7, 7, 7, 8, 9, 10 b) 43, 40, 42, 43, 47, 45, 45, 43, 44, 48 10) Para cada distribuição, determine a moda: a) xi 72 75 78 80 fi b) 8 18 28 38 xi 2,5 3,5 4,5 6,5 fi 7 17 10 5 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 11 4 b) Classes 9 11 13 3 32 Professor Mauricio Lutz 11) Para cada distribuição, determine a moda: a) Classes 7 10 10 6 fi 13 13 10 16 16 15 19 19 10 22 5 b) Classes 10 20 20 7 Fi 30 30 19 40 40 28 50 32 12) Para as distribuições: a) Classes 4 6 6 4 fi Calcule P65 e Q1. 8 8 10 11 10 15 12 5 b) Classes 20 30 30 3 Fi Calcule P43 e Q3. 40 40 8 50 50 18 60 60 22 70 24 13) Abaixo temos a distribuição do número de acidentes por dia, durante 53 dias, em certa rodovia: N° de acidentes 0 1 2 3 4 N° de dias 20 15 10 5 3 Pede-se: a) Determinar a média. b) Determinar a mediana. c) Determinar a moda. d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia? 14) Sendo: Idade (anos) N° de pessoas 10 14 15 14 18 28 18 22 40 22 26 26 30 a)Determine a média. b) Calcular a medida que deixa 50% dos elementos. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 30 20 30 34 15 34 38 10 38 42 5 33 Professor Mauricio Lutz c) Determine a moda. d) Calcular o trigésimo percentil. e) determinar a medida que deixa ¼ dos elementos. f) Calcular o percentil 80. g) Qual a porcentagem das pessoas maiores de idade? 15) Considere o seguinte conjunto de medidas: 21, 18, 26, 37, 23, 43, 24, 47, 18, 24. Então, a mediana e a média são respectivamente: a) 33 e 30 b) 24 e 28,1 c) 23 e 30,3 d) 24 e 28,5 e) 33 e 28,9 16) Considere o seguinte conjunto de dados: {3, 5, 2, 6, 5, 9, 5, 2, 8, 6}. A média, mediana e moda são respectivamente: a) 4,5; 3,6; 6. b) 5,0; 5,5; 5. c) 5,0; 5,5; 6. d) 5,1; 5; 5. e) 5,2; 5,5; 5. 17) Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: Notas 2 3 4 5 6 7 8 9 10 Nº de alunos 1 3 6 10 13 8 5 3 1 Calculando a nota mediana e modal obtemos respectivamente: a) 25,5; 5. b) 25; 13 c) 10; 5 d) 6; 6 e) 5; 6. 10 Medidas de dispersão Suponha que estivéssemos observando dois grupos de alunos e anotando os resultados dos mesmos em uma dada prova. Suponha ainda que os resultados fossem: Grupo 1 = {5, 5, 5, 5, 5} Grupo 2 = {4, 5, 8, 7, 1} Se calcularmos a média dos dois grupos vemos que ambos apresentam a mesma média aritmética, 5, mas também vemos claramente que o conjunto de dados provêm de grupos cujos resultados são bem diferentes. A diferença entre um grupo e outro se encontra num fato que a média, assim como qualquer outra medida de posição não pode perceber: a variabilidade dos dados. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 34 Professor Mauricio Lutz Para caracterizar essas diferenças os estatísticos criaram as medidas de dispersão, como a amplitude total (ou desvio extremo), desvio médio, variância (ou desvio quadrático), desvio padrão e coeficiente de variação. 10.1 Amplitude total ou amplitude de variação ou desvio extremo (H) É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, ou a diferença entre o último e o primeiro elemento de um conjunto de dados postos em ordem crescente. H = Ln - l1 Exemplo: Suponha que temos o seguinte conjunto de dados {1; 2; 5; 3; 1; 7; 2; 5}. Para esse caso a amplitude total é dada por H = Ln - l1 = 7 - 1 = 6 Essa medida tem aplicações muito limitadas, pois só capta o que acontece com os valores extremos, sendo completamente insensível aos valores intermediários. 10.2 Desvio Médio Uma maneira muito interessante de perceber como os dados estão dispersos é perceber como estão variando em torno da média. Uma forma de fazer isso é com o desvio médio ( d ). O desvio médio é definido como a média dos valores absolutos dos desvios em relação à média aritmética, ou seja: Dados não tabelados Dados tabelados n d= åX i =1 i n å(f n -X d= i =1 i Xi - X n åf i =1 onde ) i X i é a i-ésima ocorrência possível (caso discreto) ou o ponto médio do i-ésimo intervalo (caso contínuo); f i é a freqüência absoluta da i-ésima ocorrência possível (caso discreto) ou da i-ésima classe (caso contínuo); aritmética das observações e n é o número de observações. Exemplo: Suponha que temos a seguinte tabela de freqüências. Classes Freqüência (fi ) 0 2 1 2 4 3 4 6 2 6 8 1 Total Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 7 X é a média Para facilitar a aplicação da expressão do desvio médio, vamos criar algumas colunas auxiliares na nossa tabela de freqüências, de modo que nossa nova tabela é dada por: 35 Professor Mauricio Lutz Classes fi Xi X i . fi Xi - X X i - X . fi 0 2 1 1 1 2,86 2,86 2 4 3 3 9 0,86 2,58 6 2 5 10 1,14 2,28 8 1 7 7 3,14 3,14 7 X 27 X 10,86 4 6 Total As colunas auxiliares são, na verdade, organização do processo aritmético de cálculo da medida. Observe que para montar a 5ª coluna precisamos saber quanto vale a média aritmética. Para tanto podemos usar as colunas 4 e 2 para calcular. Nesse caso temos: å(f n 27 X= = 3,86 , assim d = 7 i =1 Xi - X i ) n åf i =1 = 10,86 = 1,55 . 7 i 10.3 Variância ou desvio quadrático Outra medida de dispersão em torno da média é a variância ( S 2 ) que é definida como: Dados não tabelados Dados tabelados å (X n S2 = i =1 i -X ) å f (X n 2 S2 = n -1 i =1 i -X i -1 n åf i =1 onde i ) 2 X i é a i-ésima ocorrência possível (caso discreto) ou o ponto médio do i-ésimo intervalo (caso contínuo); f i é a freqüência absoluta da i-ésima ocorrência possível (caso discreto) ou da i-ésima classe (caso contínuo); X é a média aritmética das observações e n é o número de observações. O fato de dividirmos por n - 1 está relacionado ao fato de ser uma amostra, caso fosse uma variância populacional seria somente n. Exemplo: Retornemos ao exemplo anterior criando algumas colunas auxiliares na nossa tabela de freqüências. Classes ( X i X i . fi X - X i ) (X i - X )2 ( fi X i - X 0 2 1 1 1 2,86 8,18 8,18 2 4 3 3 9 0,86 0,74 2,22 4 6 2 5 10 1,14 1,30 2,6 6 8 1 7 7 3,14 9,86 9,86 7 X 27 X 20,08 22,86 Total Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br fi )2 36 Professor Mauricio Lutz å f (X n S2 = i i =1 i -X i -1 n åf i =1 ) 2 = 22,86 = 3,81 7 -1 10.3.1 Algumas propriedades da variância a) Variância de dados constantes é zero; b) Somando-se ou subtraindo-se uma constante k a cada valor observado a variância não será alterada, isto é, S 2 = (k ± X ) = S 2 ( X ) ; c) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a variância ficará multiplicada ou dividida pelo quadrado dessa constante, isto é, S 2 = (k . X ) = k 2 .S 2 ( X ) . 10.4 Desvio padrão Pelo fato de a variância ser uma medida que utiliza o quadrado dos desvios em relação à média, sentiu-se a necessidade de uma medida que utilizasse a mesma unidade dos dados. Esta medida é chamada desvio padrão (S). O desvio padrão é definido tão somente como a raiz quadrada positiva da variância. S = S2 10.5 Coeficiente de Variação (CV) É uma medida relativa de dispersão. Utilizada para fazer comparação da dispersão de duas séries distintas em torno de suas respectivas médias. Define-se como: CV = S X Exemplo: Considere que tenhamos duas séries. A primeira com média 4 e desvio padrão 1,5 e outra com média 3 e desvio padrão 1,3. Neste caso temos os seguintes coeficientes de variação: CV1 = S 1,5 1,3 = = 0,375 e CV2 = = 0,43 X 4 3 Logo se conclui que a primeira série tem uma dispersão relativa em torno da média menor que a segunda. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 37 Professor Mauricio Lutz Em geral CV maior ou igual a 50% é considerado alto, sendo a média pouco representativa. Valores menores que 50% implicam CV baixo e a média é tão mais representativa quanto menor for o valor do CV . 11 Medidas de assimetria e curtose Uma questão importante quanto à descrição dos dados é saber onde está a maior concentração de valores (por exemplo se a maior concentração se dá antes ou depois da média). Esta questão é respondida pelas medidas de assimetria. Uma outra questão que podemos responder é: como se dá a concentração? Muito acentuada ou não? Para essa pergunta utilizam-se os coeficientes de Curtose. 11.1 Assimetria Assimetria é o grau de desvio ou afastamento que a curva de freqüência apresenta em relação a uma curva simétrica. Diz-se que uma distribuição é simétrica se obedece à seguinte condição X = Md = Mo Graficamente: X = Md = Mo Quando uma distribuição não é simétrica diz-se que é assimétrica. Neste caso temos duas possibilidades: Assimetria à direita ou positiva - Isso ocorre quando a maior concentração dos dados está localizada abaixo da média, ou seja, X > Md > Mo Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 38 Professor Mauricio Lutz Graficamente: Mo Md X Assimetria à esquerda ou negativa - isso ocorre quando temos uma concentração dos dados acima da média, ou seja, X < Md < Mo Graficamente: X Md Mo Uma medida estatística que caracteriza a assimetria é o coeficiente de Pearson que é definido como As = X é a média aritmética; Mo X - Mo , onde S é a moda e S é o desvio padrão. Para essa medida temos o seguinte comportamento: Se As = 0 Þ simétrica; Se As < 0 Þ assimétrica à esquerda ou negativa; Se As > 0 Þ assimétrica à direita ou positiva; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 39 Professor Mauricio Lutz 11.2 Curtose A curtose é uma medida de "achatamento" da distribuição. Se uma distribuição é pouco achatada dizemos que é leptocúrtica. Quando a distribuição tem um certo grau de achatamento dizemos que é mesocúrtica. Quando é muito achatada diz-se que é platicúrtica.. Graficamente podemos representar como: X A medida estatística que caracteriza a Curtose é K= Q3 - Q1 , onde 2( P90 - P10 ) Q3 é o terceiro quartil ; Q1 é o primeiro quartil; Os quartis dividem um conjunto de dados em quatro partes iguais. P90 é o percentil 90; P10 é o percentil 10; Percentil são valores que dividem o conjunto das observações em 100 partes iguais. Se K = 0,263 Þ Mesocúrtica; K > 0,263 Þ Platicúrtica; K < 0,263 Þ Leptocúrtica. Exercícios 1) Dada a amostra: 2, 3, 4, 5, 7, 10,12 a) Qual a amplitude total? b) Determine o desvio médio? c) Calcule a variância? Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 40 Professor Mauricio Lutz 2) Para a serie 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9. a) Construir a distribuição de freqüência. b) Calcular a amplitude. c) Determinar o desvio médio. d) Calcular a variância populacional. e) Determinar o desvio-padrão populacional. f) Calcular o coeficiente de variação. 3) Calcular a variância amostral: Classes 2 4 4 3 fi 6 6 5 8 8 8 10 10 6 12 3 4) Num teste aplicado a 20 alunos, obteve-se a seguinte distribuição de pontos: Pontos 35 o N de alunos 45 45 1 55 55 3 65 65 8 75 75 3 85 85 3 95 2 a) Calcular o desvio médio. b) Determinar a variância populacional. c) Determinar o desvio padrão. d) Calcular o coeficiente de variação. e) Determinar o coeficiente de assimetria (1o coeficiente de Pearson). f) Calcular o coeficiente de curtose. 5) Abaixo temos a distribuição da freqüência dos pesos de uma amostra de 45 alunos: Peso em Kg o N de alunos 40 45 45 4 50 10 50 55 15 a) Determinar a média. b) Determinar a variância. c) Qual é o valor do coeficiente de variação? d) A distribuição é simetria? e) A distribuição é mesocúrtica? Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 55 60 8 60 65 5 65 70 3 41 Professor Mauricio Lutz 6) Sendo: Classes 30 40 40 50 50 60 60 70 70 80 10 20 35 25 10 fi Calcular a média, variância, desvio padrão, coeficiente de variação, coeficiente de assimetria e coeficiente de curtose. 7) Um Grupo A de 85 moças tem estatura média de 160,6cm, com um desvio padrão igual a 5,97cm. Outro Grupo B de 125 moças tem uma estatura média de 161,9cm, sendo o desvio padrão igual a 6,01cm. Qual é o Grupo mais homogêneo e o coeficiente de variação respectivamente: a) Grupo A e 3,717. b) Grupo B e 3,712 c) Grupo A e 3,715. d) Grupo A e 3,700. e) Grupo B e 3,717. 8) Um grupo de cem estudantes tem uma estatura média de 163,8cm, com um coeficiente de variação de 3,3%, portanto o desvio padrão desse grupo vale a) 3,9352 b) 4,1254 c) 4,3045 d) 5,1032 e) 5,4054 9) Uma distribuição apresenta as seguintes estatísticas: desvio padrão de 1,5 e coeficiente de variação de 2,9%, logo o valor da média desta distribuição é a) 48,5. b) 49,8. c) 50,9. d) 51,7. e) 52,3. 10) Uma distribuição de freqüência apresenta as seguintes medidas: X = 48,1 , Mo = 47,5 e S = 2,12 , logo o valor do coeficiente de assimetria é a) 0,283 b) 0,385 c) 0,435 d) 0,543 e) 0,678 11) Considere as seguintes medidas, relativas a uma distribuição de freqüência: Distribuição Q1 Q3 P10 P90 A 814 935 772 1012 Portanto o valor do grau de curtose e o tipo de curva são respectivamente: a) 0,252 e platicúrtica. b) 0,252 e leptocúrtica. c) 0,255 e leptocúrtica. d) 0,355 e mesocúrtica. e) 0,358 e platicúrtica. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 42 Professor Mauricio Lutz 12 Representação gráfica de uma distribuição A estatística gráfica consiste na utilização de estruturas geométricas, cores, noções de proporção etc., para expor a informação contidas nos dados. A filosofia é a mesma das tabelas: o máximo de informação no mínimo de espaço. Tem com características o uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Podem ser de dois tipos: A Þ Gráficos de informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes. B Þ Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico. Temos que ter cuidado para evitar o uso indevido de gráficos, que podem trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas. Os gráficos podem ser classificados em gráficos de barras, colunas, histogramas e polígonos de freqüências entre outros. 10.1 Gráfico em colunas ou em barras É a representação de uma série por meios de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 43 Professor Mauricio Lutz Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplo: Construção de Aeronaves Brasil – 1984-89 Anos Unidades 1984 184 1985 171 1986 167 1987 203 1988 199 1999 197 Fonte: EMBRAER a) Gráfico em colunas b) Gráfico em barras Construção de Aeronaves Brasil - 1984-89 Construção de Aeronaves Brasil - 1984-89 225 1989 200 1988 150 Anos Unidades 175 125 100 75 1987 1986 1985 50 1984 25 0 1984 1985 1986 1987 1988 0 1989 25 50 75 100 125 150 175 200 225 Unidades Anos Fonte: EMBRAER Fonte: EMBRAER 10.2 Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Exemplo: Balança comercial Brasil – 1984-88 Valor (US$ 1.000.000) Especificação 1984 1985 1986 1987 1988 Exportação 27.005 25.639 22.348 26.224 33.789 13.916 13.153 14.044 15.052 14.605 (FOB) Importação Fonte: Ministério da Economia Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 44 Professor Mauricio Lutz a) Gráficos em colunas múltiplas b) Gráfico em barras múltiplas Balança Comercial Brasil - 1984-88 Balança Comercial Brasil - 1984-88 40.000 1988 35.000 1987 25.000 Anos US$ milhão 30.000 20.000 1986 15.000 1985 10.000 5.000 1984 0 1984 1985 1986 1987 1988 0 5.000 10.000 15.000 Anos exportação 20.000 25.000 30.000 35.000 40.000 US$ milhão importação exportação Fonte: Ministério da Economia importação Fonte: Ministério da Economia 10.3 Histograma É um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. Exemplo: Notas dos alunos da Classe A Notas Freqüência Freqüência Acumulada 0,0 1,7 5 5 1,7 3,4 6 11 3,4 5,1 6 17 5,1 6,8 1 18 6,8 8,5 4 22 8,5 10,2 3 25 25 X Total Fonte: Escola Estadual Olavo Bilac Notas dos alunos da Classe A 7 Números de alunos 6 5 4 3 2 1 0 0,85 2,55 4,25 5,99 Ponto médio da classe Fonte: Escola Estadual Olavo Bilac Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 7,65 9,35 45 Professor Mauricio Lutz 10.4 Polígono de freqüências É um gráfico de linha, cujos vértices são proporcionais às freqüências absolutas e correspondem aos pontos médios das classes da distribuição. O gráfico consiste na ligação dos pontos cartesianos formados pelos pontos médios das classes e as freqüências por linhas poligonais. Os pontos inicial e final do gráfico são pontos médios das classes que existiriam antes da primeira e depois da última classe real dos dados. Eles são introduzidos para manter a proporcionalidade na representação dos dados. Este gráfico também pode ser utilizado para representar freqüências acumuladas. Neste caso usam-se os pontos finais da classe como referência, ao invés dos pontos médios. Exemplo: Utilizando os dados do exemplo anterior temos: a) Polígono de freqüência da freqüência absoluta Notas dos alunos da Classe A 7 Número de alunos 6 5 4 3 2 1 0 -0,85 0,85 2,55 4,25 5,99 7,65 9,35 11,1 Ponto médio da classe Fonte: Escola Estadual Olavo Bilac b) Polígono de freqüência da freqüência acumuladas Notas dos alunos da Classe A 30 Número de alunos 25 20 15 10 5 0 0 1,7 3,4 5,1 6,8 Limite superior da classe Fonte: Escola Estadual Olavo Bilac Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 8,5 10,2 46 Professor Mauricio Lutz Exercícios 1) O gráfico abaixo representa a taxa de desemprego na Grande São Paulo, medida nos meses de abril, segundo o Dieese: RECORDE NA GRANDE SÃO PAULO Taxa de desemprego nos meses de abril - em % 22 20,4 20,3 20 18,8 18,6 18 17,7 16,1 15,9 16 15,9 15,3 15,5 14,2 14 13,5 13,1 12 11,6 10 10,4 10,3 10,6 8,9 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 8 Fonte: Dieese Analisando o gráfico, podemos afirmar que a maior variação na taxa de desemprego na Grande São Paulo ocorreu no período de: a) abril de 1985 a abril de 1986. b) abril de 1989 a abril de 1990. c) abril de 1995 a abril de 1996. d) abril de 1997 a abril de 1998. e) abril de 2001 a abril de 2002. 2) Uma pessoa com 83kg, considerando-se obesa, consulta um nutricionista e é aconselhada a fazer uma dieta para perder 0,5kg por semana. O gráfico seguinte apresenta a situação real do emagrecimento, durante as quatros primeiras semanas da dieta. semanas início 83,5 83 82,5 82 81,5 81 kg 80,5 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 80 (1) semana (2) semana (3) semana (4) semana 47 Professor Mauricio Lutz A análise do gráfico mostra que: a) ao final da primeira semana, tinha perdido menos de 1kg; b) na segunda semana, não perdeu “peso”; c) ao final da terceira semana, tinha perdido 1kg; d) ao final da quarta semana, perdeu mais de 2kg; e) na terceira e quarta semanas, a dieta não deu o resultado previsto. 3) O gráfico a seguir mostra saldos anuais da transferência de capitais entre América Latina/Caribe e os países desenvolvidos, em bilhões de dólares. Valores positivos indicam saldos favoráveis à América Latina/Caribe. 16,0 15,5 13,1 11,3 9,0 -18,7 -22,8 -26,9 -31,6 1977 1978 1979 1980 1981 1982 -32,3 1983 1984 1985 1986 De acordo com o gráfico, no período de 1977 a 1986, o saldo total é: a) 42.800.000 dólares a favor da América Latina/Caribe. b) 42.800.000 dólares a favor dos países desenvolvidos. c) 67.400.000.000 dólares a favor da América Latina/Caribe. d) 67.400.000.000 dólares a favor dos países desenvolvidos. e) 72.300.000.000 dólares a favor dos países desenvolvidos. 4) Um estudo sobre o problema do desemprego na Grande São Paulo, no período 1985-1996, realizado pelo Seade-Dieese, apresentou o seguinte gráfico sobre taxa de desemprego. Médias anuais da taxa de desemprego total Grande São Paulo 16,0% 1985 - 1996 14,0% 12,0% 10,0% 8,0% 6,0% 85 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 86 87 88 89 90 91 92 93 94 95 96 48 Professor Mauricio Lutz Pela análise do gráfico, é correto afirmar que, no período considerado: a) a maior taxa de desemprego foi de 14%; b) a taxa de desemprego no ano de 1995 foi a menor do período; c) a partir de 1992, a taxa de desemprego foi decrescente; d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%; e) a taxa de desemprego foi crescente no período compreendido entre 1988 e 1991. 5) O histograma abaixo apresenta a distribuição de freqüência das faixas salariais numa pequena empresa. Com os dados disponíveis, pode-se concluir que a média desses salários é, aproximadamente: Núme ro de funcionários 16 14 12 10 8 6 4 2 0 500 1 000 1 500 2 000 2 500 Salário (em R$) a) R$ 420,00 b) R$ 536,00 c) R$ 562,00 d) R$ 640,00 e) R$ 708,00 6) Os dados abaixo referem-se à origem do petróleo consumido no Brasil em dois diferentes anos. Origens do consumo em 1990 (em % ) Origens do consumo em 2002 (em % ) 100 100 80 80 60 60 40 40 20 20 0 0 Produção Interna Importação Produção Interna Origens das importações em 1990 (milhares de barris) Catar Irã Iraque Arábia Saudita Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Importação Origens das importações em 2002 (milhares de barris) Iraque 37 Arábia Saudita 100 150 158 Argélia Nigéria 33 60 77 114 49 Professor Mauricio Lutz Analisando os dados, pode-se perceber que o Brasil adotou determinadas estratégias energéticas, dentre as quais podemos citar: a) a diminuição das importações dos países muçulmanos e a redução do consumo interno. b) a redução da produção nacional e diminuição do consumo do petróleo produzido no Oriente Médio. c) a redução da produção nacional e o aumento das compras de petróleo dos países árabes e africanos. d) o aumento da produção nacional e redução do consumo de petróleo vindo dos países do Oriente Médio. e) o aumento da dependência externa de petróleo vindo de países mais próximos do Brasil e redução do consumo interno. veículos (%) 7) Um sistema de radar é programado para registrar automaticamente a velocidade de todos os veículos trafegando por uma avenida, onde passam em média 300 veículos por hora, sendo 55 km/h a máxima velocidade permitida. Um levantamento estatístico dos registros do radar permitiu a elaboração da distribuição percentual de veículos de acordo com a sua velocidade aproximada. 45 40 40 35 30 30 25 20 15 15 10 6 5 3 5 1 0 10 20 30 40 50 60 70 80 90 100 velocidade (km/h) A velocidade média dos veículos que trafegam nessa avenida é de: a) 35 km/h b) 44 km/h c) 55 km/h d) 76 km/h e) 85 km/h Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 50 Professor Mauricio Lutz Gabarito distribuições de freqüências 1)Dados o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e elaborar uma tabela de distribuição de freqüências (freqüência, freqüência acumulada, freqüência relativa e freqüência relativa acumulada) . 33 50 61 69 80 35 52 64 71 81 35 53 65 73 84 39 54 65 73 85 41 55 65 74 85 41 55 66 74 88 42 57 66 76 89 45 59 66 77 91 47 60 67 77 94 48 60 68 78 97 Amplitude total: H = Ln - l1 = 97 - 33 = 64 Número de classes: n(k ) = 1 + 3.3 log n = 1 + 3.3 log 50 = 6,6 @ 7 Intervalo de classe: h = H 64 = = 9,14 @ 10 k 7 Classes Xi Freqüências (fi) Fi fri (%) Fri (%) 33 43 38 7 7 0,14 0,14 43 53 48 5 12 0,10 0,24 53 63 58 9 21 0,18 0,42 63 73 68 11 32 0,22 0,64 73 83 78 10 42 0,20 0,84 83 93 88 6 48 0,12 0,96 93 103 98 2 50 0,04 1 Total 50 1 2) Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se: a) Construir a distribuição de freqüência; b) Determinar as freqüências relativas; c) determinar as freqüências acumuladas; d) Qual é a amplitude amostral; e) Qual a percentagem de elementos maiores que 5. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Xi Freqüências (fi) fri (%) Fi Fri (%) 3 1 0,05 1 0,05 4 3 0,15 4 0,20 5 5 0,25 9 0,45 6 6 0,30 15 0,75 7 4 0,20 19 0,95 8 1 0,05 20 1 Total 20 1 51 Professor Mauricio Lutz d) H = 8 - 3 = 5 e) 0,30 + 0,20 + 0,05 = 0,55 = 55% 3) Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm): 151 161 166 168 169 170 173 176 179 183 152 162 166 168 169 170 173 176 179 182 154 163 166 168 169 171 174 176 180 183 155 163 167 168 169 171 174 177 180 184 158 163 167 168 169 171 174 177 180 185 159 164 167 168 170 171 175 177 180 186 159 165 167 168 170 172 175 177 181 187 160 165 167 168 170 172 175 178 181 188 161 165 168 169 170 172 175 178 181 190 Pede-se determinar: a) A amplitude amostral = H = 190 - 151 = 39 b) O número de classes = n(k ) = 1 + 3,3 log n = 1 + 3,3 log100 = 7,6 @ 8 c) A amplitude das classes = h = H 39 = = 4,875 @ 5 k 8 d) Os limites das classes; e) As freqüências absolutas das classes; f) As freqüências relativas; g) Os pontos médios das classes; h) A freqüência acumulada. Limite das classes Freqüências (fi) fri (%) Fi 151 156 153,5 4 0,04 4 156 161 158,5 4 0,04 8 161 166 163,5 11 0,11 19 166 171 168,5 33 0,33 52 171 176 173,5 17 0,17 69 176 181 178,5 17 0,17 86 181 186 183,5 9 0,09 95 186 191 188,5 5 0,05 100 100 1 Total Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Xi 161 166 168 169 170 173 176 178 182 190 52 Professor Mauricio Lutz 4) As notas de 32 estudantes de uma classe estão descritas a seguir: 6,0 8,0 2,0 4,0 0,0 7,0 5,0 4,5 2,0 8,5 5,5 4,0 6,5 6,0 5,0 1,0 5,0 4,5 7,0 5,5 3,5 0,0 1,5 3,5 4,0 6,5 5,0 2,5 7,0 6,0 5,0 4,5 Determinar: a) O rol; 0,0 3,5 5,0 6,0 0,0 4,0 5,0 6,5 1,0 4,0 5,0 6,5 1,5 4,0 5,0 7,0 2,0 4,5 5,5 7,0 2,0 4,5 5,5 7,0 2,5 4,5 6,0 8,0 3,5 5,0 6,0 8,5 b) As distribuições de freqüências (variável contínua). Classes 0,0 Freqüências (fi) 1,5 1,5 3 3,0 4 3,0 4,5 4,5 6,0 5 6,0 10 7,5 8 7,5 9,0 2 c) O maior e o menor graus; 8,5 e 0,0 d) A amplitude total = H = 8,5 - 0,0 = 8,5 e) Qual a porcentagem dos alunos que tiveram nota menor do que 4. 9 / 32 = 0,28125 = 28,125% f) Qual o limite superior da segunda classe = 3,0 g) Qual o ponto médio da quarta classe = x4 = 4,5 + 6,0 = 5,25 2 h) Qual o ponto médio da terceira classe = x3 = 3,0 + 4,5 = 3,75 2 5) Os pesos de 40 alunos estão relacionados a seguir: 69 65 60 67 57 76 81 68 72 60 71 53 54 49 67 75 93 74 63 65 68 59 64 58 72 66 53 80 58 83 73 60 64 70 81 63 62 45 50 53 Construir a tabela de distribuição de freqüência , dado log40=1,6. Rol 45 59 65 72 H = 93 - 45 = 48 49 60 66 73 50 60 67 74 53 60 67 75 53 62 68 76 n(k ) = 1 + 3,3 log n = 1 + 3,3 log 40 = 6,28 @ 7 h= H 48 = = 6,857 @ 7 k 7 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 53 63 68 80 54 63 69 81 57 64 70 81 58 64 71 83 58 65 72 93 53 Professor Mauricio Lutz Limite das classes Xi Freqüências (fi) fri (%) Fi Fri (%) 45 52 48,5 3 0,075 3 0,075 52 59 55,5 7 0,175 10 0,250 59 66 62,5 11 0,275 21 0,525 66 73 69,5 10 0,250 31 0,775 73 80 76,5 4 0,100 35 0,875 80 87 83,5 4 0,100 39 0,975 87 94 90,5 1 0,025 40 1 40 1 Total 6) Completar os dados que faltam: Valores Freqüências (fi) Fi fri (%) 1 4 4 0,08 2 4 8 0,08 3 8 16 0,16 4 7 23 0,14 5 5 28 0,10 6 10 38 0,20 7 7 45 0,14 8 5 50 0,10 7) Conhecidas as notas de 50 alunos: 84 74 59 67 65 68 71 80 41 94 33 81 41 78 66 52 91 50 56 48 47 65 53 94 39 73 55 65 35 69 68 57 76 45 89 61 35 85 55 98 73 85 73 64 42 77 88 60 74 54 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. Rol 33 50 61 71 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 35 52 64 73 35 53 65 73 39 54 65 73 41 55 65 74 41 55 66 74 42 56 67 76 45 57 68 77 47 59 68 78 48 60 69 80 54 Professor Mauricio Lutz 81 84 85 85 Limite das classes 88 89 91 94 94 98 Xi Freqüências (fi) fri (%) Fi Fri (%) 30 40 35 4 0,08 4 0,08 40 50 45 6 0,12 10 0,20 50 60 55 9 0,18 19 0,38 60 70 65 11 0,22 30 0,60 70 80 75 9 0,18 39 0,78 80 90 85 7 0,14 46 0,92 90 100 95 4 0,08 50 1 50 1 Total 8) Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 2 4 2 3 5 1 2 3 5 5 1 4 3 4 6 2 5 6 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuição de freqüência sem intervalos de classe Rol 1 1 1 1 1 1 2 3 2 3 2 3 2 3 2 3 2 3 2 3 4 4 4 4 4 4 4 5 6 5 6 5 6 5 6 5 6 5 6 5 6 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 2 3 3 5 6 5 6 5 6 Limite das classes Freqüências (fi) fri (%) Fi Fri (%) 1 6 0,12 6 0,12 2 8 0,16 14 0,28 3 9 0,18 23 0,46 4 7 0,14 30 0,60 5 10 0,20 40 0,80 6 10 0,20 50 0,80 Total 50 1 55 Professor Mauricio Lutz 9) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: Áreas (m2) 300 Nº de lotes 400 14 500 46 600 58 700 76 800 68 900 62 1000 48 1100 22 1200 6 Com referência a essa tabela, determine: a) A amplitude total H = 1200 - 300 = 900 b) O limite superior da quinta classe = 800 c) O limite inferior da oitava classe = 1000 d) O ponto médio da sétima classe = x7 = 900 + 1000 = 950 2 e) A amplitude do intervalo da segunda classe = h = 500 - 400 = 100 f) A freqüência da quarta classe = 76 g) A freqüência relativa da sexta classe = Fri = 62 = 0,155 = 15,5% 400 h) A freqüência acumulada da quinta classe = Fi = 14 + 46 + 58 + 76 + 68 = 262 i) O número de lotes cuja área não atinge 700m2 = 14 + 46 + 58 + 76 = 194 j) O número de lotes cuja área atinge e ultrapassa 800m2 = 62 + 48 + 22 + 6 = 138 k) A percentagem dos lotes cuja área não atinge 600m2 14 + 46 + 58 = 118 118 = 0,295 = 29,5% 400 l) A percentagem dos lotes cuja área seja maior ou igual a 900m2 48 + 22 + 6 = 76 76 = 0,19 = 19% 400 m) A percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1000m2 58 + 76 + 68 + 62 + 48 = 312 312 = 0,78 = 78% 400 n) A classe do 72º lote = 3a Classe o) Até que classe estão incluídos 60% dos lotes = 5a Classe 14 + 46 + 58 + 76 + 68 = 262 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 262 = 0,655 = 65,5% 400 56 Professor Mauricio Lutz 10) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº de acidentes 0 1 2 3 4 5 6 7 Nº de motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram nenhum acidente = 20 motoristas. b) O número de motoristas que sofreram pelo menos 4 acidentes = 6 + 5 + 3 + 1 = 15 c) O número de motoristas que sofreram menos de 3 acidentes = 20 + 10 + 16 = 46 d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes 9 + 6 + 5 = 20 e) A percentagem dos motoristas que sofreram no máximo 2 acidentes 20 + 10 + 16 = 46 46 = 0,65714 = 65,714% 70 Gabarito medidas de posição 1) A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou na aprovado. n åX 7,5 + 8 + 3,5 + 6 + 2,5 + 2 + 5,5 + 4 39 = = 4,875 n 8 8 Não foi aprovado. X = i =1 i = 2) Calcule para cada uma das distribuições abaixo sua respectiva média. a) b) c) xi Fi fi xi fri 2 3 3 7 3 9 6 8 4 19 10 9 5 25 6 6 28 3 a) Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br fi xi fi 1/16 9 85 5 5/18 40 87 1 1/3 48 88 10 10 2/9 32 89 3 11 5/48 15 90 5 57 Professor Mauricio Lutz n X= å X .f i i =1 i åf i =1 2.3 + 3.6 + 4.10 + 5.6 + 6.3 112 = =4 3 + 6 + 10 + 6 + 3 28 = n i b) 1 5 1 2 5 144. = 9 ; 144. = 40 ; 144. = 48 ; 144. = 32 ; 144. = 15 6 18 3 9 48 n X= å X .f i i =1 i n åf i =1 = 7.9 + 8.40 + 9.48 + 10.32 + 11.15 1300 = = 9,028 9 + 40 + 48 + 32 + 15 144 = 85.5 + 87.1 + 88.10 + 89.3 + 90.5 2109 = = 87,875 5 + 1 + 10 + 3 + 5 24 i c) n X= å X .f i i =1 i n åf i =1 i 3) Das estaturas de 140 alunos, conseguiu-se a distribuição abaixo. Calcular a média. Estaturas (cm) 145 150 150 155 155 160 160 165 165 170 170 175 175 180 180 185 No de alunos 2 10 27 38 27 21 8 7 xi 147,5 152,5 157,5 162,5 167,5 172,5 177,5 182,5 n X= å X .f i i =1 n åf i =1 X= i = 147,5.2 + 152,5.10 + 157,5.27 + 162,5.38 + 167,5.27 + 172,5.21 + 177,5.8 + 182,5.7 2 + 10 + 27 + 38 + 27 + 21 + 8 + 7 i 23090 = 164,929 140 4) Dada a distribuição abaixo determine a média Fi 2 10 27 38 xi 70 74 78 82 fi 8 12 15 5 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 58 Professor Mauricio Lutz n X= å X .f i i =1 i n åf i =1 = 70.8 + 74.12 + 78.15 + 82.5 3028 = = 75,7 8 + 12 + 15 + 5 40 i 5) turmas que possuem determinada disciplina em comum apresentam, nessa disciplina: Turma A (40 alunos) – média 6,5 Turma B (35 alunos) – média 6,0 Turma C (35 alunos) – média 4,0 Turma D (20 alunos) – média 7,5 Determine a média geral. n X= å X .f i i =1 i n åf i =1 = 40.6,5 + 35.6 + 35.4 + 20.7,5 760 = = 5,846 40 + 35 + 35 + 20 130 i 6) Para cada item abaixo, determine a mediana. a)1, 3, 3, 4, 5, 6, 6 n = 7 , logo n +1 7 +1 8 = = = 4 , ou seja, o 4º elemento da série ordenada será a 2 2 2 mediana. Portanto a mediana será o elemento 4, isto é, Md = 4 . . b) 1, 3, 3, 4, 6, 8, 8, 9 n +1 8 +1 9 = = = 4,5 , ou seja, a mediana será a média aritmética do 2 2 2 4+6 4º e 5º termos da série, portanto =5 . 2 Portanto a mediana será 5, isto é, Md = 5 . . c) 12, 7, 10, 8, 8 n = 8 , logo Primeiramente temos que ordenar a serie { 7, 8, 8, 10, 12 } Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 59 Professor Mauricio Lutz n = 5 , logo n +1 5 +1 6 = = = 3 , ou seja, o 3º elemento da série ordenada será a 2 2 2 mediana. Portanto a mediana será o elemento 8, isto é, Md = 8 . d) 82, 86, 88, 84, 91, 93 Primeiramente temos que ordenar a serie { 82, 84, 86, 88, 91, 93 } n +1 6 +1 7 = = = 3,5 , ou seja, a mediana será a média aritmética do 2 2 2 86 + 88 3º e 4º termos da série, portanto = 87 . 2 Portanto a mediana será 87, isto é, Md = 87 . n = 6 , logo 7) Para cada distribuição determine a mediana: a) xi 73 75 77 79 81 fi 2 10 12 5 2 Fi 2 12 24 29 31 Como o somatório das freqüências foi 2 + 10 + 12 + 5 + 2 = 31 a fórmula ficará: æ n ö ç å fi ÷ + 1 31 + 1 32 PMd = è i =1 ø = = = 16 , ou seja, o 16º termo é a nossa mediana, 2 2 2 portanto Md = 77 . b) xi 232 235 237 240 Fi 15 40 55 61 Como o somatório das freqüências foi 61 a fórmula ficará: æ ö ç å fi ÷ +1 61 + 1 62 PMd = è i =1 ø = = = 31 , ou seja, o 31º termo é a nossa mediana, 2 2 2 portanto Md = 235 . n 8) Para cada distribuição, determine a mediana: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 60 Professor Mauricio Lutz a) Classes 1 3 3 5 5 7 7 9 9 11 11 13 fi 3 5 8 6 4 3 Fi 3 8 16 22 26 29 n åf 3 + 5 + 8 + 6 + 4 + 3 29 = = 14,5 , logo a classe mediana 2 2 2 7). Com isso determinamos li = 5 , Fiant = 8 , f i med = 8 e h = 2 . i =1 Calculamos será (5 i = Substituindo esses valores na fórmula, obtemos: æ n ö ç å fi ÷ ç i=1 - F ÷.h ant ç 2 ÷ ç ÷ ø = 5 + (14,5 - 8).2 Md = li + è f i med 8 Md = 6,625 Esta mediana é estimada, pois não temos os 29 valores da distribuição, isto significa, que tem metade dos valores antes e metade depois de 6,625. b) Classes 22 25 25 28 28 31 31 34 fi 18 25 30 20 Fi 18 43 73 93 n åf Calculamos i =1 2 i = 93 = 46,5 , logo a classe mediana será (28 2 Com isso determinamos li = 28 , Fiant = 43 , f i med = 30 e h = 3 . Substituindo esses valores na fórmula, obtemos: æ n ö ç å fi ÷ ç i=1 - F ÷.h ant ç 2 ÷ ç ÷ è ø = 28 + (46,5 - 43).3 Md = li + f i med 30 Md = 28,35 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 31). 61 Professor Mauricio Lutz Esta mediana é estimada, pois não temos os 93 valores da distribuição, isto significa, que tem metade dos valores antes e metade depois de 28,35. 9) Para cada série, determine a moda: a) 3, 4, 7, 7, 7, 8, 9, 10 Moda = 7 b) 43, 40, 42, 43, 47, 45, 45, 43, 44, 48 Primeiramente organizamos os dados: 40, 42, 43, 43, 43, 44, 45, 45, 47, 48 Moda = 43 10) Para cada distribuição, determine a moda: a) 72 75 78 80 8 18 fi Moda = 80 28 38 3,5 4,5 6,5 7 17 fi Moda = 3,5 10 5 xi b) 2,5 xi 11) Para cada distribuição, determine a moda: a) Classes 7 10 10 13 13 16 16 19 19 22 fi 6 10 15 10 5 Fi 6 16 31 41 46 ìD1 = f Mo - f ant æ D1 ö ÷÷.h Þ í Mo = l Mo + çç è D1 + D 2 ø îD 2 = f Mo - f pos é 13 equação: Primeiramente localizamos a classe de maior freqüência. A classe 16. A amplitude de classe é 3, logo calculamos a moda através da Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 62 Professor Mauricio Lutz ìD1 = f Mo - f ant = 15 - 10 = 5 í îD 2 = f Mo - f pos = 15 - 10 = 5 æ D1 ö æ 5 ö ÷÷.h = 13 + ç Mo = lMo + çç ÷.3 = 14,5 è5+5ø è D1 + D 2 ø b) Classes 10 20 20 30 30 40 40 50 Fi 7 19 28 32 fi 7 12 9 4 é 20 equação: Primeiramente localizamos a classe de maior freqüência. A classe 30. A amplitude de classe é 10, logo calculamos a moda através da ìD1 = f Mo - f ant = 12 - 7 = 5 í îD 2 = f Mo - f pos = 12 - 9 = 3 æ D1 ö 5 ö ÷÷.h = 20 + æç Mo = l Mo + çç ÷.10 = 26,25 è5 + 3ø è D1 + D 2 ø 12) Para as distribuições: a) Classes 4 6 4 fi 4 Fi Calcule P65 e Q1. 6 8 8 10 10 12 11 15 5 15 30 35 Calculo do P65 Temos: n PP 65 = i. åf i =1 i 100 P65 = li + = 65. 35 = 22,75 100 (PPi - Fant ).h = 8 + (22,75 - 15)2 = 9,033 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br f Pi 15 63 Professor Mauricio Lutz Primeiro quartil Temos: n PQ1 = i. åf i =1 i = 1. 4 (P Q1 = li + 35 = 8,75 4 - Fant ).h Qi f Qi =6+ (8,75 - 4)2 = 6,864 11 b) Classes 20 30 30 3 Fi 3 fi Calcule P43 e Q3. 40 40 50 50 60 60 70 8 18 22 24 5 10 4 2 Calculo do P43 Temos: n åf PP 43 = i. i =1 i 100 = 43. 24 = 10,32 100 (PPi - Fant ).h = 40 + (10,32 - 8)10 = 42,32 P43 = li + f Pi 10 Terceiro quartil Temos: n PQ 3 = i. åf i =1 Q3 = li + i 4 (P Qi = 3. 24 = 18 4 - Fant ).h f Qi = 40 + (18 - 8)10 = 50 10 13) Abaixo temos a distribuição do número de acidentes por dia, durante 53 dias, em certa rodovia: N° de acidentes 0 1 2 3 4 N° de dias 20 15 10 5 3 Pede-se: a) Determinar a média. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 64 Professor Mauricio Lutz b) Determinar a mediana. c) Determinar a moda. d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia? N° de acidentes 0 1 2 3 4 N° de dias 20 15 10 5 3 Fi 20 35 45 50 53 a) n X= å X .f i i =1 i n åf i =1 = 0.20 + 1.15 + 2.10 + 3.5 + 4.3 62 = = 1,17 20 + 15 + 10 + 5 + 3 53 i b) Como o somatório das freqüências foi 53 a fórmula ficará: æ n ö ç å fi ÷ + 1 53 + 1 54 Md = è i=1 ø = = = 27 , ou seja, o 27º termo é a nossa mediana, 2 2 2 portanto Md = 1 . c) Moda = 0 d) 10 + 5 + 3 = 0,33963 = 33,963% 53 14) Sendo: Idade (anos) 10 14 14 15 N° de pessoas 18 18 28 22 22 40 26 26 30 30 30 20 34 34 15 38 38 10 42 5 a)Determine a média. b) Calcular a medida que deixa 50% dos elementos. c) Determine a moda. d) Calcular o trigésimo percentil. e) determinar a medida que deixa ¼ dos elementos. f) Calcular o percentil 80. g) Qual a porcentagem das pessoas maiores de idade? Idade (anos) 10 14 14 18 18 22 22 26 26 30 30 34 34 38 38 42 N° de pessoas 15 28 40 30 20 15 10 5 xi 12 16 20 24 28 32 36 40 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 65 Professor Mauricio Lutz 15 Fi 43 83 113 133 148 158 163 a) n X= åX .f i i =1 i n åf i =1 = 12.15 + 16.28 + 20.40 + 24.30 + 28.20 + 32.15 + 36.10 + 40.5 3748 = = 22,994 15 + 28 + 40 + 30 + 20 + 15 + 10 + 5 163 i b) Calcular a mediana. n åf i 163 = 81,5 , logo a classe mediana será (18 2 2 Com isso determinamos li = 18 , Fiant = 43 , f i med = 40 e h = 4 . Calculamos i =1 = 22). Substituindo esses valores na fórmula, obtemos: æ n ö ç å fi ÷ ç i =1 - F ÷.h ant ç 2 ÷ ç ÷ è ø = 18 + (81,5 - 43).4 Md = li + f i med 40 Md = 21,85 c) Primeiramente localizamos a classe de maior freqüência. A classe é 18 A amplitude de classe é 4, logo calculamos a moda através da equação: ìD1 = f Mo - f ant = 40 - 28 = 12 í îD 2 = f Mo - f pos = 40 - 30 = 10 æ D1 ö æ 12 ö ÷÷.h = 18 + ç Mo = lMo + çç ÷.4 = 20,182 è 12 + 10 ø è D1 + D 2 ø d) Calculo do P30 Temos: n PP 30 = i. åf i =1 i 100 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br = 30. 163 = 48,9 100 22. 66 Professor Mauricio Lutz (PPi - Fant ).h = 18 + (48,9 - 43).4 = 18,59 P30 = li + f Pi 40 e) Primeiro quartil Temos: n åf PQ1 = i. i =1 i = 1. 4 (P Q1 = li + 163 = 40,75 4 - Fant ).h Qi f Qi = 14 + (40,75 - 15)4 = 17,679 28 f) Calculo do P80 Temos: n PP80 = i. åf i =1 P30 = li + g) i 100 = 80. 163 = 130,4 100 (PPi - Fant ).h = 26 + (130,4 - 113).4 = 29,48 f Pi 20 40 + 30 + 20 + 15 + 10 + 5 120 = = 0,7362 = 73,62% 163 163 15) Considere o seguinte conjunto de medidas: 21, 18, 26, 37, 23, 43, 24, 47, 18, 24. Então, a mediana e a média são respectivamente: a) 33 e 30 b) 24 e 28,1 c) 23 e 30,3 d) 24 e 28,5 e) 33 e 28,9 Organizando os dados temos: 18, 18, 21, 23, 24, 24, 26, 37, 43, 47 n X= åX i =1 n i = Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 18 + 18 + 21 + 23 + 24 + 24 + 26 + 37 + 43 + 47 281 = = 28,1 10 10 67 Professor Mauricio Lutz æ n ö ç å fi ÷ + 1 10 + 1 11 Md = è i =1 ø = = = 5,5 , ou seja, a mediana será a média aritmética 2 2 2 24 + 24 do 5º e 6º termos da série, portanto = 24 . 2 Portanto a mediana será 24, isto é, Md = 24 . Gabarito letra B. 16) Considere o seguinte conjunto de dados: {3, 5, 2, 6, 5, 9, 5, 2, 8, 6}. A média, mediana e moda são respectivamente: a) 4,5; 3,6; 6. b) 5,0; 5,5; 5. c) 5,0; 5,5; 6. d) 5,1; 5; 5. e) 5,2; 5,5; 5. Organizando os dados temos: 2, 2, 3, 5, 5, 5, 6, 6, 8, 9 n X= åX i =1 i n = 2 + 2 + 3 + 5 + 5 + 5 + 6 + 6 + 8 + 9 51 = = 5,1 10 10 æ n ö ç å fi ÷ + 1 10 + 1 11 Md = è i =1 ø = = = 5,5 , ou seja, a mediana será a média aritmética 2 2 2 5+5 do 5º e 6º termos da série, portanto =5 . 2 Portanto a mediana será 5, isto é, Md = 5 . Moda = 5. Gabarito letra D. 17) Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: Notas 2 3 4 5 6 7 8 9 10 Nº de alunos 1 3 6 10 13 8 5 3 1 Calculando a nota mediana e modal obtemos respectivamente: a) 25,5; 5. b) 25; 13 c) 10; 5 d) 6; 6 e) 5; 6. Notas 2 3 4 5 6 7 8 9 10 Nº de alunos 1 3 6 10 13 8 5 3 1 Fi 1 4 10 20 33 41 46 49 50 Moda = 6. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 68 Professor Mauricio Lutz æ n ö ç å fi ÷ + 1 50 + 1 51 Md = è i=1 ø = = = 25,5 , ou seja, a mediana será a média aritmética 2 2 2 do 25º e 26º termos da série, portanto Md = 6 . Gabarito Letra D. Gabarito Medidas de dispersão, Assimetria e curtose 1) Dada a amostra: 2, 3, 4, 5, 7, 10,12 a) Qual a amplitude total? H = Ln - l1 = 12 - 2 = 10 b) Determine o desvio médio? n åX X = i =1 i n n d= = åX i =1 i 2 + 3 + 4 + 5 + 7 + 10 + 12 43 = = 6,143 7 7 -X = n 2 - 6,143 + 3 - 6,143 + ... + 12 - 6,143 21,143 = = 3,02 7 7 c) Calcule a variância? å (X n S2 = i =1 i -X ) n -1 2 = (2 - 6,143)2 + (3 - 6,143)2 + ... + (12 - 6,143)2 7 = 82,857 = 13,81 6 2) Para a serie 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9. a) Construir a distribuição de freqüência. Classes 5 6 7 8 9 Total fi 3 4 6 3 2 18 xi - x 1,833 0,833 0,167 1,167 2,167 6,167 3,36 0,694 0,028 1,362 4,696 10,14 5,499 3,332 1,002 3,501 4,334 17,668 10,08 2,776 0,168 4,086 9,392 26,502 xi - x 2 f i xi - x f i xi - x 2 b) Calcular a amplitude. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 69 Professor Mauricio Lutz H = Ln - l1 = 9 - 5 = 4 c) Determinar o desvio médio. å (f n d= i =1 Xi - X i n åf i =1 ) = 17,668 = 0,982 . 18 i d) Calcular a variância populacional. å f (X n S2 = i i =1 -X i n åf i =1 ) 2 = 26,502 = 1,472 18 i e) Determinar o desvio-padrão populacional. S = S 2 = 1,472 = 1,213 f) Calcular o coeficiente de variação. S 1,213 = = 0,1775 = 17,75% X 6,833 CV = 3) Calcular a variância amostral: Classes 2 4 4 6 6 8 8 10 5 8 6 3 xi 3 5 7 9 11 xi - x 4,08 2,08 0,08 1,92 3,92 12,08 16,646 4,326 0,0064 3,686 15,366 40,03 49,938 21,63 0,0512 22,116 46,098 139,833 2 2 n å X .f i i n åf i =1 Total 3 f i xi - x i =1 12 fi xi - x X= 10 i Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br = 3.3 + 5.5 + 8.7 + 6.9 + 3.11 177 = = 7,08 25 25 25 70 Professor Mauricio Lutz å f (X n S2 = i -X i -1 i i =1 n åf i =1 ) 2 = 139,833 = 5,826 25 - 1 4) Num teste aplicado a 20 alunos, obteve-se a seguinte distribuição de pontos: Pontos 35 o 45 45 55 55 65 65 75 75 85 85 95 Total N de alunos 1 3 8 3 3 2 xi 40 50 60 70 80 90 xi - x 25 15 5 5 15 25 625 225 25 25 225 625 25 45 40 15 45 50 220 625 675 200 75 675 1250 3500 1 4 12 15 18 20 P10 Q1 Q3 P90 2 xi - x f i xi - x f i xi - x 2 Fi n å X .f X= i i =1 i = n åf i =1 40.1 + 50.3 + ... + 90.2 1300 = = 65 20 20 i a) Calcular o desvio médio. å(f n d= i =1 Xi - X i ) n åf i =1 = 220 = 11 20 i b) Determinar a variância populacional. å f (X n S2 = i =1 i i -X n åf i =1 ) 2 = 3500 = 175 20 i c) Determinar o desvio padrão. S = S 2 = 175 = 13,229 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 20 71 Professor Mauricio Lutz d) Calcular o coeficiente de variação. CV = S 13,229 = = 0,2035 = 20,35% X 65 e) Determinar o coeficiente de assimetria (1o coeficiente de Pearson). As = X - Mo 65 - 60 = = 0,378 S 13,229 ìD1 = f Mo - f ant = 8 - 3 = 5 í îD 2 = f Mo - f pos = 8 - 3 = 5 æ D1 ö æ 5 ö ÷÷.h = 55 + ç Mo = lMo + çç ÷.10 = 60 è5+5ø è D1 + D 2 ø f) Calcular o coeficiente de curtose. K= Q3 - Q1 75 - 56,25 = = 0,256 2( P90 - P10 ) 2(85 - 48,333) n PQ1 = i. å i =1 n å 20 = 1. = 5 PQ 3 = i. i=1 4 4 e fi 4 fi = 3. 20 = 15 4 Q1 = li + (PPi - Fant ).h = 55 + (5 - 4 ).10 = 56,25 Q3 = li + (PPi - Fant ).h = 65 + (15 - 12).10 = 75 f Pi 8 f Pi 3 n åf PP10 n åf i 20 20 i =1 = i. = 10. = 2 PP 90 = i. = 90. = 18 100 100 100 100 e i =1 i P10 = li + (PPi - Fant ).h = 45 + (2 - 1).10 = 48,333 P90 = li + (PPi - Fant ).h = 75 + (18 - 15).10 = 85 f Pi 3 f Pi 3 5) Abaixo temos a distribuição da freqüência dos pesos de uma amostra de 45 alunos: Peso em Kg o N de alunos Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 40 45 4 45 50 10 50 55 15 55 60 8 60 65 5 65 70 3 Total 45 72 Professor Mauricio Lutz xi 42,5 47,5 52,5 57,5 62,5 67,5 xi - x 11 6 1 4 9 14 121 36 1 16 81 196 44 60 15 32 45 42 196 484 360 15 198 405 588 2050 4 14 29 37 42 45 Q3 P90 xi - x 2 f i xi - x 2 f i xi - x Fi Q1P10 a) Determinar a média. n X= å X .f i i =1 i = n åf i =1 42,5.4 + 47,5.10 + 67,5.3 2407,5 = = 53,5 45 45 i b) Determinar a variância. å f (X n S2 = i =1 i i -X n åf i =1 ) 2 = 2050 = 45,556 45 i c) Qual é o valor do coeficiente de variação? S = S 2 = 45,556 = 6,75 CV = S 6,75 = = 0,1262 = 12,62% X 53,5 d) A distribuição é simetria? As = X - Mo 53,5 - 52,083 = = 0,21 S 6,75 ìD1 = f Mo - f ant = 15 - 10 = 5 í îD 2 = f Mo - f pos = 15 - 8 = 7 æ D1 ö æ 5 ö ÷÷.h = 50 + ç Mo = lMo + çç ÷.5 = 52,083 è5+7ø è D1 + D 2 ø Assimetria à direita ou positiva, pois As > 0 , portanto a distribuição não é simétrica e) A distribuição é mesocúrtica? Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 73 Professor Mauricio Lutz K= Q3 - Q1 57,969 - 48,625 = = 0,22 2( P90 - P10 ) 2(63,5 - 42,25) n PQ1 = i. n å å 45 = 1. = 11,25 PQ 3 = i. i=1 4 4 e fi i =1 4 fi = 3. 45 = 33,75 4 Q1 = li + (PPi - Fant ).h = 45 + (11,25 - 4).5 = 48,625 Q3 = li + (PPi - Fant ).h = 55 + (33,75 - 29).5 = 57,969 f Pi 10 f Pi 8 n åf PP10 n åf i 45 45 i =1 = i. = 10. = 4,5 PP 90 = i. = 90. = 40,5 100 100 100 100 e i =1 i P10 = li + (PPi - Fant ).h = 45 + (4,5 - 4).5 = 45,25 P90 = li + (PPi - Fant ).h = 60 + (40,5 - 37 ).5 = 63,5 f Pi 10 f Pi 5 A distribuição não é mesocúrtica pois K não é igual a 0,260. 6) Sendo: Classes 30 40 40 50 50 60 60 70 70 80 Total fi 10 20 35 25 10 xi 35 45 55 65 75 xi - x 20,5 10,5 0,5 9,5 19,5 420,25 110,25 0,25 90,25 380,25 205 210 17,5 237,5 195 865 4202,5 2205 8,75 2256,25 3802,5 12475 xi - x 2 f i xi - x f i xi - x 2 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 100 74 Professor Mauricio Lutz 10 Fi 30 65 90 100 P10 Q1 Q3P90 Calcular a média, variância, desvio padrão, coeficiente de variação, coeficiente de assimetria e coeficiente de curtose. n å X .f X= i i =1 i = n åf i =1 i å f (X n S2 = i i =1 10.35 + 20.45 + 35.55 + 25.65 + 10.75 5550 = = 55,5 100 100 i -X n åf i =1 ) 2 = 12475 = 124,75 100 i S = S 2 = 124,75 = 11,17 CV = As = S 11,17 = = 0,2013 = 20,13% X 55,5 X - Mo 55,5 - 56 = = -0,045 S 6,75 ìD1 = f Mo - f ant = 35 - 20 = 15 í îD 2 = f Mo - f pos = 35 - 25 = 10 æ D1 ö æ 15 ö ÷÷.h = 50 + ç Mo = lMo + çç ÷.10 = 56 è 15 + 10 ø è D1 + D 2 ø K= Q3 - Q1 64 - 47,5 = = 0,275 2( P90 - P10 ) 2(70 - 40) n PQ1 = i. åf i =1 n i 4 åf 100 = 1. = 25 PQ 3 = i. i =1 4 4 e i = 3. 100 = 75 4 Q1 = li + (PPi - Fant ).h = 40 + (25 - 10 ).10 = 47,5 Q3 = li + (PPi - Fant ).h = 60 + (75 - 65).10 = 64 f Pi f Pi n å PP10 20 25 n fi å 100 100 i =1 = i. = 10. = 10 PP 90 = i. = 90. = 90 100 100 100 100 e i =1 fi Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 75 Professor Mauricio Lutz P10 = li + (PPi - Fant ).h = 30 + (10 - 0).10 = 40 P90 = li + (PPi - Fant ).h = 60 + (90 - 65).10 = 70 f Pi 10 f Pi 25 7) Um Grupo A de 85 moças tem estatura média de 160,6cm, com um desvio padrão igual a 5,97cm. Outro Grupo B de 125 moças tem uma estatura média de 161,9cm, sendo o desvio padrão igual a 6,01cm. Qual é o Grupo mais homogêneo e o coeficiente de variação respectivamente: a) Grupo A e 3,717. b) Grupo B e 3,712 c) Grupo A e 3,715. d) Grupo A e 3,700. e) Grupo B e 3,717. CV = S X CV A = S 5,97 = = 3,717 X 160,6 CVB = S 6,01 = = 3,712 X 161,9 Alternativa correta é a letra B. 8) Um grupo de cem estudantes tem uma estatura média de 163,8cm, com um coeficiente de variação de 3,3%, portanto o desvio padrão desse grupo vale a) 3,9352 CV = b) 4,1254 c) 4,3045 d) 5,1032 e) 5,4054 S S Þ 0,033 = Þ S = 5,4054 X 163,8 Alternativa correta é a letra E. 9) Uma distribuição apresenta as seguintes estatísticas: desvio padrão de 1,5 e coeficiente de variação de 2,9%, logo o valor da média desta distribuição é a) 48,5. CV = b) 49,8. c) 50,9. d) 51,7. e) 52,3. S 1,5 Þ 0,029 = Þ X = 51,7 X X Alternativa correta é a letra D. 10) Uma distribuição de freqüência apresenta as seguintes medidas: X = 48,1 , Mo = 47,5 e S = 2,12 , logo o valor do coeficiente de assimetria é Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 76 Professor Mauricio Lutz a) 0,283 As = b) 0,385 c) 0,435 d) 0,543 e) 0,678 X - Mo 48,1 - 47,5 = = 0,283 S 2,12 Alternativa correta é a letra A. 11) Considere as seguintes medidas, relativas a uma distribuição de freqüência: Distribuição Q1 Q3 P10 P90 A 814 935 772 1012 Portanto o valor do grau de curtose e o tipo de curva são respectivamente: a) 0,252 e platicúrtica. b) 0,252 e leptocúrtica. d) 0,355 e mesocúrtica. e) 0,358 e platicúrtica. K= Q3 - Q1 935 - 814 = = 0,252 2( P90 - P10 ) 2(1012 - 772) K < 0,263 Þ Curva Leptocúrtica Alternativa correta é a letra B. Gabarito representação gráfica 1) d; 2) b; 3) d; 4)d; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 5)e; 6)d; 7)b; c) 0,255 e leptocúrtica.