ESTATÍSTICA APLICADA Profª Simone Della Torre Atualizada em 2016 1 ESTATÍSTICA APLICADA A Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Estatística é dividida em duas áreas: Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução dos dados, representação dos dados, obtenção de algumas informações que auxiliam a descrição do fenômeno observado. Estatística Indutiva: Tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo da probabilidade, possibilitando assim, propostas de soluções e decisões. CÁLCULO DE PROBABILIDADES ESPAÇO AMOSTRAL (S) : É o conjunto de todos os possíveis resultados de um experimento. Exemplo: Se consideramos o lançamento de um dado, teremos: S = {1,2,3,4,5,6} e n(S) = 6 EVENTO (E): È qualquer subconjunto do espaço amostral. Exemplo: Se observarmos no lançamento de um dado a face superior tendo como resultado um número par, teremos: E = {2,4,6} e n(E) = 3 PROBABILIDADE CLÁSSICA: P(E) = n(E) n(S) Exemplo: Qual a probabilidade de observarmos um número par no lançamento de um dado? S = {1,2,3,4,5,6} e n(S) = 6 E = {2,4,6} e n(E) = 3 P(E) = n(E) = 3 = 1 = 0,5 = 50% n(S) 6 2 EVENTOS COMPLEMENTARES: Sabemos que um evento pode ou não ocorrer. Sendo p a probabilidade que ele ocorra, (sucesso) e q a probabilidade de que ele não ocorra, (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 Exemplo: Se p = ¼, então q = ¾ 2 EVENTOS INDEPENDENTES: Dizemos que dois eventos são independentes quando a realização ou não de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Exemplo: Quando lançamos dois dados o resultado de um deles independe do resultado do outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é: P = p1 x p2 Exemplo: lançamos dois dados. A probabilidade de obtermos 3 no primeiro dado é 1/6 . A probabilidade de obtermos 5 no segundo dado é 1/6. Logo, a probabilidade de obtermos SIMULTANEAMENTE 3 no primeiro dado e 5 no segundo dado é 1/6 x 1/6 = 1/36. EVENTOS MUTUAMENTE EXCLUSIVOS: Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um evento exclui a realização de(os) outro(os). Exemplo: No lançamento de uma moeda , o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos , já que ao realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que UM OU OUTRO ocorra é igual a soma das probabilidades da realização de cada um deles: P = p1 + p2 Exemplo: Lançamos um dado. A probabilidade se lermos o 3 ou o 5 na face superior é P = 1 + 1 = 2 = 0,3333 = 33,33% 6 6 6 1ª lista de Exercícios 01) Qual a probabilidade de sair o “ás” de ouros quando retiramos uma carta de um baralho de 52 cartas? 02) Qual a probabilidade de sair um “rei” quando retiramos uma carta de um baralho de 52 cartas? 03) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) A probabilidade de essa peça ser defeituosa b) A probabilidade de essa peça não ser defeituosa 04) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. 3 05) Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas? 06) No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5? 07) Dois dados são lançados simultaneamente. Determine a probabilidade de lermos os resultados e obtermos a soma maior ou igual a 10. 08) Determine a probabilidade de cada evento: Um número ímpar aparece na face de um dado. Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas. Uma carta de “ouros” aparece ao se extrair uma carta de um baralho de 52 cartas Uma só “coroa” aparece no lançamento de 3 moedas 09) O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50 deputados presentes em uma reunião: Estado civil/Sexo Casado Solteiro Desquitado Divorciado Homem 10 5 7 8 Mulher 8 3 5 4 Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos: Ser um homem; Ser uma mulher; Ser uma pessoa casada; Ser uma pessoa solteira; Ser uma pessoa desquitada; Ser uma pessoa divorciada. 4 10) O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o estado civil e a cor dos cabelos: Cor dos cabelos / Estado Civil Casada Solteira Viúva Divorciada Loira 5 2 0 3 Morena 8 4 1 1 Ruiva 3 1 1 1 Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos: Ser casada; Não ser loira; Não ser morena nem ruiva; Ser viúva; Ser solteira ou casada; Ser morena e solteira; Ser viúva e ruiva. 11) De dois baralhos de 52 cartas, retiram-se simultaneamente uma carta do primeiro baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser um 5 de paus? 12) Uma urna A contém: 3 bolas brancas, 4 pretas e 2 verdes Uma urna B contém: 5 bolas brancas, 2 pretas e 1 verde Uma urna C contém: 2 bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade das 3 bolas retiradas das urnas A,B e C serem respectivamente: BRANCA, PRETA E VERDE? 13) De um baralho de 52 cartas retiram-se ao acaso 2 cartas sem reposição. Qual a probabilidade da primeira carta ser o “ás” de paus e a segunda ser o “rei” de paus? 14) São dados dois baralhos de 52 cartas. Retiramos ao mesmo tempo uma carta do primeiro baralho e uma carta do segundo baralho. Qual a probabilidade de retirarmos uma “dama” e um “rei” não necessariamente nesta ordem? 15) Em um lote de 20 peças, 5 são defeituosas. Sendo retiradas aleatoriamente duas peças, calcule: A probabilidade de ambas serem defeituosas. 5 A probabilidade de ao menos uma ser defeituosa. 16) Uma loja dispões de 18 geladeiras do mesmo tipo das quais 6 apresentam defeitos. Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar duas defeituosas? Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar pelo menos uma defeituosa? 17) Um lote é formado por 10 peças boas, 4 com defeitos e 32 com defeitos graves. Uma peça é escolhida ao acaso. Determine a probabilidade de que: Ela não tenha defeitos graves. Ela não tenha defeitos. DIAGRAMA DE VENN Diagramas de Venn são os diagramas usados em matemática para simbolizar graficamente propriedades, axiomas e problemas relativos aos conjuntos e sua teoria. Os respectivos diagramas consistem de círculos simples desenhados sobre um plano, de forma a simbolizar os conjuntos e permitir a representação das relações de pertença entre conjuntos e seus elementos Também pode ser utilizado no estudo da Estatística, a fim de organizar e analisar dados colhidos em pesquisas de opinião. Diagrama de Venn mostrando todas as interseções possíveis entre os conjuntos A e B e entre os conjuntos A, B e C. Exemplo 01) Representação de conjunto único N = (1, 2, 3, 4, 5, 6) 6 Exemplo 02) Representação de dois conjuntos: A e B A = (1, 2, 3, 4, 5, 6) B = (5, 6, 7, 8, 9, 10) Símbolos U = união ∩ = intersecção A U B = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10) A ∩ B = (5, 6) A U B = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10) A ∩ B = (5, 6) Exemplo 03) Relação entre três conjuntos: A, B e C. A = (3, 4, 5, 6, 7, 8) B = (4, 6, 8, 10, 12) C = (1, 2, 3, 4, 6, 10) A U B = (3, 4, 5, 6, 7, 8, 10, 12) A U C = (1, 2, 3, 4, 5, 6, 7, 8, 10) B U C = (1, 2, 3, 4, 6, 8, 10, 12) A ∩ B = (4, 6, 8) A ∩ C = (3, 4, 6) C ∩ B = (4, 6, 10) A ∩ B ∩ C = (4, 6,) 7 Exemplo 04) Uma prova classificatória foi composta por apenas duas questões. Sabese que: 100 pessoas acertaram as duas questões 170 pessoas acertaram a primeira questão 100 pessoas acertaram apenas uma das questões 95 pessoas erraram as duas questões Qual o número de pessoas que participaram da prova? 1º – O número de alunos que acertaram as duas questões será representado pela intersecção dos conjuntos A e B, isto é, A ∩ B = 100 2º – O conjunto A tem 170 elementos, mas A ∩ B possui 100 elementos, dessa forma, somente 70 pessoas acertaram a questão A. 3º –100 pessoas acertaram apenas uma das questões e 70 pessoas acertaram a questão A, então 30 pessoas acertaram a questão B. 8 4º - Para finalizar, 95 pessoas que não acertaram nenhuma das questões. Participaram: 70+100+30+95 = 295 pessoas 2ª lista de Exercícios 01) Uma empresa fabricante de achocolatados pretende lançar um novo produto no mercado. Para isso encomendou uma pesquisa sobre as preferências dos consumidores entre duas embalagens A e B . Foram consultadas 402 pessoas, e o resultado foi precisamente: 150 pessoas gostaram somente da embalagem A; 240 pessoas gostaram das embalagens B; 60 pessoas gostaram das duas embalagens. Quantas pessoas não gostaram de nenhuma das duas embalagens, sabendo que todas as 402 pessoas opinaram? 02) Numa classe, 40 alunos tem noções de inglês, 45 de francês, sendo que 16 tem noções das duas línguas. Se dois disseram não ter conhecimento algum de línguas estrangeiras, pergunta-se: quantos alunos tem a classe? 03) Uma empresa entrevistou 300 dos seus funcionários a respeito de 3 embalagens : A, B e C para o lançamento de um novo produto. O resultado foi o seguinte: EMBALAGENS: A B C AeB AeC BeC A, B e C Nº DE PESSOAS : 160 120 90 30 40 50 10 9 a) Dos funcionários entrevistados, quantos não tinham preferência por nenhuma das 3 embalagens? b) Quantos não indicaram a embalagem C? 04) Numa pesquisa sobre preferências de detergentes realizada numa população de 100 pessoas, constatou-se que 62 consomem Minerval, 47 consomem Limpola e 10 pessoas nem Minerval nem Limpola. Quantas pessoas dessa população consomem tanto Minerval quanto Limpola? 05) Uma empresa automobilística colocou no mercado um automóvel em duas cores diferentes: Uma ousada, verde limão metálico e outra clássica, prata. Depois de algum tempo, entrevistou 200 pessoas sobre a preferência pelas cores desse automóvel. Dos entrevistados, 120 declararam preferir o verde, 142 o prata e 30 declararam desconhecer o automóvel. Quantas pessoas gostariam de encontrar o automóvel nas duas cores disponíveis? 06) De um grupo de auxiliares técnicos de produção, 44 leem o jornal A, 42 o jornal B e 18 leem ambos os jornais. Sabendo que todo auxiliar deste grupo é leitor de pelo menos um dos jornais, qual o número de auxiliares? Qual a probabilidade de selecionarmos ao acaso uma pessoa que lê somente o jornal A? 07) Realizou-se uma pesquisa e verificou-se que, das pessoas consultadas, 200 ouviam a rádio A, 300 ouviam a rádio B, 20 ouviam as duas rádios e 220 não ouviam nenhuma das duas rádios. Quantas pessoas foram consultadas? Qual a probabilidade de selecionarmos ao acaso uma pessoa que não ouve nenhuma das duas rádios? 08) Em uma escola foi realizada uma pesquisa sobre o gosto musical dos alunos. Os resultados foram os seguintes: 458 alunos disseram que gostam de Rock 112 alunos optaram por Pop 36 alunos gostam de MPB 62 alunos gostam de Rock e Pop Determine quantos alunos foram entrevistados. 10 ESTATÍSTICA DESCRITIVA Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução dos dados, representação dos dados, obtenção de algumas informações que auxiliam a descrição do fenômeno observado. POPULAÇÃO E AMOSTRA População: Conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo. Exemplo: A idade de todos os alunos de uma faculdade. Amostra: Qualquer subconjunto (não vazio) de uma população. Exemplo: a idade dos alunos de uma classe de uma faculdade. Amostragem: A obtenção da amostra é feita através das seguintes técnicas: Amostragem casual ou aleatória simples. (sorteio) Amostragem proporcional estratificada. (proporção) Amostragem sistemática. (elaboração de um sistema a partir dos dados ordenados) Amostragem casual simples: No processo de amostragem casual simples, todos os elementos da população têm igual probabilidade de serem selecionados para constituir a amostra. Como exemplo, imagine que o gerente de uma indústria pretenda obter uma amostra dos empregados. Para isso, o gerente pode conferir um número a cada empregado e sortear aqueles que irão constituir a amostra, através de uma urna contendo todos os números. Amostragem proporcional estratificada: Usa-se o processo de amostragem estratificada quando a população se apresenta dividida em estratos, isto é, quando a população está dividida em grupos distintos. Como exemplo, imagine que o diretor de uma faculdade quer obter uma amostra da comunidade acadêmica. O diretor precisa considerar que a faculdade é constituída por três grupos distintos de pessoas, isto é, professores, funcionários e alunos. Então, para obter uma amostra mais representativa da comunidade acadêmica, o diretor deve selecionar uma amostra dentro de cada estrato, isto é, uma amostra dos professores, uma amostra dos funcionários e uma amostra dos alunos e depois reunir essas três amostras em uma só, constituindo então uma amostra estratificada. 11 Amostragem sistemática: No processo de amostragem sistemática, os elementos são selecionados para a amostra por um sistema preestabelecido. Assim, por exemplo, imagine que um gerente de vendas quer obter uma amostra dos clientes cadastrados de sua firma. Se as fichas dos clientes estiverem organizadas por ordem alfabética, o gerente obterá uma amostra sistemática se escolher a quinta de cada cinco fichas, ou a décima, de cada dez, etc. SÉRIES ESTATÍSTICAS: Apresentação dos dados: Dados Brutos: Seqüência de valores numéricos não organizados. Rol: Seqüência ordenada dos dados brutos. (pode ser crescente ou decrescente). A variável (objeto de estudo: altura, peso, idade, salário,etc.) pode ser qualitativa ou quantitativa. CLASSIFICAÇÃO DAS VARIÁVEIS: Vamos considerar dois tipos de variáveis: numéricas e não numéricas. As não numéricas serão consideras qualitativas e as numéricas quantitativas. A variável é qualitativa quando os possíveis valores que assumem representam atributos ou qualidades. Se tais variáveis têm uma ordenação natural, indicando intensidades crescentes de realização, então serão classificadas como qualitativas ordinais (tamanho: pequeno, médio, grande; classe social: baixa, média, alta). Caso contrário, quando não é possível estabelecer uma ordem natural entre seus valores, elas serão classificadas como qualitativas nominais ( sexo: feminino, masculino; candidato: A ou B; se fuma: sim ou não) A variável é quantitativa quando sua natureza é numérica, (idade, peso, salário, etc) e podem ser divididas em discretas e contínuas. Variáveis quantitativas discretas podem ser vistas como resultantes de contagens, assumindo em geral, valores inteiros (número de irmãos: 0,1,2...; número de defeitos: 0,1,2,3... ) Variáveis quantitativas contínuas assumem valores em intervalos dos números reais e , geralmente, são provenientes de uma mensuração (peso, altura). Qualitativa Nominal Ordinal Quantitativa Discreta Contínua VARIÁVEL 12 1ª Lista de Exercícios 01) Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa (discreta ou contínua): a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para esta variável). b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos. d) Intensidade da perda de peso de maratonistas na corrida de São Silvestre (leve, moderada, forte). 02) Qual a diferença entre população e amostra? Exemplifique 03) Numa escola com 500 alunos, 300 são homens e 200 são mulheres. Obtenha uma amostra de 10% da população, utilizando a amostragem proporcional estratificada. . 04) Numa empresa, um equipamento funciona em 4 turnos cuja produção/turno é indicada na tabela abaixo. Serão coletadas, para análise, 160 peças durante o processo de produção. Determinar o total de peças que serão coletadas de cada turno (amostragem proporcional estratificada). TURNO 0 h às 6:00 h 6:00 h às 12:00 h 12:00 h às 18:00 h 18:00 h às 24:00 h Total PRODUÇÃO/TURNO 300 400 500 400 1.600 AMOSTRA TABELAS E GRÁFICOS Tabelas : As informações obtidas podem ser apresentadas através de tabelas, contendo todas as informações necessárias para uma boa leitura e interpretação dos dados. Uma empresa fez o levantamento do salário de seus 50 funcionários, conforme mostra a tabela: Salário dos 50 funcionários da Empresa XYZ em dez/2016 Salário Mínimo 2 3 4 5 6 Nº e funcionários 18 12 10 6 4 13 Gráficos: As informações obtidas podem ser apresentadas através de gráficos, contendo todas as informações necessárias para uma boa leitura e interpretação dos dados. As apresentações gráficas são variadas. A escolha do tipo de gráfico fica a critério do analista. Vamos ressaltar alguns modelos mais utilizados: Gráfico de colunas: Salários (S.M.) dos funcionários da empresa Nº de Funcionários 20 15 10 5 0 1 2 3 4 5 Quantidade de Salário Mínimo Gráfico de barras: Nº de funcionários Salário de 50 funcionários da Empresa XYZ em dez/2000 6 5 4 3 2 1 0 5 10 15 20 Salário Mínimo (quantidade) Gráfico de Linhas (curva) Salário de 50 funcionários da Empresa XYZ em dez/2000 Salário Mínimo (quantidade) 20 15 10 5 0 1 2 3 4 5 6 7 Nº de funcionários Gráfico de Setores (Pizza) Esporte Preferido dos alunos do 1º ano da Faculdade WW de Adm inistração/período m atutino Futebol Voley Natação Basquete 14 DISTRIBUIÇÃO DE FREQUÊNCIAS A variável é o objeto de estudo e é indicado pela letra x Tabulamos o conjunto de freqüências em ordem crescente na primeira coluna (variável x) e na segunda coluna colocamos os valores das freqüências simples, (quando o número de elementos distintos da série for pequeno) . Exemplo: Notas de prova de 30 alunos : 3 – 4 - 2,5 – 4 - 4,5 – 6 – 5 - 5,5 - 6,5 – 7 – 7,5 2 - 3,5 – 5 - 5,5 – 8 - 8,5 – 7,5 - 9 - 9,5 – 5 - 5,5 - 4,5 – 4 - 7,5 - 6,5 – 5 - 6 - 6,5 - 6 Notas (xi) 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 nº de alunos (fi) 1 1 1 1 3 2 4 3 3 3 1 3 1 1 1 1 Agrupamos os dados por faixa de valores na primeira coluna e na segunda colocamos os valores das freqüências relativas aos agrupamentos. Classe 1 2 3 4 Intervalo de classe 2 |---- 4 4 | ---- 6 6 | ---- 8 8 | ----10 fi 4 12 10 4 Intervalos de classe: Note que as notas do exemplo anterior foram agrupadas em intervalos de classe: O intervalo da 1ª classe é: 2 |---- 4, que compreende as notas maiores ou iguais a 2 e menores que 4. O intervalo da 2ª classe é 4 | ---- 6, que compreende notas maiores ou iguais a 4 e menores que 6, e assim por diante. Faremos agora, algumas observações: 15 Dado um intervalo de classe, o limite inferior é dado por l e o limite superior é dado por L. No caso da 1ª classe do exemplo: 2 |---- 4, o limite inferior é igual a 2 e o limite superior é igual a 4. Assim temos l = 2 e L = 4. A diferença entre os limites superior e inferior, denominamos de amplitude do intervalo de classe h = L - l Amplitude Total da Série: É a diferença entre o maior e menor elemento de uma seqüência de dados. At = Xmáx – Xmín Número de classes (K) : O número de classes depende muito do pesquisador e de sua experiência. Existem diferentes critérios para determinarmos o número de classes. Vamos adotar o critério da RAIZ: Critério da raiz: K = n , onde n = número de elementos e K o número (inteiro) de classes No exemplo dado anteriormente, n = 30 (30 notas de alunos) onde K = 30 = 5,477. Vamos ajustar o valor, pois K é necessariamente um número inteiro: 4 , 5 ou 6 At 10 2 8 e aplicando a fórmula, temos: h h 2 k 4 4 Portanto, temos que a amplitude do intervalo de é igual a 2. Assim, O primeiro intervalo começa com a menor nota (2) e vai até 4, ou seja (2+2). O segundo intervalo de classe começa com 4 e vai até 6 (4+2), o terceiro intervalo começa com 6 e vai a té 8 (6+2) e finalmente o quarto e último intervalo começa com 8 e vai até 10 (8+2). Exemplo: Um teste para aferir o quociente de inteligência (QI) em determinada classe de alunos de uma faculdade, deu origem a seqüência de valores : 60 90 102 112 116 124 70 91 103 112 115 125 72 92 104 112 117 125 75 93 105 113 118 125 78 94 106 113 119 127 79 95 107 114 119 128 80 96 108 114 121 128 82 97 108 115 122 128 83 98 109 115 122 130 84 99 109 115 123 138 87 100 110 116 123 88 101 111 116 124 Observe que fica inviável a tabela de freqüência através da variável discreta. Portanto, vamos elaborar a tabela de freqüências através da variável contínua: 1º Passo: Verificamos que a seqüência possui 70 elementos. n = 70 2º Passo: Pelo critério da Raiz, temos K = n , então K = 70 8,37 3º Passo: Temos a opção de construir a variável contínua com 7, 8 ou 9 classes. 4º Passo: Determinar a amplitude total da série: At = Xmáx – Xmín At = 140 –60 = 80 Observe que 80 é divisível por 8. Então, K = 8 (vamos construir uma tabela com 8 classes.) At 5º Passo: Cálculo da amplitude do intervalo de classe: h k 16 h 80 10 (cada classe contém um intervalo igual a 10) 8 Computando as freqüências simples de cada classe, temos: Classe Intervalo de classe 60 |---- 70 70 |---- 80 80 |---- 90 90 |---- 100 100 |---- 110 110 |---- 120 120 |---- 130 130 |---- 140 1 2 3 4 5 6 7 8 Total Freqüência Simples (fi) 1 5 6 10 12 19 14 3 n = 70 HISTOGRAMA – Representação gráfica – variável contínua (intervalos de classe) Notas dos alunos de uma Faculdade) 20 15 10 5 0 60 70 80 90 100 110 120 130 140 Histograma Na estatística, um histograma é uma representação gráfica da distribuição de frequências de uma massa de medições, normalmente um gráfico de barras verticais. É uma das Sete Ferramentas da Qualidade. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. Tabela de Freqüências: Freqüência simples ou absoluta (fi): é o número de vezes que o elemento aparece na série de dados Freqüência relativa (fr): representa a participação percentual de cada freqüência fi simples ou absoluta da série de dados. fr .100 n Freqüência simples acumulada (Fi) : é a soma das freqüências simples deste elemento com as freqüências simples dos elementos que o antecedem. 17 Freqüência acumulada relativa de um elemento da série (Fr): é a divisão da Fi freqüência acumulada deste elemento pelo total de elementos da série. Fr n Exemplo: Suponha o resultado das notas de 25 alunos de uma faculdade: Tabela de Freqüência – Variável Discreta Nota (xi) 2 3 4 6 7 Total Freq. simples (fi) 3 7 8 6 1 n = 25 Freq. relativa (fr) % (3/25).100= 12 (7/25).100= 28 (8/25).100= 32 (6/25).100= 24 (1/25).100= 4 100 Freq. Simples Acumulada (Fi) 3 10 18 24 25 Freq. Relativa acumulada (Fr) ( 3/25).100= (10/25).100= (18/25).100= (24/25).100= (25/25).100= % 12 40 72 96 100 Exemplo: Suponha o resultado das notas de 40 alunos de uma faculdade: Classe 1 2 3 4 Total Intervalo de classe 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 Freq. simples (fi) 6 18 10 6 n = 40 Freq. relativa simples (%) 15% 45% 25% 15% 100 % Freq. Simples Acumulada (Fi) 6 24 34 40 Freq. Relativa acumulada (Fr) % 15% 60% 85% 100% 2ª Lista de Exercícios 01) O que são dados brutos? 02) O que é Rol? 03) Por que os estatísticos estudam amostras e não populações? 04) Para cada uma das séries seguintes, determine o Rol, o número total da série e a amplitude total: a) Pesquisa A: 2 - 4 - 8 - 7 - 12 - 15 - 21 - 20 At = ________________________ n = ____________________________ 18 b) Pesquisa B: 8 - 7 - 8 - 7 - 8 - 7 - 9 At = ________________________ n = ____________________________ 05) Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metrô e trem, o número de diferentes meios de transportes utilizados foi o seguinte: 2 1 2 3 1 1 2 1 1 1 2 2 2 2 2 1 3 1 2 1 2 1 1 1 2 1 2 3 1 3 a) Construa a tabela de freqüência. b) Represente graficamente os dados obtidos (gráfico de Colunas) c) Admitindo que essa amostra represente bem o comportamento do usuário paulistano, você acha que a porcentagem dos paulistanos que utilizam mais de um tipo de transporte é grande? Justifique. Meios de Transporte xi 1 2 3 total nº usuários fi porcentagem Freq acumul fr Fi Freq Acumul (%) Fr 06) A idade dos 20 ingressantes num certo ano no curso de pós-graduação em jornalismo de uma universidade foi o seguinte: 22 25 22 25 22 26 22 26 23 26 23 26 24 27 24 28 24 35 24 40 a) Determine a amplitude total da série. b) Represente os dados em uma tabela de freqüência (sem intervalo de classe). 19 Idade xi nº ingressantes fi porcentagem fr Freq acumul Fi Freq Acumul (%) Fr c) Qual o percentual de alunos com menos de 25 anos de idade? d) Quantos alunos ingressaram com 25 anos ou mais? e) Represente graficamente (Faça o gráfico de colunas) Idade de Ingressantes no curso de Pós-Graduação fi nº ingressantes xi Idade 07) Um grupo de pedagogas estuda a influência na troca de escolas no desempenho dos alunos do ensino fundamental. Como parte do levantamento realizado, foi anotado o número de escolas cursadas pelos alunos participantes do estudo: 20 Escolas cursadas (xi) 1 2 3 4 5 nº de alunos (fi) 46 57 21 15 4 a) Qual é a porcentagem dos alunos que cursaram uma escola? b) Qual é a porcentagem dos alunos que cursaram até duas escolas? c) Qual é a porcentagem dos alunos que cursaram mais de 3 escolas? 08) O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 26 medidas desse tempo (em minutos): 1,1 1,3 1,2 1,7 1,7 1,6 1,5 1,4 0,9 1,2 1,3 1,2 1,4 1,0 1,6 0,9 1,7 1,8 1,6 1,7 1,0 1,5 0,8 1,3 1,5 1,5 a) Agrupe os dados em intervalos de classe com amplitude do intervalo de 0,2 começando com 0,8. b) Construa a tabela de freqüência. c) Qual a porcentagem de usuários com 1,6 minutos ou mais? d) Quantos usuários utilizam menos de 1,4 minutos? Tempo (min) xi 0,8 | --- 1,0 1,0 | --- 1,2 1,2 | --- 1,4 nº usuários fi porcentagem fr Freq acumul Freq Aculum (%) Fi Fr Total 21 Tempo de utilização de caixas eletrônicos (em minutos) fi Nº usuários xi Tempo em minutos 09) Uma empresa automobilística selecionou ao acaso uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores: 10 – 15 – 25 – 21 – 6 – 23 – 15 – 21 – 26 – 32 – 9 – 14 – 19 – 20 – 32 – 18 – 16 – 26 – 24 – 20 – 7 – 18 – 17 – 28 – 35 – 22 – 19 – 39 – 18 – 21 – 15 – 18 – 22 – 20 – 25 – 28 – 30 – 16 – 12 – 20 a) Construa a tabela de freqüência através da variável contínua, utilizando o método da Raiz. . b) Observando a tabela, qual a porcentagem de revendedores que adquiriram menos de 25 carros? Rol: 6 7 9 10) Observe o gráfico abaixo: 22 Nº de dias Vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial 10 8 6 4 2 0 10 11 12 13 14 15 16 17 Nº de aparelhos vendidos a) Construa a tabela de freqüência. Nº aparelhos (xi) Nº de dias (fi) fr % Fi Fr % b) Qual a amplitude total da série de dados? c) Qual a porcentagem registrada para as vendas de até 14 aparelhos diários? 11) A tabela abaixo apresenta a distribuição de freqüência de duração de 300 lâmpadas efetuadas num laboratório. Duração em horas (xi) 300 | --- 400 400 | --- 500 500 | --- 600 600 | --- 700 700 | --- 800 Total Número de lâmpadas (fi) 24 56 68 86 66 Determine: a) O limite inferior da 2ª classe. 23 b) O ponto médio (xi) da 2ª classe. c) A amplitude do intervalo da 3ª classe. d) A freqüência relativa das 3ª classe. e) A freqüência acumulada das 2ª classe. f) A porcentagem de lâmpadas com duração maior ou igual a 500 horas. MEDIDAS DE TENDÊNCIA CENTRAL (Média – Mediana – Moda) Ao estudarmos uma série estatística, é conveniente o cálculo de algumas medidas que a caracterizam. Essas medidas podem nos fornecer informações importantes em relação à série estatística. Dessa forma, podemos localizar a maior concentração de valores de uma distribuição. __ Média: X Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos, iremos nos limitar a mais importante: a média aritmética: Média Aritmética é o quociente da divisão da soma dos valores da variável (x) pelo número deles. __ 1º Caso: Dados não agrupados: X x , onde n é o número de elementos da série: n Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0 __ X x n = 50 6,0 7,0 8,0 9,0 7,0 5 Interpretação: A média de notas da turma é de 7,0, (7,0 é o valor em torno do qual os elementos se concentram). __ xi. fi 2º caso: Dados agrupados – variável discreta: X n Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) Salário Mínimo 2 3 4 5 6 nº e funcionários 18 12 10 6 4 xi.fi 2.18 = 36 3.12 = 36 4.10 = 40 5. 6 = 30 6. 4 = 24 xi. fi 166 24 __ X xi. fi n = 166 3,32 50 Interpretação: A média de salários (S.M.) dos funcionários da empresa é de 3,32, (3,32 é o valor em torno do qual os elementos da série se concentram). __ 3º caso: Dados agrupados – variável contínua: X xi. fi n Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Intervalo 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 __ xi. fi freq. simples (fi) 6 18 10 6 n = 40 xi 3 5 7 9 xi.fi 3 . 6 = 18 5 .18 = 90 7 .10 = 70 9 . 6 = 54 xi. fi 232 232 5,8 40 n Interpretação: A média de notas dos alunos da faculdade é de 5,8, (5,8 é o valor em torno do qual os elementos da série se concentram) X = 3ª Lista de Exercícios 01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos foi: 170 – 180 – 190 – 185 – 190. Determine o consumo médio referente ao período citado. 02) Uma máquina produz peças que são embaladas em caixas . Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: nº de peças com defeito (xi) 0 1 2 3 4 5 número de caixas (fi) 20 15 12 6 4 2 Determine a quantidade média de peças com defeito encontradas nas caixas. 25 03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg 0 |--- 1 1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5 Total nº de animais (fi) 5 15 25 35 20 a) Qual o aumento médio de peso por animal? b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de 3,1 Kg/animal, esta nova ração pode a princípio ser considerada mais eficiente? 04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (horas) xi nº de motores 0 |--- 4 4 |--- 8 8 |--- 12 12|--- 16 16|--- 20 Total 1 5 10 12 4 xi xi.fi fi a) Determine o tempo médio de mão-de-obra necessário para a revisão de cada motor. b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a revisão de dez motores que aguardam revisão? c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por dia nestas revisões conseguirá provavelmente revisar estes dez motores em quatro dias? d) Construa o histograma. 26 ~ Mediana: X ou Md A mediana é um valor que ocupa a posição central em uma série, que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. 1º Caso: Dados não agrupados: se n é ímpar : o rol apresenta somente um termo central que ocupa a posição ~ n 1 X = º 2 n n se n é par: o rol apresenta dois termos centrai que ocupam as posições º e 1 º. 2 2 A mediana é calculada pela média das duas posições centrais. Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0 5 1 ~ n 1 n = 5, portanto, a mediana ocupa a posição X = 3ª posição, º= 2 2 ~ X = 7,0 Interpretação: 50% dos valores do rol são valores menores ou iguais a 7 e 50% dos valores do rol são valores maiores ou iguais a 7,0 Exemplo) Observe a nota de 6 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0 – 9,0 n n n = 6, portanto, a mediana ocupa a posição ª posição e 1 ª posição. 2 2 n 6 n 6 = 3 ª posição e 1 = 1 3 1 4 ª posição, 2 2 2 2 ~ 78 7,5 X= 2 Interpretação: 50% dos valores do rol são valores menores ou iguais a 7,5 e 50% dos valores do rol são valores maiores ou iguais a 7,5 2º caso: Dados agrupados – variável discreta O processo do cálculo da mediana é o mesmo. Basta observar o número de elementos da série e seguir os critérios já estabelecidos, localizando o valor mediano na tabela de freqüência acumulada (Fi): Exemplo) Observe o resultado de um levantamento feito com 51 funcionários de uma empresa, referente aos salários (em S.M.) 27 Salário Mínimo 2 3 4 5 6 Total nº de funcionários (fi) Freq. Acumulada (Fi) 18 18 12 30 10 40 6 46 5 51 n = 51 ~ n 1 51 1 52 n = 51 (ímpar), a posição central é X = 26ª posição = 2 2 2 A mediana ocupa a 26ª posição e fazendo a localização através da freqüência acumulada, observamos que a mediana é 3. Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos funcionários recebem 3 salários mínimos ou mais. Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) Salário Mínimo 2 3 4 5 6 Total nº e funcionários (fi) 18 12 10 6 4 n = 50 Freq. Acumulada (Fi) 18 30 40 46 50 N = 50 (par). Vamos determinar os dois termos centrais: n 50 25 ª posição = 2 2 25ª posição = 3 e n 50 1 25 1 26ª posição 1 = 2 2 ~ 33 6 e 26ª posição = 3 X = 3 2 2 Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos funcionários recebem 3 salários mínimos ou mais. 3º caso: Dados agrupados – variável contínua: n Fac ant h ~ 2 X li fi classe 28 Onde: li = limite inferior da classe da mediana n = número de elementos da série Facant = freqüência acumulada anterior à classe da mediana h = amplitude da classe da mediana ficlasse = freqüência simples da classe da mediana Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Classe 1 2 3 4 Total Intervalo 2 |--- 4 li 4 |--- 6 6 |--- 8 8 |--- 10 freq. simples (fi) 6 18 fi 10 6 n = 40 Freq Acumulada (Fi) 6 Facant 24 34 40 n 40 20ª posição, portanto, a mediana pertence à segunda classe 2 2 4 |--- 6 1ºpasso: calcular de intervalos: 2º passo: identificamos: li = 4 h = (4-2) = 2 Facant = 6 e fi = 18 n 40 Fac ant h 6 2 ~ ~ 2 2 20 6 14 = X 4 X li 4 .2 4 .2 fi classe 18 18 18 ~ X 4 0,77.2 4 1,55 5,55 Interpretação: 50% dos alunos tem notas menores ou iguais a 5,55 e 50% dos alunos tem notas maiores ou iguais a 5,55. 4ª Lista de Exercícios 01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos, foi: 170 – 180 – 190 – 185 – 190. Determine o consumo mediano referente ao período citado e interprete o resultado. 02) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: 29 nº de peças com defeito (xi) 0 1 2 3 4 5 Total número de caixas (fi) 20 15 12 6 4 2 Determine a quantidade mediana de peças com defeito encontradas nas caixas e interprete o resultado. 03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg 0 |--- 1 1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5 Total nº de animais (fi) 5 15 25 35 20 a) Qual o aumento mediano de peso por animal? b) Interprete o resultado. 04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (h) 0 |--- 4 4 |--- 8 8 |--- 12 12 |--- 16 16 |--- 20 nº de motores 1 5 10 12 8 a) Determine o número mediano de hora de mão-de-obra necessário para a revisão de cada motor. b) Interprete o resultado 30 05) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isso, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: Vendas (R$) 0 10.000 20.000 30.000 40.000 |--|--|--|--|--- nº de vendedores (fi) 10.000 20.000 30.000 40.000 50.000 1 12 27 31 10 a) A partir de qual volume de vendas o vendedor será premiado? b) Qual a média de vendas? c) Interprete os resultados obtidos. Moda (Mo) A moda é o valor que aparece com maior freqüência em um conjunto de dados 1º Caso: Dados não agrupados: Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 6,0 - 8,0 - 9,0 A moda é 6,0 , pois aparece com maior freqüência. Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 6,0 - 8,0 - 8,0 A moda é 6 e 8, pois aparecem com maior freqüência Observe a nota de 5 alunos de uma turma: 5,0 - 5,0 - 6,0 - 6,0 - 9,0 – 9,0 Note que não há um elemento que se destaque pela maior freqüência. Portanto, a série é amodal (não há moda) 2º caso: Dados agrupados – variável discreta: Basta identificar o valor que aparece com maior freqüência. Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) 31 Salário Mínimo 2 = moda 3 4 5 6 Total nº de funcionários (fi) 18 (maior freq) 12 10 6 5 n = 51 Tabela 10 A moda é igual a 2 salários mínimos, pois apresenta a maior freqüência. 3º caso: Dados agrupados – variável contínua: Neste caso, vamos utilizar a fórmula de Czuber: f mo f ant h Mo l mo 2. f ( f f ) mo ant post Onde: lmo = fmo = fant = fpost = h = limite inferior da classe modal freqüência simples da classe modal freqüência simples da classe anterior à modal. freqüência simples da classe posterior à classe modal amplitude do intervalo de classe. Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Classe 1 2 3 4 Total Intervalo 2 |--- 4 li 4 |--- 6 6 |--- 8 8 |--- 10 freq. simples (fi) 6 fant 18 fmo 10 fpost 6 n = 40 Tabela 11 1º passo: Verificar a classe com a maior freqüência: classe 2 com freqüência = 18 2º passo: identificar: lmo = 4 fmo = 18 fant = 6 fpost = 10 h = 2 (6-4) 18 6 2 Mo 4 2.18 (6 10) 32 12 Mo 4 2 36 16 12 Mo 4 2 20 Mo 4 0,6 2 Mo 4 1,2 Mo 5,2 Interpretação: A moda é nota igual a 5,2. 5ª Lista de Exercícios 01) Calcule a moda das séries abaixo: a) x: 2 – 3 – 5 – 4 – 2 – 4 – 8 b) x: 4 – 23 – 5 – 9 – 12 – 4 – 3 c) x: 4 – 5 – 6 – 6 – 6 – 7 – 8 – 8 – 8 – 10 – 10 – 10 – 11 02) Calcule a moda da distribuição do número de acidentes diários, observados em um cruzamento, durante 40 dias: nº de acidentes (xi) 0 1 2 3 4 nº de dias (fi) 30 5 3 1 1 03) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos, foi: 170 – 180 – 190 – 185 – 190. Determine a moda de consumo referente ao período citado e interprete o resultado. 04) Uma máquina produz peças que são embaladas em caixas . Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: nº de peças com defeito (xi) 0 1 2 3 4 5 número de caixas (fi) 20 15 12 6 4 2 Determine a moda de peças com defeito encontradas nas caixas e interprete o resultado. 33 05) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg 0 |--- 1 1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5 nº de animais (fi) 5 15 25 35 20 a) Determine a moda de aumento de peso dos animais com a nova ração. b) Interprete o resultado. 06) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (h) 0 |--- 4 4 |--- 8 8 |--- 12 12 |--- 16 16 |--- 20 Total nº de motores 1 5 10 12 4 a) Determine a moda de tempo de mão-de-obra b) Interprete o resultado 07) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isso, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: Vendas (R$) 0 |--- 10.000 10.000 |--- 20.000 20.000 |--- 30.000 30.000 |--- 40.000 40.000 |--- 50.000 Total nº de vendedores (fi) 1 12 27 31 10 a) Determine a moda de vendas dos funcionários. b) Interprete o resultado. 34 MEDIDAS SEPARATRIZES Chamamos medidas separatrizes àquelas que separam a distribuição em partes iguais. As medidas separatrizes são: Quartis – dividem a distribuição em 4 partes iguais Q1 0% 25% Q2 Q3 50% 75% 100% Decis – dividem a distribuição em 10 partes iguais: D1 0% D2 D3 10% 20% 30% D4 D5 40% 50% D6 D7 D8 D9 60% 70% 80% 90% 100% Centis – dividem a distribuição em 100 partes iguais 0% P1 P2 P3 P4 P5 1% 2% 3% 4% 5% P6 … P97 P98 P99 6% ... 97% 98% 99% 100% 1º Caso: Dados não agrupados: Exemplo: X: 2 – 3 – 5 – 5 – 5 – 8 – 10 – 11 – 12 – 12 – 13 – 15 Q1 = 25% Calculamos 25% de 12 = 3 Este valor indica que o Q1 localiza-se na 3ª posição e é igual a 5 Interpretação: 25% dos valores da seqüência são menores ou iguais a 5 e 75% dos valores da seqüência são maiores ou iguais a 5 P1 = 10% Calculamos 10% de 12 = 1,2 Este valor não inteiro indica que o P1 é um valor situado entre o 1º e 2º elemento da seqüência. Calculamos a média correspondente: 35 1º valor = 2 e 2º valor = 3 23 5 P1 = 2,5 2 2 Interpretação: 10% dos valores da seqüência são menores ou iguais a 2,5 e 90% dos valores da seqüência são maiores ou iguais a 2,5. 2º Caso: Dados agrupados – variável discreta. Exemplo: Observe a tabela: xi 2 4 5 7 10 Total Fi 3 5 8 6 2 n = 24 Fi 3 8 16 22 24 Tabela 12 D4 = 40% de 24 = 9,6 Esta posição não inteira significa que D4 é um valor compreendido entre o 9º e 10º elemento da série. Observando a tabela de freqüência acumulada, percebemos que o 9º elemento é igual a 5 e o 10º elemento também é 5. A média entre eles é igual a 5. Portanto, D4 = 5 Interpretação: 40% dos valores desta série são valores menores ou iguais a 5 e 60% dos valores desta série são maiores ou iguais a 5 3º Caso: Dados agrupados – variável contínua in Fac ant h Pi li 100 fi Onde: Pi = Percentil i (i = 1,2,3,4,...99) li = limite inferior da classe que contém o percentil i n = número de elementos da série. Facant = freqüência acumulada da classe anterior a classe que contém o Pi fi = freqüência simples da classe que contém o percentil i h = amplitude do intervalo de classe. 36 Exemplo) Observe a tabela abaixo: Intervalo classe 0 | --- 10 10 | --- 20 20 | --- 30 li 30 | --- 40 40 | --- 50 Total fi 16 18 24 35 fi 12 n = 105 Fi 16 34 58 Facant 93 105 Tabela 13 Calcule o Q3 da série: Q3 = P75 = 75% 75% de 105 = 78,75, isto é, nos dá a posição de P75 na série A classe que contém o elemento que ocupa a posição 78,75 na série é a quarta classe. Esta é a classe que contém P75. in Fac ant h Pi li 100 fi 78,75 58 P75 30 10 35 P75 30 5,93 P75 35,93 Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 25% dos valores da série são maiores ou iguais a 35,93 6ª Lista de Exercícios 01) A distribuição de freqüência abaixo representa a idade de 50 alunos de uma classe . Idade (xi) 17 18 19 20 21 total nº de alunos (fi) 3 18 17 8 4 a) Calcule Q1 , D5, P95 e interprete o resultado 37 02) A tabela abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos: Consumo por notas (R$) 0 | --- 50 50 | --- 100 100 | --- 150 150 | --- 200 200 | --- 250 250 | --- 300 Total fi 10 28 12 2 1 1 a) Calcule Q3 e interprete o resultado b) Calcule D3 e interprete o resultado c) Calcule P98 e interprete o resultado 03) Uma empresa estabelece o salário dos vendedores com base na produtividade. Uma amostra de salários mensais nesta empresa revelou o quadro abaixo: Salários US$ 70 | --- 120 120 | --- 170 170 | --- 220 220 | --- 270 270 | --- 320 320 | --- 370 Total fi 8 28 54 32 12 6 a) A empresa colocou uma meta extra para 5% dos vendedores que pior desempenho tiveram. Até que valor de vendas o funcionário receberá a meta de vendas? b) Para premiar os melhores vendedores, a empresa resolveu conceder um abono para 3% dos funcionários que tiveram melhor desempenho. A partir de que salário o funcionário receberá o abono? 38 MEDIDAS DE DISPERSÃO: Observe as seqüências: 1 – 3 – 7 – 10 – 10 – 11 – 15 – 18 – 20 – 35, cuja média é 13 12 – 12 – 12 – 13 – 13 – 13 – 13 – 14 – 14 – 14 , cuja média é 13 13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – cuja média é 13 Analisando as três séries acima, podemos concluir que todas possuem a mesma média, no entanto, são completamente distintas do ponto de vista da variabilidade de dados. Uma breve reflexão sobre as medidas de tendência central não são suficientes para caracterizar totalmente uma seqüência numérica. As medidas de dispersão avaliam a representatividade da média. Amplitude Total: É a diferença entre o maior e o menor valor da seqüência. Desvio Padrão VARIÂNCIA E DESVIO PADRÃO Observamos no item anterior que a dificuldade em se operar o DMS se deve à _ presença do módulo, para que as diferenças xi - x possam ser interpretadas como distâncias. Outra forma de conseguir que as diferenças se tornem sempre positivas _ ou nulas é considerar o quadrado destas diferenças, isto é: (xi - x )2. A variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e sua média. O desvio padrão é a raiz quadrada positiva da variância. Quando a seqüência de dados representa uma POPULAÇÃO, a variância está _ denotada por 2 ( xi x) 2 . fi denotada por s 2 ( xi x) e o desvio padrão por 2 n Quando a seqüência de dados representa uma AMOSTRA, a variância está n 1 2 fi e o s2 ( xi x) 2 fi n 1 Veremos os mesmos exemplos dados anteriormente, considerando-os amostra. Exemplo 1) Considere as notas de uma turma de 4 alunos: 3 – 4 – 6 – 7 39 3 4 6 7 20 5 4 4 Vamos determinar as distâncias de cada nota para a média da série: _ Vamos determinar a média: x (3 – 5)2 = 4 .1 = 4 (4 – 5)2 = 1 .1 = 1 (6 – 5)2 = 1 .1 = 1 ( xi x) 2 = 4 + 1 + 1 + 4 = 10 (7 – 5)2 = 4 .1 = 4 Variância = s 2 ( xi x) 2 fi = n 1 Desvio padrão = S = 3,33 1,82 10 10 3,33 4 1 3 Interpretação: Há um desvio padrão de 1,82 pontos em relação à média 5. Exemplo 2) Observe a tabela abaixo, que demonstra as notas de 10 alunos de uma turma: Notas(xi) nº de alunos(fi) 5 6 7 8 xi.fi 2 3 4 1 N = 10 10 18 28 8 xi.fi = 64 _ ( xi x) 2 . fi (5 – 6,4)2 . 2 (6 – 6,4)2 . 3 (7 – 6,4)2 . 4 (8 – 6,4)2 . 1 = = = = 3,92 0,48 1,44 2,56 | xi x | . fi 8,40 Tabela 15 _ Vamos determinar a média: x Variância = s 2 ( xi x) Desvio padrão = S = 2 64 6,4 10 fi = n 1 0,933 0,96 8,4 8,4 0,933 10 1 9 Interpretação: Há um desvio padrão de 0,96 pontos em relação à média 6,4. 40 Exemplo 3) Observe a tabela abaixo, referente a notas de 20 alunos de uma turma: classe Notas Nº de alunos (fi) Notas (xi) 1 2 3 4 5 10 4 1 n = 20 2 | --- 4 4 | --- 6 6 | --- 8 8 | --- 10 3 5 7 9 xi.fi 15 50 28 9 102 _ ( xi x) 2 . fi (3 – 5,1)2 5 = (5 – 5,1)2 10 = (7 – 5,1)2. 4 = (9 – 5,1)2 1 = 22,05 0,1 14,44 15,21 | xi x | . fi 51,8 Tabela 16 102 5,1 20 Cálculo da média: Variância = s 2 ( xi x) Desvio padrão = S = 2 fi n 1 2,73 1,65 = 51,8 51,8 2,73 20 1 19 Interpretação: Há um desvio padrão de 1,65 pontos em relação à média 5,1. Interpretação do desvio padrão: O desvio padrão é a mais importante das medidas de dispersão. È fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da série. Quando uma curva de freqüência da série é perfeitamente simétrica, podemos afirmar: _ _ o intervalo [ x , x ] contém aproximadamente 68% dos valores da série; _ _ o intervalo [ x 2 , x 2 ] contém aproximadamente 95% dos valores da série; _ _ o intervalo [ x 3 , x 3 ] contém 99% dos valores da série. Obs: Quando a distribuição não é perfeitamente simétrica, esses percentuais apresentam pequenas variações para mais ou para menos, segundo caso. Exemplo: Quando uma série apresenta média = 100 e desvio padrão = 5, podemos interpretar esses valores das seguinte maneira: Os valores da série estão concentrados em torno de 100; O intervalo [95,105] contém aproximadamente 68% dos valores da série. O intervalo [90,100] contém aproximadamente 95% dos valores da série; O intervalo [85,115] contém aproximadamente 99% dos valores da série. É importante que se tenha observado que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contidos que queremos. 41 COEFICIENTE DE VARIAÇÃO É uma medida de dispersão relativa (%) . Note que é uma divisão de elementos de mesma unidade, é um número puro. Portanto, pode ser expresso em percentual. CV = _ . 100 (população) ou CV = x S _ . 100 (amostra) x Nos exemplos dados anteriormente, temos: 1,82 .100 36,4% 5 0,96 Exemplo 2) Média = 6,4 e desvio padrão = 0,96 , assim, CV = .100 15% 6,4 1,65 Exemplo 3) Média = 5,1 e desvio padrão = 1,65, assim, CV = .100 32,35% 5,1 Exemplo 1) Média = 5 e desvio padrão = 1,82 , assim, CV = 7ª Lista de Exercícios 01) Observe a seqüência: 2 – 3 – 3 – 4 – 6. Determine o desvio padrão e o coeficiente de variação, considerando: a) amostra, b) população 02) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação, considerando: a) amostra; b) população Escolas cursadas (xi) 1 2 3 4 5 total nº de alunos (fi) 46 57 21 15 4 42 03) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação, considerando a pesquisa: a) amostra b) população Comprimento do peixe mm (xi) 100 |--- 110 110 | --- 120 120 | --- 130 130 | --- 140 nº de peixes (fi) 5 10 20 15 04) Uma prova de Matemática foi realizada para duas turmas. Os resultados foram os seguintes: Turma A: média 5 e desvio-padrão 2,5 Turma B: média 4 e desvio-padrão 2 Qual a turma com maior dispersão relativa? 05) Visando estudar a rotatividade de sua mão-de-obra, um grande magazine avaliou o número de empregos (nos últimos 5 anos) de seus operários especializados. Os dados obtidos foram: Número de empregos 1 2 3 4 5 total Pede-se: Número de funcionários 150 200 75 50 25 500 Fi fr% Fr% xi.fi variância a) A tabela de freqüência; b) O número médio de empregos dos funcionários nos últimos 5 anos; c) Qual o número mais freqüente de empregos dos funcionários nos últimos 5 anos? d) O número mediano de empregos dos funcionários nos últimos 5 anos; e) A variância f) O desvio padrão g) O coeficiente de variação h) Represente graficamente os dados da tabela. 43 Fórmulas de Estatística Medidas de Tendência Central: __ xi. fi Média: X n n Fac ant h ~ 2 Mediana: X li fi classe f mo f ant h Moda: Mo li 2. f ( f f ) ant post mo Medidas Separatrizes in Fac ant h Pi li 100 fi Medidas de Dispersão: Amplitude Total (Xmáx – X mín) _ ( xi x) 2 . fi Variância – população: 2 Desvio Padrão – população: 2 Variância – amostra: s 2 Desvio Padrão – amostra: s s 2 Coeficiente de Variação - população: n ( xi x) 2 fi n 1 _ x Coeficiente de Variação – amostra: S _ x 44