77 APÊNDICES Apêndice A Produto: Sequência Didática "Indústria de cosméticos é excelente setor para quem deseja montar o próprio negócio" O lucro deve ser uma consequência do empenho da empresa em satisfazer seus clientes... Podemos considerar como cosmético tudo aquilo relacionado à beleza humana. São substâncias ou tratamentos aplicados ao rosto e outras partes do corpo para alterar a aparência, embelezar ou realçar as características da pessoa. A palavra “cosmético”, deriva do grego “Ko.osme.ti.kós”, que significa “hábil em adornar”. Há milhares de anos, homens e mulheres utilizavam os cosméticos para esse fim. Arqueólogos encontraram em túmulos egípcios sinais de uso de pintura para os olhos e unguentos aromáticos. Na antiga Grécia, óleos para banho e outros produtos eram utilizados com o intuito de embelezamento; em Roma, temos relatos de pós utilizados para tornar a pele mais branca, carvões para delinear os olhos, pintar os cílios e as sobrancelhas, e carmim para a face... Atualmente, a fabricação de cosméticos é uma atividade que pode render bons lucros. Sem necessidade de instalações ou equipamentos sofisticados, e com alguns cuidados para manuseio e armazenamento, pode se fabricar grande diversidade de produtos destinados para os diferentes fins, como shampoos, creme para cabelos, rosto, mãos e pés, perfumes, dentre outros artigos. Fonte: http://www.cpt.com.br/cursos-pequenasindustrias-comomontar/artigos/industriade-cosmeticos-e-excelente-setor-para-quem-deseja-montar-o-proprio-negocio Lendo essa reportagem, o senhor Aroma de Cheiro Bom, dono de uma empresa do ramo de cosméticos, pretende lançar um novo perfume masculino no mercado. Com esse objetivo, encomendou uma pesquisa de opinião a um 78 instituto especializado para levantar hábitos, preferências e tendências dos homens brasileiros (adultos) com relação ao uso de perfumes. O instituto selecionou uma pequena parcela de homens, a fim de coletar as informações necessárias por meio de uma pesquisa de campo. Depois de coletadas as informações, a equipe do Instituto precisava fazer a análise desses dados para enviar à empresa um relatório, mas surgiu um problema. O instituto estava sem um funcionário habilitado para elaborar esse relatório. Dessa maneira, o instituto enviou para a empresa um banco de dados com os resultados da pesquisa elaborada, conforme apresentado abaixo: BANCO DE DADOS Entrevistado (homem) Estado Civil Idade (anos) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Solteiro Casado Divorciado Casado Solteiro Casado Solteiro Casado Solteiro Viúvo Solteiro Casado Divorciado Solteiro Casado Divorciado Viúvo Solteiro Casado Casado Casado Viúvo Solteiro Divorciado Casado 27 38 34 22 18 35 30 41 52 28 29 35 31 32 20 22 38 34 21 25 28 32 42 51 28 Renda Mensal (em reais) 2000 900 1500 2600 1400 950 1980 600 1300 500 2200 1550 800 880 1100 1620 1450 1780 2780 3000 2700 1400 980 780 2100 Tipo de Perfume Preferido Suave Doce Cítrico Suave Suave Amadeirado Cítrico Amadeirado Doce Suave Cítrico Amadeirado Amadeirado Suave Amadeirado Doce Cítrico Amadeirado Suave Doce Cítrico Doce Amadeirado Cítrico Suave Número de Aplicações Diárias 1 1 3 2 2 1 3 2 1 1 2 3 3 2 2 1 1 1 3 3 2 1 3 2 2 Preço do Perfume (em reais) 150 80 100 200 80 80 150 65 120 69 150 150 89 79 100 150 130 200 300 300 250 200 150 69 150 O senhor Aroma, não sabe como retirar as informações que precisa para chegar a uma conclusão sobre seu público alvo. Ele resolve solicitar sua ajuda para que possa compreender melhor o que significam esses dados e Testaria outra marca? Sim Sim Sim Não Sim Não Sim Sim Sim Não Não Sim Não Sim Sim Não Sim Não Não Sim Sim Não Sim Não Não 79 como eles podem ser úteis para o lançamento de seu mais novo produto: o perfume masculino. Que tal discutirmos os questionamentos e propósitos abaixo? Vamos avante ajudar o senhor Aroma!!! ATIVIDADE 01: Façam um pequeno texto explicando para o Sr Aroma como vocês entendem o procedimento que o instituto utilizou e quais as possíveis perguntas que ele fez para a geração desse banco de dados. Escrevam a conclusão do seu grupo em relação à relevância dos itens discutidos nesta atividade e compartilhem com os outros grupos essas conclusões. Registrem as informações que foram relevantes em outros grupos e diferentes das apontadas pelo seu grupo. ATIVIDADE 02: Com base nesse conjunto de dados levantados pelo instituto, descreva quais as técnicas ou procedimentos que o grupo utilizaria para apresentar um resumo de tal maneira que gerasse informações para o dono da empresa tomar uma decisão. ATIVIDADE 03: Utilizem as técnicas e/ou procedimentos que decidiram na atividade 2 e façam um resumo das características dos homens pesquisados, para que o senhor Aroma possa conhecer o seu público-alvo. 80 ATIVIDADE 04: Com base nos resultados obtidos pelo grupo até este momento, elaborem um relatório sucinto, explicando as características dos homens nos quais o dono da empresa deve investir para ter sucesso com o lançamento de seu perfume. Compartilhem com os outros grupos a conclusão apresentada e registrem algo diferente que os outros grupos puderam concluir. ATIVIDADE 05: Uma das coisas que devemos tomar cuidado com o lançamento de um produto no mercado é a questão do seu preço final ao consumidor. Discuta com o grupo como analisariam a relação existente entre “Renda” e “Valor do Produto”. ATIVIDADE 06: Como o grupo faria a comparação entre homens solteiros e casados quanto à renda mensal e como isso poderia ajudar o senhor Aroma? ATIVIDADE 07: Crítica ao estudo elaborado: a) Identifique público que o Instituto pesquisou b) Você acha suficiente o número de pessoas utilizado nessa pesquisa para se chegar a conclusão obtida? Explique. c) Você considera que as conclusões dessa pesquisa poderiam representar "todos" os homens brasileiros? d) As perguntas utilizadas no questionário que originou esse banco de dados são suficientes para resolver o problema do empresário? Justifique. e) Quais outros critérios que o instituto deveria ter informado ou realizado que o grupo acrescentaria para ajudar o dono da empresa a conhecer melhor seu público alvo. 81 Apêndice B MATERIAL DE APOIO DIDÁTICO PARA OS PROFESSORES DA REDE ESTADUAL DE ENSINO DO ESPIRITO SANTO CADERNO DE APOIO: ESTATÍSTICA Thiago Campos Magalhães Tânia Fernandes Bogutchi 82 SUMÁRIO 1. PRINCIPAIS OBJETIVOS .................................................................................. 83 2. INTRODUÇÃO .................................................................................................... 84 3. VARIÁVEL .......................................................................................................... 86 4. TABELAS DE FREQUÊNCIAS .......................................................................... 88 5. ATIVIDADES RELACIONADAS ......................................................................... 91 6. REPRESENTAÇÕES GRÁFICAS: CONSTRUÇÃO, LEITURA E INTERPRETAÇÃO DE DADOS .............................................................................. 93 7. CONSTRUÇÃO DE GRÁFICOS NO EXCEL ..................................................... 99 8. ATIVIDADES RELACIONADAS ....................................................................... 105 9. ESTUDO DAS MEDIDAS ESTATÍSTICAS DESCRITIVAS ............................. 109 Medidas de Posição e Medidas de Variação para dados não agrupados: .....110 Medidas de Posição e Medidas de Variação para dados agrupados em tabelas com e sem intervalos de classes: .......... ..............................................114 10.ATIVIDADES RELACIONADAS ...................................................................... 123 11.SUGESTÃO PARA UMA PRÁTICA INVESTIGATIVA .................................... 128 12.REFERÊNCIAS ................................................................................................ 131 83 1. PRINCIPAIS OBJETIVOS Reconhecer a importância da estatística no cotidiano e suas contribuições às mais diversas áreas; Identificar e classificar os tipos de variáveis; Interpretar e construir tabelas de frequências a partir de dados brutos; Construir, com apoio do Excel®, gráficos para representar e agrupar um conjunto de dados; Interpretar gráficos com diferentes representações; Calcular média, mediana e moda para variáveis quantitativas e refletir sobre o uso de cada uma dessas medidas; Compreender a necessidade de trabalhar com uma medida que revele o grau de dispersão (em torno da média) de um conjunto de valores e calcular a variância, desvio padrão e o coeficiente de variação; Compreender a necessidade de se trabalhar com dados agrupados e, nesse caso, associar a eles medidas de centralidade e variabilidade; Realizar cálculos estatísticos com o auxílio da calculadora. 84 2. INTRODUÇÃO Uma empresa do ramo de perfumaria pretende lançar um perfume masculino no mercado. Para definir seu público-alvo, encomendou uma pesquisa de opinião a um instituto especializado sobre os hábitos, as preferências e as tendências dos homens brasileiros (adultos) em relação ao uso de perfumes. O que o instituto deveria fazer para conduzir a pesquisa de modo adequado? Em uma pesquisa, é importante que se conheça, inicialmente, o conjunto de dados (variáveis) que têm em comum a característica que está sendo investigada. Esse conjunto é chamado de universo estatístico ou população. No exemplo, a população é constituída por todos os homens brasileiros adultos. No entanto, é inviável entrevistar todos os elementos da população. Por isso o instituto selecionou uma parcela dessa população, para coletar as informações. A essa parcela (parte ou subconjunto) da população damos o nome de amostra. A escolha da amostra é complexa, e os profissionais do instituto deveriam considerar diversos aspectos como idade, condições sociais, culturais, econômicas, entre outros. Depois de coletados os dados, a equipe deveria organizá-los em tabelas e gráficos, com o auxílio de softwares computacionais. Além disso, deveriam ser calculadas medidas que resumissem quantitativamente, o conjunto de informações obtidas. Por fim, o instituto levantaria informações sobre tendências do uso de perfumes e faria a confirmação dos dados, verificando a margem de erro apresentada pelos seus dados. A ciência que se dedica a esse trabalho é a Estatística. Os levantamentos estatísticos de uma pesquisa costumam ser amplamente divulgados nos meios de comunicação. Quase sempre esses levantamentos estão diretamente relacionados ao cotidiano das pessoas, envolvendo temas como hábitos de consumo, comportamento, saúde, desenvolvimento humano, economia, por exemplo. 85 Neste caderno, enfocaremos apenas a análise descritiva e quantitativa de um conjunto de dados, representando-o em formas de gráficos ou tabelas, e associando a eles algumas medidas. O estudo das etapas de seleção da amostra (amostragem) e a análise confirmatória dos dados obtidos na pesquisa (inferência) não fazem parte dos objetivos desse estudo. 86 3. VARIÁVEL Suponha que cada entrevistado da amostra pelo instituto teve de responder às seguintes questões: 1. Qual é sua idade? 2. Qual é seu estado civil? (solteiro, casado, divorciado ou viúvo) 3. Qual é sua renda mensal? 4. Que tipo de perfume você prefere: Suave, Doce, Cítrico ou Amadeirado? 5. Quantas vezes por dia você aplica o perfume? 6. Quanto custa o perfume que você usa atualmente? 7. Você usaria uma nova marca de perfume (Sim, Não)? Cada um dos itens levantados pelo questionário acima, são denominados variáveis. As perguntas relacionadas aos itens 2, 4 e 7 exigem respostas que fornecerão variáveis qualitativas, relacionadas a atributos, qualidades ou preferências do entrevistado. Já os itens 1,3, 5 e 6 exigem respostas que fornecerão variáveis quantitativas, pois tratam-se de valores numéricos. Na tabela a seguir, está representada parte dos dados coletados referente a vinte e cinco questionários da pesquisa. 87 Estado Idade Civil Renda Tipo de Número de Preço Testaria Mensal Perfume Aplicações do outra (em Preferido Diárias Perfume marca? Reais) (em Reais) Solteiro 27 2000 Suave 1 150 Sim Casado 38 900 Doce 1 80 Sim Divorciado 34 1500 Cítrico 3 100 Sim Casado 22 2600 Suave 2 200 Não Solteiro 18 1400 Suave 2 80 Sim Casado 35 950 Amadeirado 1 80 Não Solteiro 30 1980 Cítrico 150 Sim Casado 41 600 Amadeirado 2 65 Sim Solteiro 52 1300 Doce 1 120 Sim Viúvo 28 500 Suave 1 69 Não Solteiro 29 2200 Cítrico 2 150 Não Casado 35 1550 Amadeirado 3 150 Sim Divorciado 31 800 Amadeirado 3 89 Não Solteiro 32 880 Suave 79 Sim Casado 20 1100 Amadeirado 2 100 Sim Divorciado 22 1620 Doce 1 150 Não Viúvo 38 1450 Cítrico 1 130 Sim Solteiro 34 1780 Amadeirado 1 200 Não Casado 21 2780 Suave 3 300 Não Casado 25 3000 Doce 3 300 Sim Casado 28 2700 Cítrico 2 250 Sim Viúvo 32 1400 Doce 1 200 Não Solteiro 42 980 Amadeirado 3 150 Sim Divorciado 51 780 Cítrico 2 69 Não Casado 2100 Suave 2 150 Não 28 3 2 88 4. TABELAS DE FREQUÊNCIAS A organização dos dados em tabelas possibilita a organização dos resultados obtidos em uma pesquisa. Para cada variável estudada, contamos o número de vezes que cada um de seus valores (realizações) ocorre. O número obtido é chamado de Frequência Absoluta e pode ser indicado Fa. Por exemplo: Considerando os valores assumidos da variável "Tipo de Perfume preferido", vamos obter suas respectivas frequências absolutas: Amadeirado: Fa = 7 Cítrico: Fa = 6 Doce: Fa = 5 Suave: Fa = 7 Observe que a soma das frequências absolutas deve ser sempre igual ao número total de dados disponíveis. De fato, temos que: 7 + 6 + 5 + 7 = 25. A fim de tornar a análise dos dados mais significativa, os resultados de uma pesquisa são divulgados, geralmente, em jornais e revistas, por valores correspondentes às frequências absolutas acompanhadas do número total de valores obtidos. Dessa forma, caso essa pesquisa fosse realizada novamente com um número maior ou menor de entrevistados, teríamos uma ferramenta para comparar resultados obtidos por duas ou mais amostras. Essa medida é conhecida Frequência Relativa e, indicada por Fr, representa a razão entre a frequência absoluta e o total de dados descritos na amostra (N), isto é: Fr = Fa N ; com 0 ≤ Fa ≤ N teremos que 0 ≤ Fr ≤ 1. Por este motivo, é comum expressar a frequência relativa por meio de porcentagem. Vamos construir a tabela de frequência completa para a variável "Tipo de Perfume". 89 TIPO DE PERFUME FA FR FR (%) 7 7 28 = 0,28 25 Cítrico 6 6 24 = 0,24 25 Doce 5 5 20 = 0,20 25 Suave 7 7 28 = 0,28 25 Total 25 1 Amadeirado 100 Temos, no entanto, outro tipo de tabela para envolver certas variáveis, na qual seus valores estão distribuídos em intervalos, não havendo praticamente repetição. Por exemplo, quando observamos os valores assumidos pela variável "Renda Mensal", notamos que eles se distribuem num intervalo de R$ 500,00 a R$ 3.000,00. Nesse caso, vamos construir tabelas de frequência agrupando os dados em classes ou intervalos de valores. Por uma questão de padronização, iremos, aqui, adotar que o número de classes será o inteiro mais próximo da raiz quadrada do número de elementos da amostra em análise, ou seja, o número de classes (K) ou número de intervalos será fornecido pelo valor inteiro mais próximo da fórmula K = N. No exemplo proposto segue que: K = 25 = 5. Observamos que o menor valor do conjunto de dados foi 500. Logo, a partir deste, faremos o que chamamos de amplitude das classes (H), ou seja, um intervalo fixo a cada classe. Para isto, basta tomarmos a razão entre a amplitude total (R), distância entre os extremos da amostra, ou seja, o valor máximo subtraído do valor mínimo dos dados em análise e dividirmos pelo número de classes que foi calculado. 90 R Logo, teríamos que: H = 1,05. K , como R = 3000 − 500 = 2500 e K = 5, temos que H = 1,05. 2500 5 = 525. Assim, o intervalo vai de 525 em 525 a partir de 500 até completar as 5 classes determinadas. Convencionamos que cada intervalo construído será fechado à esquerda e aberto à direita e usaremos a notação a Ⱶ b para representar o intervalo formado pelos números reais que estão entre a e b, incluindo o valor de a e excluindo o valor de b, isto é, a Ⱶ b = {x ∈ R/ a ≤ x < b}. Com as informações anteriores, construiremos a tabela de frequência para a variável "Renda Mensal": RENDA MENSAL FA FR FR (%) 500 Ⱶ 1025 8 8 = 0,32 25 32 1025 Ⱶ 1550 6 6 = 0,24 25 24 1550 Ⱶ 2075 5 5 = 0,20 25 20 2075 Ⱶ 2600 2 2 = 0,08 25 8 2600 Ⱶ 3125 4 4 = 0,16 25 16 Total 25 1 100 91 5. ATIVIDADES RELACIONADAS Atividade 01: Para seleção ao cursinho Pré-Enem do professor Pardal, os estudantes responderam a um questionário no qual constavam, entre outras, as seguintes perguntas: a. Qual é a área profissional pretendida? b. Estudou o Ensino Médio em rede privada ou em rede pública? c. Qual é a renda mensal de sua família? d. Quantos irmãos você tem? e. Qual é sua disciplina favorita? f. Quantas vezes você já cursou este tipo de preparatório? g. Possui acesso à internet? h. Qual é, aproximadamente, a distância de sua casa ao cursinho? Sabendo que cada uma das perguntas anteriores define um tipo de variável, relacione as questões que envolvem variáveis qualitativas e as questões que envolvem variáveis quantitativas. Cite exemplos de possíveis resultados para as perguntas a, e e f. Nas atividades de 02 a 04 use a tabela da página 84. Atividade 02: Construa uma tabela de frequência adequada para a variável "Estado Civil". Quem apresenta maior e menor percentual entre os relacionados desta variável? Atividade 03: Considerando a variável "Testaria outra marca", determine: a) A frequência absoluta que corresponde à resposta não. b) A frequência relativa que corresponde à resposta sim. 92 Atividade 04: Faça uma tabela de frequência adequada para a variável "Preço do perfume". Qual é o intervalo, em Reais, que assume o maior percentual dos entrevistados neste problema? Atividade 05: Na tabela abaixo, estão representados os resultados de um levantamento realizado com 200 pessoas, no cinema de um shopping da capital capixaba, sobre seus gastos em relação ao consumo na alimentação durante uma sessão de filme. GASTOS NÚMERO DE (EM REAIS) PESSOAS 25 Ⱶ 30 30 Ⱶ 35 35 Ⱶ 40 40 Ⱶ 45 60 X + 50 3X X 2 a) Determine o valor da incógnita x. b) Que porcentagem do total de entrevistados gasta entre R$ 35,00 e R$ 40,00 com alimentação no cinema? c) Que porcentagem do total de entrevistados gasta menos de R$ 35,00 com alimentação no cinema? 93 6. REPRESENTAÇÕES GRÁFICAS: CONSTRUÇÃO, LEITURA E INTERPRETAÇÃO DE DADOS Umas das principais ferramentas da linguagem matemática apropriada para descrição de dados de pesquisas econômicas, físicas e sociais são os gráficos. Este recurso é uma representação, um diagrama, um desenho que demonstra a relação entre duas ou mais variáveis. Existem diversos tipos de gráficos aplicados na Estatística, tendo, como principal objetivo, possibilitar uma leitura mais simples e rápida dos dados observados na pesquisa. Os gráficos "falam" dos dados de uma forma mais completa, simples e direta do que o texto e até mesmo do que as tabelas. Por isso, essas representações devem atender alguns requisitos fundamentais como: simplicidade, clareza e veracidade. Além disso, é importante que a escolha do tipo de representação gráfica seja adequada com a natureza dos dados envolvidos. Na leitura inicial de um gráfico, devemos ser capazes de identificar o objetivo geral da pesquisa, as variáveis e como foram medidas. Para isso, todo gráfico estatístico deve conter um título que informe o que pretende divulgar. Gráfico de Barras ou de Colunas: Estes são os gráficos mais simples, tanto para construção, quanto para leitura e interpretação. Permitem uma comparação rápida dos valores apresentados. São muito utilizados em pesquisas nas quais contamos o número de ocorrências dos valores do domínio de uma das variáveis, que não é numérica. A decisão entre usar colunas ou as barras é uma questão de estética. Os gráficos de barras costumam ser mais utilizados quando os valores da variável estudada são palavras e, escritas na horizontal, tornam a leitura mais fácil. Então, ele é usado para ilustrar qualquer tipo de série, desde que uma das variáveis seja quantitativa. Todas as barras (colunas) devem ter a mesma largura e serem espaçadas umas das outras de metade da largura (altura) da barra (coluna). 94 Exemplo: O gráfico abaixo representa o rendimento anual de 100 alunos de uma escola na disciplina de matemática. Gráfico de Linhas: Os gráficos em linha são muito utilizados para representar evolução (tendências de aumento ou diminuição) dos valores numéricos de uma variável. Assim, encontramos, com frequência, esse tipo de representação em análises econômicas, incidência de moléstias, política, crescimento populacional, custo de vida etc. Este tipo de gráfico é também muito utilizado na representação de séries temporais. Exemplo: O gráfico abaixo mostra a evolução da intenção de votos do povo brasileiro entre os três principais candidatos a Presidência da República, na eleição de 2014. 95 Fonte: ESTADO DE MINAS, 2014. Gráfico de Setores: O gráfico em setores, mais conhecido como gráfico de "pizzas", é construído fundamentado em um círculo. Os setores são tais que as medidas de suas áreas e a medida de seus ângulos centrais são, respectivamente, proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a πr². caso a relação entre os setores seja a área, ou a 360º, caso a relação entre os setores seja o ângulo central. Este tipo de representação gráfica é muito utilizado para representar uma contagem do número de ocorrências dos valores de uma variável não numérica E mostrar a relação das partes com o todo. É muito importante salientar que todos os resultados encontrados (100%) devem ser representados num mesmo círculo. Costuma-se usar gráficos de setores para tabelas geográficas ou por categorias, desde que não haja muitas subdivisões. Em hipótese alguma se pode usar deste tipo de representação para séries mistas. Exemplo: O gráfico abaixo mostra a preferência por modalidade esportiva referente a um grupo de 100 alunos de uma escola localizada numa região carente do Município de Aracruz-ES. 96 Pictogramas: O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Este tipo de representações gráficas é construído a partir de outros gráficos, acrescentando-se a ele figuras relacionadas à situação pesquisada. Este tipo de gráfico pode ser atraente, mas torna a informação menos clara. Pictogramas costumam não respeitar os três pilares mencionados anteriormente: simplicidade, clareza e veracidade. Exemplo: O gráfico abaixo mostra a distribuição das idades dos jovens por sexo, na faixa etária de 14 a 17 anos de idade. 97 Histogramas e Polígonos de Frequência: Um histograma de frequência é utilizado quando se deseja demonstrar dados agrupados e é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidem com os pontos médios dos intervalos de classe. 98 Tomando como referência um histograma de frequência, pode-se construir, a partir desse histograma, um polígono de frequência, bastando, para isso, ligar os pontos médios, conforme demonstrado a seguir: Existem muitos outros tipos de gráficos, específicos para determinados fatos, como: o gráfico polar, cartograma, boxplot, ramo-efolhas etc. 99 7. CONSTRUÇÃO DE GRÁFICOS NO EXCEL Com uso de simples tecnologias como, por exemplo, o Excel®, podemos construir, facilmente, qualquer tipo dos gráficos citados anteriormente. Vamos tomar, como demonstração, a tabela da página 84, e representarmos um gráfico de setores para variável "estado civil" usando esta ferramenta. 1º Passo: Abra uma planilha do Excel e construa uma tabela referenciando a frequência absoluta para cada tipo de variável relacionada a "estado civil". 100 2º Passo: Selecione a tabela construída no primeiro passo e clique no menu Inserir - Pizza - Pizza 2D. 3º Passo: Ao concluir o segundo passo, aparecerá a imagem abaixo: 101 4º Passo: Clique no menu layout de gráfico e faça as edições necessárias, por exemplo, clicando no layout 6 o gráfico ficaria com a seguinte edição: Homens 16% 32% Solteiro Casado 12% Viúvo Divorciado 40% Se quisermos construir um gráfico de colunas para a tabela de frequência "Tipo de perfume", da página 84, basta seguir os mesmos procedimentos da construção anterior, porém, ao invés de selecionar gráfico de pizzas, selecionaremos o gráfico de coluna, conforme demonstrado a seguir: 102 O resultado será, então, o seguinte: Tipo de Perfume 8 7 6 5 4 3 2 1 0 Amadeirado Cítrico Doce Suave Se quisermos construir um histograma de frequência para a tabela de dados agrupados em intervalos de classes relacionadas à variável "Renda Mensal" da página 93, basta seguirmos os mesmos procedimentos da construção anterior. Porém, ao editar o gráfico, vamos deixar as barras justapostas, dando o formato do histograma. Para isso, temos os seguintes passos: 103 1º Passo: Copie e cole a tabela de distribuição de frequências com intervalos de classes no Excel® e, selecionando as frequências absolutas, clique no menu inserir - colunas - coluna 2D. 2º Passo: Quando o passo anterior for concluído, aparecerá na tela um gráfico de colunas que será editado seguindo o seguinte esquema: Selecione o layout e edite os campos referentes ao título e eixos coordenados de acordo com a tabela. Homens Renda Mensal 10 8 6 4 2 0 Série1 1 2 3 Renda 4 5 104 3º Passo: Agora vamos deixar as colunas justapostas, clicando com o botão direito do mouse em cima de qualquer uma das colunas, selecione a função "formatar série de dados", e em "largura do espaçamento" digite 0%. 4º Passo: Para finalizarmos, basta substituirmos o eixo das classes pelos dados da tabela. Para isso, clique sobre o eixo horizontal e, com ele selecionado, clique com o botão direito do mouse, selecione a função "selecionar dados" e, clicando em "editar", selecione os dados da tabela referentes aos intervalos de classes. O histograma estará pronto! Renda Mensal 10 Homens 8 6 4 2 0 500 Ⱶ 1025 1025 Ⱶ 1550 1550 Ⱶ 2075 Renda 2075 Ⱶ 2600 2600 Ⱶ 3125 105 8. ATIVIDADES RELACIONADAS Atividade 01: Utilizando o Excel® e a tabela da página 84, construa um gráfico de setores para representar a variável "Tipo de Perfume" e um histograma de frequência para representar a distribuição com intervalos de classes para variável "Preço do Perfume". Atividade 02: Os alunos da turma de Educação Física devem optar por um, e somente um, dos três esportes para treinar: Futebol; Vôlei ou Basquete. A distribuição da escolha de 180 alunos está indicada pelo gráfico a seguir: Sabendo que o ângulo central do setor representado pelos alunos que optaram pelo futebol é 250º e que apenas 25 alunos optaram por treinar Basquete, determine: a) A medida do ângulo do setor correspondente à modalidade do Basquete; b) O número de alunos que optaram por treinar Vôlei e o ângulo do setor correspondente. 106 c) Os percentuais referentes às quantidades de alunos por modalidade esportiva. Atividade 03: A variação do saldo diário (em milhares de Reais) das contas da empresa do Senhor Rico, referente aos 10 primeiros dias do mês de maio de 2016, encontra-se representada no gráfico de linhas abaixo: Saldo (x 1000) Variação do Saldo Diário 12 10 8 6 4 2 0 -2 -4 -6 -8 -10 -12 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º Dia Esse saldo representa a diferença entre os valores recebidos e os valores gastos pela empresa. Com base no exposto, determine: a) Em quais dias a empresa do Sr. Rico operou "no vermelho", ou seja, com saldo bancário negativo? b) Identifique os períodos de crescimento e de decrescimento do saldo. c) Se no 4º dia a empresa pagou R$ 20.000,00 de contas, qual foi o valor recebido nesse dia? d) Se no 8º dia a empresa recebeu R$ 30.000,00, que valor a empresa gastou nesse dia? e) Se no dia 10 a empresa gastou R$ 6.000,00, que valor ela recebeu nesse dia? 107 Atividade 04: O gráfico abaixo mostra a produção de veículos da empresa CALHAMBEQUE, no período de 2004 a 2007. Com base nos dados apresentados no gráfico, responda: a) Qual foi, aproximadamente, o aumento relativo e percentual da produção de veículos no período apresentado? b) Em qual período anual houve o maior e o menor desempenho percentual na produção de veículos? c) Se a partir de 2005, a cada ano, a empresa apresentasse mais duas unidades do gráfico em relação ao ano anterior, qual seria a estimativa de veículos para o ano de 2010? 108 Atividade 05: Analisando os dados dispostos no gráfico abaixo, responda as perguntas propostas: a) Qual região brasileira apresentou, em 2010, o maior e o menor percentual de crianças com 10 anos ou mais que possuíam aparelhos celulares? b) Em percentual, qual seria a média brasileira dos estudantes com 10 anos ou mais que não possuíam aparelhos celulares em 2010? c) Podemos afirmar que, da média encontrada no item anterior, as regiões Norte e Nordeste, juntas, foram responsáveis por mais da metade do percentual calculado? Justifique sua reposta. d) Em relação à média brasileira dos estudantes com 10 anos ou mais que possuíam aparelhos celulares em 2010, é correto afirmar que a região sul do país colabora com essa média em mais de 12%? Justifique sua resposta. 109 9. ESTUDO DAS MEDIDAS ESTATÍSTICAS DESCRITIVAS Quando a variável em estudo é quantitativa, podemos resumir certas informações dos dados (valores) por algumas medidas descritivas. Por exemplo, para se conhecer o peso típico de recém-nascidos numa comunidade, podemos calcular a média ou a mediana dos pesos dos recémnascidos nessa comunidade. Para se ter ideia da magnitude de variação do peso dessas crianças, podemos calcular o chamado desvio padrão. Em suma, nesta etapa, vamos aprender a calcular e a interpretar certas medidas estatísticas que descrevem informações específicas de um conjunto de dados. Definimos Medidas Estatísticas como Valores Numéricos calculados sobre o conjunto de valores observados da Variável Quantitativa em estudo, cuja interpretação fornece informações específicas sobre o comportamento da variável naquele conjunto de dados. Estudaremos, aqui, as principais medidas conhecidas como: Medidas de Tendência Central (ou de Posição) e as Medidas de Dispersão (ou de Variação) O esquema abaixo mostra como estarão sendo abordados esses termos: 110 Medidas de Posição e Medidas de Variação para dados não agrupados: Dada a nota final de 7 alunos de uma turma (4 − 5 − 5 − 6 − 6 − 6 − 8), podemos perceber que esses dados não estão agrupados em tabelas. Estão apenas na formatação de um rol. Assim, podemos determinar as medidas descritivas desta distribuição usando das ferramentas a seguir: a) Média Aritmética: 𝐗 De um modo geral, dado um conjunto de n valores de uma certa variável x, podemos definir a média aritmética por: X= n i =1(x i ) n . Assim, teríamos, no exemplo proposto, que a média aritmética das notas finais dos setes alunos foi: X= 4 + 5 + 5 + 6 + 6 + 6 + 8 40 = ≅ 5,71 7 7 b) Mediana: Me É o elemento que está exatamente no centro das informações ordenadas. A mediana é um valor do domínio da variável que divide os dados observados em dois grupos com a mesma quantidade de observações. O procedimento para determinação da mediana depende do número de observações. Deveremos seguir os seguintes passos: I) Se N for ímpar a mediana é o termo de ordem P N 1 . 2 II) Se N for par é a média aritmética dos termos de ordem: P1 N N e P2 1 2 2 No exemplo proposto, a nota mediana dos alunos seria calculada pelo item I, tendo em vista que a série apresenta um total de sete alunos, ou seja, uma quantidade ímpar de observações. Assim: 111 P= 7+1 2 8 = = 4, portanto, a nota final mediana dos alunos relacionados 2 seria a variável que ocupa a quarta posição no rol, ou seja, a Me = 6. c) Moda: Mo Moda é o valor mais frequente da distribuição. Para distribuições simples (sem agrupamento em classes), a identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência. Neste caso, a nota modal dos alunos é Mo = 6, pois a nota (variável 6) foi a quem mais se destacou em relação as outras. A moda é, aproximadamente, a diferença entre o triplo da mediana e o dobro da média, segundo o processo obtido pela fórmula de Pearson: 𝐌𝐨 ≅ 𝟑𝐌𝐞 − 𝟐𝐗. Esta fórmula dá uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. Podemos perceber que, trabalhando com a fórmula de Pearson, no exemplo proposto, chegaríamos ao mesmo valor. Verificamos que as Medidas de Posição expressam a característica dos dados observados tenderem a se agrupar em torno dos valores centrais, e que elas representam valores intermediários da série (entre o menor e o maior valor), em torno dos quais os elementos da série estão distribuídos. Em síntese, podemos dizer que as Medidas de Posição tentam traduzir a semelhança que os dados estatísticos referentes à observação de um fenômeno apresentam entre si, conforme se pode notar pela observação das séries abaixo. SÉRIE VALORES 3 7 MÉDI MEDIAN MOD A A A 1 1 10 10 11 15 18 20 35 13 10,5 10 2 12 12 13 13 13 13 13 13 14 14 13 13 13 3 13 13 13 13 13 13 13 13 13 13 13 13 13 112 A julgar apenas pela Média, teríamos que concluir pela igualdade entre as três séries 1, 2 e 3. Se estendermos nossa análise, incluindo as medidas Média, Mediana e Moda, teríamos que concluir pela igualdade entre as séries 2 e 3. Mas como os conjuntos são pequenos, conseguimos observar que eles não são iguais. Frequentemente, as Medidas de Tendência Central não são suficientes para caracterizar completamente uma série numérica, conforme pode ser observado nas séries de dados acima. O que se constata, é que os fenômenos passíveis de análise pelo método estatístico, bem como os dados estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto pela sua variabilidade. Chamamos de dispersão ou variabilidade, à maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. Analisando os conjuntos de dados acima, podemos dizer que a série 3 apresenta dispersão ou variabilidade nula (todos os valores iguais entre si), e que o conjunto 2 apresenta dispersão ou variabilidade menor que o conjunto 1. Para justificar esta última afirmação, basta apenas observarmos os valores extremos das duas séries. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão (ou variabilidade) entre esses valores e uma respectiva medida de posição, a Estatística recorre às Medidas de Dispersão ou de Variabilidade. d) Variância S² e Desvio Padrão S: Tanto a variância quanto o desvio padrão são medidas que fornecem informações complementares à informação da média aritmética. Estas medidas avaliam a dispersão do conjunto de valores em análise. Para calcularmos a variância e o desvio padrão, devemos considerar os desvios de cada valor em relação à média aritmética. A expressão que nos permite calcular a variância para dados não n agrupados pode se dar por: S 2 (x i 1 i x)2 (n 1) . 113 Se voltarmos ao exemplo proposto sobre as notas finais dos sete alunos, podemos chegar ao cálculo da variância com a expressão acima, tomando, como apoio, a construção da seguinte tabela: DESCRIÇÃO NOTAÇÃO RESULTADOS NUMÉRICOS Valores (Notas dos alunos) Xi Média X Desvios (𝑋𝑖 − 𝑋 ) Desvios quadráticos (𝑋𝑖 − 𝑋)² 4 5 5 6 6 6 8 6 −2 −1 4 1 −1 1 0 0 0 0 0 0 2 4 Portanto, a variância das notas finais dos sete alunos seria dada por: 𝑆² = 4 + 1 + 1 + 4 10 = ≅ 1,67. 7−1 6 Como a variância de um conjunto de dados é calculada em função dos desvios quadráticos, sua unidade de medida equivale à unidade de medida dos dados ao quadrado. Nesse contexto, é mais comum se trabalhar com a raiz quadrada positiva da variância. Esta medida é conhecida como desvio padrão, o qual é expresso na mesma unidade de medida dos dados em análise. Então, o cálculo do desvio padrão nada mais será do que sempre extrair a raiz quadrada da variância. Neste exemplo, teríamos que: 𝑆 = 𝑆² = 1,67 ≅ 1,29. Ao compararmos os desvios padrões de vários conjuntos de dados, podemos avaliar quais dados se distribuem de forma mais ou menos dispersa em relação à média, ou seja, o desvio padrão representa a distância padronizada dos dados em relação à média, sendo que, quanto maior for o desvio padrão, maior dispersão apresentará a distribuição e quanto menor for o desvio padrão, menor dispersão apresentará a distribuição. O desvio padrão fornece informação sobre a dispersão (Variância ou heterogeneidade) dos valores. 114 e) Coeficiente de Variação CV: Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por: CV = S X O Coeficiente de Variação é a razão entre o Desvio Padrão e a Média Aritmética, e é, geralmente, expresso em porcentagem. Trata-se de um número puro (sem unidade de medida), sendo, portanto, uma medida relativa. A grande utilidade do Coeficiente de Variação é permitir a comparação de variabilidade de diferentes conjuntos de dados. Remetendo-se ao nosso exemplo inicial, podemos verificar que o coeficiente de variação em relação às notas finais dos sete alunos seria calculado por: CV = 1,29 6 ≅ 0,22 = 22%. Isso significa que o grau de concentração dos dados em torno da média é de 22%. Diz-se que a distribuição possui pequena variabilidade (dispersão) quando o coeficiente der até 10%; média dispersão quando estiver acima de 10% até 20%; e grande dispersão quando superar os 20%. Alguns analistas consideram: Baixa dispersão: 𝐶𝑉 ≤ 15%; Média dispersão: 15% < 𝐶𝑉 < 30% e Alta dispersão: 𝐶𝑉 ≥ 30%. Medidas de Posição e Medidas de Variação para dados agrupados em tabelas com e sem intervalos de classes: Nas páginas anteriores, já trabalhamos com as definições das principais medidas estatísticas descritivas. Elas foram citadas em um contexto envolvendo dados não agrupados em tabelas. Veremos agora a formatação e o manejo de cálculos para tais medidas envolvendo um conjunto de dados agrupados em tabelas que envolvam ou não intervalos de classes. Para isso, seguem dois exemplos que servirão de norte para o cálculo das medidas estatísticas: 115 Exemplo 01: Em uma sala de aula, foi perguntado a uma amostra de 20 alunos, quantos irmãos eles têm. Os dados foram organizados na tabela abaixo: QUANTIDADE DE IRMÃOS (XI) FREQUÊNCIA ABSOLUTA (FA) 0 1 2 3 4 Total 2 5 10 2 1 20 Para o cálculo das medidas, podemos, ao invés de desmembrar e somar uma por uma, associar de forma multiplicativa cada variável com sua respectiva frequência absoluta. Assim, teríamos: a) Média Aritmética 𝐗: X= n i=1 Xi . Fai n No exemplo citado, teríamos: (Xi) (Fa) (Xi. Fa) 0 2 0 1 5 5 2 10 20 3 2 6 4 1 4 Total 20 35 116 Portanto, a média do quantitativo de irmãos dos alunos seria dada por: X= 35 20 = 1,75 ≅ 2 irmãos por aluno. b) Mediana Me: Neste caso, a mediana seria a variável que primeiramente envolvesse a n posição da mediana P = , em sua frequência acumulada. 2 (Xi) (Fa) (Xi. Fa) Fac 0 2 0 2 1 5 5 7 2 10 20 17 3 2 6 19 4 1 4 20 Total 20 35 - Pelo exemplo, temos que a posição da mediana seria dada por P = 20 2 = 10, ou seja, analisando esta posição na tabela e observando a coluna da Fac, percebemos claramente que a variável que representa a quantidade mediana de irmão é a variável Xi = 2. Logo temo que a Me = 2. Perceba que ela está muito próxima da média, que foi de 1,75. c) Moda Mo: Neste caso, determinamos a moda observando qual variável X i, obteve a maior frequência absoluta. Pelo exemplo exposto, fica notório perceber que a moda seria representada pela variável Xi = 2, pois a ela temos referente a maior frequência absoluta da distribuição, Fa = 10, portanto, a Mo = 2. 117 (Xi) (Fa) 0 2 1 5 2 10 3 2 4 1 Total 20 d) Variância S² e Desvio Padrão S: Para o cálculo dessas medidas, vamos projetar o numerador da fórmula da variância na própria tabela. n Neste caso, a variância seria dada por: S 2 [ Fa.( x i 1 i x)2 ] (n 1) , e, portanto teríamos que, como a média da quantidade de irmãos foi de X = 1,75, a projeção da tabela ficaria assim: (Xi) (Fa) (𝑿𝒊 − 𝑿) (𝑿𝒊 − 𝑿)² Fa.(𝑿𝒊 − 𝑿)² 0 2 - 1,75 3,06 6,12 1 5 - 0,75 0,56 2,80 2 10 0,25 0,06 0,6 3 2 1,25 1,56 3,12 4 1 2,25 5,06 5,06 Total 20 - - 17,70 118 Assim, teríamos que a variância seria S² = padrão, então, seria fornecido por: 𝑆 = 17,70 20−1 = 17,70 19 ≅ 0,93 e o desvio 𝑆² = 0,93 ≅ 0,96. e) Coeficiente de Variação CV: Este cálculo não muda nada em relação aos dados não agrupados. Portanto, o coeficiente de variação para esta distribuição seria dado por: CV = 0,96 1,75 ≅ 0,55 = 55%. Isso significa que o grau de concentração dos dados em torno da média é de 55%. Esta distribuição apresenta uma alta dispersão dos dados em torno da média. Exemplo 02: A distribuição de frequência abaixo mostra as notas de 2000 candidatos em uma prova de concurso. As notas foram organizadas em classes (intervalos): Notas Fa 0Ⱶ2 40 2Ⱶ4 440 4Ⱶ6 520 6Ⱶ8 640 8 Ⱶ 10 360 Total 2000 Para o cálculo das medidas, temos que encontrar o ponto médio de cada classe, pois, apesar de sabermos a frequência absoluta de cada classe, não sabemos a qual ou quais variáveis elas estão atreladas. Com isso, o ponto de referência de cada classe fica sendo o valor do ponto médio. Assim teríamos: 119 a) Média Aritmética 𝐗: X= n i=1 PMi . Fai n Notas Fa PM (PM.Fa) 0Ⱶ2 40 1 40 2Ⱶ4 440 3 1320 4Ⱶ6 520 5 2600 6Ⱶ8 640 7 4480 8 Ⱶ 10 360 9 3240 Total 2000 - 11680 Portanto, a média de pontuação dos candidatos desse concurso seria dada por: X= 11680 2000 = 5,84 ≅ 6 pontos por candidato. b) Mediana Me: Para o cálculo da mediana, percebemos que, como os dados estão agrupados em intervalos de classes, precisamos, primeiramente, encontrar qual seria a classe mediana, ou seja, a classe que contém o valor da posição da mediana. Para isso, já sabemos que basta calcularmos o valor da posição P= n 2 e comparar com a frequência acumulada. Assim temos que: 120 Notas Fa Fac 0Ⱶ2 40 40 2Ⱶ4 440 480 4Ⱶ6 520 1000 6Ⱶ8 640 1640 8 Ⱶ 10 360 2000 Total 2000 - É perceptível que a posição da mediana seria dada por: P = 2000 2 = 1000, onde verificamos que classe mediana ficaria sendo a terceira classe. (Classe mediana: 3ª Classe). A expressão que nos auxilia no cálculo para esse tipo de agrupamento é calculada dentro da devida classe, sendo, sua formulação genérica, dada por: P F ' ac Me = Li + h onde: Fi Li - Limite inferior da classe mediana; F'ac- Frequência acumulada da classe anterior à classe mediana; P - É a posição da mediana; Fa - É a frequência absoluta da classe mediana; h - É a amplitude das classes. No exemplo, a mediana seria calculada como: Me = 4 + 1000 − 480 520 . 2 ∴ Me = 4 + . 2 ∴ Me = 4 + 1.2 ∴ Me = 4 + 2 ∴ Me 520 520 =6 c) Moda Mo: Neste caso, o cálculo da moda também é efetuado dentro da classe modal, que é localizada pela classe que oferece a maior frequência absoluta da distribuição. Feito isso, aplica-se a fórmula de Czuber: Mo = Li + Em que: ∆1 ∙h ∆1 + ∆2 121 𝑳𝒊 = Limite Inferior da classe modal; ∆𝟏 = Diferença entre a frequência da classe modal e a imediatamente anterior; ∆𝟐 = Diferença entre a frequência da classe modal e a imediatamente posterior; 𝒉 = Amplitude das classes. Notas Fa 0Ⱶ2 40 2Ⱶ4 440 4Ⱶ6 520 6Ⱶ8 640 8 Ⱶ 10 360 Total 2000 Pela tabela de distribuição, destacamos a classe modal como sendo a quarta classe, pois 640 é o registro de maior frequência absoluta nesta distribuição. Aplicando a fórmula, temos: Mo = 6 + (640 − 520) ∙2 640 − 520 + (640 − 360) 120 ∙2 120 + 280 120 Mo = 6 + ∙2 400 120 Mo = 6 + ∙2 400 Mo = 6 + Mo = 6 + 0,3 ∙ 2 Mo = 6 + 0,6 Mo = 6,6 122 d) Variância S² e Desvio Padrão S: Para o cálculo dessas medidas, vamos também projetar o numerador da fórmula da variância na própria tabela. n Neste caso, a variância seria dada por: S 2 [ Fa.( PM x ) 2 i 1 ] . (n 1) Percebemos que a variável deu lugar ao ponto médio das classes, já que não sabemos ao certo quem e quantas vezes tais variáveis apareceram, e, portanto teríamos que, como a média da quantidade da distribuição foi de X = 5,84, a projeção da tabela ficaria assim: (𝑷𝑴 − 𝑿) (𝑷𝑴 − 𝑿)² Fa.(𝑷𝑴 − 𝑿)² Notas Fa PM 0Ⱶ2 40 1 - 4,84 23,43 937,20 2Ⱶ4 440 3 - 2,84 8,07 3550,80 4Ⱶ6 520 5 - 0,84 0,71 369,20 6Ⱶ8 640 7 1,16 1,35 864 8 Ⱶ 10 360 9 3,16 9,99 3596,40 Total 2000 - - - 9317,60 Assim, teríamos que a variância seria S² = o desvio padrão então seria fornecido por: 𝑆 = 9317,60 2000 −1 = 9317,60 1999 ≅ 4,66 e 𝑆² = 4,66 ≅ 2,16. e) Coeficiente de Variação CV: Este cálculo não muda em relação aos dados anteriormente. Portanto, o coeficiente de variação para esta distribuição seria dado por: CV = 2,16 5,84 ≅ 0,37 = 37%. Isso significa que, o grau de concentração dos dados em torno da média é de 37% Esta distribuição apresenta uma alta dispersão dos dados em torno da média. 123 10. ATIVIDADES RELACIONADAS Atividade 01: Em um edifício comercial com 50 lojas, 30 lojistas pagam uma taxa de manutenção de R$ 200,00. Para os demais, essa taxa é de R$ 250,00. Qual é o valor da taxa média de manutenção nesse edifício? Atividade 02: Sabendo que a média aritmética de um conjunto de dados formado por trinta números é igual a 16, descreva o que aconteceria com essa média aritmética se: a) Acrescentarmos o número 30 a esse conjunto de dados? b) Retirarmos o número 40 desse conjunto de dados? c) Acrescentarmos o número 60 a esse conjunto e retirarmos o número 20? Atividade 03: O gráfico de setores abaixo representa a pesquisa realizada em uma sala de aula com 40 alunos acerca da quantidade de irmãos desses alunos. 124 Com base no exposto, determine: a) Quantos alunos dessa turma possuem pelo menos três irmãos? b) Qual é o número médio, mediano e modal de irmãos dos alunos dessa turma? Atividade 04: O conjunto de dados a seguir representa o tempo de espera (em minutos) de 10 pessoas que foram atendidas em um banco da cidade durante o início da tarde: 5 - 9 - 26 - y - 18 - 8 - x - 23 - 1 - 16 Sabendo que o tempo médio e mediano foi, respectivamente, de 14 e 15 minutos, determine: a) Os valores de x e y tal que 9 < 𝑥 < 16 e 18 < 𝑦 < 23. b) Podemos detectar um tempo de espera modal no conjunto de dados? Justifique. c) As medidas de variação para este conjunto de dados. Atividade 05: A Segunda Guerra Mundial (1939–1945) foi o conflito que causou mais vítimas em toda a história da Humanidade. 125 Analisando os dados da tabela, determine: a) Calcule a média e a mediana do número de mortos na II Guerra. Por que a média é bem superior à mediana? b) Em que condição a média ficaria mais próxima da mediana? Justifique sua resposta com possíveis cálculos. Atividade 06: As temperaturas máximas diárias registradas no mês de janeiro, na capital Pernambucana, estão indicadas na tabela abaixo: Temperatura Máxima (ºC) Número 𝐏𝐌 de (𝐏𝐌. 𝐅𝐚) (𝑷𝑴 − (𝑷𝑴 − 𝐅𝐚. (𝑷𝑴 − 𝑿) 𝑿)² 𝑿)² - - Dias 25 Ⱶ 28 7 28 Ⱶ 31 10 31 Ⱶ 34 8 34 Ⱶ 37 4 37 Ⱶ 40 2 Total 31 Bbbb - Complete a tabela com os dados necessários e determine a média, o desvio padrão e o coeficiente de variação. Atividade 07: Com os dados obtidos em uma pesquisa sobre quanto tempo crianças de 7 anos passam na internet diariamente, construiu-se o seguinte histograma: 126 Com base no histograma acima, responda: a) Que porcentagem do total de crianças fica entre meia hora e uma hora e meia na rede? b) Qual é a média e a mediana do tempo de uso da internet? c) A partir do histograma anterior, faça outro histograma agrupando os tempos de hora em hora. Calcule as medidas descritas de posição e de variação. Atividade 08: Um determinado estado é composto por duas regiões, A e B, cada uma com cinco cidades de mesma população. Feito um levantamento para saber o grau de satisfação da população de cada cidade em relação à respectiva administração municipal, constatou-se o seguinte resultado com notas de 0 a 10: Região A 7,0 4,5 5,5 5 3 Região B 5 8,5 3 1 7,5 Em qual das regiões as opiniões são menos divergentes? Justifique sua resposta. 127 Atividade 09: Um professor de Matemática elaborou, através do computador, um histograma das notas obtidas pela turma em uma prova cujo valor era 5 pontos. Entretanto, o histograma ficou incompleto, pois este professor esqueceu-se de fornecer o número de alunos que obtiveram notas iguais a 2, 4 ou 5. Veja a ilustração a seguir: Com base no exposto, determine a nota modal para os alunos dessa classe. Atividade 10: Sejam 𝑋1 ; 𝑋2 ; … ; 𝑋𝑛 os n valores assumidos por uma variável quantitativa. O que acontece com a média aritmética X , com a variância (S²) e com o desvio padrão (S) desses valores, quando cada 𝑋𝑖 (para i = 1,2,3, . . . , n) é: a) Aumentado de duas unidades? b) Multiplicado por 2? Justifique suas respostas. 128 11. SUGESTÃO PARA UMA PRÁTICA INVESTIGATIVA Uma das grandes competências que permeia o estudo da Estatística é a contextualização sociocultural, no sentido de que ela permite ao jovem estudante fazer uma leitura consciente e crítica das questões do cotidiano e dos problemas de nossa sociedade e, desse modo, o prepara para intervir e propor soluções para problemas diversos. Não é difícil enumerar temas que podem ser discutidos no estudo da Estatística: Saúde e bem-estar; Meio ambiente; Violência urbana; Desigualdades sociais e regionais; Trabalho; Comunicação; Mundo digital; Economia; entre outros. Neste material, fizemos um breve estudo da Estatística Descritiva, com tabelas de frequências, gráficos, medidas de posição e de variação. Agora, passamos a "bola" para vocês, que, com autonomia e criatividade, deverão desenvolver este roteiro de atividades proposto a seguir: Agora é com vocês! Mãos à obra! 129 ATIVIDADE 01: Levantamento de uma problemática e a busca pelos dados. Reúnam-se em grupo de cinco pessoas e discutam (levantem) temas interessantes para uso de uma pesquisa estatística dentro da comunidade de sua escola. Após o levantamento destas informações, debatam suas ideias com os demais grupos da sua turma. ATIVIDADE 02: Seleção do Tema (problema) da pesquisa e busca pelos tipos de variáveis a serem analisadas. Dentre os temas debatidos na questão anterior, descreva qual foi o selecionado pelo grupo, e apontem as respectivas variáveis que possam ser úteis dentro da pesquisa, classificando-as em: Variáveis Quantitativas (Discretas/Contínuas) ou Qualitativas (Nominal/Ordinal). Após este estudo, elaborem um simples questionário que atenda a escolha da pesquisa do seu grupo. ATIVIDADE 03: É hora de ir a campo! Aplique o questionário ao público destinado à sua pesquisa. Sejam breves, objetivos e, acima de tudo, imparciais e verdadeiros com a execução da pesquisa proposta pelo grupo. ATIVIDADE 04: Verificando e organizando os frutos da pesquisa. Chegou a hora de começarmos a "tratar as informações" que foram coletadas na pesquisa de seu grupo! Procure construir tabelas que organizem os dados coletados, buscando resumir as informações, fazendo o que chamamos de tabulação de dados. 130 ATIVIDADE 05: Construindo Gráficos. Debata com o grupo e construa, com o apoio do Microsoft Excel®, possíveis gráficos que possibilitem uma boa representação de algumas das variáveis tratadas pela sua pesquisa. ATIVIDADE 06: Escolhendo variáveis para o trabalho descritivo. Escolha duas variáveis quantitativas de sua pesquisa e as organizem em uma distribuição de frequências com intervalos de classes, ao final, utilize do Microsoft Excel, para apresentar esses dados através de um Histograma de Frequência. ATIVIDADE 07: Estudo das medidas estatísticas descritivas. Com base na atividade anterior, determine as Medidas de Tendência Central e as Medidas de Dispersão que envolvam os dados selecionados. Façam um breve relatório do que essas medidas representam para vocês dentro da pesquisa do grupo. ATIVIDADE 08: Apresentação da pesquisa. Agora seu grupo deverá apresentar, de forma dinâmica e criativa, para o restante da turma, a pesquisa que foi realizada. Estejam preparados para possíveis perguntas sugeridas pelo tema. 131 12. REFERÊNCIAS BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 7 ed., rev. Florianópolis: Ed. UFSC, 2007. 315 p. (Série Didática) DANTE, L. R. Didática da Resolução de Problemas em Matemática. São Paulo: Ática, 1991. DANTE, L. R. Tudo é Matemática: São Paulo: Ática, 2009. GIOVANNI, José Ruy; BONJORNO, José Roberto; GIOVANNI, José Ruy Jr.. Matemática fundamental. Volume único. São Paulo: FTD, 2002. HARZAN, Samuel; IEZZI, Gerson; DEGENSZAJN, David. Fundamentos de Matemática Elementar. V.11, 2.ed. São Paulo: Editora Atual. 2013. IEZZI, Gelson; ALMEIDA, N. DEGENSZAJN, D.; DOLCE, O.; PÉRIGO, R. Matemática: ciência e aplicações, volume 1: ensino médio. 8. ed. São Paulo: Atual, 2014a. 448 p. IEZZI, Gelson; ALMEIDA, N. DEGENSZAJN, D.; DOLCE, O.; PÉRIGO, R. Matemática: ciência e aplicações, volume 3: ensino médio. 8. ed. São Paulo: Atual, 2014b. 336 p. PAIVA, Manoel. Matemática. Vol. I. São Paulo: Moderna, 1995. TROTTA, Fernando. Matemática por Assunto: análise probabilidade e estatística. V.4. Rio de Janeiro: Scipione, 1988. combinatória,