ESTATÍSTICA I NOCÕES FUNDAMENTAIS Conceito Básico: Def. – Vários autores têm procurado definir a Estatística. Através de muitos livros escritos sobre Estatística, todos contendo definições, desde as mais simples até as mais complexas, porém a que vamos sugerir aqui é a que julgamos ser simples e fácil de ser memorizada : Estatística é a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população. Objetivo e Aplicação: Objetivo – O objetivo da Estatística é a análise e interpretação dos fenômenos sociais de qualquer natureza, com o intuito de fornecer ao ser humano dados suficientes para planejamento de ações futuras. Aplicação – Vamos encontrar aplicação da Estatística no Comércio, na Industria, na Medicina, na Física, na Química, na Biologia, na Psicologia, na Sociologia, na Economia, na Engenharia, na Agronomia, na Administração, na Zootecnia, enfim, em todos os conceitos de atividade humana que dela fazem uso. Do exame de uma série Estatística, uma empresa poderá adquirir a quantidade, a matéria exata para o seu funcionamento, graças a comparações e análises das tabelas referentes e já elaboradas. A operação com numeração Estatística é uma tarefa especializada e deverá ser tratada com muito discernimento e conhecimento, pois poderá levar-nos a conclusões indevidas. Noções de População e Amostra: População – O conjunto da totalidade dos indivíduos ou objetos sobre o qual se faz uma inferência recebe o nome de população ou universo. A população congrega todas as observações que sejam relevantes para o estudo de uma ou mais características dos indivíduos ou objetos. Em linguagem mais formal, a população é o conjunto constituído por todos os indivíduos ou objetos que apresentam pelo menos uma característica comum, cujo comportamento interessa analisar (inferir). Exemplo: As pessoas de uma comunidade podem ser estudadas sob diversos ângulos : o conjunto das estaturas de todas essas pessoas constituem uma população de estaturas; o conjunto de todos os pesos constituem uma população de pesos, etc.... Amostra – A amostra pode ser definida como um subconjunto, uma parte selecionada da totalidade de observações abrangidas pela população, através da qual se faz um juízo ou inferência sobre as características da população. As características da amostra são chamadas de Estatísticas (descritivas), sendo simbolizadas por caracteres latinos, enquanto que os parâmetros da população terão como símbolos, via de regra, os caracteres gregos. Nesse texto, a preocupação será, portanto, a de descrição das amostras através da comumente chamada Estatística Descritiva. TIPOS DE AMOSTRAGENS Utilizamos a amostragem em nossa vida diária, por exemplo, num aeroporto internacional, a escolha dos passageiros, para a revista da bagagem, é feita por amostragem. Existem técnicas adequadas para recolher amostras, de forma a garantir (tanto quanto possível) o sucesso da pesquisa e dos resultados. Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve ser menor que 10% do total de elementos da população. Por que Amostragem? • Economia – O levantamento de dados sobre uma parte da população é mais econômico que o levantamento de dados sobre toda a população; Tempo – O levantamento de dados sobre uma parte da população é mais rápido que o levantamento de dados sobre toda a população; Confiabilidade dos dados – Ocorre menor número de erros em pesquisas que disponham de menor número de elementos; Operacionalidade – É mais fácil trabalhar os dados em menor escala. • • • Técnicas para a determinação da Amostragem: • • • Amostragem casual ou aleatória simples; Amostragem proporcional estratificada; Amostragem sistemática. Amostragem Casual ou Aleatória Simples É a seleção por meio de sorteio. É sempre recomendável que a amostra contenha no mínimo 10% da população. Inicialmente, devemos listar ou numerar de 1 a N a população a ser analisada, e posteriormente selecionar uma amostra de pelo menos 10% da população mediante um sorteio. Amostragem Proporcional Estratificada Nesta amostragem consideramos a população dividida em subconjuntos, em que cada subconjunto recebe o nome de estrato. Cada subconjunto (chamado estrato) tem uma característica comum entre seus elementos. Amostragem Sistemática Esse método é um procedimento para a amostragem aleatória, utilizado quando os elementos da população já se acham ordenados. Exemplos que podem ser citados: os prédios de uma rua, os funcionários de uma empresa, as linhas de produção etc... Intervalo de Seleção: N , onde N é a população e n é a amostra. n Classificação da Estatística: A Estatística pode ser dividida, basicamente, em duas partes que se inter-relacionam: a Estatística Descritiva e a Estatística Indutiva. Estatística Descritiva ou Dedutiva – É à parte da Estatística que descreve a organização, o resumo e a descrição de conjuntos de dados variáveis, reduzindo-os a um pequeno número de medidas que contém toda a informação relevante. A finalidade é tornar as coisas mais fáceis de entender, de relatar, de discutir. Nestes processos descritos de sintetização salientam-se as formas de apresentação de dados, através de tabela e gráficos, e as medidas de posição (tendência central) de dispersão (variabilidade), de assimetria e curtose. Exemplo : Índices de desemprego, de mortalidade, de acidentes no trabalho, de custo de vida, média de estudantes, produção média de uma fábrica, despesa média de uma família, etc.... Estatística Indutiva ou Inferência Estatística – É à parte da Estatística que, baseando-se em resultados obtidos da análise de uma amostra da população, procura inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi retirada, através do cálculo de probabilidade. Exemplo : Através de uma pesquisa eleitoral, um instituto anuncia o provável vencedor das eleições para governador. Fábricas frequentemente produzem um pequeno número de peças (lote piloto) antes de se lançarem à fabricação em grande escala. Uma nova vacina é testada num grupo de pacientes para se avaliar a sua eficácia. Arredondamento Estatístico de Dados: Sempre nos deparamos com situações onde é necessário ou conveniente suprimir unidades inferiores às de determinada ordem. Torna-se imperiosa, então, a definição de critérios para considerar números próximos aos que representam os valores reais de determinada medida, com finalidade de reduzir ao mínimo os efeitos dos erros cometidos nessas aproximações. Os critérios de arredondamento de dados foram estabelecidos através da Resolução nº 886, de 26/10/1996, do Conselho Nacional de Estatística. 1) Quando o primeiro algarismo a ser suprimido for 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer. 26,450 ≅ 26,45 Exemplo : Arredondar para o centésimo mais próximo: 47,523 ≅ 47,52 35, 892 ≅ 35,89 98, 764 ≅ 98,76 Arredondar para a unidade mais próxima: 115,39 ≅ 115 97,08 ≅ 97 189,47 ≅ 189 76,18 ≅ 76 456,28 ≅ 456 2) Quando o primeiro algarismo a ser suprimido for 6, 7, 8, ou 9, aumenta-se em uma unidade o último algarismo a permanecer. Exemplo : Arredondar para o centésimo mais próximo: 89,567 ≅ 89,57 58,479 ≅ 58,48 98,498 ≅ 98,50 47,356 ≅ 47,36 Arredondar para a unidade mais próxima: 65,74 ≅ 66 875,84 ≅ 876 28,92 ≅ 29 126,64 ≅ 127 3) Quando o primeiro algarismo a ser suprimido for 5, apresentam-se duas soluções: 3.1) Se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unidade ao último algarismo a permanecer. 76,35003 ≅ 76,4 Exemplo : Arredondar para o décimo mais próximo: 5,453 ≅ 5,5 3.2) Se o 5 for o último algarismo (ou se a ele só se seguirem zeros) o último algarismo a permanecer: a) Sendo par, permanece inalterado. Exemplo : Arredondar para o décimo mais próximo: 47,65 ≅ 47,6 124,45000 ≅ 124,4 b) Sendo impar, será aumentado em uma unidade. Exemplo: arredondar para a unidade mais próxima: 57,5 ≅ 58 85,500 ≅ 86 Arredondamento de Soma: Quando se trata de soma, deve-se arredondar primeiro o total, e posteriormente as parcelas. Há aqui dois casos a considerar: a) Se a soma das parcelas da série arredondada for superior ao total, deve-se retornar à série original, arredondando-se, por falta, tantas parcelas quantas forem as unidades excedentes. Serão escolhidas as parcelas anteriormente arredondadas por excesso e cujas frações desprezadas formem um número mais próximo de 5, 50, 500 etc..., conforme o caso. Exemplo: Série original Série arredondada 6,51 7 7,50 8 14,63 15 20,10 20 24,73 25 26,52 27 99,99 102 >100 * Arredondamentos refeitos. Série corrigida 6* 7* 15 20 25 27 100 b) Se a soma das parcelas da série arredondada for inferior ao total, retornar-se-á à série original, arredondando-se, por excesso, tantas parcelas quantas sejam as unidades em falta. Serão escolhidas aquelas parcelas anteriormente arredondadas por falta e cujas frações formem um número mais próximo de 5, 50, 500 etc.., conforme o caso. Exemplo: Série original Série arredondada 5,34 5 7,45 7 18,50 18 19,90 20 22,37 22 26,43 26 99,99 98 <100 * Arredondamentos refeitos. Série corrigida 5 8* 19* 20 22 26 100 Somatório e suas Propriedades: Muitas vezes precisamos escrever expressões que envolvem somas com muitos termos, ou cujos termos obedecem a certa lei de formação. Por exemplo, a soma dos 110 primeiros números naturais: 1 + 2 + 3 + 4 + . . . . . . . . + 109 + 110. Simbolizaremos por xi o i-ésimo termo da soma. Assim, x1 representa o 1º termo, x2 representa o 2º, x3, o 3º, x110 , o centésimo décimo elemento. Também chamaremos “n” o número de termos da soma. Na ilustração n = 110. n A soma de “n” termos pode simbolicamente representada por: ∑ xi i =1 110 No caso anterior, temos 110 termos; então n = 110 e a soma dos cento e dez números será representada por: ∑ xi i =1 n Partes do símbolo do Somatório: ∑ xi i =1 a) “ ∑ ”– é o operador somatório (instrução para somar) b) “ n ” – é último elemento a ser somado c) “ x ” – é o nome dos termos a serem somados d) “ i ” – o primeiro elemento dos termos a serem somados. Lê-se a simbologia acima assim : somatório de xi , para “i” variando de 1 a “n”. O símbolo “ ∑ ”éa letra grega maiúscula chamada SIGMA.. Caso estivéssemos interessados na soma dos segundo, terceiro,... centésimo elemento, deveríamos 100 escrever ∑ i=2 Propriedades do Somatório: 1º) Se cada elemento da série é multiplicado por uma constante, os elementos podem ser somados e o resultado multiplicado pela constante. n n i =1 i =1 ∑ c.xi = c. ∑ xi 2º) A soma de uma constante sobre “n” termos é igual a “n” vezes a constante. n ∑ c = n.c i =1 3º) O somatório da soma (ou diferença) é igual à soma (ou diferença) dos somatórios individuais das variáveis. n n n i =1 i =1 i =1 ∑ (xi ± yi ) = ∑ xi ± ∑ yi 4º) O somatório múltiplo (duplo) de um produto é igual ao produto dos somatórios tomados separadamente. n m ∑ ∑ xi y j = ∑ xi ⋅ ∑ y j i =1 j =1 i =1 j =1 n m Observações Importantes: 1º) Quando não houver possibilidades de dúvidas, poderemos eliminar os índices. Dessa forma: n ∑ xi = ∑ x n ; i =1 ∑ xi2 = ∑ x 2 i =1 2º) O somatório dos quadrados é diferente do quadrado do somatório. ∑ x 2 ≠ (∑ x )2 3º) O somatório dos produtos é diferente do produto de dois somatórios. ∑ xy ≠ ∑ x ⋅ ∑ y 4º) Sempre que houver operações indicadas em frente do somatório, deveremos desenvolve-las, para em seguida aplicarmos as propriedades. ∑ ( x + y )2 = ∑ x 2 + 2 xy + y 2 = ∑ x 2 + 2∑ xy + ∑ y 2 n 5º) O número k de parcelas ou termos do somatório k = n − a +1 ∑ é dado pela seguinte expressão: i=a Somatório Duplo: É frequente na representação dos dados estatísticos, o uso de tabelas de dupla entrada, onde os valores são expressos em função de duas variáveis. Uma variável linha e uma variável coluna. Poderíamos representar numa tabela de dupla entrada: estado civil X sexo; faixas etárias X faixas de rendas; escolaridade X departamentos, etc... A indicação da soma dos elementos de tabelas de dupla entrada pode ser feita pelo somatório duplo. Seja x ij um elemento genérico, sujeito à i-ésima linha e à j-ésima coluna da tabela: J 1 2 3 ...K X11 X21 X31 . . . XL1 X12 X22 X32 . . . XL2 X13 X23 X33 . . . XL3 X1k X2k X3k . . . XLK I 1 2 3 . . . L Assim teremos: a) X11 + X12 + ... + X1k + X 21 + X 22 + ... + X lk = 2 2 + ... + X 2 + X 2 + ... + X 2 = b) X + X 33 34 3k 43 c) X 21 + X 22 + X 23 + ... + X 2k = d) X13 + X 23 + ... + X L3 = lk L K ∑ ∑ x ij i =1 j =1 L K ∑∑ i =3 j =3 2 x ij K ∑ x2 j j =1 L ∑ xi3 i =1 Exemplo: X ij representa o elemento sujeito à i-ésima linha e à j-ésima coluna da tabela abaixo: j 1 2 3 4 5 2 1 -2 1 2 0 0 4 1 -2 3 i 1 2 3 Pede-se calcular: 3 4 a) ∑ ∑ x ij = 5 + (-2) + 0 + 1 + 2 +...+ 3 =15 i =1 j =1 4 b) ∑ x3 j = 1 + 2 + 4 + 3 = 10 j =1 3 4 c) ∑ ∑ x 3 = 0 3 + (− 2 )3 + 4 3 + 33 = 83 ij i = 2 j =3 FASES DO MÉTODO ESTATÍSTICO COMENTÁRIO: - Quando pretendemos um estudo estatístico completo, recorremos a diversas etapas ou operações que são chamadas Fases do trabalho estatístico as quais descreveremos: As Fases principais são: - Definição do Problema Planejamento Coleta dos Dados Apuração dos Dados Apresentação dos Dados Análise e Interpretação de Dados Definição do Problema: Consiste na formulação correta do problema a ser estudado, saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. Planejamento: Consiste em determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. É nessa fase que será escolhido o tipo de levantamento a ser utilizado, onde temos dois tipos de levantamento: 1.- Levantamento censitário, quando a contagem for completa, abrangendo todo o universo. 2.- Levantamento por amostragem, quando a contagem for parcial. Temos outros elementos importantes que não devem ser esquecidos dentre eles destacamos: - cronograma das atividades, onde fixamos os prazos para as várias fases; - custos envolvidos; - exame das informações disponíveis; - delineamento da amostra, - forma como serão escolhidos os dados. Coleta dos Dados: Refere-se à obtenção, reunião e registro sistemático de dados, com um objetivo determinado. Lembramos que é possível, pois, distinguir dois tipos de fontes externas, as quais darão origem a duas espécies de dados: - Dados Primários: São aqueles publicados ou comunicados pela própria pessoa ou organização que os haja recolhido, exemplos Censo Demográficos. - Dados Secundários: São aqueles publicados ou comunicados por outra organização, exemplo Publicações Estatísticas extraídas de várias fontes e relacionadas com diversos setores industriais através de determinado jornal. Recomendamos trabalhar com fontes primárias, por várias razões: 1- Uma fonte primária oferece, em geral, informações mais detalhadas do que uma fonte secundária; 2- É mais provável que as definições de termos e de unidades figurem somente nas fontes primárias; 3- O uso da fonte secundária traz o risco adicional de erros de transcrição; 4- Uma fonte primária poderá vir acompanhada de cópias dos impressos utilizados para coletar as informações, juntamente com o procedimento adotado na pesquisa, a metodologia seguida e o tipo e tamanho da amostra. Podemos também realizar a Coleta de Dados de duas maneiras: Coleta Direta e Indireta. - Coleta Direta: É aquela obtida diretamente da fonte, é o caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. Existem três tipos de Coleta Direta: 1- Coleta Contínua, 2- Coleta Periódica, 3- Coleta Ocasional Coleta Contínua: É aquela obtida ininterruptamente, automaticamente e na vigência de um determinado período, exemplo: registro de nascimento, casamento. Coleta Periódica: É aquela obtida em períodos curtos, determinados, de tempos em tempos, exemplo: recenseamento demográfico, realizado a cada dez anos Coleta Ocasional: É aquela obtida esporadicamente, atendendo a uma conjuntura qualquer ou a uma emergência, exemplo: coleta de casos fatais em um surto epidêmico. - Coleta Indireta: É obtida a partir dos elementos conseguidos pela coleta direta, é feita, portanto, por deduções e suposições, podendo ser realizada: 1 – Por Analogia 2 – Por Proporcionalização 3 – Por Indícios 4 – Por Avaliação Por Analogia: É aquela quando o conhecimento de um fenômeno é induzido a partir de outro que com ele guarda relações de casualidade; Por Proporcionalização: É aquela quando o conhecimento de um fato se induz das condições quantitativas de uma parte dele; Por Indícios: É aquela que se dá quando são escolhidos fenômenos sintomáticos para discutir um aspecto geral da vida social; Por Avaliação: É aquela que ocorre quando, através de informações fidedignas ou estimativas cadastrais, se presume o estado quantitativo de um fenômeno. Apuração dos Dados: É um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada, tornando impossível à tarefa de apreender todo o seu significado pela simples leitura. Dependendo das necessidades e dos recursos disponíveis há várias formas de se fazer a apuração: Manual, Mecânica, Eletromecânica ou Eletrônica. Apresentação dos Dados: A apresentação ou exposição dos dados observados pode ser feita de duas formas, onde não se excluem mutuamente: 1 – Apresentação Tabular: Que é uma apresentação numérica dos dados 2 – Apresentação Gráfica: Que é uma apresentação geométrica dos dados numéricos. Análise e Interpretação dos Dados: Nesta fase do trabalho o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. APRESENTAÇÃO DAS INFORMAÇÕES APRESENTAÇÃO TABULAR: Um dos métodos usados para a apresentação de dados estatísticos é aquele que consegue expor os resultados sobre determinado assunto num só local, sinteticamente, de tal modo que tenhamos uma visão mais globalizada daquilo que vamos analisar. Denominamos esse método de Apresentação Tabular. Apresentação Tabular dos dados estatísticos se faz mediante tabelas (ou quadros), resultantes da disposição dos respectivos dados em linhas e colunas distribuídos de modo ordenado, segundo regras práticas adotadas pelos diversos sistemas estatísticos. No Brasil estas regras foram fixadas pelo Conselho Nacional de Estatística. Definições: Definimos tabela como sendo a “disposição escrita que se obtém referindo-se uma coleção de dados numéricos a uma determinada ordem de classificação”. Uma tabela pode ser simples ou de dupla entrada. Tabela Estatística Simples é “aquela composta de uma coluna matriz, também chamada coluna indicadora, onde inscritos os valores ou modalidades da ordem de classificação e da coluna em que aparecem os valores que representam as ocorrências ou as intensidades do fenômeno em casa”. Tabela de dupla entrada é aquela “própria à apresentação das distribuições a dois atributos, qualitativos ou quantitativos, em que existem duas ordens de classificação: uma horizontal e outra em coluna indicadora; nos cruzamentos formados pelas linhas com as colunas encontra-se a frequência dos indivíduos que apresentam conjuntamente as alternativas correspondentes à linha e à coluna que sobre ela se cruzam”. Exemplo: a tabulação simultânea de um conjunto de pessoas segundo seus pesos e suas estaturas. As tabelas estatísticas se compõem de elementos essenciais e elementos complementares. Elementos Essenciais: Os elementos essenciais de uma tabela são: título, corpo, cabeçalho, e coluna indicadora. Título – é a indicação que precede a tabela e que contém, a designação do fato observado, o local e a época em que foi registrado. Corpo – é o conjunto de colunas e linhas que contém, respectivamente, em ordem vertical e horizontal, as informações sobre o fato observado. Cabeçalho – é a parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora – é a parte da tabela que especifica o conteúdo das linhas. Elementos Complementares Os elementos complementares de uma tabela estatística são: fonte, notas, e chamadas, todos eles se situando, de preferência, no rodapé da tabela. Fonte – é a indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração. Notas – são informações de natureza gerais, destinadas a conceituar ou esclarecer o conteúdo das tabelas ou a indicar a metodologia adotada no levantamento ou na elaboração dos dados. Chamadas – são informações de natureza específicas sobre determinada parte da tabela, destinadas a conceituar ou a esclarecer dados. As chamadas são indicadas no corpo da tabela em algarismos arábicos, entre parênteses, à esquerda das casas e à direita da coluna indicadora. A numeração das chamadas na tabela será sucessiva, de cima para baixo, e da esquerda para a direita. A distribuição das chamadas no rodapé da tabela obedecerá à ordem de sua sucessão na tabela, separando-se uma das outras por um ponto. Sinais Convencionais a) – (traço horizontal), quando o valor numérico é nulo, quanto ao resultado do inquérito ou em casos em que o espaço tiver que ser deixado em branco, pela natureza das coisas ou pela maneira como a tabela é apresentada; b) ... (três pontos), quando não se dispõe dos dados; c) ? (ponto de interrogação), quando há dúvida quanto à exatidão do valor numérico; d) § (parágrafo), quando o dado retifica informação anteriormente publicada; e) 0; 0,0; 0,00 (zero), quando o valor numérico é muito pequeno para ser expresso pela unidade utilizada. Se os valores numéricos são expressos em números decimais, acrescentar-se-á à parte decimal um número correspondente de zeros; f) X (letra X), quando o dado for omitido a fim de evitar individualização de informações. Apresentação das Tabelas Quando apresentarmos uma tabela estatística, deveremos levar em consideração os seguintes pontos: a) Nenhuma casa deve ficar em branco, apresentando sempre um número ou sinal convencional; b) Evitar-se-á apresentação de tabelas em que a maior parte das casas indique a inexistência do fenômeno, a ausência de informações e dados sujeitos a retificação; c) As tabelas serão fechadas, no alto e embaixo, por traços horizontais, fortes, preferencialmente; d) As tabelas não serão fechadas, à direita e à esquerda, por traços verticais; será facultativo o emprego de traços verticais para separação das colunas no corpo da tabela, embora seja mais usual o seu uso; e) Nas tabelas que ocupam diversas páginas, as “chamadas” devem ser inseridas no rodapé das páginas em que estiverem indicadas; a “fonte” e as “notas” figurarão no fim da tabela; f) A soma dos dados numéricos de uma linha ou coluna será indicada destacadamente pela palavra “total”, exceto quando se referir a uma área geográfica, caso em que receberá o nome do conjunto da mesma; g) É facultativo que o total preceda ou suceda as parcelas; em qualquer dos casos, o modo de apresentação deve ser uniforme; a soma de totais parciais será indicada pela expressão “total geral”; h) Quando os dados se referirem a uma série de anos civis consecutivos, indicar-se-ão três algarismo, no caso de variar o século, e dois em caso contrário, separados por um hífen: 1890 – 960; 1960 – 67; i) Quando os dados se referirem a uma série de anos civis consecutivos, indicar-se-ão ambos em algarismo completos, separados por hífen: 1950 – 1967; j) Quando os dados se referirem a um período de doze meses diferentes do ano civil, indicar-se-ão o primeiro e a parte variável do segundo, separados por uma barra inclinada: 1966 / 67; k) A indicação dos meses poderá ser abreviada pelas suas três primeiras letras. SÉRIES ESTATÍSTICAS: Denominamos Série Estatística ao conjunto de números, associados a um fenômeno expressando quantidades absolutas ou grandezas, disposto em correspondência com um critério de modalidade. Segundo esse critério podemos ter: a) b) c) d) e) Séries Cronológicas Séries Geográficas Séries Específicas Séries Conjugadas Distribuição de Frequência Séries Cronológicas Também denominadas temporais, têm como critério classificado a característica de o tempo ser variável, enquanto o local e o fato permanecem fixos. Evolução da demanda de vestibulandos para o 3º grau – Brasil – 1995 – 99 Anos Inscritos 1995 1.250.537 1996 1.559.094 1997 1.803.567 1998 1.735.457 1999 1.989.249 Fonte: Ministério da Educação Séries Geográficas Também chamadas de localização, onde o local é a variável, enquanto que o tempo e o fato permanecem constantes. Número de emissoras de rádio FM’s no Rio Grande do Norte – 1999 Cidades Quantidades Natal 15 Mossoró 10 Caicó 05 Parnamirim 02 Fonte: Dentel Séries Específicas Séries específicas, ou de qualidade, apresentam o local e o tempo constantes, enquanto que o fato é que varia. Tais séries se apresentam de duas maneiras: quando o fato se apresenta como um todo e quando o fato se apresenta disposto em classes ou categorias, dando nesse caso, origem à chamada distribuição de frequências, que, mercê de sua importância, será analisada mais à frente de forma pormenorizada. Matrículas no ensino de 3º grau em Mossoró na Uern - 1999 Cursos Matrículas Administração 50 C. Contábeis 45 História 35 Direito 60 Fonte: Dare Séries Conjugadas Também chamadas mistas, quando existe a combinação entre as séries cronológicas, geográficas e específicas, visto que podem variar o fato, o lugar e o tempo. Agências do Banco do Brasil instaladas em algumas cidades do Rio G. do Norte, 1992 – 1996 Cidades 1992 1996 Natal 03 05 Mossoró 01 02 Parnamirim 01 01 Caicó 01 01 Currais Novos 01 01 Santa Cruz 01 01 Umarizal 01 01 Fonte: Anuário do Banco Central Distribuição de Frequência Também chamadas distribuição por frequência ou derivadas, são séries que têm fixos o fenômeno, o tempo e o local, sendo o fenômeno apresentado através de gradações da variável. As gradações do fenômeno estudado são obtidas através de classes de frequências, cujo método de obtenção será ensinado mais adiante. Estrutura Etária da População no Rio G. do Norte – 1999 Idades (anos) % 0 Ⱶ 10 29 10 Ⱶ 20 25 20 Ⱶ 30 21 30 Ⱶ 40 10 40 Ⱶ 50 10 50 Ⱶ 60 3 60 Ⱶ 70 1 70 Ⱶ 80 1 Fonte: Fundação IBGE APRESENTAÇÃO GRÁFICA: Chamamos de apresentação gráfica de um fenômeno o processo de obtenção de uma figura geométrica representativa desse mesmo fenômeno em toda sua extensão. A figura geométrica assim obtida denomina-se gráfico ou diagrama do fenômeno. O gráfico constitui, atualmente, um instrumento essencial para o economista, o administrador, o educador, o biólogo, o químico, o engenheiro, o sociólogo, bem como para os profissionais de quase todos os demais ramos de atividades. Classificação dos Gráficos a) b) c) d) Gráficos Lineares ou de Curvas Gráficos em Barras ou em Colunas Setogramas Outros Tipos Gráficos Lineares ou de Curvas O diagrama linear, provavelmente, é o gráfico empregado com maior frequência. Representa alterações quantitativas sob a forma de uma linha. As flutuações da linha proporcionam rápida percepção visual da tendência dos dados ou da sua mutação em certo período de tempo. Exemplo: Construir um gráfico linear baseado nos dados da tabela a seguir. Evolução do preço médio unitário dos PCs no Brasil 1994 – 000 Anos Preços em reais Med.Graf.=Preço/Med.real 1994 1415 2,9 1995 1477 3,1 1996 1580 3,3 1997 1850 3,9 1998 1680 3,5 1999 1350 2,8 2000 1290 2,6 Fonte: Data Folha Construção: São 07 anos a representar, ou seja, 06 intervalos de tempo, neste período. Cada intervalo pode valer 1cm, 2cm, 3cm etc., dependendo das dimensões do papel; escolhemos 1cm, então: Largura do Gráfico = 6 x 1 = 6cm Altura Máxima = 4,8 Altura Mínima = 3,4 Maior Preço em reais = 1850 ÷ 4,8 ≅ 385 e 1850 ÷ 3,4 ≅ 544 A passagem da medida real para a medida gráfica é feita através de uma escala que, como vimos, deve figurar no intervalo de 385 a 544 PCs por centímetro. Escolhemos 1cm correspondente a 480 PCs. Gráficos em Barras ou em Colunas O gráfico em barras confronta quantidades por meio de barras cuja largura é constante, enquanto a altura varia em função da magnitude dos valores. Os retângulos podem apresentar-se horizontal ou verticalmente, devendo-se preferir a última posição quando está envolvido o elemento tempo. Exemplo: Construir um gráfico em barras baseado nos dados da tabela a seguir: Matricula Inicial no Ensino do 2º grau no Rio G. do Norte –1990 – 94 Anos Matrículas (1000) Med.Graf.=Matric/Med.real 1990 1003 6,7 1991 1119 7,5 1992 1300 8,7 1993 1480 9,9 1994 1682 11,2 Fonte: Secretaria de Educação Construção: Devemos considerar 05 colunas e 06 espaços (as colunas são separadas da moldura do gráfico e entre si, por espaços). Cada coluna pode ter para largura 1cm, 2cm 3cm, etc..., dependendo das dimensões do papel, os espaços entre colunas devem ser no máximo 2/3 da largura da coluna. Largura do Gráfico = 5 colunas à 2cm + 6 espaços à 1cm = 16cm Altura Mínima = 9,1 Altura Máxima = 12,8 Maior Quantidade de Alunos Matriculados =1682 ÷ 9,1 ≅ 185 e 1682 ÷ 12,8 ≅ 131 A passagem da medida real para a medida gráfica é feita através de uma escala que, como vimos, deve figurar no intervalo de 131 a 185 matriculas por centímetros. Escolhemos 1cm correspondentes 150.000 matriculas. Setogramas É um circulo cuja área se divide em segmentos representativos das partes proporcionais de um todo. O setogramas constitui um tipo de gráfico de componentes e presta-se para confrontar as partes integrantes de um total. Exemplo: Construir um gráfico de setores com os dados da tabela abaixo. Produção Agrícola no Vale do Açu – 2000 Discriminação Tonelada % º Banana 150 60 216 Melão 57 22,8 82,08 Uva 25 10 36 Abacaxi 18 7,2 25,92 Total 250 100 360 Fonte: Emater Construção: Verificamos, ao observar a tabela, que a soma da produção em toneladas do nosso exemplo é de 250, total que corresponderá a 100%, no gráfico de setores. Calculamos a percentagem correspondente a cada produção, desta maneira: Banana... se 250 ton → 100% 150 ton → x , encontramos x = 60% Fazemos o mesmo com as outras produções. Calculamos também os graus dos ângulos correspondentes às porcentagens de cada produto, sabendo-se que o total (100%) equivale (360º), logo teremos: se 100% → 360º 60% → x , encontramos x = 216º Fazemos o mesmo com as outras produções. DISTRIBUIÇÃO DE FREQÜÊNCIA Definição: É uma tabela na qual os possíveis valores de uma variável se encontram agrupados em classes de valores, registrando-se o número de dados observados em cada uma delas. Desta forma, podemos dividir as distribuições de frequências em dois tipos: Distribuição de Frequência – Variável Discreta É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos (variável discreta) da série e na segunda coluna colocamos os valores das frequências simples correspondentes. Geralmente esta variável assume valores inteiros. Exemplos: 1. 2. 3. 4. número de alunos da classe X; número de acidentes na Av. Presidente Dutra; quantidade de livros da biblioteca da escola; peças defeituosas num lote recebido. Exemplo de construção de uma variável discreta: A sequência abaixo representa a observação do número de acidentes por dia, em uma rodovia, durante 25 dias. X: 0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 3, 2, 2, 0, 1, 2, 1, 1, 0, 0. Os valores distintos da sequência são: 0, 1, 2, 3. As frequências simples respectivas são: 10, 7, 6, 2. Portanto, a variável discreta representativa desta sequência é: xi 0 1 2 3 total fi 10 7 6 2 25 Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno. Distribuição de Frequência – Variável Continua É quando a variável assume valores em intervalos da reta real, não é possível enumerar todos os valores. Geralmente esta variável provém de medições. Exemplos: 1. 2. 3. 4. peso dos alunos de uma classe; lucro das empresas no ramo metalúrgico; tempo de duração de um transistor; nota de aproveitamento dos alunos. Exemplo de construção da variável contínua: Suponha que a observação das notas de 30 alunos em uma prova nos conduzisse aos seguintes valores: X: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,5; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6. Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a série com a seguinte apresentação: Classe 1 2 3 4 Notas 2Ⱶ4 4Ⱶ6 6Ⱶ8 8 Ⱶ 10 fi 4 12 10 4 (1) Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande. Para explicar a colocação das notas dos alunos, segundo uma distribuição de acordo com a tabela (1), necessitamos de algumas definições: 1 – Dados Brutos: São aqueles que não foram numericamente organizados, como é o caso das notas de 30 alunos. 2 – Rol: É o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente. 3 – Amplitude Total: (At ) É a diferença entre o maior e o menor elemento de uma sequência. At = Xmáx - Xmín Exemplo: Na sequência que deu origem à tabela (1), Xmáx = 9,5 e Xmín = 2, portanto At = 7,5. 4 – Frequência Absoluta ou Simples: ( f i ) É o número de acontecimentos verificados nos intervalos que se observa. Na tabela (1) na segunda classe 12 notas verificada no intervalo de 4 | 6. 5 – Limites de Classe: São os números extremos de cada classe. Exemplo: Se considerarmos a classe 3, temos como limite inferior li = 6 e limite superior Ls= 8. 6 – Ponto Médio de Classe: x i Obtém-se através da semi-soma dos limites de determinada classe x i = l i + Ls 2 7 – Intervalo de Classe: ( h i ) Também denominado amplitude ou oscilação de classe, é cada um dos subintervalos estipulados. Obtém-se em uma tabela, pela diferença entre os limites da classe ou dois limites consecutivos inferiores ou superiores ou também entre dois pontos médios consecutivos, a saber: hi = L − l = l −l =L − Ls = x −x s i i +1 i s+1 Exemplo: Calcular o intervalo da classe 2 da tabela (1): hi = 6 – 4 = 8 – 6 = 7 – 5 = 2 i +1 i 8 – Classe de Maior Frequência (modal) e Classe de Menor Frequência: Denominamos classe de maior frequência ou modal àquela em que se verifica o maior número de frequências, e consequentemente, de menor frequência àquela em que se verifica o menor número de frequências. 9 – Frequência Acumulada Crescente: Fac i Chama-se frequência acumulada de uma classe à soma da frequência absoluta da classe com as das classes anteriores. Exemplo: A frequência acumulada da 3 classe na tabela (1) será: Fac3 = f1+f2+f3 = 4+12+10 = 26 10 –Frequência Acumulada Decrescente: Fad i Chama-se frequência acumulada decrescente de uma classe à soma das frequências das classes subsequentes. Exemplo: A frequência acumulada decrescente da 3 classe na tabela (1) será: Fad3 = f3+f4 = 10+4 = 14 11 – Número de Classe: k A questão do número de classes é, teoricamente controvertida e diversos autores apresentam soluções diferentes. Embora existam fórmulas apropriadas, em geral, não se conhecem regras precisas que levem a uma decisão final, a partir da distribuição dos dados. um procedimento geralmente aceito é adotar um número mínimo de 5 classes e um máximo de 20 classes. Menos que 5 classes pode ocultar detalhes importantes, assim como mais que 20 pode tornar a apresentação demasiadamente detalhada. Determinaremos o intervalo de classe através do seguinte critério: Para k1 = 5 → h1 = At A ; Para k2 = 20 → h2 = t k1 k2 Qualquer valor de “ h i ” situado entre os limites h1 e h2 satisfaz plenamente os objetivos. Preferentemente, escolhemos o valor médio de“ h i ”. h1 + h 2 2 Outros critérios: k = n hi = Regra de Sturges: k = 1 + 3,3 log n 12 – Frequência Relativa de Classe: f r i Corresponde ao quociente entre a frequência absoluta da classe e o total de elementos. n fi fr = f i N ; onde N = ∑ i i =1 13 – Frequência Acumulada Relativa de Classe: Facr i É a divisão da frequência acumulada desta classe pelo número total de elementos da série: Facri = Faci N n ; onde N = ∑ fi i =1 Critérios Gerais de Elaboração de uma Distribuição 1. 2. 3. 4. 5. 6. 7. 8. 9. Tomar a lista de dados brutos e transforma-la em Rol; Encontrar a amplitude total da sequência; Escolher o número desejado de classe (k) Fixar a amplitude do intervalo de classe (hi) Estabelecer o limite inferior da 1ª classe - Limite inferior 1ª classe = menor dado – (hi/2) - Limite inferior 1ª classe = menor dado - Limite inferior 1ª classe = inteiro inferior ao menor dado Construir as diversas classes, a partir do limite inferior 1ª classe; Fazer a contagem do número de observações em cada classe (f i ) Encontrar os pontos médios de classe; Determinar os outros tipos de frequências de classe Representação Gráfica das Distribuições de frequência Para variáveis quantitativas discretas, a representação gráfica será, normalmente feita por meio de um diagrama de barras. Como se trata de uma variável quantitativa (expressa em valores numéricos), representamos tais valores no eixo das abscissas e as respectivas frequências no eixo das ordenadas, o que facilita a descrição. Quando as variáveis são quantitativas contínuas, a representação gráfica da distribuição de frequência é feita através dos histogramas de frequência e polígonos de frequência. Histograma de Frequência É um gráfico formado por um conjunto de retângulos justaposto assentados sobre um eixo horizontal, tendo como bases os diversos intervalos de classe. A área de cada retângulo deve ser proporcional à frequência da classe que ele representa. Polígono de Frequência É o gráfico de linha obtido pela localização das frequências, a partir dos pontos médios das diversas classes. Podemos construir o polígono de frequência unindo por segmentos de reta, os pontos médios dos topos dos retângulos do histograma. O polígono é fechado nos pontos médios das classes anteriores e posteriores às extremas. MEDIDAS DE TENDÊNCIA CENTRAL Def. – Refere-se ao fato de que, geralmente, numa série de dados numéricos observa-se um valor central, onde a maioria dos dados observados se agrupa em torno dele. Principais Medidas de Tendência Central: 1. 2. 3. 4. 5. Média Aritmética Simples e Ponderada; Média Geométrica Simples e Ponderada; Média Harmônica Simples e Ponderada; Mediana para Dados Discretos e Contínuos; Moda para Dados Discretos e Contínuos. Média Aritmética Simples Para uma sequência numérica X : x1 , x 2 ,..., x n , a média simples, que designaremos por X é definida por: X= ∑ xi n Exemplo: Se X: 3, 6, 4, 0, 9, então X = 3+6+4+0+9 ⇒ X = 4,4 5 Média Aritmética Ponderada Para uma sequência numérica X : x1 , x 2 ,..., x n afetadas de pesos (frequências) p1 , p 2 ,..., p n , respectivamente, a média aritmética ponderada, que designaremos por: X= ∑ xipi ∑ pi Exemplo: Se X: 6, 8, 4, 10, com pesos 3, 4, 5, 6 respectivamente, então: X= ∑ x i p i = 6 × 3 + 8 × 4 + 4 × 5 + 10 × 6 ≅ 7,2 3+4+5+6 ∑ pi Média Geométrica Simples Para uma sequência numérica X : x1 , x 2 ,..., x n , a média geométrica simples, que designaremos por X g , é definida por: n X g = n x1 .x 2 ...x n = n Π x i i =1 Exemplo: Se X: 3, 7, 8, 2, então: X g = 4 3.7.8.2 = 4 336 ≅ 4,28 Média Geométrica Ponderada Para uma sequência numérica X : x1 , x 2 ,..., x n , afetadas de pesos (frequências) p1 , p 2 ,..., p n , respectivamente, a média geométrica ponderada que designaremos por X g é definida por: n p n = ∑p X g = ∑ p x p1 .x p 2 ...x p Π xi i n 1 2 i =1 Exemplo: Se X: 3, 5, 9, 10 com pesos (frequências), 3, 2, 4, 1, respectivamente, então: Xg = 10 3 2 4 1 10 3 .5 .9 .10 = 44286750 ≅ 5,82 Média Harmônica Simples Para uma sequência numérica de elementos não nulos X : x1 , x 2 ,..., x n , a média harmônica simples, que designaremos por X h , é definida por: Xh = n 1 1 1 + + ... + x1 x 2 xn = n 1 ∑x i Podemos notar que a média harmônica é o inverso da média aritmética dos inversos dos elementos. Exemplo: Se X: 7, 9, 6, 5, então: Xh = 4 1 1 1 1 + + + 7 9 6 5 = 4 630x4 2520 = = ≅ 6,45 90 + 70 + 105 + 126 391 391 630 Média Harmônica Ponderada Para uma sequência numérica de elementos não nulos X : x1 , x 2 ,..., x n , afetados de pesos (frequências) p1 , p 2 ,..., p n , respectivamente, a média harmônica ponderada que designaremos por X h é definida por: Xh = ∑ pi p1 p 2 p + + ... + n x1 x 2 xn = ∑ pi p ∑ xi i Exemplo: Se X: 5, 7, 9, 3, com pesos 2, 3, 5, 1, respectivamente, então: Xh = 11 2 3 5 1 + + + 5 7 9 3 = 11 11x315 3465 = = ≅ 6,4 126 + 135 + 175 + 105 541 541 315 Observações: 1. A média harmônica é particularmente recomendada para séries de valores que são inversamente proporcionais, como para o cálculo de velocidade média, tempo médio de escoamento de estoques, custo médio de bens comprados com uma quantia fixa etc... 2. A média geométrica só é indicada para representar uma série de valores aproximadamente em progressão geométrica. 3. Os casos anteriores não são muito frequentes nas aplicações. Vamos restringir o desenvolvimento de médias ao caso de média aritmética, que é a média mais utilizada nas aplicações. 4. Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a média aritmética ponderada, considerando as frequências simples das classes como sendo as ponderações dos pontos médios destas classes. Mediana É um valor real que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana cujo símbolo é M d é um valor que ocupa a posição central em uma série. Mediana para Dados Não-Agrupados Cálculo da mediana será: A) Se n for impar: (n é o número de elementos) ο n +1 n +1 A mediana será o termo de ordem ⇒ Md = 2 2 o Exemplo: Dada a sequência de valores qual a mediana: 2, 5, 6, 9, 10, 13, 15, 16, 18. Como n = 9 ⇒ 9+1 = 5 ο , logo M d = 10 2 B) Se n for par: (n é o número de elementos) ο n n + + 1 ο ο n n 2 2 A mediana será o termo de ordem e + 1 ⇒ M d = 2 2 2 ο Exemplo: Dada a sequência de valores qual a mediana: 2, 6, 7, 10, 12, 13, 18, 21. Como n = 8 ⇒ 4 ο + 5 ο 10 + 12 22 8 8 = = = 11 = 4ο e + 1 = 5 ο , logo M d = 2 2 2 2 2 Mediana para Dados Agrupados A) Sem intervalo de classe: Devemos identificar a frequência acumulada que é imediatamente superior ao elemento mediano ∑ fi 2 (também conhecido de classe mediana). A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Exemplo: Determinar a mediana da série: x i 2 5 8 11 13 fi Fac 1 5 9 10 8 i 1 6 15 25 33 ∑ fi 2 33 = ≅ 16,5 2 A maior frequência acumulada imediatamente superior a este valor é 25, logo a mediana é 11 Observação: Quando a classe mediana tiver o mesmo valor da frequência acumulada a mediana será a semisoma do valor da variável correspondente a essa frequência acumulada e a seguinte. Exemplo: Determinar a mediana da série: x i 12 14 15 16 17 Como o elemento mediano é igual a frequência 2 2 1 2 1 fi 8 fi acumulada, logo a mediana será = =4 14 + 15 29 2 2 Fac 2 4 5 7 8 ∑ i B) Com intervalo de classe: Devemos ter a seguinte sequência: A) determinamos as frequências acumuladas; Md = 2 = 2 ≅ 14,5 ∑ fi 2 A) calculamos (classe mediana) B) verificamos a frequência acumulada imediatamente superior a classe mediana, em seguida utilizamos a seguinte expressão para o cálculo da mediana: Md = li + ∑ fi − F ant 2 fi ⋅ h i , onde: l i ⇒ ∑ fi 2 Fant limite inferior da classe mediana; ⇒ ⇒ ⇒ fi hi classe mediana; frequência acumulada da classe anterior à classe mediana; frequência simples da classe mediana; ⇒ amplitude do intervalo da classe mediana. Exemplo: Determine a estatura mediana na seguinte tabela: Estaturas (cm) fi Fac ∑ fi 2 = i 150 Ⱶ154 4 154 Ⱶ 158 9 158 Ⱶ 162 11 162 Ⱶ 166 8 166 Ⱶ 170 5 170 Ⱶ 174 3 4 13 24 32 37 40 40 = 20 ; l i = 158 2 ; Fant = 13; h i = 4; f i =11, logo substituindo estes valores na expressão para o cálculo da mediana para dados agrupados com intervalo de classe temos: M d = 158 + 20 − 13 28 ⋅ 4 = 158 + = 158 + 2,55 ≅ 160,55 cm 11 11 Observação: Quando a classe mediana tiver o mesmo valor da frequência acumulada, a mediana será o limite superior da classe correspondente. Exemplo: Dada a seguinte tabela determine a mediana: Classe 0 Ⱶ 10 1 fi Fac i 1 10 Ⱶ20 3 4 20 Ⱶ 30 9 13 30 Ⱶ 40 7 20 40 Ⱶ 50 4 24 50 Ⱶ 60 2 ∑ fi 26 2 = 26 = 13 2 Logo M d = 30 Moda Denominamos moda cujo símbolo M o , o valor que ocorre com maior frequência em uma série de valores Moda para Dados Não-Agrupados Reconhecemos a moda de acordo com a definição é aquele valor que mais se repete em uma série. Exemplo: Seja a série: 7, 8, 11, 10, 15, 12, 11, 13, 11, 9. Podemos verificar que a série tem moda igual a 11 ⇒ M o = 11 Tipos de séries Modais: Amodal: é a série que não apresenta valores repetidos Exemplo: 1, 3, 8, 5, 10, 16, 15. Bimodal: é a série que apresenta dois ou mais valores modais Exemplo: 3, 2, 4, 4, 5, 4, 6, 7, 8,7, 9, 7. Vemos que tem modas 4 e 7 logo ⇒ M o = 4 e M o = 7 Moda para Dados Agrupados A) Sem intervalo de classe: Quando agrupados os valores de uma série é possível determinarmos a moda que será o valor da variável de maior frequência. Exemplo: Consideremos a tabela abaixo onde temos o número de famílias com filhos masculinos. A família que apresenta com maior frequência é a que tem 3 filhos logo a M o = 3. Nº de meninos 0 1 2 3 4 2 6 10 12 4 fi B) Com intervalo de classe: A classe que apresenta a maior frequência é denominada classe modal, em dados agrupados com intervalo de classe, a moda é o valor dominante que está compreendido entre os limites da classe modal. Para determinação da moda para dados agrupados com intervalo de classe Czuber apresentou a seguinte expressão: Mo = li + f máx − f ant ⋅ hi 2 ⋅ f máx − (f ant + f post ) Onde: li ⇒ limite inferior da classe modal f máx ⇒ frequência simples máxima f ant ⇒ frequência simples imediatamente anterior a frequência máxima f post ⇒ frequência simples imediatamente posterior a frequência máxima hi ⇒ amplitude da classe modal Exemplo: Dada a tabela de distribuição abaixo determinar a moda. Estaturas (cm) 150 Ⱶ 154 4 fi 154 Ⱶ 158 9 158 Ⱶ 162 11 162 Ⱶ 166 8 166 Ⱶ 170 5 170 Ⱶ 174 3 Na tabela podemos verificar que a classe modal é terceira aplicando na expressão de Czuber temos: l i = 158 ; f máx = 11; f ant = 9; f post = 8; h = 4 M o = 158 + 11 − 9 8 8 ⋅ 4 = 158 + = 158 + = 158 + 1,6 = 159,6cm 2 ⋅ 11 − (9 + 8) 22 − 17 5 Separatrizes Além das medidas de posição que já estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que elas se baseiam em sua posição na série. Essas medidas são: – os quartis, os percentis e os decis, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. Os Quartis (QK) Def. Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Temos, portanto, três quartis: - O primeiro quatril (Q1) que é o valor que está situado de tal modo na série que uma quarta parte (25%) dos dados é menor e as três quartas partes restantes (75%) maiores do que ele; - O segundo quatril (Q2) que é, evidentemente, coincidente com a mediana (Q2 = Md); - O terceiro quatril (Q3), que é o valor situado de tal sorte que as três quartas partes (75%) dos termos são menores e uma quarta parte (25%), maior que ele. Quando os dados são agrupados para determinar os quartis, usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, ∑ fi 2 ∑ fi Q1 = l i + k∑ fi 4 por 4 − Fant fi sendo k o número de ordem do quartil. Assim, temos: ∗ hi 3∑ f i − Fant 4 Q3 = l i + ∗ hi fi Os Percentis (PK) Def. Denominamos percentis o noventa e nove valores que separam uma série em 100 partes iguais. Indicamos: P1, P2, ..., P32, ..., P99 É evidente que: P50 = Md; P25 = Q1 e P75 = Q3 O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula ∑ fi 2 será substituída por k∑ fi sendo k o número de ordem do percentil 100 3∑ f i − Fant 100 P3 = l i + ∗ hi fi Os Decis (DK) Def. Nos decis, a série é dividida em 10 partes iguais (D1, D2,...,D9). MEDIDAS DISPERSÃO OU DE VARIABILIDADE Def. – Servem para verificarmos a representatividade das medidas de posição, pois é muito comum encontrarmos séries que, apesar de terem a mesma média, são compostas de maneira distinta. Exemplo: Consideremos as séries: − ⇒ cuja média é : x = 13 A : 1; 18; 10; 20; 35; 3; 7; 15; 11; 10 − B : 14; 12; 13; 13; 12; 14; 13; 12; 14; 13 ⇒ cuja média é : x = 13 − C : 13; 13; 13; 13; 13; 13; 13; 13; 13; 13 ⇒ cuja média é : x = 13 Verificamos que todas possuem a mesma média 13. A série A, existem muitos elementos bastante diferenciados da média 13. A série B, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da média. A série C, não existe variabilidade de dados. - Medidas de Dispersão mais Empregadas: - Medidas de Dispersão Absolutas: - Amplitude Total ( AT ) - Desvio Médio ( DM ) - Variância ( S2 ) - Desvio Padrão ( S ) - Medidas de Dispersão Relativa: - Coeficiente de Variação ( CV ) - Amplitude Total – Dados Brutos: É a diferença entre o maior e o menor valor da sequência. Exemplo: Considerando a série A do exemplo anterior, temos: Amplitude Total: AT = 35 – 1 = 34 unidades - Amplitude Total – Dados Agrupados Sem Intervalo de Classe: É a diferença entre o último e o primeiro elemento da série. Exemplo: Consideremos a tabela abaixo: 3 1 xi fi 5 4 6 5 7 2 Como o maior valor da série é 7 e o menor valor é 3. A amplitude é AT = 7 – 3 = 4 unidades - Amplitude Total – Dados Agrupados Com Intervalo de Classe: É a diferença entre o ponto médio da última classe e o ponto médio da primeira classe. Exemplo: Classe fi 3 Ⱶ 7 Ⱶ 11 Ⱶ 15 Ⱶ 19 Ⱶ 23 2 8 10 11 4 Ponto médio da última e primeira classe é : x5 = 23 + 19 42 7 + 3 10 = = 21 ; x1 = = = 5 ,logo 2 2 2 2 AT = 21 – 5 = 16 Conclusão: A utilização da Amplitude Total como medida de dispersão é muito limitada, pois, sendo uma medida que depende apenas dos valores extremos, é instável, não sendo afetada pela dispersão dos valores internos. - Desvio Médio (DM) Def. : É baseado na diferença entre cada valor do conjunto de dados e a média do grupo, tomados em módulo. n ∑ xi − x - Desvio Médio – Dados Brutos : DM = i =1 n - Desvio Médio – Dados Agrupados Sem e Com Intervalo de Classe: k ∑ f i . xi − x DM = i =1 k , onde k ∑ fi = n i =1 ∑ fi i =1 - Variância ( S2 ) : É a média aritmética da soma dos quadrados dos desvios tomados em relação à média. 2 n 2 ∑ xi ∑ xi - Variância - Dados Brutos : S2 = i =1 − i =1 n −1 n(n − 1) n - Variância – Dados Agrupados Sem e Com Intervalos de Classe: n 2 ∑ xi . f i x . f ∑ i i i =1 2 − i =1 S = n −1 n(n − 1) n 2 - Desvio Padrão ( S ) : É a raiz quadrada da variância 2 n 2 ∑ xi ∑ xi i =1 − i =1 n −1 n(n − 1) n - Desvio Padrão – Dados Brutos : S = - Desvio Padrão – Dados Agrupados Sem e Com Intervalo de Classe: n ∑ xi . f i ∑ xi . f i i =1 − i =1 n −1 n(n − 1) n S= 2 2 - Coeficiente de Variação ( CV ) : É uma medida de dispersão relativa que expressa o desvio padrão em termos da média, podendo também ser expresso em porcentagem. CV = S ⋅ 100 x ASSIS MORAIS∴ TEORIA ELEMENTAR DA PROBABILIDADE Da Origem às Aplicações: As origens do cálculo de probabilidade remontam ao século XVI e suas aplicações referiam-se sempre a jogos de azar. Os jogadores ricos aplicavam o conhecimento da teoria das probabilidades para planejar estratégias de apostas. Ainda hoje há muitas aplicações envolvendo tais jogos, como as loterias, os cassinos, as corridas de cavalos e os esportes organizados. Com o decorrer do tempo, a utilização das probabilidades ultrapassou o âmbito desses jogos e, atualmente, os governos as empresas e as organizações profissionais incorporam esta teoria em seus processos diários de deliberações. Independente de sua aplicação, a utilização de probabilidade indica que existe um elemento de acaso (ou de incerteza), quanto à ocorrência ou não de um evento futuro. Em muitas situações pode ser impossível afirmar, por antecipação, o que ocorrerá, mas é possível dizer o que pode ocorrer. O estudo das probabilidades é útil porque auxilia a desenvolver estratégias e na tomada de decisões. Conceitos: O ponto central da teoria das probabilidades é quantificar quão provável é a ocorrência de determinado evento. Em geral, é possível determinar ou exprimir a probabilidade de um evento, mediante uma combinação de experiência, julgamento e dados históricos. Exemplos: a) b) c) d) e) f) previsão da procura de um novo produto; previsão de safras agrícolas; previsão de tempo em várias regiões; compra de apólices de seguro; avaliação do impacto de um projeto do governo; aplicação de investidores que depende das chances de lucro. Experimento Aleatório: (E) É todo fenômeno ou ação que geralmente pode ser repetido e cujo resultado é casual ou aleatório. Espaço Amostral: (S) É o conjunto de todos os resultados possíveis de um experimento aleatório. Evento: (A, B, C, D, F,..., R, T,...) É um subconjunto do espaço amostral, ou seja, são alguns resultados do experimento claramente especificados. Exemplos: a) E: Lançar um dado e observar o nº da face voltada para cima. S: {1; 2; 3; 4; 5; 6} Evento A: ocorrer um número par. A = {2; 4; 6} Evento B: ocorrer um número maior que 4. B = {5; 6} Evento C: ocorrer um número primo e par. C = {2} b) E: Lançar duas moedas e observar o resultado: c = (cara) e k = (coroa). S: {(cc ) ; (ck ) ; (kc) ; (kk )} Evento A: ocorrer mais de uma coroa. A = {(kk)} Evento B: ocorrer pelo menos uma cara. B = {(cc); (ck); (kc)} Evento C: ocorrer apenas uma coroa. C = {(ck); (kc)} Tipos de Eventos: A determinação de probabilidade leva em conta a maneira como os vários eventos podem relacionar-se entre si. Essas relações são descritas pelos os seguintes eventos: 1. Mutuamente excludentes (exclusivos) ou disjuntos; 2. Não mutuamente excludentes ou conjuntos; 3. Coletivamente exaustivos; 4. Complementares; 5. Independentes; 6. Dependentes Mutuamente Excludentes ou Disjuntos São aqueles em que a ocorrência de um evento impede ou exclui a ocorrência do outro. Exemplo: a) Lances de uma moeda (cara ou coroa) b) Lances de um dado c) Sexo de um animal (masc. ou femin.) d) Artigos produzidos (bons ou defeit.) Não mutuamente excludentes ou Conjuntos São os eventos que podem ocorrer ao mesmo tempo. A ocorrência de um evento não exclui a ocorrência do outro. Exemplo: a) Sistema Econômico Evento A: inflação. b) Tempo chuvoso Evento A: relâmpago Evento B: recessão Evento B: chuva Eventos Coletivamente Exaustivos É quando ao menos um dos eventos tem de ocorrer durante um dado experimento. Nenhum outro resultado é possível, porque se esgotam todas as possibilidades. Exemplo: a) Jogo de futebol Evento A: ganhar; Evento B: perder; Evento C: empatar b) Loteria esportiva Evento A: coluna 1; Evento B: coluna do meio; Evento C: coluna 2 _ Eventos Complementares ( A ) O complemento de um evento A consiste de todos os resultados possíveis que não fazem parte de A. _ Exemplo: a) Lance de moedas: A = cara ; A = coroa _ b) Inspeção de um lote de peças produzidas: A = peças perfeitas; A = peças defeituosas. Eventos Independentes São aqueles em que a ocorrência de um deles não afeta de maneira alguma a probabilidade de ocorrência do outro evento. Exemplo: a) Dois lances sucessivos de um dado ou de uma moeda. b) Extração de bolas de uma urna, com reposição. Eventos Dependentes São aqueles em que a ocorrência de um evento afeta a probabilidade de ocorrência do outro. Exemplo: a) Extração de bolas de uma urna, sem reposição. Obs: Eventos mutuamente exclusivos são altamente dependentes. Probabilidade a Priori ou Clássica Dada uma experiência aleatória definida num espaço amostral S, a probabilidade de ocorrer em evento E, contido em S, é o quociente entre o número de elementos do evento E e o número de elementos do espaço amostral S. Em outras palavras, é o valor calculado com base em considerações teóricas, dispensando uma experimentação sobre o objeto estudado. É de grande importância como referencial ou termo de comparação. Para um espaço S, a probabilidade de um evento E é dado por: P (E ) = n( E ) n(S ) Exemplo: Suponha-se que desejamos determinar a probabilidade do aparecimento de 1 coroa em uma jogada de uma moeda. Como existe dois resultados igualmente prováveis, a saber, “cara” e “coroa”, e como só há uma maneira de aparecer “coroa”, dizemos que a probabilidade do evento “coroa” na jogada de uma moeda é 1 . Considerando que 2 tal moeda seja “honesta”, ou “não-viciada”. Probabilidade a Posteriori ou Frequencialista Trata-se da probabilidade avaliada, empírica. Ela tem por objetivo estabelecer um modelo adequado à interpretação de certa classe de fenômeno observados (não todos). Portanto, ela depende da amostra considerada: quando maior a amostra (e de melhor qualidade), mais confiável é o valor da probabilidade a posteriori. Com base no conceito de frequência relativa podemos então definir a probabilidade a posteriori para dado evento E: Número de ocorrências de E P(E) = ----------------------------------------------------------- Número total de provas ou ocorrências Exemplo: Se jogarmos uma moeda 1.000 vezes e aparecer “cara” 653 vezes, estimamos a probabilidade de “cara” em 653 1.000 = 0,653 = 65,3% Axiomas da Probabilidade - Para todo evento E do espaço amostral S temos 0 ≤ P(E) ≤ 1, ou seja, a probabilidade está sempre no intervalo fechado 0 e 1. - Para todo evento certo S temos P(S) = 1 - Para um número qualquer de eventos mutuamente excludentes E1, E2, ..., En pertencentes ao espaço amostral S, temos: P(E1 ∪ E2 ∪ E3 ... En) = P(E1) + P(E2) + ... + P(En) Principais Teoremas sobre Probabilidade - O evento impossível possui probabilidade 0 (zero), P(∅) = 0 - Se Ec é o evento complementar de E, então P(Ec) = 1 – P(E) - Para quaisquer eventos A e B, P(A) = P(A ∩ B) + P(A ∩ Bc) - Se A ⊆ B então P(A) ≤ P(B) - Se A e B são dois eventos quaisquer associados a um espaço amostral S, então: P( A ∪ B ) = P(A) + P(B) – P( A ∩ B ) - Se os eventos A e B forem mutuamente exclusivos, isto é, A ∩ B = ∅, o teorema supra é simplificado: P( A ∪ B ) = P(A) + P(B) Probabilidade Condicional Sejam dois eventos A e B associados a um espaço amostral S. A probabilidade de A ocorrer dado que o evento B ocorreu é definida por: P (A B ) = P (A I B ) onde P(B) > 0 P (B ) Portanto, quando calculamos P(A/B), tudo se passa como se o evento B fosse um novo espaço amostral reduzido dentro do qual queremos calcular a probabilidade do evento A. Exemplo: Duas bolas são retiradas de uma urna que contém 2 bolas brancas, 3 bolas pretas e 4 bolas verdes. Qual a probabilidade de que ambas: a) sejam Verdes? b) sejam de mesma cor? ( V )= 4 9 . 3 8 = 16 Resolução: a) P (V ∩ V ) = P (V ). P V b) P ( MC ) = P (B ∩ B ) + P (P ∩ P ) + P (V ∩ V ) = 2 . 1 + 3 . 2 + 4 . 3 9 8 9 8 9 8 = 20 72 =5 18 Teorema do Produto Sejam dois eventos A e B associados a um espaço amostral S. Então a probabilidade de ocorrer o evento ( A )• P(A ) ou P(A ∩ B ) = P B ( B)• P(B) . Que pode ser generalizada para vários eventos segundo P(A ∩ B ) = P A uma regra baseada na associatividade de eventos: ( P(A ∩ B ∩ C ∩ D ) = P D A∩B∩C )• P(C A ∩ B)• P(B A )• P(A ) . Exemplo: Uma urna contém as letras A, A, A, R, R, S. Retira-se letra por letra. Qual a probabilidade de sair a palavra ARARAS ? Resolução: P(A ∩ R ∩ A ∩ R ∩ A ∩ S ) = P ( A ). P (R A ). P ( A A ∩ R ). P (R A ∩ R ∩ A ). P ( A A ∩ R ∩ A ∩ R ). P (S A ∩ R ∩ A ∩ R ∩ A ) = 3 .2 .2 .1 .1 .1 = 1 6 5 4 3 2 1 60 Eventos Independentes Sejam dois eventos A e B associados a um espaço amostral S. Se A e B são eventos independentes então ( B) = P(A ) e P(B A ) = P(B) logo pelo teorema do produto temos: PA P(A ∩ B) = P(B) • P(A ) ou P(A ∩ B ∩ C ∩ D ) = P(D ) • P(C ) • P(B) • P(A ) . Exemplo: Sendo S = {1,2,3,4} um espaço-amostral equiprovável e A = {1,2}; B = {1,3}; C = {1,4} três eventos de S. Verificar se os eventos A, B, C são independentes. Resolução: Para A e B. P(A) =1/2; P(B) =1/2 e P(A∩B) = 1/4 pelo Teorema do produto P(A∩B) = P(A).P(B) =1/4. Para A e C. P(A) =1/2 ; P(C) =1/2 e P(A∩C) = 1/4 pelo Teorema do produto P(A∩C) = P(A).P(C) =1/4. Para B e C. P(B) =1/2 ; P(C) = 1/2 e P(B∩C) = 1/4 pelo Teorema do produto P(B∩C) = P(B).P(C) =1/4. Para A, B e C. P(A) =1/2; P(B) =1/2; P(C) =1/2 e P(A∩B∩C) =1/4; mas P(A∩B∩C) ≠ P(A).P(B).P(C) portanto os eventos A, B e C não são independentes. Teorema da Probabilidade Total Sejam A1, A2, A3, ..., An eventos que formam uma partição do espaço amostral S. Seja B um evento desse espaço. Então P (B ) = n n ( ) P A B ∩ = ∑ i ∑ P B Ai • P ( Ai ) . i =1 i =1 Teorema de Bayes Sejam A1, A2, A3, ..., An eventos que formam uma partição do espaço amostral S. Seja B ⊂ S. Sejam conhecidas P(A i ) e P B , i = 1, 2, 3, ..., n. Então Ai ( ) P A j • P B A j A P j = n , j = 1, 2, 3, ..., n. B B P • P(A i ) ∑ A i i =1 Exemplo : Observando a seguinte tabela: urnas cores Pretas Brancas Vermelhas u1 u2 u3 4 2 6 5 4 3 3 2 4 Escolheu-se uma urna ao acaso e dela extraiu-se uma bola ao acaso, verificando-se que a bola é vermelha. Qual a probabilidade de a bola ter vindo da urna 3. Resolução: Probabilidade a priori: P(u1) = 1/3; P(u2) = 1/3; P(u3) = 1/3 Probabilidades Condicionais: P(vr/u1) = 6/12 = 1/2; P(vr/u2) = 3/12 = 1/4; P(vr/u3) = 4/ 9 Desejamos calcular P(u3/vr). Logo : P (u3 vr ) = P (u3 ). P (vr u3 ) P (u1 ). P (vr u1 ) + P (u2 ). P (vr u2 ) + P (u3 ). P (vr u3 ) P (u3 vr ) = 1 3.4 9 = 16 43 = 0,372093 ≅ 37,21% 1 3 .1 2 + 1 3 .1 4 + 1 3 . 4 9 ASSIS MORAIS∴ EXERCÍCIOS PROPOSTOS 1º - FAÇA OS ARREDONDAMENTOS ABAIXO: Série Original 15,58501 5,3915 0,385500 19,497045 21,942404 15,756500 35,505000 108,575555 29,500602 129,815400 Inteiro Décimo Centésimo Milésimo 2º - SENDO e = 2,718281829 E π = 3,141592654 QUAL SERÁ SEU VALOR EM : A) DÉCIMOS; B) MILÉSIMOS; C) CENTÉSIMOS; D) UNIDADES; E) DEZENAS. 3º - UMA TRANSPORTADORA ENTREGOU, NUM MÊS: 6,19655 TONELADAS DE PRODUTOS ELETRÔNICOS; 15,8561 TONELADAS DE BRINQUEDOS; 13,6455 TONELADAS DE ALIMENTOS; 9,745 TONELADAS DE PAPEL; 10,34 TONELADAS DE REMÉDIOS E 12,235 TONELADAS DE TECIDOS. QUAL O TOTAL EM TONELADAS QUE A TRANSPORTADORA ENTREGOU NESSE MÊS, ARREDONDANDO PARA O CENTÉSIMO MAIS PRÓXIMO E COMPENSE SE NECESSÁRIO. 4º - UMA TRANSPORTADORA ENTREGOU, NUM MÊS: 6,79755 TONELADAS DE PRODUTOS ELETRÔNICOS; 16,8581 TONELADAS DE BRINQUEDOS; 13,8255 TONELADAS DE ALIMENTOS; 9,764 TONELADAS DE PAPEL; 10,546 TONELADAS DE REMÉDIOS E 15,635 TONELADAS DE TECIDOS. QUAL O TOTAL EM TONELADAS QUE A TRANSPORTADORA ENTREGOU NESSE MÊS, ARREDONDANDO PARA O CENTÉSIMO MAIS PRÓXIMO E COMPENSE SE NECESSÁRIO. 5º - ARREDONDE PARA O INTEIRO MAIS PRÓXIMO E COMPENSE SE NECESSÁRIO: A) 5,34 + 7,45 + 18,50 + 19,90 + 22,37 + 26,43 = B) 6,51 + 7,50 + 14,63 + 20,10 + 24,73 + 26,52 = C) 4,0 + 7,6 + 12,4 + 27,4 + 11,4 + 8,0 = D) 53,02 + 98,49 + 71,500002 + 23,5 + 40,900 = 6º - ARREDONDE PARA O CENTÉSIMO MAIS PRÓXIMO E COMPENSE SE NECESSÁRIO: A) 0,060 + 0,119 + 0,223 + 0,313 + 0,164 + 0,091 + 0,030 = B) 46,727 + 123,842 + 253,65 + 299,951 + 28,255 + 37,485 = C) 56,456 + 32,23456 + 98,7655 + 16,8976 + 57,68732 = D) 76,345 + 83,5467 + 36,055608 + 67,82145 + 48,7565 = 7º - DUAS VARIÁVEIS, X E Y, ASSUMEM OS VALORES: X1 = - 5; X2 = - 6; X3 = -3; Y1 = -2; Y2 = - 4; Y3 = - 7, RESPECTIVAMENTE, CALCULAR: (∑ X )• (∑ Y ) = A) (∑ X ) • (∑ Y ) = B) D) (∑ X )• (∑ Y ) = E) G) ∑ (X − Y ) = H) 2 2 2 2 2 2 2 X ∑ = Y (∑ X • Y ) = 2 (∑ X ) • (∑ Y ) 2 ∑X = F) ∑Y 2 I) [∑ (X + Y )] = C) 2 = 3 8º - SE ∑ xi = 3 ; i =1 3 3 3 3 3 i =1 i =1 i =1 i =1 i =1 ∑ y i = −2 ; ∑ x i y i = 4 ; ∑ x i2 = ∑ y i2 = − 5 ; ∑ x i2 y i = − 4 . DETERMINE: 2 3 y A) ∑ x i − i = 2 i =1 2 3 2 3 2 B) ∑ xi − • y i − = 2 3 i =1 3 y x C) ∑ i + i = 2 2 i =1 3 D) ∑ (x i =1 i − 3) • ( y i − 2 ) = 9º - X ij REPRESENTA O ELEMENTO SUJEITO À I-ÉSIMA LINHA E À J-ÉSIMA COLUNA DA TABELA: i\j 1 2 1 7 5 2 DETERMINE: A) 2 6 3 3 4 ∑ ∑ (Xij)2 ; B) i =1 j = 2 ∑ ∑ (x i + 2) 2 i =1 = n ∑ i =1 4 2 4 (X 2 j )2 ; C) j= 2 n 10º - PROVAR QUE: A) 3 0 2 7 x i2 + 4 2 2 4 Xi2 Xij ∑ 3 ; D) ∑ ∑ i =1 i =1 j = 3 2 n ∑ x i + 4n i =1 n n n n i =1 i =1 i =1 i =1 ∑ (x i + a ) ⋅ (y i + b ) = ∑ x i y i + a ∑ y i + b ∑ x i + nab , ONDE a E b B) SÃO CONSTANTES. 11º - DESENVOLVA CADA UMA DAS EXPRESSÕES SEGUINTES: 6 a) 9 ∑ | Xi − X | = ∑ 3i = c) i=2 i =4 n b) 7 ∑ Xi / n para n = 15 Xi + 5 = 2 i=2 ∑ d) i =1 12º - ESCREVA EM NOTAÇÃO DE SOMATÓRIO: a) [(B 2 − 2 ) : (C 2 + 4 )]7 + ⋅ ⋅ ⋅ ⋅ +[(B 20 − 2 ) : (C 20 + 4 )]7 = b) (D1U12 + ⋅ ⋅ ⋅ + D18 U182 ): (D1 + ⋅ ⋅ ⋅ + D18 ) = 3 c) D 33 E3 + ... + D 12 E12 = d) (O1 − E1 )2 ÷ E1 + (O 2 − E 2 )2 ÷ E 2 + ⋅ ⋅ ⋅ + (O5 − E 5 )2 ÷ E 5 = 2 13º - CALCULE CADA UMA DAS QUANTIDADES SEGUINTES PARA OS DADOS ABAIXO: (N É O NÚMERO DE OBSERVAÇÕES). Y 15; 10; 05; 09; 14; 20; 06; 17 a) ∑ (Y − 12)2 ÷ (N − 1) = 2 b) ∑ Y 2 − (∑ Y ) ÷ N ÷ (N − 1) = c) ∑ (Y − 12)2 = 14º - QUAIS OS ELEMENTOS ESSENCIAIS E COMPLEMENTARES NUMA TABELA ESTATÍSTICA. 15º - ESBOCE A TABELA E ESPECIFIQUE O TIPO DE SÉRIE EM CADA CASO: A) AS CAPACIDADES DOS ESTÁDIOS DO MARACANÃ; MORUMBÍ ; MINEIRÃO E MACHADÃO SÃO RESPECTIVAMENTE: 250.000; 120.000; 150.000; 145.000. B) A POPULAÇÃO DO BRASIL EM 1962 ERA DE 74.100.000 ; EM 1964 78.800.000; EM 1966 83.900.000 E EM 1969 92.300.000 HABITANTES. C) A PRODUÇÃO DE VEÍCULOS EM SÃO PAULO NOS ANOS 1998; 1999; 2000, DAS MARCAS FORD; FIAT E CHEVROLET, FORAM RESPECTIVAMENTE: 200.000; 150.000 E 220.000. 16º - COM OS DADOS IMAGINADOS POR VOCE, ORGANIZE A SEGUINTE TABELA E QUAL SEU TIPO. UM COLÉGIO DE 1º GRAU FUNCIONA EM TRÊS TURNOS E POSSUI ALUNOS NAS QUATRO SÉRIES EM TODOS OS TURNOS, À EXCEÇÃO DA 3º SÉRIE, QUE NÃO FUNCIONA NO 2º TURNO. 17º - ORGANIZE TABELAS SIMPLES E DE NOME: A) SÉRIE CUJOS TERMOS FIXOS SÃO TEMPO E ESPÉCIE. B) SÉRIE CUJOS TERMOS FIXOS SÃO LOCAL E ESPÉCIE. C) SÉRIE CUJOS TERMOS FIXOS SÃO TEMPO E LOCAL. 18º - COM OS DADOS ABAIXO, PEDE-SE: A) ORGANIZAR OS DADOS EM UMA SÉRIE; B) IDENTIFICAR O NOME DA SÉRIE. 1 – UMA ESCOLA DE NATAL TEVE EM 1983 A SEGUINTE MATRÍCULA POR GRUPO SOCIAL: 1º GRUPO 27; 2º GRUPO 58; 3º GRUPO 110; 4º GRUPO 150; 5º GRUPO 240. 2 – SEGUNDO O SERVIÇO DE ESTATÍSTICA ECONÔMICA E FINANCEIRA, VERIFICOU-SE EM AGOSTO DE 1999, NO PORTO DE SANTOS, O SEGUINTE MOVIMENTO DE EXPORTAÇÃO DE MERCADORIAS: 9.405.423 KG DE MATÉRIAS-PRIMAS, NO VALOR DE R$ 120.234,45; 65.123.450 KG, NO VALOR DE R$ 905.567,87 DE GENEROS ALIMENTÍCIOS E 345.123 KG DE MANUFATURAS, NO VALOR R$ 5.124,98. 3 – NÚMERO DE ALUNOS MATRÍCULADOS NO 2º GRAU NO BRASIL NOS ANOS 1986 A 1992 EM MILHARES DE ALUNOS, SEGUNDO DADOS FORNECIDOS PELO SEEC-MEC: 20.675; 22.434; 22.765; 23.876; 24.435; 24.987; 25.768. 4 – NÚMERO DE ESTABELECIMENTOS DE ENSINO DA REGIÃO NORDESTE DO BRASIL EM 1998. A REGIÃO NORDESTE SUBDIVIDE-SE EM: NATAL, JOÃO PESSOA, RECIFE, MACEÓ, SALVADOR, ARACAJU, FORTALEZA, TERESINA E SÃO LUIS, POSSUEM UM TOTAL DE: 50; 40; 60; 55; 65; 68; 70; 48; 57 ESTABELECIMENTOS DE ENSINO, RESPECTIVAMENTE, CONFORME SEEC-MEC. 5 – O MOVIMENTO RELIGIOSO DE CERTO MUNICÍPIO NO PERÍODO DE 1997/99, APRESENTARAM OS SEGUINTES DADOS: EM 1997 HOUVE 65.456 BATIZADOS (DOS QUAIS 35.345 DO SEXO FEMININO), 26.687 CASAMENTOS E 23.654 EXTREMAS -UNÇÕES. EM 1998 HOUVE 45.456 BATIZADOS DO SEXO MASCULINO E 26.486 DO SEXO FEMININO; OS CASAMENTOS FORAM EM NÚMERO DE 18.876 E AS EXTREMAS -UNÇÕES 15.234. EM 1999 DE UM TOTAL DE 76.345 BATIZADOS, 43.253 ERAM DO SEXO MASCULINO; AS EXTREMAS-UNÇÕES FORAM 25.432 E OS CASAMENTOS 24.456. 6 – NO ANO DE 1997, HOUVE 756 MATRÍCULAS NA ESCOLA RURAL, EM 1998, 987. EM 1997, 564 ERAM BRASILEIROS, DOS QUAIS 195 MULHERES, SENDO QUE HAVIA APENAS 6 MOÇAS ESTRANGEIRAS. EM 1998 FORAM MATRICULADOS 60 ESTRANGEIROS, DOS QUAIS APENAS 15% ERAM MULHERES; DOS BRASILEIROS MATRICULADOS NESSE ANO, HAVIA 254 MULHERES. EM 1999, DOS 987 ALUNOS NÃO HAVIA NENHUMA MOÇA ESTRANGEIRA, MAS DOS 654 BRASILEIROS, 188 ERAM DO SEXO FEMININO. 7 – O NÚMERO DE DOCENTES EM EXERCÍCIO NO BRASIL EM 1992, DIVIDIDO SEGUNDO A NATUREZA: (UNIVERSIDADES E FEDERAÇÕES ISOLADAS) E DEPENDÊNCIA ADMINISTRATIVA (PÚBLICAS E PARTICULADAS) E QUE CORRESPONDEM RESPECTIVAMENTE AOS SEGUINTES VALORES: 80.789; 65.765; 78.443 E 59.345, DE ACORDO COM OS DADOS FORNECIDOS PELO SEEC-MEC. 19º - USANDO UM GRÁFICO LINEAR, REPRESENTAR A TABELA ABAIXO. EVOLUÇÃO DE MATRÍCULA GERAL NO ENSINO SUPERIOR NOS CURSOS DE DIREITO, MATEMÁTICA, PEDAGOGIA, NO BRASIL, DE 1980 A 1992 ANOS 1980 1983 1986 1989 1992 DIREITO 32.345 35.564 37.458 45.478 57.587 CURSOS MATEMÁTICA 15.525 17.265 19.245 25.879 30.587 PEDAGOGIA 21.254 23.457 30.458 35.478 47.965 FONTE: SERVIÇO DE ESTAT. DA EDUC. CULT.-MEC 20º - USANDO UM GRÁFICO EM COLUNA, REPRESENTAR A TABELA ABAIXO. POPULAÇÃO DO BRASIL, EM 1950 A 1990 ANOS URBANA 1950 15.885.458 1960 24.478.325 1970 35.478.685 1980 42.547.587 1990 58.458.478 FONTE: FUNDAÇÃO IBGE RURAL 12.458.451 18.458.478 23.487.512 35.458.125 41.547.784 21º - USANDO UM GRÁFICO EM SETOR, REPRESENTAR A TABELA ABAIXO. POPULAÇÃO RESIDENTE NO BRASIL, 1990 REGIÕES POPULAÇÃO NORDESTE 25.458.547 NORTE 16.458.547 SUDESTE 78.458.254 SUL 45.478.987 CENTRO OESTE 20.457.874 FONTE: FUNDAÇÃO IBGE 22º - ELABORE UM GRÁFICO DE ORGANIZAÇÃO DE SEU COLÉGIO. 23º - ELABORE UM FLUXOGRAMA DO CURRÍCULO DE SEU CURSO. 24º - CONSTRUA O ROL PARA SEGÜÊNCIA DE DADOS: A) X: 2; 4; 12; 7; 8; 15; 21; 20. B) Y: 3; 5; 8; 5; 12; 14; 13; 12; 18. C) Z: 12,2; 13,9; 14,7; 21,8; 12,2; 14,7. D) W: 8; 7; 8; 7; 8; 7; 9. 25º - UMA PESQUISA SOBRE A IDADE, EM ANOS DE UMA CLASSE DE CALOUROS DE UMA FACULDADE, REVELOU OS SEGUINTES VALORES: 18, 17, 18, 20, 21, 19, 20, 18, 17, 19, 20, 18, 19, 18, 19, 21, 18, 19, 18, 18, 19, 19, 21, 20, 17, 19, 19, 18, 18, 19, 18, 21, 18, 19, 19, 20, 19, 18, 19, 20, 18, 19, 19, 18, 20, 20, 18, 19, 18, 18. AGRUPE, POR FREQÜÊNCIA, ESTES DADOS. 26º - UMA EMPRESA AUTOMOBILÍSTICA SELECIONOU AO ACASO, UMA AMOSTRA DE 40 REVENDEDORES AUTORIZADOS EM TODO O BRASIL E ANOTOU EM DETERMINADO MÊS O NÚMERO DE UNIDADES ADQUIRIDAS POR ESTES REVENDEDORES. OBTEVE OS SEGUINTES DADOS: 10, 15, 25, 21, 6, 23, 15, 21, 26, 32, 9, 14, 19, 20, 32, 18, 16, 26, 24, 20, 7, 18, 28, 17, 35, 22, 19, 39, 18, 21, 15, 18, 22, 20, 25, 28, 30, 16, 12, 20. AGRUPE, POR FREQÜÊNCIA, ESTES DADOS. 27º - CONSTRUA A DISTRIBUIÇÃO DE FREQÜÊNCIAS PARA A SÉRIE REPRESENTATIVA DA IDADE DE 50 ALUNOS DO PRIMEIRO ANO DE UMA FACULDADE. IDADES (ANOS) NÚMEROS DE ALUNOS 17 18 19 20 21 TOTAL 3 18 17 8 4 f ri % Fac i Facri % 28º - COMPLETE O QUADRO. xi fi 2 5 8 10 13 TOTAL 16 f ri % Fac i Facri % 24 57 76 200 29º - COMPLETE O QUADRO DE DISTRIBUIÇÃO DE FREQÜÊNCIAS. INT. CL. fi 6 Ⱶ 10 10 Ⱶ 14 14 Ⱶ 18 18 Ⱶ 22 22 Ⱶ 26 TOTAL 1 f ri % Fac i Facri % 25 14 90 2 30º - OS GRAUS DE 32 ESTUDANTES DE UMA CLASSE ESTÃO DESCRITOS ABAIXO: 6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,0 8,0 7,0 8,5 6,0 4,5 0,0 6,5 6,0 2,0 5,0 5,5 5,0 7,0 1,5 5,0 5,0 4,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5. COM REFERÊNCIA A ESSA TABELA, DETERMINE: A) O ROL B) A TABELA DE DISTRIBUIÇÃO DE FREQÜÊNCIA C) O MAIOR E O MENOR GRAU D) A AMPLITUDE TOTAL E) QUAL A PORCENTAGEM DOS ALUNOS QUE TIRARAM NOTA MENOR QUE 4 F) QUAL A PORCENTAGEM DOS ALUNOS QUE TIRARAM NOTA ENTRE 5 E 7 INCLUSIVE G) QUAL O LIMITE SUPERIOR DA 2ª CLASSE H) QUAL O LIMITE INFERIOR DA 4ª CLASSE I) QUAL O PONTO MÉDIO DA 3ª CLASSE J) COLOCAR A FREQÜÊNCIA ACUMULADA CRESCENTE E DECRESCENTE. 31º - SABENDO QUE AS IDADES DE UM GRUPO DE PESSOAS SE DISTRIBUEM DE FORMA ACUMULADA CRESCENTE DA SEGUINTE FORMA: IDADES Fac i 34 0Ⱶ5 57 5 Ⱶ 10 103 10 Ⱶ 15 203 15 Ⱶ 20 242 20 Ⱶ 25 250 25 Ⱶ 30 TOTAL DETERMINAR : A) f i DAS CLASSES B) FREQÜÊNCIA ACUMULADA DECRESCENTE 32º - OS PESOS DOS 40 ALUNOS DO CURSO DE PROFORMAÇÃO ESTÃO ABAIXO RELACIONADOS: 69 57 72 54 93 68 72 58 64 62 65 76 60 49 74 59 66 83 70 45 60 81 71 67 63 64 53 73 81 50 67 68 53 75 65 58 80 60 63 53. DETERMINAR: A) A TABELA DE DISTRIBUIÇÃO DE FREQÜÊNCIA B) A DISTRIBUIÇÃO DE FREQÜÊNCIA ACUMULADA CRESCENTE C) A DISTRIBUIÇÃO DE FREQÜÊNCIA ACUMULADA DECRESCENTE D) A DISTRIBUIÇÃO DE FREQÜÊNCIA PORCENTUAL SIMPLES E) A DISTRIBUIÇÃO DE FREQÜÊNCIA RELATIVA SIMPLES 33º - A DISTRIBUIÇÃO DE FRÊNQUENCIA ABAIXO DESCREVE AS DIVERSAS FAIXAS DE ALUGUEIS PAGOS POR 100 MORADORES DE CERTA REGIÃO DE MOSSORÓ – RN : ALUGUEIS ( R$ 100 ) 14 Ⱶ 16 16 Ⱶ 18 18 Ⱶ 20 20 Ⱶ 22 22 Ⱶ 24 24 Ⱶ 26 TOTAL Nº MORADORES 07 20 25 33 11 04 100 CALCULE : A) O ALUGUEL MÉDIO; MEDIANO; E MODAL PAGO PELOS MORADORES. 34º - NA TEBELA SEGUINTE SÃO APRESENTADOS OS SALÁRIOS DE 200 TRABALHADORES DE UMA COMPANHIA. FAIXA SM Facri % 01 Ⱶ 04 04 Ⱶ 07 07 Ⱶ 10 10 Ⱶ 13 13 Ⱶ 16 16 Ⱶ 19 TOTAL 30,0 52,5 68,5 81,0 91,0 100 A) CALCULE O SALÁRIO MÉDIO, MEDIANO E MODAL DOS TRABALHADORES. B) INDIQUE QUE MEDIDA DE POSIÇÃO – MÉDIA, MODA OU MEDIANA - VOCE ESCOLHERIA PARA REPRESENTAR A MASSA SÁLARIAL DA COMPANHIA SE: - VOCE FÔSSE O DIRETOR DA COMPANHIA ENCARREGADO DA NEGOCIAÇÃO COLETIVA OU VOCE FÔSSE O LÍDER SINDICAL, REINVIDICANDO AUMENTO SALARIAL. JUSTIFIQUE SUA RESPOSTA. 35º - NA DISTRIBUIÇÃO: Nº MOTORISTAS Nº DE ACIDENTES 12 4 20 2 4 5 5 6 7 0 9 1 18 3 DETERMINE: A) MÉDIA ARITMÉTICA B) MEDIANA C) MODA 36º - NA TABELA SEGUINTE SÃO APRESENTADAS AS ALTURAS DE 65 ALUNOS DO CURSO DE MATEMÁTICA: ALTURAS f ri 1,75 Ⱶ 1,90 Ⱶ 2,05 Ⱶ 2,20 Ⱶ 2,35 Ⱶ 2,50 0,28 0,46 0,15 0,08 0,03 A) CALCULE A ALTURA MÉDIA, MEDIANA E MODAL B) QUE MEDIDA DE POSIÇÃO – MÉDIA, MEDIANA OU MODA, VOCE APRESENTARIA PARA REPRESENTAR O CURSO DE MATEMÁTICA SE VOCE: - FÔSSE DIRETOR DO CURSO, OU DIRETOR DE OUTRO CURSO. JUSTIFIQUE SUA RESPOSTA 37º - COMPLETE A TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIA ABAIXO: CLASSE Ⱶ 20 20 Ⱶ Ⱶ 40 Ⱶ Ⱶ 60 TOTAL fi xi Fac i 15 02 Fad i 04 14 05 ∑ f i = 20 38º - CONHECENDO AS ALTURAS DE 4 0 ALUNOS DO CURSO DE MATEMÁTICA REVELOU OS RESULTADOS NA TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIA ABAIXO. DETERMINE COM APROXIMAÇÃO DE CENTÉSIMO: A) ALTURA MÉDIA B) ALTURA MODAL C) ALTURA MEDIANA D) DESVIO MÉDIO E) VARIÂNCIA F) DESVIO PADRÃO ALTURA (m) fi 1,20 Ⱶ 1,30 1,30 Ⱶ 1,40 1,40 Ⱶ 1,50 1,50 Ⱶ 1,60 1,60 Ⱶ 1,70 1,70 Ⱶ 1,80 TOTAL 02 06 16 10 02 04 40 39º - OBSERVOU-SE A IDADE DOS 95 CLIENTES ATENDIDOS EM UMA LOJA DE CALÇADOS. OS RESULTADOS OBTIDOS ESTÃO EM FORMA DE TABELA, A SEGUIR, CONSIDERAR O RESULTADO EM CENTÉSIMO. DETERMINE: A) A MÉDIA; B) A MEDIANA; C) A FREQUÊNCIA ACUMULADA DESCRESCENTE DAS IDADES. Idades dos clientes 25 Ⱶ 28 10 fi 28 Ⱶ 31 9 31 Ⱶ 34 33 34 Ⱶ 37 14 37 Ⱶ 40 20 40 Ⱶ 43 2 43 Ⱶ 46 7 40º -CONSIDERANDO QUATRO GRUPOS DE PESSOAS CONSTITUIDOS DE PESOS 81; 74; 70; 77 KG, COM OS SEGUINTES QUANTITATIVOS 15; 10; 20; 18 DE PESSOAS. DETERMINE. O PESO MÉDIO E PESO MEDIANO. CONSIDERAR OS RESULTADOS EM CENTÉSIMO. 41º - UMA AMOSTRA ALEATÓRIA DE 250 RESIDÊNCIAS DE FAMÍLIAS, CLASSE MÉDIA, COM DOIS FILHOS, REVELOU A SEGUINTE DISTRIBUIÇÃO DO CONSUMO MENSAL DE ENERGIA ELÉTRICA. CONS. MENS. (KWH) Nº DE FAMÍLIAS 2 0 Ⱶ 50 15 50 Ⱶ 100 32 100 Ⱶ 150 47 150 Ⱶ 200 50 200 Ⱶ 250 80 250 Ⱶ 300 24 300 Ⱶ 350 TOTAL 250 PEDE-SE: A) O CONSUMO MÉDIO POR FAMÍLIAS; B) A PORCENTAGEM DE FAMÍLIA COM CONSUMO MENSAL MAIOR OU IGUAL A 200 E MENOR QUE 250 KWH; C) A PERCENTAGEM DE FAMÍLIAS COM CONSUMO MENSAL MENOR QUE 200 KWH; D) A PERCENTAGEM DE FAMÍLIA COM CONSUMO MAIOR OU IGUAL 250 KWH; E) O CONSUMO MEDIANO; F) O CONSUMO MODAL; G) A AMPLITUDE TOTAL DA SÉRIE; H) DESVIO MÉDIO; I) VARIÂNCIA; J) DESVIO PADRÃO; K) COEFICIENTE DE VARIAÇÃO. 42º - UM AVIÃO COM VELOCIDADE DE 300 KM/H FAZ O PERCURSO DE A PARA B; O MESMO AVIÃO NO PERCURSO DE VOLTA, AUMENTA EM 100KM/H A SUA VELOCIDADE. QUAL FOI ENTÃO A VELOCIDADE NO PERCURSO COMPLETO (IDA E VOLTA)? 43º - EM UM CONCURSO, REALIZADO SIMULTANEAMENTE NAS CIDADES A, B E C, AS MÉDIAS ARITMÉTICAS FORAM, RESPECTIVAMENTE, 70, 65 E 45 PONTOS, OBTIDAS POR 30, 40 E 30 CANDIDATOS, NA MESMA ORDEM. QUAL FOI ENTÃO A MÉDIA ARITMÉTICA GERAL DO CONCURSO? 44º - A ESCOLA GUARARAPES RECEBE DIARIAMENTE UMA VERBA DE R$ 20.000,00 QUE É INTEGRALMENTE UTILIZADA PARA AQUISIÇÃO DE MERENDA ESCOLAR PARA SEUS ALUNOS. SE O PREÇO UNITÁRIO DA MERENDA FOI NOS ÚLTIMOS DOIS DIAS, RESPECTIVAMENTE, R$ 40,00 E R$ 60,00, PERGUNTA-SE QUAL O PREÇO MÉDIO DIÁRIO DA MESMA NO PERÍODO CONSIDERADO. 45º - DETERMINE: A) MÉDIA ARITMÉTICA; B) MODA; C) MEDIANA. DOS SEGUINTES VALORES COM SUAS RESPECTIVAS FREQÜÊNCIAS: 3,5 ; 2,3 ; 4,6 ; 0,0 ; 5,4 ; FREQÜÊNCIAS : 5; 6 ; 3 ; 2 ; 4. 46º - OBSERVOU-SE O NÚMERO DOS 100 SAPATOS VENDIDOS EM UMA LOJA DE CALÇADOS. OS RESULTADOS OBTIDOS ESTÃO EM FORMA DE TABELA, A SEGUIR, CONSIDERAR O RESULTADO EM CENTÉSIMO. DETERMINE: A) A MÉDIA; B) A MEDIANA; C) A MODA; D) O DESVIO PADRÃO; E) O DESVIO MÉDIO; F) A VARIÂNCIA; G) AMPLITUDE TOTAL; H) A FREQUÊNCIA ACUMULADA DESCRESCENTE; I) O COEFICIENTE DE VARIAÇÃO DAS VENDAS. Nº do Sapato 25 Ⱶ 28 2 fi 28 Ⱶ 31 9 31 Ⱶ 34 17 34 Ⱶ 37 35 47º - PARA CADA DISTRIBUIÇÃO, DETERMINE: A) MÉDIA ARITMÉTICA B) MEDIANA C) MODA D) DESVIO MÉDIO E) VARIÂNCIA F) DESVIO PADRÃO G) COEFICIENTE DE VARIAÇÃO 37 Ⱶ 40 20 40 Ⱶ 43 10 43 Ⱶ 46 7 I) 2 7 4 3 5 3 2 8 5 4 xi fi 173 275 77 259 181 2 10 12 5 2 xi fi 12 17 13 15 10 5 2 10 3 4 xi fi II) III) ASSIS MORAIS∴