FACULDADE ESTADUAL DE FILOSOFIA, CIÊNCIAS E LETRAS Praça Coronel Amazonas, s/n.º - Caixa Postal, 291 - Telefone (0425) 22-4433 CEP 84.600-000 UNIÃO DA VITÓRIA ESTADO DO PARANÁ HISTÓRIA E PEDAGOGIA: Decreto Federal n.º 61.120 - 31.07.67 – DOU 03.08.67 LETRAS E GEOGRAFIA: Decreto Federal n.º 74.750 - 23.10.74 - DOU 24.10.74 LETRAS-PORTUGUÊS/ESPANHOL: Decreto Estadual n.º 1715 - 13. 08. 03 - DOE 13.08.03 MATEMÁTICA: Decreto Estadual n.º 1719 – 13.08.03- DOE 13.08.03 PROBABILIDADE E ESTATÍSTICA CURSO DE LICENCIATURA EM MATEMÁTICA - 2012 PROFESSORA: MARIA IVETE BASNIAK SUMÁRIO ESTATÍSTICA ...................................................................................................................................... 4 CONCEITOS ESTATÍSTICOS ............................................................................................................ 4 Estatística Descritiva .......................................................................................................................... 4 Inferência Estatística .......................................................................................................................... 4 Variáveis Estatísticas ............................................................................................................................. 5 Variável Quantitativa ......................................................................................................................... 5 Variável Quantitativa Continua ..................................................................................................... 5 Variável Quantitativa Discreta:...................................................................................................... 5 Variável Qualitativa ........................................................................................................................... 5 Arredondamento De Dados ................................................................................................................... 6 AMOSTRAGEM ................................................................................................................................... 7 Quando não se deve realizar um estudo por amostragem? ................................................................ 7 Técnicas Probabilísticas (aleatórias) .................................................................................................. 7 Amostragem Aleatória Simples ..................................................................................................... 7 Amostragem Estratificada.............................................................................................................. 7 Amostragem Sistemática ............................................................................................................... 8 Amostragem por Conglomerados .................................................................................................. 9 Estudar a população de uma cidade, dispondo apenas do mapa dos quarteirões da cidade. ......... 9 Técnicas Não-Probabilísticas (não-aleatórias) ................................................................................... 9 Amostragem Acidental .................................................................................................................. 9 Amostragem Intencional ................................................................................................................ 9 Tamanho da amostra ........................................................................................................................ 10 Dados Absolutos .................................................................................................................................. 11 Dados Relativos ................................................................................................................................... 11 Índices .................................................................................................................................................. 11 Coeficientes ......................................................................................................................................... 11 Taxas .................................................................................................................................................... 12 GRÁFICOS ESTATÍSTICOS ............................................................................................................. 13 Principais Gráficos ........................................................................................................................... 13 Diagrama Por Linha Poligonal..................................................................................................... 13 Gráfico Em Colunas ..................................................................................................................... 14 Gráficos Em Barras ...................................................................................................................... 14 DISTRIBUIÇAO DE FREQUÊNCIA................................................................................................. 17 Tabela primitiva e rol de dados ........................................................................................................ 17 Distribuição de frequência ............................................................................................................... 17 Elementos de uma distribuição de frequência ................................................................................. 18 Classe ........................................................................................................................................... 18 Limites de classe .......................................................................................................................... 18 Amplitude de um intervalo de classe ........................................................................................... 18 Amplitude total da distribuição .................................................................................................... 18 Amplitude amostral ...................................................................................................................... 19 Ponto médio de uma classe .......................................................................................................... 19 Frequência simples ou absoluta ................................................................................................... 19 Tipos de Frequências ....................................................................................................................... 21 Frequência simples ou absoluta (fi) ............................................................................................. 21 Frequência relativa (fri) ................................................................................................................ 21 Frequência acumulada (Fi) ........................................................................................................... 21 Frequência acumulada relativa (Fri) ............................................................................................ 21 1 MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO .......................................................... 25 MÉDIA ............................................................................................................................................ 25 Desvio em relação a média .......................................................................................................... 25 Cálculo da média para dados agrupados (média ponderada) ........................................................... 25 Sem intervalo de classe ................................................................................................................ 25 Com intervalo de classe ............................................................................................................... 26 MODA (Mo) .................................................................................................................................... 27 Cálculo da moda para dados agrupados ....................................................................................... 27 Sem intervalo de classe ................................................................................................................ 27 Cálculo da moda para dados agrupados ....................................................................................... 27 Com intervalo de classe ............................................................................................................... 27 MEDIANA ....................................................................................................................................... 28 Dados não-agrupados ................................................................................................................... 28 Sem intervalo de classe ................................................................................................................ 28 Dados agrupados .......................................................................................................................... 29 SEPARATRIZES................................................................................................................................. 31 Quartis .............................................................................................................................................. 31 Decis ................................................................................................................................................ 31 Percentis ........................................................................................................................................... 32 Representação Gráfica De Uma Distribuição ...................................................................................... 33 Histograma E Sua Interpretação .......................................................................................................... 33 MEDIDAS DE DISPERSÃO .............................................................................................................. 36 VARIÂNCIA ................................................................................................................................... 36 DESVIO PADRÃO ......................................................................................................................... 36 Dados agrupados .......................................................................................................................... 37 Sem intervalo de classes ou com intervalo de classe ................................................................... 37 Coeficientes De Variação (Cv) ............................................................................................................ 42 MEDIDAS DE ASSIMETRIA E CURTOSE ..................................................................................... 42 Momentos ............................................................................................................................................ 42 Formato de uma distribuição ....................................................................................................... 43 Medida De Assimetria ......................................................................................................................... 43 Interpretação .................................................................................................................................... 43 Medida De Curtose .............................................................................................................................. 44 ANÁLISE COMBINATÓRIA ............................................................................................................ 46 Permutações simples ........................................................................................................................ 47 Combinações simples....................................................................................................................... 48 Permutações circulares..................................................................................................................... 49 Permutações de elementos nem todos distintos ............................................................................... 49 Combinações completas................................................................................................................... 50 Princípio da inclusão/ exclusão ........................................................................................................ 50 PROBABILIDADE ............................................................................................................................. 51 Revisão conjuntos ................................................................................................................................ 51 Conjuntos ......................................................................................................................................... 51 Subconjuntos .................................................................................................................................... 51 Teorema 1.1 ................................................................................................................................. 51 Operações entre conjuntos ........................................................................................................... 51 Alguns Teoremas ......................................................................................................................... 51 Experimentos aleatórios ou não determinísticos ................................................................................. 52 Espaços amostrais ................................................................................................................................ 53 Eventos................................................................................................................................................. 53 2 Eventos particulares ou certos: ........................................................................................................ 53 Frequência Relativa e Probabilidade ................................................................................................... 55 Probabilidade ....................................................................................................................................... 55 Teoremas de Probabilidade .............................................................................................................. 55 Definição geométrica de Probabilidade ........................................................................................... 57 Probabilidade condicional.................................................................................................................... 57 Eventos independentes ..................................................................................................................... 58 Probabilidades Condicionais ............................................................................................................ 58 Teorema do Produto ..................................................................................................................... 59 Teorema da Probabilidade Total .................................................................................................. 60 Teorema de Bayes ........................................................................................................................ 60 Eventos independentes ..................................................................................................................... 60 Referências: ......................................................................................................................................... 63 3 ESTATÍSTICA Introdução Diariamente estamos envolvidos em análises estatísticas, por exemplo, quando você é abordado na rua para responder qual o candidato irá votar na próxima eleição, quando o IBGE faz uma visita a sua casa para o censo... Desta forma você está fazendo parte da estatística. Mas não é só desta forma que você faz parte do infinito mundo da estatística. Quando você está desempregado ou empregado, está fazendo parte da estatística, quando seu salário aumenta ou diminui, faz parte também. Podemos ver que em quase tudo podemos empregar a estatística. A estatística, como parte da matemática aplicada, trata da coleta, da análise e da interpretação de dados observados. Estudando os mais variados fenômenos das diversas áreas do conhecimento, ela representa um valioso instrumento de trabalho nos dias de hoje. CONCEITOS ESTATÍSTICOS Estatística Descritiva Pode ser definida como os métodos que envolvem a coleta, a apresentação e a caracterização de um conjunto de dados de modo a descrever apropriadamente as várias características deste conjunto. Embora os métodos estatísticos descritivos sejam importantes para a apresentação e a caracterização dos dados, foi o desenvolvimento de métodos estatísticos de inferência, como um produto de teoria da probabilidade, que levou à ampla aplicação da estatística em todos os campos de pesquisas atuais. Inferência Estatística Pode ser definida como os métodos que tornam possível a estimativa de uma característica de uma população ou a tomada de uma decisão referente à população com base somente em resultados de amostras. Para tornar mais claro esta definição, as definições seguintes são necessárias: Uma população é a totalidade dos itens ou objetos a ser considerado. Uma amostra é a parte da população selecionada para análise. Um parâmetro é a medida calculada para descrever uma característica de toda uma população. Uma estatística é a medida calculada para descrever uma característica de apenas uma amostra da população. 4 Variáveis Estatísticas Em estatística, uma variável é um atributo mensurável que tipicamente varia entre indivíduos. Variável Quantitativa - São aquelas que são numericamente mensuráveis, por exemplo, a idade, a altura, o peso. Estas ainda se subdividem em: Variável Quantitativa Continua: São aquelas que assumem valores dentro de um conjunto contínuo, tipicamente os números reais. São exemplos, o peso ou a altura de uma pessoa. Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito ou enumerável, tipicamente números inteiros. Um exemplo é o número de filhos de uma pessoa. Variável Qualitativa - São aquelas que se baseiam em qualidades e não podem ser mensuráveis numericamente. Exercícios: Identifique a população e as variáveis e classifique-as como qualitativas ou quantitativas: contínuas (C) ou discretas (D): a) Altura de precipitação de chuvas em um local. b) Valores das ações vendidas na bolsa de valores. c) Quantidade de ações vendidas na bolsa de valores. d) Número de pétalas em ma flor. e) Velocidade de um automóvel. f) Cor dos cabelos dos alunos em uma escola. g) Número de filhos dos casais residentes em uma cidade. h) O ponto obtido em cada jogada nas jogadas de um dado. i) Número de peças produzidas por hora, entre as peças produzidas por certa máquina. j) Diâmetro externo das peças produzidas por certa máquina. k) Número de ações negociadas na Bolsa de Valores de São Paulo. l) Comprimento dos pregos produzidos por certa máquina. 5 Arredondamento De Dados Conforme critério universal adotado pela estatística o arredondamento de dados é feito da seguinte forma: 1. Se o 1º algarismo a ser abandonado for menor que “5” o último a permanecer fica inalterado. (arredondamento por falta) Arredondar para centésimos os números abaixo. a) 47,3227 ≅ 47,32 c) 53,77474 ≅ 53,77 b) 0,29364 ≅ 0,29 d) 30,00132 ≅ 30,00 2. O último algarismo a permanecer será acrescido de uma unidade se o 1º algarismo a abandonar for maior que “5”. (arredondamento por excesso) Arredondar para décimos os números abaixo. a) 1,4632 ≅ 1,5 b) 23,09425 ≅ 23,1 c) 38,97777 ≅ 39,0 d) 74,28583 ≅ 74,3 3. Quando o “5” for o 1º algarismo a ser abandonado teremos duas soluções: a) Quando o “5” for o único algarismo ou se a ele só se seguirem zeros o último algarismo a permanecer se for ímpar, será acrescido de uma unidade. b) Se após o “5” houver em qualquer casa um número diferente de zero, o último algarismo a permanecer será acrescido de uma unidade. Ex: Arredondar para milésimos os números abaixo: a) 13,474503≅ 13,475 b) 29,87350 ≅ 29,874 c) 5,55555 ≅ 5,556 d) 0,138500 ≅ 0,138 e) 20,797504 ≅ 20,798 f) 99,99950 ≅ 100,000 Exercícios 01- Os dados abaixo são os índices (em %) alcançados por algumas escolas, em relação à taxa de ocupação nas escolas públicas. Arredondamento para inteiros, unidade. a) 85,4 ____________ b) 75,7 ___________c) 85,0 ______________ d) 75,99____________ e) 85,5 ___________f) 75,55 _____________ g) 95,05 ___________ h) 65,6 ___________i) 65,3 ______________ 02- Em uma pesquisa sobre o tempo, em minutos, gasto pelos alunos da Escola X para realizar uma atividade em sala de aula observou-se os seguintes dados. Faça os arredondamentos para décimos. a) 35,94 b) 18,09 c) 18,009 d) 19,55 e) 19,93 f) 29,97 g) 10,05 h) 10,55 i) 16,66 j) 18,88 l) 10,00 m) 26,06 n) 16,04 o) 17,65 p) 17,75 03- Utilize os dados do exercício 2 e faça o arredondamento para inteiros, unidade. 6 AMOSTRAGEM É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer. Esses pequenos grupos retirados da população são chamados de Amostras. Como a amostragem considera apenas parte da população, diferentemente de um censo, o tempo para análise e o custo são menores, além de ser mais fácil e gerar resultados satisfatórios. Quando não se deve realizar um estudo por amostragem? Quando o tamanho da amostra é grande em relação ao tamanho da população, ou quando se exige o resultado exato, ou quando já se dispõe dos dados da população, é recomendado realizar um censo, que considera todos os elementos da população. A partir das três perguntas anteriores, vamos aprender a realizar um estudo por amostragem, conhecendo suas diferentes técnicas. Para realizar um estudo por amostragem, a amostra deve ser representativa da população estudada. Para isso, existem técnicas adequadas para cada tipo de situação. Técnicas Probabilísticas (aleatórias) As técnicas probabilísticas garantem a possibilidade de realizar afirmações sobre a população com base nas amostras. Normalmente, todos os elementos da população possuem a mesma probabilidade de serem selecionados. Assim, considerando N como o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Estas técnicas garantem o acaso na escolha. São técnicas probabilísticas: Amostragem Aleatória Simples É o processo mais elementar e freqüentemente utilizado. Pode ser realizado numerando-se os elementos da população de 1 a n e sorteando-se, por meio de um dispositivo aleatório qualquer, X números dessa seqüência, que corresponderão aos elementos pertencente à amostra. Exemplo Obter uma amostra representativa, de 10%, de uma população de 200 alunos de uma escola. 1º) Numerar os alunos de 1 a 200; 2º) Escrever os números de 1 a 200 em pedaços de papel e colocá-los em uma urna; 3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da população. Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados: 1/N, onde N é o número de elementos da população. Amostragem Estratificada Quando a população possui características que permitem a criação de subconjuntos, as amostras extraídas por amostragem simples são menos representativas. Nesse caso, é utilizada a amostragem estratificada. 7 Como a população se divide em subconjuntos, convém que o sorteio dos elementos leve em consideração tais divisões, para que os elementos da amostra sejam proporcionais ao número de elementos desses subconjuntos. Exemplo: Em uma população de 200 alunos, há 120 meninos e 80 meninas. Extraia uma amostra representativa, de 10%, dessa população. Nesse exemplo, há uma característica que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão, vamos extrair a amostra da população. SEXO POPULAÇÃO AMOSTRA (10%) Masculino 120 12 Feminino 80 8 Total 200 20 Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que correspondem a 10% da população. Para selecionar os elementos da população para formar a amostra, podemos executar os seguintes passos: 1º) Numerar os alunos de 1 a 200, sendo os meninos numerados de 1 a 120 e as meninas, de 121 a 200; 2º) Escrever os números de 1 a 120 em pedaços de papel e colocá-los em uma urna A; 3º) Escrever os números de 121 a 200 em pedaços de papel e colocá-los em uma urna B; 4º) Retirar 12 pedaços de papel, um a um, da urna A, e 8 da urna B, formando a amostra da população. São exemplos desta técnica de amostragem as pesquisas eleitorais por região, cidades pequenas e grandes, área urbana e área rural, sexo, faixa etária, faixa de renda, etc. Amostragem Sistemática Esta técnica de amostragem em populações que possuem os elementos ordenados, em que não há a necessidade de construir um sistema de referência. Nesta técnica, a seleção dos elementos que comporão a amostra pode ser feita por um sistema criado pelo pesquisador. Exemplo Obter uma amostra de 80 casas de uma rua que contém 2000 casas. Nesta técnica de amostragem, podemos realizar o seguinte procedimento: 1º) Como 2000 dividido por 80 é igual a 25, escolhemos, por um método aleatório qualquer, um número entre 1 e 25, que indica o primeiro elemento selecionado para a amostra. 2º) Consideramos os demais elementos, periodicamente, de 25 em 25. Se o número sorteado entre 1 e 25 for o número 8, a amostra será formada pelas casas: 8ª, 33ª, 58ª, 83ª, 108ª, etc. Apesar de esta técnica ser de fácil execução, há a possibilidade de haver ciclos de variação, que tornariam a amostra não-representativa da população. 8 Amostragem por Conglomerados Esta técnica é usada quando a identificação dos elementos da população é extremamente difícil, porém pode ser relativamente fácil dividir a população em conglomerados (subgrupos) heterogêneos representativos da população global. A seguir, é descrito o procedimento de execução desta técnica: 1º) Seleciona uma amostra aleatória simples dos conglomerados existentes; 2º) Realizar o estudo sobre todos os elementos do conglomerado selecionado. São exemplos de conglomerados: quarteirões, famílias, organizações, agências, edifícios, etc. Exemplo: Estudar a população de uma cidade, dispondo apenas do mapa dos quarteirões da cidade. Neste caso, não temos a relação dos moradores da cidade, restando o uso dos subgrupos heterogêneos (conglomerados). Para realizar o estudo estatístico sobre a cidade, realizaremos os seguintes procedimentos: 1º) Numerar os quarteirões de 1 a n; 2º) Escrever os números de 1 a n em pedaços de papel e colocá-los em uma urna; 3º) Retirar um pedaço de papel da urna e realizar o estudo sobre os elementos do conglomerado selecionado. Técnicas Não-Probabilísticas (não-aleatórias) São técnicas em que há uma escolha deliberada dos elementos da população, que não permite generalizar os resultados das pesquisas para a população, pois amostras não garantem a representatividade desta. São técnicas não-probabilísticas: Amostragem Acidental Trata-se da formação de amostras por aqueles elementos que vão aparecendo. Este método é utilizado, geralmente, em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Exemplo: Pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades, etc. Amostragem Intencional De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que comporão a amostra. O pesquisador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Exemplo: Em uma pesquisa sobre preferência por determinado cosmético, o pesquisador entrevista os freqüentadores de um grande salão de beleza. 9 Tamanho da amostra Exemplos: a) Obter uma amostra representativa para uma pesquisa da estatura de noventa alunos de uma escola. Sugestão usar a 18ª linha da tabela de números aleatórios. b) Supondo que destes 90 alunos, 54 sejam meninos e 36 meninas, obter a amostra proporcional estratificada. SEXO POPULAÇÃO 10% AMOSTRA M 54 10X54:100=5,4 5 F 36 10X36:100=3,6 4 TOTAL 90 10X90:100=9,0 9 2) Uma cidade X apresenta a seguinte tabela em relação às suas escolas de Ensino Fundamental: ESCOLAS Nº DE ESTUDANTES A B C D E F MASCULINO FEMININO 80 102 110 134 150 300 95 120 92 228 130 290 Total 876 955 Obtenha uma amostra proporcional estratificada de 120 estudantes 3) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. Obtenha uma amostra de 40 alunos e preencha a tabela seguinte: Séries População Cálculo Proporcional Amostra 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 35 35x49:250=5,6 6 Total 250 28 31x40:250= 40 10 4) Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa correspondente a 15% da população. Sugestão: Use a 8ª, 9ª e 10ª colunas, a partir da 5ª linha da Tabela de números aleatórios. 5) Uma população é formada por 140 notas resultantes da aplicação de um teste de inteligência: 62 129 95 123 81 93 105 95 96 80 87 110 139 75 123 60 72 86 108 120 57 113 65 108 90 137 74 106 109 84 121 60 128 100 72 119 103 128 80 99 149 85 77 91 51 100 63 107 76 82 110 63 131 65 114 103 104 107 63 117 116 86 115 62 122 92 102 113 74 78 69 116 82 95 72 121 52 80 100 85 117 85 102 106 94 84 123 42 90 91 81 116 73 79 98 82 69 102 100 79 101 98 110 95 67 77 91 95 74 90 134 94 79 92 73 83 74 125 101 82 71 75 101 102 78 108 125 56 86 98 106 72 117 89 99 86 82 57 106 90 Obtenha uma amostra formada de 26 elementos, tomando inicialmente a 1ª linha da esquerda para a direita. Dados Absolutos: Dados resultantes da coleta direta da fonte, sem qualquer outra manipulação que a contagem ou medição da característica ou fenômeno em estudo. Dados Relativos: São os resultados de comparações por quociente (ou razão) que se estabelecem entre dados absolutos. Objetiva realçar ou facilitar as comparações entre quantidades, e são normalmente expressos por PORCENTAGENS, ÍNDICES, COEFICIENTES e TAXAS. Índices: São razões entre duas grandezas tais que uma não inclui a outra. Exemplos: Densidade Demográfica = População Superfície Renda per Capita= Renda População Quociente de Inteligência=Idade Mental Idade Cronológica Coeficientes: São razões entre o número de ocorrências e o número total de casos (ocorrências+não ocorrências). Observe-se que o conseqüente da razão (denominador) inclui o antecedente (numerador). Exemplos: Coeficiente de Natalidade = Nº Nascimentos População Coeficiente de Aproveitamento = Nº Alunos Aprovados Nº Final de Matrículas Coeficiente de evasão escolar = Nº de alunos evadidos Total da População 11 Taxas: São coeficientes multiplicados por uma potência de 10. No caso específico da segunda potência de 10 (100) temos a PORCENTAGEM. Exemplos: Taxa de Mortalidade = Coeficiente de Mortalidadex1.000 Taxa de evasão escolar = coeficiente de evasão escolar X 100 Exercícios: 1) Uma escola apresentava, no final do ano, o seguinte quadro Séries Matrículas Março Novembro 1ª 2ª 3ª 4ª 480 458 436 420 475 456 430 420 Total 1794 1781 Evadidos Taxa de Evasão a) Calcule a taxa de evasão por série; b) Calcule a taxa de evasão da escola. 2) Considere a tabela abaixo: Meses Valor (U$ milhões) Janeiro Fevereiro Março Abril 33,3 54,1 44,5 52,9 Total 184,8 Taxas percentuais Evolução das receitas de café industrializado a) Complete-a com uma coluna de taxas percentuais. b) Como se distribuem as receitas em relação ao total? c) Qual o desenvolvimento das receitas de um mês para o outro? d) Qual o desenvolvimento das receitas em relação ao mês de janeiro? 3) São Paulo tinha em 1989, uma população projetada de 32361700 habitantes. Sabendo que sua área terrestre é de 248256 Km², calcule a sua densidade demográfica. 4) Considerando que Minas Gerais, em 1988, apresentou: população projetada: 15345800 habitantes superfície: 586624 Km² nascimentos: 337889 casamentos: 110473 Calcule: a) o índice da densidade demográfica; b) a taxa de natalidade; c) a taxa de nupcialidade. 12 GRÁFICOS ESTATÍSTICOS Representar graficamente significa fazer um desenho que sintetize de maneira clara o comportamento de uma ou mais variáveis. Existem vários tipos de gráficos. Os melhores são os que primam pela simplicidade e clarezas: Principais Gráficos Diagrama Por Linha Poligonal - é a representação gráfica de uma série estatística, por meio de segmentos de retas que une em sequencia os pontos de um sistema cartesiano. Exs.: 1) VENDAS MESES R$ JAN 170 FEV 230 MAR 320 ABR 410 MAI 530 JUN 600 Fonte: Loja Z 2) COMÉRCIO EXTERIOR US$ (bilhões) ANOS Importação Exportação 1996 12 14 1997 15 17,2 1998 17 24,3 1999 19,2 20,4 2000 21,2 22,5 2001 25,4 20,3 Fonte:BB * Previsão VENDAS 800 600 400 200 0 JAN FEV MAR ABR MAI JUN Fonte: Loja Z COMÉRCIO EXTERIOR 50 30 20,4 17 21,2 15 19,2 1997 1998 1999 2000 20,3 17,2 14 20 10 22,5 24,3 40 12 25,4 0 1996 Fonte: BB Importação 2001 Exportação 13 Gráfico Em Colunas: é a representação gráfica de uma série estatística por meio de retângulos dispostos na vertical, com espaços entre eles. PRODUÇÃO DA REGIÃO "A" Produtos Toneladas soja 2550 trigo 1050 milho 2200 feijão 1300 Fonte: Cooperativa "A" Produção da Região "A" 3000 2500 2000 1500 1000 500 0 soja trigo milho feijão Fonte: Cooperativa "A" Gráficos Em Barras: é a representação gráfica de uma série estatística em ordem crescente ou decrescente por meio de retângulos dispostos na horizontal. MOVIMENTO DA LOJA "IMPORTADOS" AGO/2000 Modelos Unidades BMW 30 HONDA 23 FERRARI 7 GOLF 32 BESTA 48 Fonte: Loja "Importados" MOVIMENTO DA LOJA "IMPORTADOS" - AGO 2000 BESTA GOLF FERRARI HONDA BMW 0 10 20 30 40 50 60 Fonte: Loja "Importados" 14 Gráfico Em Setores – é a representação gráfica de uma série estatística por meio de superfícies setoriais. Ex.: PRODUÇÃO DA PRODUÇÃO DA REGIÃO "ABC" REGIÃO "ABC" Produtos Toneladas 9% feijão 170 trigo 230 13% feijão 46% soja 570 trigo milho 830 soja Fonte: Cooperativa "ABC" 32% milho Fonte: Cooperativa "ABC" Exercícios propostos: Para as tabelas e quadros abaixo construa os gráficos que melhor representá-los: 1) O CUSTO DOS INATIVOS civis militares Ano ativos inativos ativos inativos 1995 1647 1378 914 1692 1997 1897 1617 988 1860 1999 1938 1762 1423 2239 Fonte: Ministério da Administração *média salarial dos servidores civis e militares em R$ 2500 O CUSTO DOS INATIVOS 2000 1500 1000 1995 500 1997 0 1999 ativos inativos civis ativos inativos militares Fonte: Ministério da Administração 15 2) COMPUTADOR/ AUTOMÓVEL Ano Computador Automóvel 94 2,2 1,2 95 2,8 1,3 96 4 1,5 97 5,6 1,7 98 6,8 1,5 Fonte: Revista Exame/98 *em milhões 3) QUEM COMPRA PCs? Indústria e Comércio 18% Governo 15% Setor Financeiro 27% Pequenos Consumidores 40% Fonte: Fenasoft/Simonsen Associados 4) O CLUBE DOS SEM* os sem-telefone os sem-esgoto os sem-casa própria os sem-terra os sem-mulher os sem-marido os sem-trabalho Fonte Veja - 23/04/97 *em bilhões 108,7 84,6 43,7 20 16,7 14,1 4,5 5) NÚMERO DE CASOS DE AIDS NA REGIÃO ABC MESES N. DE CASOS NOV 13 DEZ 17 JAN 23 FEV 32 MAR 20 ABR 15 MAI 18 Fonte: Secretaria de Saúde 16 DISTRIBUIÇAO DE FREQUÊNCIA Tabela primitiva e rol de dados É o tipo de tabela cujos elementos não foram numericamente organizados. Exemplo: 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Tabela 1: Estatura de 40 alunos do colégio A Fonte: Crespo, 2002 A tabela primitiva após a ordenação recebe o nome de rol Exemplo: 150 151 152 153 154 155 155 155 156 156 157 158 158 160 160 160 161 161 161 161 162 162 163 163 164 165 166 167 168 168 169 170 Tabela 2: Estatura de 40 alunos do colégio A Fonte: Crespo, 2002 155 160 164 172 156 160 164 173 Distribuição de frequência Denomina-se frequência o número de alunos que fica relacionado a um determinado valor da variável. Exemplo: Estatura (cm) Frequência 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 158 2 160 5 161 4 162 2 163 2 164 3 165 1 166 1 167 1 168 2 169 1 170 1 172 1 173 1 Total 40 Tabela 3: Estatura de 40 alunos do colégio A/ Fonte: Crespo, 2002 17 Pode-se ainda simplificar o processo, agrupando os valores da variável em intervalos, que chamamos de classes. Assim, a tabela 4 representa a estatura dos alunos através de uma distribuição com intervalos de classes: Estatura (cm) Frequência 150 |-- 154 4 154 |-- 158 9 158 |-- 162 11 162 |-- 166 8 166 |-- 170 5 170 |-- 174 3 Total 40 Tabela 4: Estatura de 40 alunos do colégio A agrupados Fonte: Crespo, 2002 Ao agruparmos os dados ganhamos em simplicidade, mas perdemos em pormenores. Elementos de uma distribuição de frequência Classe São intervalos de variação da variável. São representadas por i, sendo i = 1, 2, 3, ..., k. Assim, na tabela 4, o intervalo 154 |-- 158, define a segunda classe, i = 2, sendo k = 6, já que a tabela possui 6 classes. Limites de classe São os extremos de cada classe. O menor número é o limite inferior (li) e o maior número é o limite superior (Li) Na segunda classe por exemplo, tem-se: li = 154 Li = 158 Amplitude de um intervalo de classe É a medida do intervalo que define a classe. É obtida pela diferença entre os limites superior e inferior dessa classe e é indicado por hi. Assim: hi = Li - li Assim, a amplitude da segunda classe é: h2 = L2 – l2 h2 = 158 – 154 = 4 cm Amplitude total da distribuição É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT= L (máx) – l (min) No exemplo da tabela 4: AT = 174 – 150 = 24 cm 18 Amplitude amostral É a diferença entre o valor máximo e valor mínimo da amostra. AA = x(máx) – x (min) No exemplo da tabela 2: AA = 173 – 150 = 23 cm Observe que a amplitude total da distribuição não coincide com a da amplitude amostral. Ponto médio de uma classe É o ponto que divide o intervalo de classe em duas partes iguais. = Assim, o ponto médio da segunda classe, é: + 2 + 2 154 + 158 = = 156 2 = Frequência simples ou absoluta É o número de observações correspondentes a classe ou ao valor. A frequência simples é simbolizada por fi (lemos: f índice i ou frequência da classe i) Assim, no exemplo anterior: f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3 A soma de todas as frequências é representada por: É evidente que: = Para a distribuição em estudo, tem-se: = 40 Representa-se da seguinte forma: i Estatura (cm) fi 1 150 |-- 154 4 2 154 |-- 158 9 3 158 |-- 162 11 4 162 |-- 166 8 5 166 |-- 170 5 6 170 |-- 174 3 Total ∑ fi = 40 19 Exercícios: 1) As notas obtidas por 50 alunos de uma classe foram: 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 Complete a distribuição de frequência abaixo: i Notas 1 0 |-- 2 1 1 2 2 |-- 4 ____ ____ 3 4 |-- 6 ____ ____ 4 6 |-- 8 ____ ____ 5 8 |-- 10 ____ ____ xi Total fi ∑ fi = 50 E, responda: a) Qual a amplitude amostral? b) Qual a amplitude da distribuição? c) Qual o número de classes da distribuição d) Qual o limite inferior da quarta classe? e) Qual o limite superior da classe de ordem 2? f) Qual a amplitude do segundo intervalo de classe? Complete: a) h3 = b) n = c) l1 = d) L3 = e) x2 = f) f5 = 20 Tipos de Frequências Frequência simples ou absoluta (fi) São os valores que realmente representam o número de cada classe. = Frequência relativa (fri) São os valores das razões entre as frequências simples e a frequência total: = ∑ A frequência relativa da terceira classe em nosso exemplo será: = ∑ 11 = = 0,275 40 A soma das frequências relativas será sempre = 1 ou seja de 100% Frequência acumulada (Fi) É a total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: Fk = f1+ f2+...+ fk ou Fk = ∑fi (i = 1, 2, ... , k) Assim, a frequência acumulada da terceira classe será: F3 = f1+ f2+f3 F3 = 4+ 9 + 11= 24 O que significa que existem 24 alunos com estatura inferior a 162 cm, limite superior do intervalo da terceira classe. Frequência acumulada relativa (Fri) É a frequência acumulada da classe, dividida pela frequência total da distribuição: = ∑ = ∑ Assim, no exemplo para a terceira classe: 24 = 0,600 40 Vamos montar uma tabela com os dados do exemplo inicial da estatura dos alunos: = i Estatura (cm) xi fi Fi fri Fri 1 150 |-- 154 ______ ______ ______ ______ ______ 2 154 |-- 158 ______ ______ ______ ______ ______ 3 158 |-- 162 ______ ______ ______ ______ ______ 4 162 |-- 166 ______ ______ ______ ______ ______ 5 166 |-- 170 ______ ______ ______ ______ ______ 6 170 |-- 174 ______ ______ ______ ______ ______ ∑ fri = 1 ∑ fi = 40 Total ∑ fi = 40 21 Exercícios: 1) Complete a distribuição abaixo determinando as frequências simples: i xi fi Fi 1 2 ______ 2 2 3 ______ 9 3 4 ______ 21 4 5 ______ 29 5 6 ______ 34 ∑ fi = 34 2) Conhecidas as notas de 50 alunos: 84 74 59 67 65 68 71 80 41 94 33 81 41 78 66 52 91 50 56 48 47 65 53 94 39 73 55 65 35 69 68 57 76 45 89 61 35 85 55 98 73 85 73 64 42 77 88 60 74 54 Obtenha a distribuição de frequência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 3) Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 1 5 2 5 5 6 4 2 6 2 3 3 5 2 6 3 1 2 4 4 5 3 5 6 3 1 5 1 1 6 3 4 3 5 2 6 4 6 2 6 3 2 5 4 5 4 6 1 3 Forme uma distribuição de frequência sem intervalos de classe. 4) Considerando as notas de um teste de inteligência aplicado a 100 alunos: 64 73 78 86 76 82 68 71 95 94 78 95 86 84 80 90 96 73 94 75 66 82 74 103 78 82 89 73 92 85 78 101 85 98 75 86 76 76 83 103 92 102 73 87 70 83 81 85 72 81 86 70 72 74 84 63 105 74 98 78 88 62 91 83 98 67 95 108 98 71 86 103 80 81 73 90 86 84 85 79 96 81 99 81 78 83 93 83 92 72 87 90 86 85 93 85 89 96 76 73 Forme uma distribuição de frequência. 22 5) A tabela abaixo apresenta apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 12 15 12 14 14 13 11 13 10 16 13 14 13 17 14 11 15 14 13 12 11 14 Forme uma distribuição de frequência sem intervalos de classes. 6) Complete a tabela abaixo: i Classes xi 1 fi Fi fri Fri 0 |-- 8 2 8 |-- 16 ______ 4 ______ ______ ______ ______ 10 ______ ______ 3 ______ 4 16 |-- 24 ______ 14 ______ ______ ______ 5 24 |-- 32 ______ 9 ______ ______ ______ 32 |-- 40 ______ 3 ______ ______ ______ Total ∑ fi = 40 7) Dada a distribuição de frequência: xi 3 4 5 6 7 fi 2 5 12 10 8 ∑ fri = 1 8 3 Determine: a) ∑fi b) As frequências relativas c) As frequências acumuladas d) As frequências relativas acumuladas 8) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes: Áreas m2 300 |-- 400 |-- 500 |-- 600 |-- 700 |-- 800 |-- 900 |-- 1000 |-- 1100|-- 1200 Número de lotes 14 46 58 76 68 62 48 22 6 Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe: d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a frequência da quarta classe; g) a frequência relativa da sexta classe; h) a frequência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2; 23 j) k) l) m) n) o) o número de lotes cuja área atinge e ultrapassa 800 m2; a percentagem de lotes cuja área não atinge 600 m2; a percentagem de lotes cuja área seja maior ou igual a 900 m2; a percentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2; a classe do 72° lote; até que classe estão incluídos 60% dos lotes 9) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Determine: a) o número de motoristas que não sofreram nenhum acidente; b) o número de motoristas que sofreram pelo menos 4 acidentes; c) o número de motoristas que sofreram menos de 3 acidentes; d) o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; e) o número de motoristas que não sofreram no máximo 2 acidentes; 10) Complete os dados que faltam na distribuição de frequência: a) i xi fi fri Fi Fri 1 0 1 0,05 ______ ______ 2 1 ______ 0,15 4 ______ 3 2 4 ______ ______ ______ 4 3 ______ 0,25 13 ______ 5 4 3 0,15 ______ ______ 6 5 2 ______ 18 7 6 ______ ______ 19 8 7 ______ ______ ______ ∑ fi = 20 ∑ fri = 1 b) i Classes xi fi Fi fri Fri 1 0 |-- 2 ______ 4 ______ ______ ______ 2 2 |-- 4 ______ 8 ______ ______ ______ 3 4 |-- 6 ______ ______ 30 ______ ______ 4 6 |-- 8 ______ 27 ______ ______ ______ 5 8 |-- 10 ______ 15 72 ______ ______ 6 10 |-- 12 ______ ______ 83 ______ ______ 7 12 |-- 14 ______ 10 93 ______ ______ 8 14 |-- 16 ______ ______ ______ ______ ______ Total ∑ fi = 40 ∑ fri = 1 24 MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO MÉDIA Quando a distribuição é simétrica, a média e a mediana coincidem. A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes. Por outro lado a média reflete o valor de todas as observações. Assim, não se pode dizer em termos absolutos qual destas medidas de localização é preferível, dependendo do contexto em que estão a ser utilizadas. x =∑xi n A média é o quociente da divisão da soma dos valores das variáveis pelo número deles: Ex. para dados não agrupados: Sabendo-se que a produção diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, calcule a produção média na semana. Desvio em relação a média – é a diferença entre cada elemento de um conjunto de valores e a média aritmética. Ex. Determinar o desvio em relação a média no exemplo anterior. Cálculo da média para dados agrupados (média ponderada) Sem intervalo de classe x =∑xifi ∑fi Ex.: Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Nº de meninos fi xifi 0 2 1 6 2 10 3 12 4 4 ∑=34 ∑= Determine a média aritmética ponderada: 25 Exercício: Determine a média aritmética da distribuição: xi fi 1 2 2 4 3 6 4 8 5 3 6 1 xifi ∑= ∑= Com intervalo de classe Ex.: i Estaturas (cm) fi 1 150|--154 4 2 154|--158 9 3 158|--162 11 4 162|--166 8 5 166|--170 5 6 170|--174 3 xi xifi ∑=40 ∑=6440 Exercício: Complete o esquema para o cálculo da média aritmética da distribuição de frequência: Custos 450|--550|--650|--750|--850|--950|--1050|--1150 fi i 8 xi 10 11 16 13 fi xifi 1 8 4000 2 10 3 11 4 16 5 1 5 6 7 1100 ∑= ∑= R.:755 26 MODA (Mo) Para um conjunto de dados, define-se moda como sendo: O valor que surge com mais frequência se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal. Cálculo da moda para dados agrupados Sem intervalo de classe: Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação). Ex.: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Mo=10 Série amodal: nenhum valor aparece mais vezes que outro. Ex.: 3, 5, 8, 10, 12, 13 Série bimodal: mais de um valor aparece mais vezes que outros. Ex.: 3, 4, 4, 4, 5, 7, 7, 7, 8, 10, 12, 13 Mo= 4 e 7 Cálculo da moda para dados agrupados Com intervalo de classe Mo = l + L 2 l = limite inferior da classe modal L = limite superior da classe modal Ex.: Determine a moda i Estatura (cm) fi 1 150 |-- 154 4 2 154 |-- 158 9 3 158 |-- 162 11 4 162 |-- 166 8 5 166 |-- 170 5 6 170 |-- 174 3 Total ∑ fi = 40 Mo = 158 + 162 = 160 2 27 Exercício: Determine a moda: i Estaturas (cm) fi 1 450 |--550 8 2 550 |--650 10 3 650 |--750 11 4 750 |--850 16 5 850 |--950 13 6 950 |--1050 5 7 1050|--1150 1 ∑=64 MEDIANA A mediana, m, é uma medida de localização do centro da distribuição dos dados, definida do seguinte modo: Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento médio. Se n é par, a mediana é a semi-soma dos dois elementos médios. Ex.: Dada a série: 5, 13, 10, 2, 18, 15, 6, 16, 9, determine a mediana. Dados não-agrupados Sem intervalo de classe Nº de meninos fi Fi 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 ∑=34 34/2=17, MD=2 meninos 28 Ex. 2 xi fi Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Md = 15,5 Exercícios: Qual é a mediana nas distribuições? a) xi 2 4 6 8 10 fi 3 7 12 8 4 Md = b) xi 0 1 2 3 4 5 fi 2 5 9 7 6 3 Md= Dados agrupados Deve-se seguir os seguintes passos: 1) Determinar as frequências acumuladas 2) Calcular ∑ 3) Marcar a classe correspondente a frequência acumulada imediatamente superior à mediana e em seguida empregar a fórmula: ∑ – classe ∑% $ ' & − )(+,-)/ 0∗ ! = "∗ + %∗ Na qual: l* é o limite inferior da classe mediana; F(ant) é a frequência acumulada da classe anterior à classe mediana; f* é a frequência simples da classe mediana; h* é a amplitude do intervalo da classe mediana. 29 Exemplo: Determinar a mediana da distribuição de frequência: i Estatura (cm) fi 1 150 |-- 154 4 2 154 |-- 158 9 3 158 |-- 162 11 4 162 |-- 166 8 5 166 |-- 170 5 6 170 |-- 174 3 Total ∑ fi = 40 Observação no caso de existir uma frequência acumulada exatamente igual a limite superior da classe correspondente. ∑ , a mediana será o Exercício: 1) Determinar a mediana das distribuições de frequência: i Custo fi 1 450 |--550 8 2 550 |--650 10 3 650 |--750 11 4 750 |--850 16 5 850 |--950 13 6 950 |--1050 5 7 1050|--1150 1 ∑=64 i classes fi 1 0 |-- 10 1 2 10 |-- 20 3 3 20 |-- 30 9 4 30 |-- 40 7 5 40 |-- 50 4 6 50 |-- 60 2 Total ∑ fi = 26 Calcule a média e a mediana das distribuições: i toneladas fi 1 300 |-- 400 17 2 400 |-- 500 22 3 500 |-- 600 38 4 600 |-- 700 20 5 700 |-- 800 15 Total ∑ fi = 112 30 i cm 1 140 |-- 150 17 2 150 |-- 155 28 3 155 |-- 160 43 4 160 |-- 165 52 5 165 |-- 170 40 6 170 |-- 180 30 Total ∑ fi = 210 fi Resumindo, como a média é influenciada quer por valores muito grandes, quer por valores muito pequenos, se a distribuição dos dados: 1. for aproximadamente simétrica, a média aproxima-se da mediana 2. for enviesada para a direita (alguns valores grandes como "outliers"), a média tende a ser maior que a mediana 3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a média tende a ser inferior à mediana. Representando as ditribuições dos dados (esta observação é válida para as representações gráficas na forma de diagramas de barras ou de histograma) na forma de uma mancha, temos, de um modo geral: SEPARATRIZES São medidas teóricas que permitem a separação da distribuição em grupos. Posição das separatrizes: Quartis Denomina-se quartis os valores de uma série que a dividem em quatro partes iguais. ∑ 1 = 2 com i = 1, 2 ou 3 Decis Denomina-se decis os valores de uma série que a dividem em 10 partes iguais. ∑ 3 = 4 com i = 1, 2, ..., 9 31 Percentis Denomina-se decis os valores de uma série que a dividem em 100 partes iguais. ∑ 5 = com i = 1, 2 ou 3 44 Quando os dados são agrupados, usa-se a mesma técnica do cálculo da mediana. Por exemplo, para calcularmos o terceiro quartil: 3 ∑ − (78)/ ℎ∗ 2 ∗ 1 = + ∗ $ Exemplo: 1) Calcule o 1° e 3° quartil, 3° e 6° decil e o 32° percentil:11, 13, 13, 15, 17, 17, 17, 18, 18, 21, 23, 23, 25, 26, 28, 30, 31, 33, 36, 37, 37, 38, 38, 39, 39, 40, 41, 42, 42, 42, 45, 46, 48, 49, 51, 52. 2) Calcular os quartis inferior e superior e os 15° e 25° centis: Vida útil (horas) fi 0 |-- 100 13 100 |-- 200 45 200 |-- 300 54 300 |-- 400 125 400 |-- 500 96 500 |-- 600 27 Total ∑ fi = 3) A avaliação de desempenho de um treinamento aplicado aos funcionários da empresa Um Dois Três de Oliveira Quatro obedecia o seguinte critério: Notas de 65 a 100 Aprovados; de 50 até 65 Recuperação Parcial; de 34 a 50, Recuperação Plena e abaixo de 34 Reprovados. Os resultados obtidos foram expressos na distribuição abaixo: Notas fi 10 |-- 25 14 25 |-- 40 20 40 |-- 55 26 55 |-- 70 34 70 |-- 85 60 85 |-- 100 26 Total ∑ fi = 180 Pede-se: a) A quantidade de funcionários reprovados; b) A quantidade de funcionários em recuperação plena; c) A quantidade de funcionários recuperação parcial; d) A quantidade de funcionários aprovados. 32 Representação Gráfica De Uma Distribuição Histograma E Sua Interpretação Uma leitura atenta do histograma deve responder a questões como: 1. Qual é a forma da distribuição? 2. Existe um ponto central bem definido? 3. Quão grande é a variação? 4. Qual é a amplitude dos dados? 5. Existe apenas um pico? 6. A distribuição é simétrica? 7. Existem barras isoladas? 8. Quais conclusões que você pode tirar sobre o desempenho do processo em relação r à característica estudada? 9. O histograma é conclusivo ou seu aspecto sugere a necessidade de estratificação para buscar as causas das anomalias encontradas? Tipos De Histogramas: Histograma simétrico, tipo distribuição Normal: Característica: a frequência é mais alta no centro e decresce gradualmente para as caudas de maneira simétrica (forma de sino). A média e a mediana são aproximadamente iguais e localizam-se se no centro do histograma (ponto de pico). Quando ocorre: forma usualmente observada observada em processos padronizados, estáveis, em que a característica de qualidade é contínua e não apresenta nenhuma restrição teórica nos valores que podem ocorrer. 90 80 70 60 50 40 30 20 10 0 33 Histograma assimétrico e com apenas um pico: 90 80 70 60 50 40 30 20 10 0 Características: a frequência decresce bruscamente em um dos lados de forma gradual no outro, produzindo uma calda mais longa em um dos lados. A média localiza-se localiza se fora do meio da faixa de variação. Quando a assimetria é à direita a mediana é inferior a média. Quando a assimetria é à esquerda squerda a mediana é superior à média. Quando ocorre:: possivelmente a característica de qualidade possui apenas um limite de especificação e é controlada durante o processo, de modo que satisfaça a essa especificação. Histograma tipo “despenhadeiro”: 90 80 70 60 50 40 30 20 10 0 90 80 70 60 50 40 30 20 10 0 Característica: o histograma termina abruptamente de um ou dos dois lados, dando a impressão de faltar um pedaço na figura. Quando ocorre: possivelmente foram eliminados dados por uma inspeção 100%; nesse caso o “corte” coincide com os limites de especificação. Histograma com dois picos: 90 80 70 60 50 40 30 20 10 0 34 Característica: ocorrem dois picos e a frequência é baixa entre eles Quando ocorre: em situações ções em que há mistura de dados com médias diferentes obtidos em duas condições distintas. Por exemplo, dois tipos de matérias primas, duas máquinas ou dois operadores. A estratificação dos dados segundo esses fatores poderá confirmar ou não tais conjecturas. Histograma do tipo “platô” 80 70 60 50 40 30 20 10 0 Característica: classes centrais possuem aproximadamente a mesma frequência. Quando ocorre: aspecto possível quando há mistura de várias distribuições com médias diferentes Histograma com uma pequena “ilha” isolada: 90 80 70 60 50 40 30 20 10 0 Característica: algumas faixas de valores da característica de qualidade observada ficam isoladas da grande maioria dos dados, gerando barras ou pequenos agrupamentos separados. Quando ocorre: possivelmente ocorreram anormalidades temporárias temporárias no processo, erros de medição, erros de registro ou transcrição dos dados, produzindo alguns resultados muito diferentes dos demais. 35 MEDIDAS DE DISPERSÃO VARIÂNCIA: Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um: ( xi − x) 2 s =∑ i =1 n −1 n 2 DESVIO PADRÃO: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: ( xi − x) 2 i =1 n −1 n s= ∑ O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: • o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre os dados. • se s = 0, então não existe variabilidade, isto é, os dados são todos iguais. A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade dos dados, uns relativamente aos outros. Ex.: Calcular o desvio padrão par ao conjunto de valores: 40, 45, 48, 52, 54, 62, 70 xi x xi - x (xi- x )2 40 53 -13 169 45 53 -8 64 48 53 -5 25 52 53 -1 1 54 53 1 1 62 53 9 81 70 53 17 289 ∑=371 S= 630 36 Exercício: Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10, 11, 15, 16, 18 xi x xi - x (xi- x )2 8 10 11 15 16 18 ∑= S= Dados agrupados Sem intervalo de classes ou com intervalo de classe ( xi − x) 2 fi amostral s= ∑ i =1 n −1 n xi fi 0 2 1 6 2 12 3 7 4 3 x xi - x (xi- x )2 (xi- x )2fi ∑= S= 37 Exercício: Calcule o desvio padrão da distribuição: xi 1 2 3 4 5 6 fi 2 5 8 6 3 1 xi fi x xi - x (xi- x )2 (xi- x )2fi 1 2 3 4 5 6 S= Ex.: i Estaturas (cm) fi xi 1 150|--154 4 152 2 154|--158 9 156 3 158|--162 11 160 4 162|--166 8 164 5 166|--170 5 168 6 170|--174 3 172 x (xi- x )2 xi - x (xi- x )2fi S= Exercício: Calcule o desvio padrão da distribuição: i intervalo fi 1 30|--50 2 2 50|--70 8 3 70|--90 12 4 90|--110 10 5 110|--130 5 ∑= xi x xi - x ∑= ∑= (xi- x )2 (xi- x )2fi 38 Exercícios complementares: 1) Os tempos despendidos por 12 alunos (N = 12), em segundos, para percorrer certo trajeto, sem barreira, foram 16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23. Determine o valor, sem agrupar os dados: da moda, mediana e média; da variância absoluta, do desvio padrão. 2) Considerando uma população, de tamanho 16 (N = 16), constituída de alunos, cuja variável de interesse X é o número de faltas de cada aluno, obteve-se: 0, 0, 1, 2, 2, 2, 4, 4, 4, 3, 0, 5, 4, 4, 3 e 2. Sem agrupar os dados, determine o valor: da moda, mediana e média; da variância absoluta, do desvio padrão. 3) Considere uma população de 40 profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela: Nº de Publicações Nº de Profissionais 0 6 1 8 2 12 3 10 4 4 ∑ 40 Pede-se: a) A percentagem de profissionais que tem menos de 3 revistas e/ou jornais (publicações). b) valor da moda, da mediana e da média aritmética simples. c) valor da variância absoluta, do desvio padrão. 4) Em certo dia foi realizado um levantamento a respeito das idades dos alunos de um curso noturno, obtendose a tabela abaixo: Idades (anos) Nº de Alunos 16 |- 20 8 20 |- 24 16 24 |- 28 12 28 |- 32 4 ∑ 40 Considerando esta turma como uma população, determine: a) A percentagem de alunos com menos de 24 anos. b) O valor da média aritmética simples e a moda. c) O valor da variância absoluta, do desvio padrão. 39 5) Em um levantamento realizado, em maio de 1983 nos 200 funcionários da empresa XK, em relação a variável expressa em unidades monetárias (u.m.), obteve-se a seguinte tabela: Salário (u.m.) Nº de Funcionários 0 |- 2 26 2 |- 4 32 4 |- 6 34 6 |- 8 40 8 |- 10 28 10 |- 12 22 12 |- 14 18 ∑ 200 Considerando os 200 funcionários como de uma população, determine: a) A percentagem de funcionários que recebem salário maior ou igual a 2 u.m. e menor que 4 u.m. b) A porcentagem de funcionários que recebem menos de 8 u.m. c) O valor da moda e da média dos salários. d) O valor da variância absoluta, do desvio padrão. 6) Considerando que foi extraída uma amostra aleatória simples de 10 alunos de uma grande escola, cuja variável em estudo é a nota obtida em Matemática, obteve-se: 5, 7, 8, 6, 5, 4, 8, 9, 10 e 6. Determine a média da amostra, a variância da amostra e o desvio padrão da amostra. 7) Considerando que as três distribuições hipotéticas apresentam os valores indicados abaixo: Valores obtidos em três distribuições hipotéticas DISTRIBUIÇÃO A B C N = 200 N = 50 N = 400 ∑f.X = 4000 ∑f.X = 500 ∑f.X = 3200 ∑f.X2 = 85000 ∑f.X2 = 5450 ∑f.X2 = 32000 Determine os indicadores: média aritmética, variância absoluta, desvio padrão. 8) Uma empresa de informática possui 10 vendedores e cada um deles trabalha com diferentes cargas horárias. As cargas horárias dos vendedores são dadas abaixo: 5 4 8 8 7 6 6 8 8 12 Calcule a média, a mediana, a moda e desvio padrão das cargas horárias desses vendedores. 40 9) Uma pesquisa sobre a idade (em anos), de uma classe de calouros do curso de Computação de certa faculdade, revelou os seguintes valores: 17 17 17 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 21 21 21 21 Construa uma distribuição de frequência e em seguida determine a média, a mediana, a moda e desvio padrão das idades. 10) Um produto é condicionado em lotes contendo cada um deles 10 unidades. Considere os produtos que compõe um determinado lote com seus respectivos pesos (em kg): 3 4 3,5 5 3,5 4 5 5,5 4 5 Determine: a) O peso médio dos produtos; b) A mediana correspondente ao peso dos produtos; c) A Moda correspondente ao peso dos produtos; d) A variação dos pesos dos produtos. 11) Considere as seguintes distribuições A, B e C, que representam a satisfação do cliente em relação ao atendimento ao usuário: Distribuição A Distribuição B Distribuição C Satisfação do Cliente fi Satisfação do Cliente fi Satisfação do Cliente fi 0├ 2├ 4├ 6├ 8├ 2 4 9 15 7 0├ 2├ 4├ 6├ 8├ 5 8 11 8 5 0├ 2├ 4├ 6├ 8├ 7 12 9 5 4 2 4 6 8 10 Σfi = 37 2 4 6 8 10 Σfi = 37 2 4 6 8 10 Σfi = 37 Calcular a média, mediana, moda e desvio padrão das distribuições A, B e C; 41 Coeficientes De Variação (Cv) Quando temos dois ou mais conjuntos com média e desvio padrão diferentes entre eles, como podemos determinar o mais homogêneo? Exemplo: Conjunto C Conjunto D ̅ = 100 ̅ = 450 s = 10 s = 35 Podemos usar a idéia de: Quanto 10 representa em 100? E quanto 35 representa em 450? Este cálculo, expresso em porcentagem é o coeficiente de variação, ou seja mede percentualmente a relação ação entre desvio padrão e a média aritmética, sendo pois uma medida adimensional. ; CV = <̅ 100 MEDIDAS DE ASSIMETRIA E CURTOSE Momentos 42 Formato de uma distribuição O terceiro e quarto momentos1 de uma distribuição são freqüentemente usados para estudar a “aparência” de uma distribuição, em especial sua assimetria e sua curtose. Em outras palavras, a distribuição dos dados pode ser simétrica ou não, ou ainda achatada ou pontiaguda e, isso, dará um u formato à curva de distribuição. Medida De Assimetria Denomina-se se assimetria o grau de afastamento da simetria de uma distribuição de dados. Em uma distribuição (a) simétrica, tem-se tem se igualdade dos valores da média, mediana e moda. Entretanto, se numa distribuição ocorrer: b) X ≥ Md ≥ Mo : existirão mais dados da série menores do que a média, porém a curva da distribuição terá uma cauda mais longa para os dados maiores do que a média, isto é, diz-se diz que a distribuição tem assimetria positiva. c) X ≤ Md ≤ Mo : existirão mais dados da série série maiores do que a média, porém poré a curva de distribuição terá uma cauda mais longa para os dados menores do que a média, isto é, diz-se diz que a distribuição tem assimetria negativa; A estimativa do coeficiente de assimetria (Cs) ( de uma variável X é dada por: 5= 5= ?B *;C .D,E Interpretação a) Cs = 0:: se o resultado for zero, a distribuição é simétrica, b) Cs < 0:: se o valor for negativo, a distribuição é assimétrica negativa (inclinada para a esquerda) e, c) Cs > 0:: se o resultado for positivo, a distribuição é assimétrica positiva (inclinada para a direita). A estimativa do coeficiente de assimetria pode ainda ser encontrado através do primeiro e segundo coeficiente de assimetria de Pearson, dados respectivamente respe por: 5= = 1 <̅ >?@ ; e 5= *<̅ >?A. ; O primeiro momento é a média e o segundo momento é a variância. 43 Medida De Curtose Denomina-se se curtose o grau de achatamento da distribuição. O resultado pode ser assim definido: 5F = ?′G *;C .C Ck = 3 - Mesocúrtica – a distribuição de frequências é a própria distribuição normal; Ck > 3 - Platicúrtica – a distribuição é achatada (alta variabilidade); Ck < 3 - Leptocúrtica – a distribuição é concentrada em torno da média (alta homogeneidade). Obs: A assimetria positiva surge quando a média aritmética é aumentada por algum valor extraordinariamente elevado e, a assimetria negativa ocorre quando a média é reduzida por algum valor extremamente baixo. Os dados são simétricos quando não existem valores realmente extremos em uma direção específica, de modo que que os valores baixos e altos se equilibram entre si. Ou também pela fórmula: Exercícios: 1) Determinar : a) O primeiro, o segundo e o terceiro momento para o conjunto de números 2, 3, 7, 8, 10. b) O segundo momento em relação à média. 44 2) Os dados a seguir referem-se referem se ao número de partos/dia ocorridos num determinado hospital durante o mês de março de 2007: a) Obter o primeiro momento à origem b) Segundo, terceiro e quarto momentos em relação à média c) Obter os coeficientes de assimetria e curtose utilizando o terceiro e quarto momento encontrado. ções de frequência frequência abaixo determine: a media, a moda, a mediana, o desvio 3) Para as distribuições padrão ão os coeficientes de assimetria de Person e os coeficientes de curtose. 45 ANÁLISE COMBINATÓRIA Princípio Fundamental da Contagem Se um resultado pode ser obtido de n1 maneiras diferentes e se, após isso um segundo resultado pode ser obtido de n2 maneiras diferentes, ... e finalmente se um k° resultado pode ser obtido de nk maneiras diferentes, então, todos os kk resultados podem ser obtidos na ordem especificada, de n1,n2 ..., nk maneiras diferentes. Exercícios: 1) Se um homem tem 2 camisas e 4 gravatas, poderá escolher uma camisa e uma gravata de quantas maneiras diferentes? 2) Uma bandeira é formada por 4 listras, que devem ser coloridas usando-se apenas as cores amarelo, branco e cinza, não devendo listras adjacentes ter a mesma cor. De quantos modos pode ser colorida a bandeira? 3) Quantos números naturais de 3 algarismo distintos (na base 10) existem? Recomendação: Tomar primeiro a decisão mais difícil. 4) Quantos números de 4 algarismos (na base 10) que sejam menores que 5000 e divisíveis por 5 podem ser formados usando-se apenas os algarismos 2, 3, 4 e 5? 5) As placas de automóvel são formadas por 3 letras (K, Y e W inclusive) seguidas por 4 algarismos.Quantas placas podem ser formadas? 6) Quantos são os números naturais pares que se escrevem (na base 10) com 3 algarismos distintos? 7) O conjunto A possui 4 elementos e o conjunto B possui 7 elementos/ a) Quantas são as funções f: A→B? b) Quantas são as funções injetoras f: A→B? 8) Quantos subconjuntos possui um conjunto que tem n elementos? 9) Há duas estradas principais da cidade A até a cidade B, ligadas por 10 estradas secundárias. Quantas rotas livres de auto-interseção há de A até B? 46 Permutações simples Dados n objetos distintos a1, a2, ..., an de quantos modos é possível ordená-los? O números de modos de ordenar n objetos distintos é: n(n-1) ... 1 = n! Cada ordenação dos n objetos é chamada uma permutação simples de n objetos e o número de permutações simples de n objetos distintos é representado por Pn. Assim Pn = n! 0! = 1, por quê? Exercícios: 1) Quantos são os anagramas da palavra PRATICO? 2) Quantos são os anagramas da palavra PRATICO que começam e terminam por consoante? 3) De quantos modos 5 rapazes e 5 moças podem se sentar em 5 bancos de 2 lugares cada, de modo que em cada banco fique um rapaz e uma moça? 4) De quantos modos podemos dividir 8 pessoas em 2 grupos de 4 pessoas cada? 5) Se A é um conjunto com n elementos, quantas são as funções f: A→B bijetoras? 6) De quantos modos r rapazes e m moças podem se colocar em fila de modo que as moças fiquem juntas? 7) Quantas são as permutações simples dos números, 1, 2,..., n nas quais o elemento que ocupa a k-ésima posição é inferior a k+4 para todo k? 8) Quantas são as permutações simples dos números 1, 2, ..., n nas quais os k-ésima posição é maior que k-3, para todo k? 47 Combinações simples De quantos modos podemos escolher p objetos distintos entre n objetos distintos dados? Ou, o que é o mesmo, quantos são os subconjuntos com p elementos do conjunto {a1,a2 ..., an}? Cada subconjunto com p elementos é chamado de uma combinação simples da classe p dos n objetos a1,a2 ..., an. Assim, por exemplo, as combinações simples de classe 3 dos objetos a1 ,a2, a3, a4, a5 são: {a1,a2,a3}{a1,a2,a4}{a1,a2,a5}{a1,a3,a4}{a1,a3,a5}{a1,a4,a5}{a2,a3,a4}{a2,a3,a5}{a2,a4,a5}{a3,a4,a5} I O número de combinações simples de classe p de n objetos é representado por 5H .Assim, 5J = 10 Analisemos essa resposta: Primeiro elemento: Segundo elemento: Terceiro elemento: .... Concluindo: 5HI = ! MNO 0 ≤ L ≤ L! ( − L)! Exercícios: 1) Quantas saladas contendo exatamente 4 frutas podemos formar dispondo de 10 frutas diferentes? 2) Marcam-se 5 pontos sobre uma reta R e 8 pontos sobre uma reta R’. Quantos triângulos existem com vértices em 3 desses pontos? 3) De quantos modos podemos escolher 6 pessoas, incluindo pelo menos 2 mulheres, em um grupo de 7 elementos e 4 mulheres? 4) De quantos modos podemos dividir 8 pessoas em 2 grupos de 4 pessoas cada? 5) Uma comissão formada por 3 homens e 3 mulheres deve ser escolhido um grupo de 8 homens e 5 mulheres. a) Quantas comissões podem ser formadas? b) Qual seria a resposta se um dos homens não aceitasse participar da comissão se nela estivesse determinada mulher? 6) Para a seleção brasileira foram convocados 2 goleiros, 6 zagueiros, 7 meios de campo e 4 atacantes. De quantos modos é possível escalar a seleção com um goleiro, 4 zagueiros, 4 meios de campo e 2 atacantes? 7) Quantas diagonais possui um polígono de n lados? 8) Tem-se 5 pontos sobre uma reta R e 8 pontos sobre uma reta R’ paralela a R. quantos quadriláteros convexos em 4 desses 13 pontos existem? 9) Um homem tem 5 amigas e 7 amigos. Sua esposa tem 7 amigas e 5 amigos. De quantos modos eles podem convidar 6 amigas e 6 amigos, se cada um deve convidar 6 pessoas? 10) De quantos modos podemos formar uma roda com 5 crianças? 48 Permutações circulares De quantos podemos colocar n objetos distintos em n lugares equiespaçados em torno de um círculo, se considerarmos equivalentes disposições que podem coincidir por rotação? PCn = número de permutações circulares de n objetos distintos. Exemplo: Como podemos permutar 3 objetos distintos em 3 lugares em um único círculo? PCn = H! H ou (n-1)! Exercícios: 1) Quantas rodas de ciranda podem ser formadas com n crianças? 2) De quantos modos podemos formar uma roda de ciranda com 7 crianças, de modo que 2 determinadas dessas crianças não fiquem juntas? Permutações de elementos nem todos distintos Exemplo: Quantos anagramas possui e palavra TARTARA? Exercícios: 1) Quantos são os anagramas da palavra MATEMÁTICA? 2) Quantos são os anagramas da palavra URUGUAI que começam por vogal? 3) A figura representa o mapa de uma cidade na qual há 7 avenidas na direção norte-sul e 6 avenidas na direção leste-oeste. a) Quantos são os trajetos de comprimento mínimo ligando o ponto A ao ponto B? b) Quantos desses trajetos passam por C? 49 Combinações completas Exemplo: De quantos modos é possível comprar 4 sorvetes em uma loja que os oferece em 7 sabores? I I 5QH = 5IRH> = ( + L − 1)! L! ( − 1)! Exercícios: 1) Quantas são as soluções inteiras e não-negativas de x + y + z = 5? 2) Quantas são as soluções inteiras e não-negativas da inequação x + y + z ≤ 5? 3) Quantas são as soluções inteiras da equação x + y + z = 20, com x≥2, y≥2, z≥2? 4) Quantos são os anagramas da palavra PIRACICABA que não possuem duas letras A juntas? 5) Quantas são as soluções inteiras não-negativas de x + y + z + w = 3? 6) Quantas são as soluções inteiras e não-negativas de x + y + z + w < 6? 7) Quantas são as peças de um dominó comum? 8) D e quantos modos podemos colocar em fila 7 letras A, 6 letras B e 5 letras C de modo que não haja duas letras B juntas? 9) A fábrica X produz 8 tipos de bombons que são vendidos em caixas de 30 bombons (de um mesmo tipo ou sortidos). Quantas caixas diferentes podem ser formadas? 10) De quantos modos podem ser pintados seis objetos iguais usando 3 cores diferentes? 11) De quantos modos esse mapa pode ser colorido (cada país de uma cor, países com uma linha fronteira comum não podem ter a mesma cor) se dispomos de x cores diferentes? Qual o menor valor de x que permite colorir o mapa? e Princípio da inclusão/ exclusão Exemplo: Quantos inteiros entre 1 e 1000 são divisíveis por 3 ou 7? Exercícios: 1) Uma urna contém n bolas, das quais devem ser escolhidas p bolas. Determine: a) O número SIH de seleções ordenadas, se repetições não são permitidas (essas seleções são denominadas arranjos simples de classe p das n bolas. b) O número de seleções desordenadas (isto é, seleções que só diferem pela ordem são consideradas iguais se repetições não são permitidas). c) O número SQHI de seleções ordenadas, se repetições são permitidas (essas seleções são denominadas arranjos completos de classe p das n bolas. Também são usados os nomes arranjos com reposição ou arranjos sem reposição). d) O número de seleções desordenadas, se seleções são permitidas. 50 PROBABILIDADE Revisão conjuntos Conjuntos Coleção de objetos chamados membros ou elementos do conjunto. Denota-se por uma letra maiúscula (A, B, C, ...) e os elementos por letras minúsculas (a, b, c, ...) A ∈ C se A pertence a C A ∉ C se A não pertence a C Deve-se ter uma regra para determinar se um elemento pertence ou não a determinado conjunto. Subconjuntos Se todo elemento de A é também elemento de B, dizemos que A é subconjunto de B: A ⊂ B ou B ⊃ A. Segue que qualquer que seja A, A ⊂ A Se A ⊂ B e B ⊃ A, A = B. Em tal caso tem exatamente os mesmos elementos. Se A e B não são iguais, isto é, não tem os mesmos elementos A ≠ B. Se A ⊂ B, mas A ≠ B., dizemos que A é subconjunto próprio de B. Exemplo: {a, i, u} é subconjunto próprio de {a, e, i, o, u}. Teorema 1.1 : Se A ⊂ B e B ⊂ C, então A ⊂ C. Conjunto Universal ou Universo: também designado por U Conjunto vazio: sem elementos ∅ Exemplos: Operações entre conjuntos União – A ∪ B Intersecção – A ∩ B Diferença – A - B Complemento – Se B ∁ A então A – B é o complemento de B em relação a A Se A = ∪, ∪ - B complemento de B (B’ ou ]^) Alguns Teoremas T 1.2 - A ∪ B = B ∪ A (lei comutativa da união) 51 T 1.3 - A ∪ (B ∪ C) = (A ∪ B) ∪ C = A ∪ B ∪ C (lei associativa da união) T 1.4 - A ∩ B = B ∩ A (lei comutativa da intersecção) T 1.5 - A ∩ (B ∩ C) = (A ∩ B) ∩ C = A ∩ B ∩ C (lei associativa da intersecção) T 1.6 – A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) (Primeira lei distributiva) T 1.7 – A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) (Segunda lei distributiva) T 1.8 – A – B = A ∩ B’ T 1.9 – Se A ⊂ B, então A’⊃ B’ ou B’ ⊂ A’ T 1.10 - A ∪ ∅ = A, A ∩ ∅ = ∅ T 1.11 - A ∪ U = U, A ∩ U = A T 1.12a – (A ∪ B’) = A’ ∩ B’ (Primeira lei de Morgan) T 1.12b – (A ∩ B)’ = A’ ∪ B’ (Segunda lei de Morgan) T 1.13 – A = (A ∩ B) ∪ (A ∩ B’) para quaisquer conjuntos A e B Exercícios: 1) Sejam os conjuntos A= {x/x é inteiro ímpar}, B = {x/x2 - 8x + 15 = 0}, mostre que B ⊂ A. 2) Determine quais afirmações são verdadeiras. a) {x/x ≠ x}= {∅} b) Se A = {x/x2 = 4, x > 9} e B = {x/x ≤ 1}, então B > A. 3) Seja o Universo U = _ , 0, `, 5, − √2, −4b. Se A = c− √2, `, 0d, B = _5, , − √2, −4b e C = _ , −4b. são subconjuntos de U, determine: a) (A ∩ B) = b) (A ∪ B) = c) (A ∪ B) ∩ C = d) B’ ∪ C’ = e) A – B = f) (B ∩ C)’ = g) (A ∩ B) ∪ (B ∩ C) = Experimentos aleatórios ou não determinísticos São experimentos em que os resultados não são essencialmente os mesmos, ainda que as condições se mantenham as mesmas. 52 Exemplo: jogada de uma moeda, jogada de um dado, máquinas de roelas. Obs.: repetido muitas vezes a regularidade aparece Espaços amostrais Definição: Para cada experimento ε do tipo considerado, definimos espaço amostral como o conjunto de todos os resultados possíveis de ε. Exemplos. Jogue um dado e observe o número mostrado na face de cima. Jogue uma moeda quatro vezes e observe o número de caras obtido Jogue uma moeda duas vezes. Descreva o espaço amostral representado por coroa (T) e cara (H) Eventos Um evento é um subconjunto de A do espaço amostral, isto é, um conjunto de resultados possíveis, Se o resultado de um experimento é elemento de A, dizemos que A ocorreu, Exemplo: Jogue uma moeda duas vezes, o evento consiste em aparecer cara apenas uma vez. É o subconjunto do espaço amostral que consiste dos pontos {TH e HT}. Eventos particulares ou certos: temos nesse caso o próprio espaço amostral, e como evento impossível o ∅, pois sempre teremos cara ou coroa. Eventos são conjuntos, assim, se A e B são eventos: a) A ∪ B é o evento A, ou B, ou ambos b) A ∩ B é o evento A e B c) A’ é o evento não A d) A – B é o evento A mas não B Se os conjuntos correspondentes aos eventos A e B são disjuntos, isto é, se A ∩ B = ∅ diz-se que os conjuntos são mutuamente excludentes, o que significa que os eventos em questão não podem ocorrer simultaneamente. Exemplo: Referindo-se ao lançamento de uma moeda duas vezes, seja A o evento “aparece ao menos uma cara” e B o evento “o resultado do segundo lançamento é coroa”, então A =? e B=? a) A ∪ B b) A ∩ B c) A’ d) A – B Observações: Se um espaço amostral tem um número finito de pontos, chama-se espaço amostral finito. Exemplo: Jogar uma moeda duas vezes. Se tem tantos pontos quantos são os números naturais, chama-se espaço amostral infinito numerável. Esses dois casos são discretos. Se tem tantos pontos quantos um determinado segmento do eixo dos x, tal como 0 ≤ x ≤ 1, chamase espaço amostral infinito não-enumerável, é um espaço amostral não discreto ou contínuo. Exemplos: 53 1) De um baralho comum de 52 cartas extrai-se uma carta ao acaso. Descreva o espaço amostral: a) Não se levando em conta os naipes b) Levando-se em conta os naipes c) Represente a letra b através de uma figura, mais especificamente um sistema cartesiano em que os eixo x representa as cartas e o eixo y os naipes. 2) Ainda em relação ao problema 1, seja A o evento {extração de um rei}ou simplesmente {rei} e B o evento {carta de paus}. Descreva: a) A ∪ B = b) A ∩ B = c) A ∪ B’ = d) A’ ∪ B’ e) A – B = f) A’ - B’ = g) (A ∩ B) ∪ (A ∩ B’) = 3) Um dispositivo eletrônico é ensaiado e o tempo total do serviço t é registrado. Admitindo-se que o espaço amostral seja {t/ t ≥ 0}. Sejam A, B e C três eventos definidos da seguinte maneira: {A = t/ t < 100}, B = {t/ 50 ≤ t ≤ 200} e C = {t/ t > 150}. Então: a) A ∪ B = b) A ∩ B = c) B ∪ C = d) B ∩ C = e) A ∩ C = f) A ∪ C = g) A’ = h) C’ = 54 Frequência Relativa e Probabilidade Definição: fA = nA/n é denominada frequência relativa do evento A nas n repetições de ε. A frequência relativa fA apresenta as seguintes propriedades: 1) 0 ≤ fA ≤ 1 2) fA = 1 se e, somente se, A ocorrer em todas as n repetições. 3) fA = 0 se e, somente se, A nunca ocorrer nas n repetições. 4) Se A e B forem eventos mutuamente excludentes e se fAuB for a frequência relativa associada ao evento A ∪ B , então fAuB = fA + fb 5) fA, com base nas n repetições do experimento é considerada uma função de n, que converge em certo sentido probabilístico para P (A), quando n → ∞. Exemplo: pingo de chuva na calçada. Probabilidade Definição: Seja ε um experimento. Seja S um espaço amostral associado a ε. A cada evento A associaremos um número real representado por P(A) e denominado probabilidade de A que satisfaça às seguintes propriedades: 1) 0 ≤ P(A) ≤ 1 2) P(S) = 1 3) Se A e B são eventos mutuamente excludentes P(A ∪ B) = P(A) + P(B) 4) Se A1, A2, ... , An forem 2 a 2 eventos mutuamente excludentes, então: g ∞ e(⋃g S ) = e(S ) + e(S ) + ⋯ + e(SH ) Ni =jk7, e(⋃ S ) = ∑m=1(S ) Teoremas de Probabilidade T1. Se ∅ for o conjunto vazio, então P(∅) = 0 T2. Se A’ for o evento complementar de A, P(AP = 1 – P(A’) T3. Se A e B forem dois eventos quaisquer, então: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) Se (A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A ∩ B) - P(A ∩ C) - P(B ∩ C) + P(A ∩ B ∩ C) T4. Se A ⊂ B, então P(A) ≤ P(B) Atribuições: Se um espaço amostral consiste apenas de eventos elementares A1, A2, ... , An P(A1), P(A2), ... , P(An) = 1 Então P(Ak)= 1/n, k= 1, 2, ..., n 55 Exercícios: 1) Lança-se um dado. Determinar a probabilidade de aparecer 2 ou 5. 2) Extrai-se uma carta de um baralho ordinário de 52 cartas. Determine a probabilidade de a carta ser: a) Um às b) Um valete de copas c) 3 de paus ou 6 de ouro d) Uma carta de copas e) De qualquer naipe, exceto copas f) Um dez ou uma carta de espadas g) Nem 4 nem carta de paus. 3) Extrai-se ao acaso uma bola de uma caixa que contém 6 bolas vermelhas, 4 brancas e 5 azuis. Determine a probabilidade de a bola extraída ser: a) Vermelha b) Branca c) Azul d) Não vermelha e) Vermelha ou branca 4) Um dado é lançado. Pergunta-se a probabilidade dos eventos: a) A = sair um número ímpar b) B = sair um número menor que 3 c) C = sair um número maior que 10 d) D = sair um número inteiro maior ou igual a 1 e menor ou igual a 6. 5) Uma carta é retirada ao acaso de um baralho de 52 cartas. a) Qual a probabilidade de sair uma carta de espadas? b) Qual a probabilidade de sair um rei? 6) De quantas maneiras é possível colocar 6 anéis diferentes em 4 dedos? 7) Três moedas são jogas simultaneamente. Qual é a probabilidade de obter 2 caras? Qual é a probabilidade de obter ao menos 2 caras? Descreva o espaço amostral. 8) Dois dados são jogados simultaneamente. Calcular a probabilidade de que a soma dos números mostrados nas faces de cima seja 7. Descreva o espaço amostral. 9) Suponha que de n objetos escolhemos r ao acaso com reposição. Qual a probabilidade de que nenhum objeto seja escolhido mais de uma vez? 10) Quantas são as soluções inteiras não- negativas de x + y + z + w = 20 nas quais x>y? 56 Definição geométrica de Probabilidade Suponha que um segmento l seja parte de um outro segmento L e que se tenha escolhido ao acaso um ponto de L. Se admitirmos que a probabilidade deste ponto pertencer a l é proporcional ao comprimento de l e não depende do lugar que l ocupa em L, então a probabilidade de que o ponto selecionado esteja em l é: e() = MNOL. MNOL. e(o) = áj7 o áj7 q Analogamente: E ainda: e(r) = rN r rN s Probabilidade condicional Sejam A e b dois eventos, com P(A) > 0. Denotemos por P(B/A) a probabilidade de ocorrência de B, na hipótese de A ter ocorrido. Como A ocorreu, A passa a ser o novo espaço amostral que vem substituir o espaço original S. Então, em outras palavras, a probabilidade de ocorrência de B dado que A ocorreu é: e(S ∩ ]) e(]/S) = e(S) Observações: 1) Como P(B/A) é uma probabilidade vale para ela todas as propriedades da probabilidade. 2) Como e(S/]) = u(v∩w) u(w) , então a ocorrência simultânea dos eventos A e B é dada por P(A∩B) = P(A) P(B/A) = P(B). P(A/B) Teorema da Multiplicação ou da Probabilidade Composta: Seja o espaço de probabilidade (S, x, y), então: a) P(A∩B) = P(A) P(B/A) ∀S, ] ∈ x b) e (S ∩ S ∩ … ∩ SH ) = e(S ). e(S /S ). e(S /S ∩ S ) … e(SH /S ∩ S ∩ … SH> ) ∀S , S … , SH ∈ x Prova: 57 Exemplo: Determinar a probabilidade de a jogada de um dado resultar em um número menor que 4: a) Se não temos nenhuma outra informação b) Sabendo-se que o resultado é um número ímpar. Eventos independentes Se P(B/A) = P(B) isto é, se a probabilidade de ocorrência de B não é afetada pela ocorrência, ou não de A, dizemos que A e B são eventos independentes. Isto equivale a P(A∩B) = P(A) P(B) Ou seja, P(B/A) = P(B) e P(A/B) = P(A) Exercícios: 1) Um lote é formado por 10 artigos bons, 4 com defeitos menores e 2 com defeitos graves. Dois artigos são escolhidos ao acaso. Ache a probabilidade de que: a) Ambos sejam perfeitos b) Ambos tenham defeitos graves c) Ao menos um seja perfeito d) No máximo um seja perfeito e) Exatamente um seja perfeito Probabilidades Condicionais Consideremos o experimento que consiste em jogar um dado não-viciado. Sejam Ω = {1, 2, ..., 6}, A = {2, 4, 6} e B = {1, 2, 3}... Definição: Dados dois eventos A e B, a probabilidade condicional de B dado A é o número e(S ∩ ])/e(S). Representa-se por P(B/A). Simbolicamente: e(]/S) = Então e(S ∩ ]) = e(]/S). e(S) I(v∩w) u(v) quando P(A)>0. Se P(B) > 0, e(S ∩ ]) = e(]). e(S/]) Como P(A/B) é uma probabilidade vale para ela todas as propriedades da probabilidade, ou seja, seja A tal que P(A) > 0, então: a) e(∅/S) = 0, e(Ω/S) = 1, 0 ≤ e(]/S) ≤ 1 58 b) e((] ∪ 5)/S) = e(]/S) + e(5/S), =j ] ∩ 5 = ∅ . Ou seja, fixado A a probabilidade condicional é outra probabilidade sobre o espaço amostral Ω. Demonstração: Teorema do Produto: Se e (S ∩ S ∩ … ∩ SH ) ≠ 0 j8ãN e (S ∩ S ∩ … ∩ SH ) = e(S ). e(S /S ). e(S / S ∩ S ) … e(SH /S ∩ S ∩ … SH> ) Esboço de Demonstração: Exercícios: 1) Um grupo de pessoas está classificado da seguinte forma: fala inglês 92 101 Homens Mulheres fala alemão 35 33 fala francês 47 52 Escolhe-se uma pessoa ao caso. Sabendo-se que esta pessoa fala francês, qual é a probabilidade de que seja homem? 2) Sabe-se que 80% dos pênaltis marcados a favor do Brasil são cobrados por jogadores do Flamengo. A probabilidade de um pênalti ser convertido é de 40% se o cobrador for do Flamengo e de 70% em caso contrário. Um pênalti a favor do Brasil acabou de ser cobrado: a) Qual a probabilidade do pênalti ser cobrado por um jogador do Flamengo e ser convertido? b) Qual a probabilidade do pênalti ser convertido? c) Um pênalti foi marcado a favor do Brasil e acabou de ser desperdiçado. Qual é a probabilidade de que o cobrador tenha sido um jogador do Flamengo? 3) Consideremos dois dados: um deles equilibrado (P({1}) = P({2}) = ... = P({6}))= 1/6 e outro viciado com P({1}) = ½ e P({2}) = ... = P({6}) = 1/10. Escolhe-se um dos dados ao acaso e se efetuam dois lançamentos, obtendo-se dois uns. Qual a probabilidade condicional de que o dado escolhido tenha sido viciado? 4) Marina quer enviar uma carta a Verônica. A probabilidade de que Marina escreva a carta é de 8/10. A probabilidade de que o correio não a perca é de 9/10. A probabilidade de que o carteiro a entregue é de 9/10. Dado que Verônica não recebeu a carta, qual é a probabilidade condicional de que Marina não a tenha escrito? 59 Teorema da Probabilidade Total Se B é um evento contido numa reunião de eventos disjuntos S , S , … , SH e P(S ) > 0, P(S ) > 0, ... , P(SH ) > 0, então: P(B) = e(S )e(]/S ) + e(S )e(]/S ) + ⋯ + e(SH ). e(]/SH ) Demonstração: Teorema de Bayes Nas condições da proposição anterior, se P(B)>0, então para i = 1, 2, ... , n. e(S )e(]/S ) e(S /]) = e(S )e(]/S ) + ⋯ + e(SH ). e(]/SH ) Exercícios: 1) Durante o mês de agosto a probabilidade de chuva em um dia determinado é de 4/10. O Fluminense ganha um jogo em um dia com chuva com probabilidade 6/10 e em um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou um jogo naquele dia de agosto, qual a probabilidade de que choveu nesse dia? 2) Num exame há três respostas para cada pergunta e apenas uma delas é certa. Portanto, para cada pergunta um alunos tem probabilidade 1/3 de escolher a resposta certa se ele está adivinhando e 1 se sabe a resposta. Um estudante sabe 30% das respostas do exame. Se ele deu a resposta correta para uma das perguntas qual a probabilidade de que ele adivinhou? Eventos independentes Dois eventos A e B são chamados independentes se: P(A∩B) = P(A). P(B) Uma conseqüência imediata desta definição é que o vazio o espaço amostral são independentes de qualquer outro evento, então: e(S ∩ ∅) = e(∅) = 0 = e(∅. e(S) e(S ∩ Ω) = e(S). 1 = e(S). e(Ω) Definição: A1, A2, ..., An são independentes se ∀ k, e ∀ i1, i2, ..., ik tem-se: e (S ∩ S ∩ … ∩ S ) = e (S )e(S ) … e(S ) Prova: 60 Exemplo: Seja o espaço amostral apresentado na figura a seguir com 4 pontos w1, w2, w3, w4, e Pa a probabilidade que associa a cada ponto o valor ¼. Sejam C= {w1, w3}, L = {w3, w4} e D = {w2, w3} três eventos correspondentes a primeira coluna, à segunda linha e a diagonal, respectivamente, resulta que: .w1 .w2 .w3 .w4 Exercícios: 1) Um jogador deve enfrentar, em um torneio, dois outros A e B. Os resultados dos jogos são independentes e as probabilidades dele ganhar de A e B são 1/3 e 2/3 respectivamente. O jogador vencerá o torneio se ganhar dois jogos consecutivos de uma série de 3. Que série de jogos é mais favorável para o jogador ABA ou BAB? 2) A probabilidade de fechamento de cada rele do circuito apresentado na figura a seguir é igual a p, 0<p<1 Se todos os reles funcionam independentemente, qual é a probabilidade de que haja corrente circulando entre os circuitos? 2 A 1 3 4 5 B Se todos os reles funcionam independentemente, qual é a probabilidade de que haja corrente circulando entre os terminais A e B? 3) Escolhe-se ao acaso um número entre 1 e 50. Se o número é primo, qual é a probabilidade de que seja ímpar? 61 4) Uma moeda é jogada 6 vezes. Sabendo-se que no primeiro lançamento deu coroa, calcular a probabilidade condicional de que o número de caras nos seis primeiros lançamentos supere o número de coroas? 5) Uma moeda é jogada 4 vezes. Sabendo que o primeiro resultado foi cara, calcular a probabilidade condicional de obter pelo menos duas caras? 6) Joguei um dado duas vezes. Calcule a probabilidade de obter 3 na primeira jogada, sabendo que a soma dos resultados foi 7. 7) Se A e B são eventos independentes, tais que P(A) = 1/3 e P(B) = ½, calcule: P (A ∪ B) = P (A’ ∪ B’) = P (P’ ∩ B) = 8) Sejam A e B dois eventos independentes tais que P(A) = ¼ e P(A ∪ B) A ∪ B) = 1/3, calcule P(B). 62 Referências: CRESPO, Antonio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002. DANTAS, Carlos A. B. Probabilidade um curso introdutório. 3 ed. Ver. São Paulo: Editora da Universidade de São Paulo, 2008. JAMES, Barry R. Probabilidade um curso em nível intermediário. 2 ed. Rio de Janeiro: IMPA, 1996. MEYER, PAUL L. Probabilidade com aplicações à Estatística. Rio de Janeiro: LTC, 2006. MAGALHÃES, Marcos Nascimento. Probabilidade e variáveis aleatórias. 3 ed. São Paulo: Editora da Universidade de São Paulo, 2011. MARQUES, Jair Mendes. MARQUES, Marcos Augusto Mendes. Estatística básica para os cursos de engenharia. Curitiba: Domínio do Saber, 2005. MARQUES, Jair Mendes. Testes estatísticos para cursos das áreas biológicas e da saúde com o uso do computador. Curitiba: Domínio do Saber, 2004. SPIEGEL, M. R. Estatística. Coleção Schaum. São Paulo: McGraw_Hill do Brasil, 1976. SPIEGEL, M. R. Probabilidade e Estatística. Coleção Schaum. São Paulo: McGraw_Hill do Brasil, 1978. 63