Ministério da Educação Universidade Tecnológica Federal do Paraná Campus Curitiba Gerência de Ensino e Pesquisa Departamento Acadêmico de Matemática ESTATÍSTICA Notas de Aula para o curso de Tecnologia Prof.a Paula Francis Benevides Prof a Paula Francis Benevides Estatística Conteúdo AULA 1 .................................................................................................................................... 7 1. CONCEITOS PRELIMINARES: .............................................................................................. 7 1.1 MÉTODO ESTATÍSTICO .......................................................................................................... 7 1.1.1 O método experimental: ........................................................................................ 7 1.1.2 O método estatístico:............................................................................................. 7 2. A ESTATÍSTICA .................................................................................................................. 7 3. FASES DO MÉTODO ESTATÍSTICO ...................................................................................... 7 3.1 COLETA DE DADOS: .............................................................................................................. 7 3.2 CRÍTICA DE DADOS:............................................................................................................... 8 3.3 APURAÇÃO DOS DADOS: ........................................................................................................ 8 3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS:.............................................................................. 8 3.5 ANÁLISE DOS RESULTADOS: .................................................................................................... 8 4. VARIÁVEIS ........................................................................................................................ 9 5. POPULAÇÃO E AMOSTRA.................................................................................................. 9 6. AMOSTRAGEM ............................................................................................................... 10 6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: ....................................................................... 10 6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: ....................................................................... 12 SEXO ................................................................................................................................. 12 POPULAÇÃO ..................................................................................................................... 12 AMOSTRA......................................................................................................................... 12 Total................................................................................................................................................................................ 12 6.3 AMOSTRAGEM SISTEMÁTICA: ............................................................................................... 12 7. TENDENCIOSIDADE DA AMOSTRA .................................................................................. 13 AULA 2 .................................................................................................................................. 16 8. DISTRIBUIÇÃO DE FREQÜÊNCIA ...................................................................................... 16 2 Estatística Prof a Paula Francis Benevides 9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA..................................................... 17 9.1 CLASSE:............................................................................................................................ 17 9.2 LIMITE DE CLASSE:.............................................................................................................. 18 9.3 AMPLITUDE DE UM INTERVALO DE CLASSE: ............................................................................. 18 9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO: .................................................................................... 18 9.5 AMPLITUDE AMOSTRAL: ...................................................................................................... 18 9.6 PONTO MÉDIO DE UMA CLASSE: ........................................................................................... 19 9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA ..................................................................................... 19 9.8 FREQUÊNCIA ABSOLUTA ACUMULADA .................................................................................... 20 9.9 FREQÜÊNCIA RELATIVA........................................................................................................ 20 AULA 3 .................................................................................................................................. 25 10. REPRESENTAÇÃO GRÁFICA ............................................................................................. 25 10.1 GRÁFICO DE BARRAS:.......................................................................................................... 25 10.2 GRÁFICO DE SETORES (PIZZA): .............................................................................................. 26 10.3 DIAGRAMAS DE DISPERSÃO: ................................................................................................. 26 10.4 HISTOGRAMA (OU OGIVA DE GALTON): ................................................................................. 28 10.5 DIAGRAMA DE PARETO: ...................................................................................................... 29 10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: .................................................................................... 30 Tabela 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA DOS ALUNOS DA TURMA A-51 .................................................................................. 30 10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): ................................................ 31 10.8 PICTOGRAMA: ............................................................................................................... 32 TOTAL ................................................................................................................................... 33 AULA 4 .................................................................................................................................. 36 11. MEDIDAS DE POSIÇÃO .................................................................................................... 36 11.1 MÉDIA ARITMÉTICA ( x ):..................................................................................................... 36 11.1.1 Dados não Agrupados:....................................................................................... 36 11.1.2 Desvio em relação à média: ............................................................................... 37 11.1.3 Propriedades da média: ..................................................................................... 37 11.1.4 Dados Agrupados:.............................................................................................. 38 3 Prof a Paula Francis Benevides Estatística 11.1.4.1 Sem intervalo de classe: .............................................................................................................................. 38 11.1.4.2 Com intervalos de classe: ............................................................................................................................ 39 11.2 A MODA (MO) ................................................................................................................. 40 11.2.1 Dados não agrupados: ....................................................................................... 40 11.2.2 Dados agrupados: .............................................................................................. 41 11.2.2.1 Sem intervalo de classe: .............................................................................................................................. 41 11.2.2.2 Com intervalo de classe: ............................................................................................................................. 41 11.3 A MEDIANA (MD): ............................................................................................................ 41 11.3.1 Dados não agrupados: ....................................................................................... 41 11.3.2 Dados Agrupados:.............................................................................................. 42 11.3.2.1 Sem intervalo de classes: ............................................................................................................................ 43 11.3.2.2 Com intervalos de Classe: ........................................................................................................................... 44 11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:.................................................................. 46 AULA 5 .................................................................................................................................. 51 11.5 AS SEPARATRIZES: .............................................................................................................. 51 11.5.1 Os Quartis: ......................................................................................................... 51 11.5.2 Os Percentis: ...................................................................................................... 52 AULA 6 .................................................................................................................................. 55 12. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ............................................................ 55 12.1 AMPLITUDE: ..................................................................................................................... 55 12.2 DESVIO MÉDIO:................................................................................................................. 55 12.3 DESVIO PADRÃO: ............................................................................................................... 57 12.3.1 Propriedades do Desvio Padrão ......................................................................... 58 12.3.2 Dados não- agrupados:...................................................................................... 58 12.3.3 Dados agrupados: .............................................................................................. 58 12.3.3.1 Sem intervalo de Classe: ............................................................................................................................. 58 12.3.3.2 Com intervalo de classe: ............................................................................................................................. 59 12.4 VARIÂNCIA:....................................................................................................................... 60 12.5 COEFICIENTE DE VARIAÇÃO:.................................................................................................. 60 AULA 7 .................................................................................................................................. 64 13. MEDIDAS DE ASSIMETRIA: .............................................................................................. 64 13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA: ............................................................................. 64 4 Estatística Prof a Paula Francis Benevides 13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA: .......................................................................... 64 13.3 COEFICIENTE DE ASSIMETRIA: ............................................................................................... 66 14. MEDIDAS DE CURTOSE: .................................................................................................. 68 14.1 COEFICIENTE DE CURTOSE: ................................................................................................... 68 AULA 8 .................................................................................................................................. 72 15. PROBABILIDADE: ............................................................................................................ 72 15.1 INTRODUÇÃO: ................................................................................................................... 72 15.2 EXPERIMENTO ALEATÓRIO: .................................................................................................. 72 15.3 ESPAÇO AMOSTRAL: ........................................................................................................... 72 15.4 EVENTOS: ......................................................................................................................... 73 15.5 PROBABILIDADE: ................................................................................................................ 74 15.6 EVENTOS COMPLEMENTARES: .............................................................................................. 75 15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS: ...................................................... 76 15.8 EVENTOS INDEPENDENTES: .................................................................................................. 77 15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS: .................................................................................... 78 AULA 9 .................................................................................................................................. 80 15.10 PROBABILIDADE CONDICIONADA: .......................................................................................... 80 15.11 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 81 AULA 10 ................................................................................................................................ 84 16. DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS: ................ 84 16.1 INTRODUÇÃO: ................................................................................................................... 84 16.2 VARIÁVEIS ALEATÓRIAS: ...................................................................................................... 84 16.2.1 Variável aleatória discreta: ................................................................................ 84 16.2.2 Variável aleatória contínua: .............................................................................. 84 16.3 FUNÇÃO DE PROBABILIDADE:................................................................................................ 85 16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA: ............................................................................... 86 16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ....................................... 87 16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ...................................... 88 16.7 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 89 5 Estatística Prof a Paula Francis Benevides 16.7.1 Medidas Características:.................................................................................... 89 16.8 DISTRIBUIÇÃO DE POISSON: ................................................................................................. 91 16.8.1 Hipótese do modelo de Poisson: ........................................................................ 92 16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES DA DISTRIBUIÇÃO DE POISSON: ...................................................................................................................................... 94 AULA 11 ................................................................................................................................ 96 17. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS:................ 96 17.1 DISTRIBUIÇÃO NORMAL: ..................................................................................................... 96 17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA: ...................................................... 100 AULA 12 .............................................................................................................................. 104 17.3 DISTRIBUIÇÃO T DE STUDENT: ............................................................................................. 104 17.3.1 Uso da tabela da distribuição t de Student: .................................................... 105 17.4 DISTRIBUIÇÃO F: .............................................................................................................. 109 17.4.1 Uso da tabela da distribuição F: ...................................................................... 110 6 Prof a Paula Francis Benevides Estatística AULA 1 1. CONCEITOS PRELIMINARES: 1.1 1.1.1 MÉTODO ESTATÍSTICO O MÉTODO EXPERIMENTAL: Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química, etc. 1.1.2 O MÉTODO ESTATÍSTICO: O método estatístico diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 2. A ESTATÍSTICA A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmo na tomada de decisões. A coleta, a organização e a descrição dos dados, estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a carga da Estatística Indutiva ou Inferencial. Em geral, as pessoas desconhecem que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formação de soluções apropriadas e um planejamento objetivo de ação. 3. FASES DO MÉTODO ESTATÍSTICO 3.1 COLETA DE DADOS: A coleta pode ser direta e indireta. A coleta é direta quando feita sobre elementos informativos de registros obrigatórios (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes 7 Prof a Paula Francis Benevides Estatística aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames do censo demográfico, etc. A coleta direta de dados podem ser classificadas relativamente ao fator tempo em: contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a frequência dos alunos às aulas. periódica – quando feita em intervalos constantes de tempo em tempo,como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizima rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 3.2 CRÍTICA DE DADOS: Externa: quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas. Interna: quando visa observar os elementos originais dos dados da coleta. 3.3 APURAÇÃO DOS DADOS: Pode ser manual, eletromecânica ou eletrônica. 3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: Os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 3.5 ANÁLISE DOS RESULTADOS: Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 8 Prof a Paula Francis Benevides Estatística 4. VARIÁVEIS Variável: conjunto de resultados possíveis de um fenômeno. Cada fenômeno corresponde um número de resultados possíveis Assim por exemplo: Para o fenômeno ―sexo‖ são dois os resultados possíveis: sexo masculino e sexo feminino. Para o fenômeno ―número de filho‖ há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ...., n Para o fenômeno ―estatura‖ temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Logo, as variáveis podem ser: Qualitativa: se os valores tomados não são numéricos, como: raça, meio de transporte, sexo do bebe, etc. Quantitativa: se os valores tomados são numéricos, como altura, peso, preço de um produto, etc. Variável quantitativa também se chama variável estatística ou simplesmente variável. Cada valor que essa variável pode assumir chama-se dado estatístico. As variáveis estatísticas podem ser: Contínuas: quando podem assumir qualquer valor do intervalo de variação. Por exemplo, na determinação das alturas dos adolescentes de uma escola, a variável ―altura‖ é continua. Discretas: quando só podem assumir valores inteiros. Por exemplo, na determinação do número de alunos de uma certa turma, a variável ―número de alunos‖ é discreta. De um modo geral, as medições dão origem a variável contínuas e as contagens ou enumerações, a variáveis discretas. 5. POPULAÇÃO E AMOSTRA Entende-se por população o conjunto de elementos que tem, em comum, determinada característica. As populações podem ser finitas, como, por exemplo, os alunos matriculados em determinada escola, ou infinitas, como por exemplo, os resultados obtidos quando se joga um dado sucessivamente. Existem populações que embora finita, são consideradas infinitas para qualquer finalidade prática. Como exemplo, imagine o número de peixes que há no mar. Entende-se por amostra qualquer conjunto de elementos, retirados da população, desde que esse conjunto seja não-vazio e tenha menor número de elementos que a população. É um subconjunto finito de uma população 9 Prof a Paula Francis Benevides Estatística 6. AMOSTRAGEM Existe uma técnica especial – amostragem – para recolher amostras, que garante, tanto quanto possível, o acaso da escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante á amostra o caráter de representatividade, e isto é muito importante, pois, como vimos, nossas conclusões relativas á população vão estar baseadas nos resultados obtidos nas amostras dessa população. Daremos, a seguir, três das principais técnicas de amostragem. 6.1 AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: Este tipo de amostragem é equivalente a um sorteio lotérico. Na pratica, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes a amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: Numeramos os alunos de 01 a 90. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios – construída de modo que os dez algarismos (0 a 9) são distribuidos ao acaso nas linhas e colunas. 10 Prof a Paula Francis Benevides Estatística * TABELA DE NÚMEROS ALEATÓRIOS * C1 C2 C3 C4 C5 C6 C7 C8 C9 L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20 L21 L22 L23 L24 L25 L26 L27 L28 L29 4 3 2 1 0 0 8 8 5 6 4 3 2 0 9 7 8 6 5 3 8 1 2 4 5 2 1 0 9 1 0 2 9 3 8 3 8 4 7 4 5 6 1 0 2 9 3 8 4 7 4 7 3 0 5 1 2 1 6 7 5 8 4 9 3 0 1 2 0 1 9 2 8 2 3 0 1 0 2 9 3 8 3 7 4 7 5 1 2 3 4 5 6 7 8 9 0 5 4 3 2 1 0 9 8 7 6 1 1 2 2 3 3 4 4 5 6 6 7 7 8 8 9 9 0 0 1 3 5 7 9 2 4 6 8 0 1 3 5 7 9 0 2 3 6 1 3 5 7 9 1 0 2 0 3 9 3 8 4 8 5 7 6 7 1 3 2 4 3 5 4 6 6 8 0 9 0 8 0 7 6 3 2 1 1 0 2 0 3 0 4 0 5 9 5 8 6 7 7 2 3 4 5 2 5 1 6 2 2 3 6 0 1 9 3 3 7 8 5 1 1 9 8 2 6 5 8 0 2 2 3 6 3 5 9 5 0 2 7 3 3 1 4 2 6 0 3 3 1 4 4 4 4 1 8 0 4 6 0 1 9 C1 C1 C1 C1 C1 C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C2 C2 C2 C2 C2 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1 Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção porém, deve ser feita antes de iniciado o processo. Assim, para o nosso exemplo, considerando a 18 o linha, tomamos os números de dois algarismo (tantos algarismos quantos formam o maior número da população, obtendo: 63 08 66 01 46 22 33 01 54 51 13 47 81 28 Evidentemente, se constasse um numeral maior que 90, este seria desprezado, pois não consta da população, como será também abandonado um numeral que já tenha aparecido. Temos então: 63 08 66 01 46 22 33 54 51 Medindo as alturas dos alunos correspondentes aos números sorteados obteremos uma amostra das estaturas dos noventa alunos. 11 Prof a Paula Francis Benevides Estatística 6.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente de estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO POPULAÇÃO M 54 F 36 Total 90 10% 10 54 5,4 100 10 36 3,6 100 10 90 9,0 100 AMOSTRA 5 4 9 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 corresponde aos meninos e de 55 a 90, meninas. Tomando na Tabela de Números Aleatórios a primeira e a segunda coluna da esquerda, de cima para baixo, obtemos os seguintes números: 41 30 22 19 03 08 83 88 54 67 44 35 26 01 90 72 89 63 58 34 87 14 27 43 50 25 11 02 91 Temos então: 41 30 22 19 03 – para os meninos 83 88 67 90 – para as meninas 6.3 AMOSTRAGEM SISTEMÁTICA: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referências. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra 12 Estatística Prof a Paula Francis Benevides pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Assim, no caso de uma linha de produção, podemos a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolheremos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4 o prédio, o 22o, o 40o etc, até voltarmos ao início da rua, pelo lado esquerdo.·. 7. TENDENCIOSIDADE DA AMOSTRA Muitas vezes as amostras são constituídas por pessoas que devem executar algum tipo de tarefa, com responder perguntas, preencher um questionário ou até mesmo testar um produto. Algumas pessoas se recusam a cooperar. Nesses casos é preciso ter muito senso crítico para avaliar se a amostra efetivamente utilizada é representativa da população. Sempre é possível que a amostra obtida seja tendenciosa ou viciada, isto é, não representativa da população. O senso crítico ainda é mais importante quando as amostrar são constituídas por voluntários. Muitas vezes, o procedimento usado para solicitar voluntários conduz á formação de amostrar tendenciosas. Como por exemplo, imagine que um professor de educação física peça que três alunos da turma se apresentem como voluntários para apostar uma corrida. Ora, é bastante razoável imaginar que, neste caso, se apresentarão como voluntários apenas os alunos que sabem ser bons corredores. Então, os três alunos não constituirão uma amostra representativa da turma, mas uma amostra tendenciosa ou viciada. 13 Prof a Paula Francis Benevides Estatística AULA 01 - EXERCICIOS 1) O método experimental é mais usados por ciências como:........ 2) As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método? 3) O que é Estatística? 4) Cite as fases do método estatístico. 5) Para você o que é coletar dados? 6) Para que serve a crítica dos dados? 7) O que é apurar dados? 8) Como podem ser apresentados os expostos os dados? 9) Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária. 10)Classificar as variáveis em qualitativas ou quantitativas (continuas e discretas): a. População: os alunos de uma escola. Variável: cor dos cabelos b. P: casais residentes em uma cidade V: número de filhos c. P: as jogadas de um dado V: o ponto obtido em cada jogada d. P: peças produzidas por certas máquinas V: número de peças produzidas por hora e. P: peças produzidas por certa máquina V: diâmetro externo f. P: estação meteorológica de uma cidade V: precipitação pluviométrica, durante um ano. g. P: alunos de uma cidade V: cor dos olhos h. P: bolsa de valores de São Paulo V: números de ações negociadas i. P: funcionários de uma empresa V: salários. j. P: pregos produzidos por uma máquina V: comprimento k. P: propriedades agrícolas no Brasil V: produção de algodão l. P: segmento de reta V: comprimento m. P: biblioteca da cidade de Curitiba V: número de volumes 14 Prof a Paula Francis Benevides Estatística n. P: indústrias de uma cidade V: índice de liquidez. 11)A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários esta registrada a seguir: 62 52 73 80 65 50 70 75 80 65 70 77 82 91 75 52 68 86 70 80 Com base nos dados obtidos, responda: a. b. c. Qual a população e a unidade estatística dessa pesquisa? Qual é a sua amostra? Qual é a variável nessa pesquisa? Ela é discreta ou contínua? 12) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n 1=40, n2= 100 e n3= 60. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3 o estrato, determine o número total de elementos da amostra. 13) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence? 1648, 290, 725, 2025, 1120 15 Prof a Paula Francis Benevides Estatística AULA 2 8. DISTRIBUIÇÃO DE FREQÜÊNCIA Tabela primitiva: tabela cujos elementos não foram numericamente organizados Rol: Tabela obtida após a ordenação dos elementos da tabela primitiva No exemplo em que trabalharemos, a variável em questão, nota, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Denominamos de frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência. Vamos analisar a seguinte situação: Consideremos o quadro seguinte que mostra as notas de Cálculo dos alunos de uma classe de 2o período de Eletrotécnica numa determinada Faculdade. Turma: 2 o período Disciplina: Cálculo Número 1 Nota 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0 Tabela 1 Nesse caso temos: População estatística: grupo de 25 alunos do segundo período Unidade estatística: cada aluno desse ano Variável estatística: as notas da prova de Cálculo A partir desse conhecimento, elaboramos a seguinte tabela: i Notas Número de alunos(fi) 1 0 0 2 1,0 0 3 2,0 0 4 3,0 1 5 4,0 3 6 5,0 4 7 6,0 6 8 7,0 5 9 8,0 4 10 9,0 2 11 10,0 0 Total: 25 Tabela 2 16 Prof a Paula Francis Benevides Estatística Mas o processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento de valores em vários intervalos. Assim, se um dos intervalos for, por exemplo, 0| 4, 0, (é um intervalo fechado à esquerda e aberto à direita, 0 x< 4,0) em vez de dizermos que a nota de nenhum aluno é 0 ou 1,0 ou 2,0 e de 1 aluno é 3,0, diremos que 1 aluno tem nota entre 0, inclusive, e 4,0. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar de classes. Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela 2, podem ser dispostos como na tabela 3, denominada distribuição de frequência com intervalos de classe. Notas Frequência 0 | 2,0 0 2,0 | 4,0 1 4,0 | 6,0 7 6,0 | 8,0 11 8,0 | 11,0 6 Tabela 3 Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Assim, na Tabela 2 podemos verificar facilmente, que 2 alunos têm nota 9,0 e que nenhum tem nota 10,0. Já na tabela 3 não podemos ver se algum aluno tem nota 10,0. No entanto, sabemos com segurança, que onze alunos tem nota compreendida entre 6,0 e 8,0. O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. 9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 9.1 CLASSE: Classes de frequência ou, simplesmente, classes são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3,..., k (onde k é o número total de classes da distribuição). 17 Prof a Paula Francis Benevides Estatística Assim, em nosso exemplo, o intervalo 2,0 | 4,0 define a segunda classe (i = 2). Como a distribuição é formada de 5 classes, podemos afirmar que k = 5. 9.2 LIMITE DE CLASSE: Denominamos de limite de classe os extremos de cada classe. O menor número é o limite inferior da classe ( i ) e o maior número, o limite superior da classe(Li). Na segunda classe, por exemplo, temos: 2 = 2,0 e L2 = 4,0 Obs.: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo | (inclusão de i e exclusão de Li). Assim, o indivíduo com uma nota de 4,0 está incluído na terceira classe (i = 3) e não na segunda. 9.3 AMPLITUDE DE UM INTERVALO DE CLASSE: Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi . Assim: hi = Li - i Na distribuição da tabela 3 temos: h2 = 4,0 – 2,0 = 2,0 9.4 AMPLITUDE TOTAL DA DISTRIBUIÇÃO: Amplitude total da distribuição (AT) é a diferença ente o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo). AT = L(máx) – (mín) Em nosso exemplo, temos: AT = 11,0 – 0 = 11,0 Obs.: É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação: AT k hi 9.5 AMPLITUDE AMOSTRAL: Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra. AA = x (max.) – x (min.) 18 Prof a Paula Francis Benevides Estatística Em nosso exemplo, temos: AA = 10,0 – 0 = 10,0 Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral. 9.6 PONTO MÉDIO DE UMA CLASSE: Ponto médio de uma classe (xi) é como o próprio nome indica o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a semissoma dos limites da classe (média aritmética). xi i Li 2 Assim, o ponto médio da segunda classe, em nosso exemplo é: 9.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados pesquisados sobre uma população estatística ou sobre uma amostra dessa população. Escolhida uma característica sobre os elementos de uma população, devemos elaborar uma tabela de dados denominada distribuição estatística. Posteriormente, os resultados podem ser interpretados por meio de um gráfico. Diversos tipos de gráficos são usados em Estatística: de barras, de setores, por pontos, etc. Na coluna ―Notas‖ aparecem os diferentes valores da variável estatística. Na coluna ―Número de alunos‖ está indicado o número de vezes que cada valor se repete é a coluna de frequência absoluta (fi). Logo, frequência absoluta (fi), simples, ou frequência de classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. Utilizando o somatório ( ): O símbolo é usado para escrever abreviadamente expressões que envolvem adição. Assim, indicamos a adição dos termos f i, com i variando de 1 até k (k |N*), como: K f i 1 i ou f i n 7 No exemplo das notas de Cálculo, o desenvolvimento do somatório do f i 1 i é dado por: 7 f i 1 i = f 1 + f 2 + f 3 + f4 + f 5 + f 6 + f 7 i = 0 + 0 + 0 + 1 + 3 + 4 + 6 = 14 7 f i 1 19 Prof a Paula Francis Benevides Estatística 9.8 FREQUÊNCIA ABSOLUTA ACUMULADA A distribuição de frequência absoluta pode ser completada com mais uma coluna, chamada de frequências absolutas acumuladas (fia), cujos valores são obtidos adicionando a cada frequência absoluta os valores das frequências anteriores. Veja como fica o quadro anterior: i Nota fi fia 1 0 0 0 2 1,0 0 0 3 2,0 0 0 4 3,0 1 1 5 4,0 3 1+3=4 6 5,0 4 4+4=8 7 6,0 6 8 + 6 = 14 8 7,0 5 14 + 4 = 19 9 8,0 4 19 + 4 = 23 10 9,0 2 23 + 2 = 25 11 10,0 0 25 N = 25 Pelo quadro e usando a frequência acumulada, podemos fazer algumas observações, tais como: 8 alunos não obtiveram nota superior a 5,0 nessa classe 25 – 14 = 11 alunos obtiveram nota 7,0 ou acima de 7,0 nessa classe f6a = 6 f i 1 9.9 i =8 FREQÜÊNCIA RELATIVA Chama-se frequência relativa (fr) do valor de xi da variável o quociente entre a frequência absoluta (fi) e a frequência total (número de elementos n da amostra), ou seja: fr fi f i Observe o gráfico: 20 Prof a Paula Francis Benevides Estatística Devemos observar que se a frequência relativa (fr) é dada na forma de porcentagem, ela vai tornar mais clara à análise de certos dados. Se tomarmos como exemplo o quadro de frequência das notas de Cálculo de uma classe de segundo período de Eletrotécnica, podemos, então, completar o quadro de distribuição de frequência com mais duas colunas; a coluna das frequências relativas (fr) e a coluna das frequências relativas acumuladas (fa). xi fi fia Fr (%) Fra (%) 3,0 1 1 1/25 = 4% 4% 4,0 3 4 3/25 = 12% 16% 5,0 4 8 4/25 = 16% 32% 6,0 6 14 6/25 = 24% 56% 7,0 5 19 5/25 = 20% 76% 8,0 4 23 4/25 =16% 92% 9,0 2 25 2/25 = 8% 100% Observando a tabela, temos: 20% dos alunos obtiveram média 7,0 56% dos alunos obtiveram média inferior a 7,0 100% - 56% = 44% obtiveram média igual ou superior a 7,0 21 Prof a Paula Francis Benevides Estatística AULA 02 - EXERCÍCIOS 1) Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de televisão de sua preferência, obteve-se a seguinte tabela de frequências absolutas: Programa de TV Número de Telespectadores Novela 360 Esportes 128 Filmes 80 Noticiário 32 Shows 200 Construa um quadro com distribuição de frequências absolutas acumuladas, frequências relativas e frequências relativas acumuladas. 2) Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: 1 5 6 5 2 2 2 4 6 5 2 3 3 1 6 6 5 5 4 2 a) Elabore um quadro com distribuição de frequências absolutas, frequências absolutas acumuladas, frequências relativas e frequências relativas acumuladas. b) Observando a tabela responda: I. Quantas vezes o número 3 foi obtido no dado? II. Quantas vezes o número obtido no dado foi menor que 5? III. Qual o índice, em porcentagem, em que o número 6 foi obtido no dado? IV. Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos no dado? 3) Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região metropolitana, ao justificarem atrasos do crediário ou cheque sem fundo. Com base nessa pesquisa, responda: a) Qual a frequência relativa das pessoas que apresentam outras justificativas? b) Quais as frequências absolutas para cada tipo de devedor? 22 Prof a Paula Francis Benevides Estatística 4) Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra de alunos de um colégio A., resultando a seguinte tabela de valores: 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Determine: a) O rol da tabela primitiva acima. b) A distribuição de frequência c) Distribuição de frequência com intervalos de classe. (sugestão, de 4 em 4) d) A segunda classe. e) Os limites da segunda classe. f) O intervalo (amplitude) da segunda classe. g) A amplitude total da distribuição. h) A amplitude amostral i) O ponto médio da segunda classe. j) A frequência absoluta da segunda classe. 5) A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14 Forme uma distribuição de frequência sem intervalos de classe. 6) Considerando as notas de um teste de inteligência aplicado a 100 alunos: 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 76 80 92 102 73 87 70 85 79 93 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 Forme a distribuição de frequência: 23 Prof a Paula Francis Benevides Estatística 7) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes: Área (m2) 300 |— 400 |— 500 |— 600 |— 700 |— 800 |— 900 |— 1.000 |— 1.100 |— 1.200 No DE 14 46 58 76 68 62 48 22 6 LOTES Com referência a essa tabela, determine: a) b) c) d) e) f) g) h) i) j) k) l) m) a amplitude total; o limite superior da quinta classe; o limite inferior da oitava classe; o ponto médio da sétima classe; a amplitude do intervalo da segunda classe; a frequência da quarta classe; a frequência relativa da sexta classe; a frequência acumulada da quinta classe; o número de lotes cuja área não atinge 700 m 2; o número de lotes cuja área seja maior ou igual a 900 m 2; a percentagem dos lotes cuja área [e de 500 m 2, no mínimo, mas inferior a 1.000 m2; a classe do 72o lote; até que classe estão incluídos 60% dos lotes. 8) Complete a tabela abaixo: i CLASSES fi 1 0 |— 8 4 2 8 |— 16 10 3 16 |— 24 14 4 24 |— 32 9 5 32 |— 40 3 fr fia fra 40 1,00 24 Prof a Paula Francis Benevides Estatística AULA 3 10.REPRESENTAÇÃO GRÁFICA Em muitos casos, uma representação gráfica de uma distribuição de frequência nos dá uma ideia melhor de um levantamento estatístico do que um quadro com números. Nesse item, estudaremos as representações gráficas mais usadas em Estatística. 10.1 GRÁFICO DE BARRAS: Os gráficos de Barras ou colunas são gráficos que podem ser facilmente elaborados à mão ou com uso de softwares específicos, tais como o software Excel ou outro programa gerador de gráficos. Como exemplo, considere-se uma pesquisa de opinião realizada em determinada comunidade, para a qual os dados coletados indicaram o hábito dos moradores em assistir ou não horário político televisivos. Tais informações constam na Tabela 10.1. Tabela 10.1 - HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO HÁBITO FREQUENCIA PERCENTUAL SIM 1150 31,5% NÃO 2500 68,5% TOTAL 3650 100% A tabela 10.1 facilita a apresentação dos resultados e o entendimento do leitor sobre como se comporta os moradores quanto ao hábito de assistirem ou não o horário político. Igualmente, o gráfico de barras também se constitui em uma excelente forma de apresentação de tais informações. GRÁFICO 10.1 – FREQUENCIA COMPORTAMENTAL DOS MEMBROS DE UMA COMUNIDADE 3000 2500 2500 2000 1500 1150 1000 500 31,50% 68,50% 0 SIM NÃO QUANTO AO HÁBITO DE ASSISTIR O HORÁRIO POLITICO TELEVISIVO 25 Prof a Paula Francis Benevides Estatística 10.2 GRÁFICO DE SETORES (PIZZA): O gráfico de setores pode ser utilizado tanto para variáveis quantitativas como para variáveis qualitativas. Este gráfico também possui a peculiaridade de facilitar a visualização de resultados, especialmente quando se trata de porcentagens. GRÁFICO 10. 2 – PORCENTAGENS DOS MEMBROS DE UMA COMUNIDADE QUE POSSUEM O HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO TELEVISIVO 31,50% 68,50% O Gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde à 360o. Temos 3650 - 3600 1150 - x x1 = 113,4 x2 = 246,6 x1 = 113o x2 = 247o Notas: O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando o valor percentual por 3,6. 10.3 DIAGRAMAS DE DISPERSÃO: Às vezes temos dados emparelhados de uma forma que associa cada valor de um conjunto a um determinado valor de um segundo conjunto. Um diagrama de dispersão é um gráfico dos dados emparelhados (x, y), com um eixo x horizontal e um eixo y vertical. Para construir manualmente um diagrama de dispersão, traçamos um eixo horizontal para os valores da primeira 26 Prof a Paula Francis Benevides Estatística variável e um eixo vertical para os valores da segunda variável e marcamos os pontos. O padrão dos pontos assim marcados costuma ajudar a determinar se existe algum relacionamento entre as duas variáveis. Exemplo: O gráfico de dispersão abaixo mostra a estatura de um grupo de alunos do Curso Superior de Tecnologia de Alimentos do CEFET-PR, Unidade de Medianeira, em função da ordem de coleta. Tabela 10.2 - ESTATURA DOS ALUNOS DA TURMA A-51, DO CEFET-PR, UNIDADE MEDIANEIRA. 2o SEMESTRE 2003 ESTATURA ALUNOS 1 178 10 160 2 165 11 167 3 168 12 173 4 169 13 167 5 165 14 174 6 168 15 160 7 183 16 160 8 175 17 160 9 167 18 166 estatura ALUNOS ESTATURA 185 180 175 170 165 160 155 0 5 10 15 20 alunos O gráfico de dispersão é um importante instrumento de análise preliminar sobre o comportamento de um conjunto de dados. No gráfico acima é possível visualizar, mesmo que subjetivamente, como se comporta a variável estatura dos alunos da turma A-51. 27 Prof a Paula Francis Benevides Estatística 10.4 HISTOGRAMA (OU OGIVA DE GALTON): O histograma é um gráfico formado por um conjunto de colunas retangulares. No eixo das abscissas marcamos as classes, cujas amplitudes correspondem às bases dos retângulos. No eixo das ordenadas marcamos as frequências absolutas, que correspondem às alturas dos retângulos. Os pontos médios das bases dos retângulos coincidem com os pontos médios dos intervalos de classes. Os dados da Tabela 10.2 podem ser organizados em uma distribuição de frequência, tal como na tabela abaixo. Tabela 10.3 – DISTRIBUIÇÃO DE FREQUENCIA PARA ESTATURA DOS ALUNOS DA TURMA A-51 CLASSES FREQUENCIAS 160 | 165 4 165 | 170 9 170 | 175 2 175 | 180 2 180 | 185 1 A organização dos dados como na Tabela 10.3 facilita a construção do histograma. Observe que cada um dos intervalos deve-se construir um retângulo de área proporcional à frequência absoluta respectiva.··. 28 Estatística Prof a Paula Francis Benevides 10.5 DIAGRAMA DE PARETO: Consideremos a afirmação: De 75.200 mortes por acidente nos EUA, em um ano recente, 43.500 foram causados por veículos motorizados, 12.200 por quedas, 6.400 por envenenamento, 4.600 por afogamentos, 4.200 por incêndios, 2.900 por ingestão de alimentos ou de um objeto, e 1.400 por armas de fogo (com base em dados do conselho de Segurança Nacional). O ponto fraco dessa afirmação escrita é não caracterizar bem um relacionamento entre categorias diferentes de dados qualitativos. Uma forma mais conveniente de indicar relações entre dados qualitativos é a construção de um diagrama de Pareto. Um Diagrama de Pareto é um gráfico em barras pra dados qualitativos, com as barras ordenadas de acordo com a frequência. Tal como no caso dos histogramas, as escalas verticais em um diagrama de Pareto podem representar frequências absolutas ou frequências relativas. A barra mais alta fica à esquerda, e as barras menores na extrema direita. Dispondo as barras por ordem de frequência, o diagrama de Pareto focaliza a atenção sobre as categorias mais importantes. 29 Prof a Paula Francis Benevides Estatística Segundo o gráfico construído acima, podemos ver que as mortes acidentais causadas por veículos motorizados representam um problema muito mais sério do que as outras categorias. Embora as mortes acidentais causadas por armas de fogo mereçam considerável atenção dos jornais, elas constituem um problema relativamente pequeno quando comparadas com as outras categorias. 10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: O polígono de frequência também é estruturado a partir da tabela de frequência, tal qual o histograma. Define-se o gráfico polígono de frequência como um gráfico de linha, onde os pontos a serem conectados pela linha são os pontos médios dos intervalos de classe para as abscissas com as correspondentes frequências para as ordenadas. TABELA 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA DOS ALUNOS DA TURMA A-51 PONTO MÉDIO DOS FREQÜÊNCIAS INTERVALOS DE CLASSES 160,0 0 162,5 4 167,5 9 172,5 2 177,5 2 182,5 1 185,0 0 30 Prof a Paula Francis Benevides Estatística 10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): Trata-se de um gráfico importante na análise dos resultados de uma variável, uma vez que em cada valor da abscissa a partir do valor mínimo, corresponde a frequência acumulada. Neste caso também a construção de uma Tabela facilita a construção do gráfico. O polígono de frequência acumulada pode ser definido como um dos gráficos de linhas, ligadas aos pontos correspondentes ao limite superior dos intervalos de classes para as abscissas e as frequências acumuladas para as ordenadas. Destaca-se que o primeiro ponto deve ser o valor mínimo dos dados para a variável independente x e zero para a ordenada. Tabela 10.5 – DISTRIBUIÇÃO DE FREQUENCIA ACUMULADA PARA ESTATURA DOS ALUNOS DA TURMA A-51 CLASSES FREQUENCIAS FREQUENCIA ACUMULADA 160 | 165 4 4 165 | 170 9 13 170 | 175 2 15 175 | 180 2 17 180 | 185 1 18 31 Prof a Paula Francis Benevides Estatística 10.8 PICTOGRAMA: O gráfico que utiliza desenhos para representar um conjunto de dados é denominado pictograma. Os gráficos pictogramas são muitos usados na mídia, imprensa escrita e apresentações visuais. Para elaboração desse tipo de gráfico, é comum a inserção de figuras relacionadas com a variável em estudo, substituindo representando os elementos dos gráficos gerados. - Pictograma do Histograma da Estatura dos alunos da turma A-51 AULA 3 - Exercícios 1) Pergunte aos colegas da sua turma de aula qual a disciplina que cada um mais gosta no semestre e qual é a que cada um menos aprecia. Faça um gráfico de barras para representar os resultados. 2) Os alunos do primeiro ano do Ensino Médio do CEFET-PR, turma M12, fizeram uma prova de Matemática e obtiveram as seguintes notas: 5 8 5 6 7 5 6 8 4 7 5 5 5 8 5 6 2 5 6 0 6 5 6 7 6 6 7 2 7 6 8 3 4 9 0 1 7 6 3 4 Construa a partir destas notas, os gráficos de: a. Dispersão b. Polígono de frequência c. Frequência Acumulada d. Histograma 3) Em um mercado de telefones celulares da Região Oeste do Paraná, considerando-se uma fatia de mercado meramente ilustrativa, obtiveram-se os resultados conforme descritos na tabela abaixo: 32 Prof a Paula Francis Benevides Estatística MARCAS PARTICIPAÇÃO NO MERCADO Nokia 60% Ericson 20% Gradiente 15% Motorola 5% 100% TOTAL Construa um gráfico de setores. 4) Baseando-se no gráfico, responda às questões a seguir: a. Qual o assunto de que ele trata? b. Quantas pessoas contaminadas pelo vírus da Aids morreram em 1995? E em 1999? c. Em que ano se deu a maior contaminação pelo vírus da Aids? Qual o número de pessoas contaminadas? d. Qual a porcentagem de mulheres contaminadas pelo vírus da Aids de 1995 a 1999 em relação ao total de pessoas contaminadas? 5) Analise o gráfico a seguir e responda: a. De que trata o gráfico em questão? b. A que tipo de informação o consumidor brasileiro tem menos acesso? Qual a porcentagem correspondente? 6) O quadro mostra a distribuição dos salários mensais (agrupados em classes) de 40 empregados de uma firma. 33 Prof a Paula Francis Benevides Estatística SALÁRIO (EM REAIS) NÚMERO DE EMPREGADOS (fi) 800 | 900 4 900 | 1000 10 1000 | 1100 18 1100 | 1200 5 1200 | 1300 3 Nessas condições: a. Qual é a amplitude do intervalo de classe? b. Elabore um quadro de distribuição de frequências acumuladas, relativas e relativas acumuladas. A seguir, construa o histograma de frequências. c. Quantos empregados ganham menos que R$ 1.000,00 mensais? d. Qual o índice, em porcentagem, de empregados que ganham R$ 1.000,00 mensais ou mais. e. Quantos empregados ganham entre R$ 800,00 (inclusive) e R$ 1200,00? f. Qual é o índice, em porcentagem, de empregados que ganham menos que R$ 1 000,00? 7) No quadro a seguir estão registradas as massas, em quilogramas, de 50 pessoas que frequentam uma academia de ginástica. 72 81 57 64 87 90 74 69 77 73 80 96 55 58 88 92 47 60 68 80 77 76 59 57 83 81 90 68 65 74 91 97 86 82 73 64 69 71 88 94 77 72 81 91 49 75 52 50 63 70 a. Escolha um intervalo com amplitude conveniente e elabore um quadro de distribuição de frequências absolutas e relativas. b. Construa o histograma para a distribuição. c. Calcule os pontos médios dos intervalos e represente a distribuição por meio de um polígono de frequências. d. Represente essa distribuição por meio de um gráfico de setores com as respectivas frequências relativas. 8) No laboratório de Eletromecânica, um aluno pesquisador testa cinco diferentes ligas metálicas para resistência de tensores. O experimento foi efetuado com diversos ensaios relativos às diferentes ligas. Os resultados obtidos constam da Tabela abaixo: 34 Prof a Paula Francis Benevides Estatística MATERIAL TESTADO RESULTADO DOS ENSAIOS Liga metálica 1 12,4 19,8 15,2 14,8 18,5 Liga metálica 2 8,9 11,6 10 10,3 9,8 Liga metálica 3 10,5 13,8 12,1 11,9 12,6 Liga metálica 4 16,4 15,9 17,8 20,3 18,5 Liga metálica 5 12,8 14,2 15,9 14,1 14,8 Com base nos dados obtidos, construa: a. Um gráfico de linhas que relacione os valores dos ensaios em funções das ligas. b. Um gráfico de colunas para cada tipo de liga. c. Um gráfico de dispersão dos resultados em função das ligas. 35 Prof a Paula Francis Benevides Estatística AULA 4 11.MEDIDAS DE POSIÇÃO As medidas de posição permitem ao pesquisador verificar a distribuição e o comportamento de dados no intervalo fechado [Valor mínimo; Valor máximo]. Entre as medidas de posição citam-se a média aritmética, a mediana e a moda, conhecidas como medidas de tendência central. As separatrizes também são denominadas medidas de posição: 1o, 2o e 3o quartis, decis e percentis. O segundo quartil equivale à mediana. 11.1 MÉDIA ARITMÉTICA ( x ): Média aritmética é o quociente da divisão da soma dos valores das variáveis pelo número deles: x x i n sendo: x = a média aritmética x i = os valores da variável n = o número de valores. 11.1.1 DADOS NÃO AGRUPADOS: Quando desejamos conhecer a média dos dados não agrupados, determinamos a média aritmética simples. Exemplo: Relacionam-se há seguir os tempos (em anos) que os 10 primeiros presidentes americanos sobreviveram à posse. Calcule a média dessa amostra: 10 29 26 28 15 23 17 25 0 20 Solução: x = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193 x 193 19,3 10 A média é 19,3 anos. 36 Prof a Paula Francis Benevides Estatística 11.1.2 DESVIO EM RELAÇÃO À MÉDIA: Denomina-se desvio em relação à média a diferença entre cada elemento de um conjunto de valores e média aritmética. Designando o desvio por di , temos: d i xi x Para o exemplo dado, temos: 11.1.3 di = 10 – 19,3 = - 9,3 d6 = 23 – 19,3 = 3,7 d2 = 29 – 19,3 = 9,7 d7 = 17 – 19,3 = - 2,3 d3 = 26 – 19, 3 = 6,7 d8 = 25 – 19,3 = 5,7 d4 = 28 - 19,3 = 8,7 d9 = 0 - 19,3 = - 19,3 d5 = 15 – 19, 3 = - 4,3 d10 = 20 – 19,3 = 0,7 PROPRIEDADES DA MÉDIA: 1a Propriedade: A soma dos desvios tomados em relação à média é nula. n d i 1 i 0 No exemplo anterior, temos: 10 d i 1 i - 9,3 + 9,7 + 6,7 + 8,7 + (- 4,3) + 3,7 + (- 2,3) + 5,7 + (- 19,3) + 0,7 = 0 2a Propriedade: Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. y i xi c y x c Somando 2 a cada um dos valores da variável do exemplo dado, temos: y1 = 12, y2 = 31, y3 28, y4 = 30, y5 = 17, y6 = 25, y7 = 19, y8 = 27, y9 = 2 e y10 = 22 10 y i 1 i 12 + 31 + 28 + 30 + 17 + 25 + 19 + 27 + 2 + 22 = 213 Como n = 10, vem: y 213 21,3 y 21,3 19,3 2 y x 2 10 3a Propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto final fica multiplicado (ou dividido) por essa constante. y i xi c y x c ou yi xi x y c c 37 Prof a Paula Francis Benevides Estatística 11.1.4 DADOS AGRUPADOS: 11.1.4.1 Sem intervalo de classe: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Tabela 11.1 No DE MENINOS fi 0 2 1 6 2 10 3 12 4 4 = 34 Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: x x f f i i i O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xifi: Tabela 11.2 xi fi xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 = 34 = 78 Logo: x x f f i i i x 78 2,29 x 2,3 meninos 34 Nota: 38 Prof a Paula Francis Benevides Estatística Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos. 11.1.4.2 Com intervalos de classe: Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: x x f f i i onde xi é o ponto médio da classe. i Consideremos a distribuição: Tabela 11.3 i ESTATURAS (cm) fi 1 150 | 154 4 2 154 | 158 9 3 158 | 162 11 4 162 | 166 8 5 166 | 170 5 6 170 | 174 3 = 40 Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xifi: Tabela 11.4 i ESTATURAS (cm) fi xi xifi 1 150 | 154 4 152 608 2 154 | 158 9 156 1404 3 158 | 162 11 160 1760 4 162 | 166 8 164 1312 5 166 | 170 5 168 840 6 170 | 174 3 172 516 = 40 = 6440 39 Prof a Paula Francis Benevides Estatística Logo: x x f f i i x i 6440 161 x 161 cm 40 11.2 A MODA (MO) Denominamos moda o valor que ocorre com maior frequência em uma série de valores, ou seja, é o valor de maior frequência absoluta. Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria. 11.2.1 DADOS NÃO AGRUPADOS: Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. A série de dados: 7, 8, 9, 10, 10, 10, 10, 11, 12, 13, 15 tem moda igual a 10. Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto em nas quais nenhum valor apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 11, 13, 15 que não apresenta moda, então dizemos que é amodal. Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 temos duas modas: 4 e 7, o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada uma deles é uma moda, e o conjunto é multimodal. 40 Prof a Paula Francis Benevides Estatística 11.2.2 DADOS AGRUPADOS: 11.2.2.1 Sem intervalo de classe: Uma vez agrupado os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Na distribuição da Tabela 11.1, à frequência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3 11.2.2.2 Com intervalo de classe: A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que esta compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos então: Mo lL , onde l é o limite inferior da classe modal e L é o limite superior. 2 Assim, para a distribuição da Tabela 11.3, temos que a classe modal é i = 3, l = 158 e L = 162. Logo: Mo 158 162 320 160 2 2 11.3 A MEDIANA (MD): A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. 11.3.1 DADOS NÃO AGRUPADOS: Dada uma série de valores, como por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 41 Prof a Paula Francis Benevides Estatística de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (ordem crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é 10, já que nessa série, há quatro elementos acima dele e quatro abaixo. Temos então: Md = 10 Se porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a média aritmética entre 10 e 12. Logo: Md 10 12 22 11 Md 11 2 2 Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será: o termo de ordem n 1 , se n for ímpar 2 a média aritmética dos termos de ordem n n e 1 , se n for par. 2 2 Notas: A mediana e a média aritmética não tem necessariamente, o mesmo valor. A mediada, como vimos, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma diferença marcante entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). A mediana designada, muitas vezes, por valor mediano. 11.3.2 DADOS AGRUPADOS: Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante aquele dos dados não agrupados, implicando porém, a determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. 42 Prof a Paula Francis Benevides Estatística Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: f i 2 11.3.2.1 Sem intervalo de classes: Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável correspondente a tal frequência acumulada. Tomemos a distribuição relativa a Tabele 11.1, completando-a com a coluna correspondente à frequência acumulada: Tabela 11.5 o N DE MENINOS fi fia 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 = 34 Sendo: f 2 i = 34 17 2 a menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este valor mediano. Logo, Md = 2 meninos Nota: f No caso de existir uma frequência acumulada (fia), tal que: f ia 2 i , a mediana será dada pela média aritmética entre o valor da variável correspondente a essa frequência acumulada e o seguinte. Exemplo: 43 Prof a Paula Francis Benevides Estatística Tabela 11.6 xi fi fia 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 = 8 Temos: 8/2 = 4 Logo, Md 15 16 31 15,5 2 2 Md xi xi 1 2 Onde: Md = 15,5 11.3.2.2 Com intervalos de Classe: Neste caso o problema consiste em determinar o ponto do intervalo em que esta compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente a imediatamente superior a f 2 i frequência acumulada . Feito isso, um problema de interpolação (inserção de uma determinada quantidade de valores entre dois números) resolve a questão, admitindo-se agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Assim, considerando a distribuição da Tabela 11.3, acrescida das frequências acumuladas: 44 Prof a Paula Francis Benevides Estatística Tabela 11.7 i ESTATURAS (cm) fi fia 1 150 | 154 4 4 2 154 | 158 9 13 3 158 | 162 11 24 4 162 | 166 8 32 5 166 | 170 5 37 6 170 | 174 3 40 = 40 Temos: f 2 i = 40 20 2 Como há 24 valores incluídos nas três primeiras classes da distribuição, a partir do início da série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do limite inferior, à distância: 20 13 28 4 11 11 e a mediana será dada por: Md 158 28 160,54 11 Logo, Md = 160,5 cm. Na prática executamos os seguintes passo: 1o) Determinamos as frequências acumuladas f 2o) Calculamos i 2 3o) Marcamos a classe correspondente à frequência acumulada imediatamente superior a f 2 i - classe mediana – e, em seguida, empregamos a fórmula: 45 Prof a Paula Francis Benevides Estatística fi f ia (ant ) h 2 Md l fi onde: l é o limite inferior da classe mediana fia(ant) é a frequência acumulada da classe anterior à classe mediana fi é a frequência simples da classe mediana h é a amplitude do intervalo da classe mediana. 11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA: Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria torna-as diferente e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma distribuição em forma de sino, temos: x Md Mo , no caso da curva simétrica; Mo Md x , no caso da curva assimétrica positiva; x Md Mo , no caso da curva assimétrica negativa. 46 Prof a Paula Francis Benevides Estatística AULA 04 - Exercícios 1) Complete o esquema para o cálculo da média aritmética da distribuição de frequência. CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150 8 fi 10 11 16 13 5 1 Temos: 1 xi fi xi fi 500 8 4000 2 10 3 11 4 16 5 13 6 5 7 1100 1 = Logo: x ....... ....... ....... = onde x = R$ 755 2) No ano 2000, o número de nascimentos, por mês, em uma maternidade foi: Jan Fev Ma r Ab r Ma io Jun Jul Ago Set Out Nov Dez Mês Nascimento 38 25 42 30 29 47 18 36 38 43 49 37 a) Calcule a média de nascimentos. b) Em que meses o número de nascimentos ficou acima da média? 3) A classificação final para um determinado curso é a média ponderada das provas de capacidade geral, com peso 3, e das provas de capacidade especifica, com peso 2. Nessas condições, qual é a classificação final de um aluno que obteve 162 pontos na prova de capacidade geral e 147 pontos na prova de capacidade específica? 47 Prof a Paula Francis Benevides Estatística 4) O quadro de distribuição de frequência representa os salários mensais de 40 empregados de uma firma. Calcule o salário médio mensal dos empregados dessa firma. CLASSE (em R$) Ponto Médio da Classe Frequência (fi ) 180 | 200 190 4 200 | 220 210 18 220 | 240 230 10 240 | 260 250 5 260 |280 270 3 5) É dado um conjunto de 20 números cuja média aritmética é 64. Cada número desse conjunto é multiplicado por 2 e, em seguida, acrescido de 5 unidades. Qual é a média aritmética dos 20 números assim obtidos? 6) A média das idades de um grupo de estudantes é 22 anos. Excluindo-se o mais novo deles, que tem 17 anos, a média do novo grupo formado passa a ser 23 anos. Quantos estudantes há no primeiro grupo? 7) Um comerciante mistura 4 kg do café tipo A, que custa R$ 6,00 o quilo; 10 kg do café B, que custa R$ 5,60 o quilo; e 6 kg do café C, que custa R$ 5,00 o quilo. Qual o preço por quilo da mistura? 8) Para ser aprovado em uma disciplina, o aluno precisa ter média maior ou igual a 5,0, obtida num conjunto de cinco provas, sendo quatro parciais, com peso 1 cada, e uma prova-exame, com peso 2. Um aluno obteve, nas quatro provas parciais, notas iguais a 3,0; 6,0; 5,0 e 7,0. Calcule a nota mínima que esse aluno deverá obter na prova-exame para ser aprovado. 9) As marcas obtidas, em metros, pelos alunos numa prova de salto em distancia foram as seguintes 2,20 2,28 2,23 2,20 2,35 2,28 2,25 2,30 2,37 Calcule a média, a mediana e a moda dessa distribuição. 10) O quadro de frequências a seguir, refere-se às idades dos jogadores de basquete de um clube. ID NÚMERO DE ADE JOGADORES xi fi 16 6 14 12 15 15 20 24 23 9 Qual será a mediana dos dados nesse caso? 48 Prof a Paula Francis Benevides Estatística 11) Em uma casa de repouso, as pessoas internadas tem as seguintes idades: 67 68 74 67 68 84 75 80 75 84 75 73 67 74 78 77 75 80 74 77 85 85 68 74 72 73 71 73 71 85 68 84 80 77 78 75 71 72 73 84 Calcule a mediana e a moda dessa distribuição. 12) Complete o esquema para o cálculo da mediana das distribuições: xi 2 4 6 8 10 fi 3 7 12 8 4 Temos: xi fi 2 3 4 7 6 12 8 8 10 4 fia 10 30 = Como: f 2 i ...... .......... . 2 vem: Md=................. 13) Complete o esquema para o cálculo da mediana da distribuição de frequência: CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150 fi 8 10 11 16 13 5 1 Temos: i CUSTOS (R$) fi fia 1 450 | 550 8 8 2 550 | 650 3 650 | 750 4 750 | 850 5 850 | 950 6 950 | 1050 7 1050 | 1150 18 = 49 Prof a Paula Francis Benevides Estatística f i 2 ...... .......... . 2 l =................., fia (ant) = .................., fi = .................... e h = ...................... Logo: Md .......... . (........ .......... )......... . .......... .......... .......... . .......... .. .......... .... .......... ..... ......... isto é: Md = R$ 769 50 Prof a Paula Francis Benevides Estatística AULA 5 11.5 AS SEPARATRIZES: Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se baseiam em sua posição na série. Essas medidas – os quartis, os percentis e os decis – são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. 11.5.1 OS QUARTIS: Denominamos, quartis os valores de uma série que a dividem em quatro partes iguais. Há portanto, três quartis: a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarte parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md) c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte (25%) é maior. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana fi 2 por: k fi 4 sendo k o número de ordem do quartil. Assim temos: k fi fia (ant ) h 4 Qk l fi Exemplo: 51 Prof a Paula Francis Benevides Estatística Tabela 11.8 ESTATURAS (cm) fi fia 150 | 154 4 4 154 | 158 9 13 158 | 162 11 24 162 | 166 8 32 166 | 170 5 37 170 | 174 3 4 ← (Q1) ← (Q3) = 40 Primeiro Quartil Terceiro Quartil f i 40 10 3 f i 4 4 4 Q1 154 10 4 4 156,66 9 Q1 156,7cm 11.5.2 3 40 30 4 Q3 162 30 24 4 165 8 Q3 165cm OS PERCENTIS: Denominamos percentis os noventa e nove valores que separam uma série de 100 iguais. Indicamos por P1, P2,....,P32,....,P99. É evidente que: P50 = Md, P25 = Q1 e P75 = Q3 O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula fi 2 será substituída por: k fi 100 sendo k o número de ordem do percentil. k fi f ia (ant ) h 100 Assim temos: Pk l fi Exemplo: Considerando a Tabela 11.8, temos para o oitavo percentil: k 8 8 f i 100 8 40 3,2 100 Logo: P8 150 (3,2 0) 4 153,2 4 52 Prof a Paula Francis Benevides Estatística AULA 05 - EXERCÍCIOS 1) Calcule do primeiro quartil, o terceiro quartil e o vigésimo percentil da distribuição de frequência: CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150 fi 8 10 11 16 13 i CUSTOS (R$) fi 1 450 | 550 8 8 2 550 | 650 10 18 3 650 | 750 11 29 4 750 | 850 16 45 5 850 | 950 13 58 6 950 |1050 5 63 7 1050 | 1150 1 64 5 1 fia ← (Q1) ← (Q3) ∑ = 64 2) Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, o 10 o, o 1o, o 23o, o 15o e o 90o percentis das distribuições de frequência abaixo: a) b) ESTATURAS (cm) fi 5 150 | 158 5 2 | 4 8 158 | 166 12 4 | 6 14 166 | 174 18 6 | 8 10 174 | 182 27 8 | 10 7 182 | 190 8 NOTAS fi 0 | 2 ∑ = 44 ∑= 70 53 Prof a Paula Francis Benevides Estatística c) d) SALÁRIOS (R$) fi PESOS (kg) fi 500 | 700 18 145 |151 10 700 | 900 31 151 | 157 9 900 | 1100 15 157 | 163 8 1100 | 1300 3 163 | 169 6 1300 | 1500 1 169 | 175 3 1500 | 1700 1 175 | 181 3 1700 | 1900 1 181 | 187 1 ∑ = 40 ∑ = 70 3) Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual a soma dos desvios? 4) Em uma classe com 50 alunos, as notas obtidas formaram a seguinte distribuição: Notas 2 3 4 5 6 7 8 9 10 NO DE ALUNOS 1 3 6 10 13 8 5 3 1 Calcule: a) a nota média b) a nota mediana c) a nota modal 5) Considerando a distribuição abaixo: xi 3 4 5 6 7 8 fi 4 8 11 10 8 3 Calcule: a) a média b) a mediana c) a moda 6) Os salários-hora de cinco funcionários de uma companhia são: R$75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine: a) a média dos salários-hora b) o salário-hora mediano. 7) Considere o conjunto de dados: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 b) 20, 9, 7, 2, 12, 7, 20, 15, 7 c) 51, 6; 48,7; 50,3; 49,5; 48,9 d) 15, 18, 20, 13, 10, 16, 14 Calcule: I. a média II. a mediana III. a moda 54 Prof a Paula Francis Benevides Estatística AULA 6 12.MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE As medidas de dispersão medem a variabilidade dos dados em estudo. As medidas de dispersão como amplitude, variância, desvio padrão e coeficiente de variação, permitem verificar se o conjunto de dados é homogêneo ou heterogêneo. 12.1 AMPLITUDE: Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados. O cálculo e a interpretação da amplitude máxima é muito fácil. Como no caso da estatura da Tabela 11.4, a amplitude máxima é dada pela diferença entre 174 e 150cm, ou seja, 24 cm. Logo, a estatura dos alunos em questão vaia de 24 cm. A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade. 12.2 DESVIO MÉDIO: A média aritmética dos valores absolutos dos desvios para a média é uma medida de dispersão chamada desvio médio, que se indica por dm. Quando os dados da distribuição estão agrupados, a fórmula para o cálculo do desvio médio é: n dm f i xi x i 1 n fi i 1 Exemplo: 1) A tabela abaixo mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000. 1996 1997 1998 1999 2000 TIME A 7 12 20 16 10 TIME B 18 16 15 9 12 55 Prof a Paula Francis Benevides Estatística Qual o desvio médio de cada um desses times? Time A: Vamos calcular a média aritmética dos dados: 7 12 20 16 10 13 5 x Vamos calcular os desvios para a média, ou seja x1- x 7 - 13 = - 6 16 – 13 = 3 12 – 13 = - 1 10 – 13 = - 3 20 – 13 = 7 Finalmente, vamos calcular o desvio médio: | 6 | | 1 | | 7 | | 3 | | 3 | 4 5 dm Logo, o desvio médio do time A é 4 Time B: A média aritmética é igual a: x 18 16 15 9 12 14 5 Os desvios para as médias são iguais a: 18 – 14 = 4 15 – 14 = 1 16 – 14 = 2 9 – 14 = - 5 12 – 14 = - 2 O desvio médio é igual a: dm | 4 | | 2 | | 1 | | 5 | | 2 | 2,8 5 Logo, o desvio médio do time A é 2,8 Qual o time mais regular nesse período? Como o desvio médio do time B é menor que o desvio médio do time a (2,8 < 4), o time B é o mais regular. 2) Considere a distribuição de frequência representada pelo quadro abaixo e determine: a) a média aritmética b) o desvio médio I Classe fi 1 O | 4 2 2 4 | 8 6 3 8 | 12 8 4 12 | 16 3 5 16 | 20 1 56 Prof a Paula Francis Benevides Estatística Tomando como base essa distribuição, vamos fazer um quadro mais completo, que nos permite calcular a média, os desvios em relação à média e o desvio médio. i Classe Ponto médio da classe fi f i . xi xi x f i xi x 1 0 | 4 2 2 4 7 14 2 4 | 8 6 6 36 3 18 3 8 | 12 10 8 80 1 8 4 12 | 16 14 3 42 5 15 5 16 | 20 18 1 18 9 9 ∑=20 ∑= 180 5 x i 1 5 fi xi i 1 fi 5 180 9 20 dm i 1 f i xi x 5 i 1 fi ∑= 64 64 3,2 20 Logo o valor da média aritmética é 9 e o desvio médio tem valor 3,2 12.3 DESVIO PADRÃO: Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de dados numerosos. O desvio padrão foge a falha que ocorre na amplitude, por levar em conta todos os valores em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão. O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios. xi x 2 s n Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média aritmética ( x ) é um número fracionário, o que torna pouco prático o cálculo das quantidades ( xi x ) 2 . Para simplificar os cálculos , usamos a seguinte fórmula: s xi2 xi n 2 n 57 Prof a Paula Francis Benevides Estatística 12.3.1 PROPRIEDADES DO DESVIO PADRÃO O desvio padrão goza de algumas propriedades, dentre as quais destacamos: 1a Propriedade: Somando-se (ou subtraindo-se) uma constante de todos os valores de uma variável, o desvio padrão não se altera. 2a Propriedade: Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante. 12.3.2 DADOS NÃO- AGRUPADOS: Tomemos, como exemplo, o conjunto de valores da variável x: 40 45 48 52 54 62 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas, uma pra xi e outra para xi2. Tabela 12.1 xi xi2 40 1600 45 2025 48 2304 52 2704 54 2916 62 3844 70 4900 ∑ = 371 ∑= 20293 Como n = 7, temos: 2 s 20293 371 90 9,486 7 7 logo, s = 9,49 12.3.3 DADOS AGRUPADOS: 12.3.3.1 Sem intervalo de Classe: Como, neste caso, temos a presença de frequências, devemos levá-las em consideração, resultando a fórmula: s f i xi2 f i xi n n 2 58 Prof a Paula Francis Benevides Estatística Consideremos, como exemplo a seguinte tabela: Tabela 12.2 xi 0 1 2 3 4 fi 2 6 12 7 3 O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma colunapara os produtos fixi e outra para fixi2, lembrando que para obter fixi2 basta multiplicar cada fixi pelo seu respectivo xi. Assim: Tabela 12.3 xi fi fixi fixi2 0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 4 3 12 48 ∑ = 30 ∑ = 63 ∑ = 165 Logo: 2 165 63 s 1,09 1,044 30 30 Daí: s = 1, 04 12.3.3.2 Com intervalo de classe: Tomemos como exemplo a distribuição da seguinte Tabela 11.3. Começaremos por abrir as colunas para xi (ponto médio), para fixi e para fixi2. Assim Tabela 12.4 i ESTATURAS (cm) fi xi fixi fixi2 1 150 | 154 4 152 608 92416 2 154 | 158 9 156 1404 219024 3 158 | 162 11 160 1760 281600 4 162 | 166 8 164 1312 215168 5 166 | 170 5 168 840 141120 6 170 | 174 3 172 516 88752 ∑ = 6440 ∑= = 40 1038080 59 Prof a Paula Francis Benevides Estatística Logo: 2 1038080 6440 s 31 5,567 daí: s = 5,57 40 40 12.4 VARIÂNCIA: A variância nada mais é do que o quadrado do desvio padrão. 12.5 COEFICIENTE DE VARIAÇÃO: O coeficiente de variação dá uma idéia da precisão de um experimento ou da dispersão de um conjunto de dados. É definido como o quociente entre desvio padrão e a média, multiplicado por 100. Logo, o coeficiente de variação nada mais é do que o desvio padrão em porcentagem da média. CV s 100 x Para a distribuição da tabela 12.4, obtemos x = 161 cm e s = 5,57 cm, logo CV 5,57 100 3,459 3,5% 161 Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: ESTATURAS PESOS x s 175 cm 5,0 cm 68 kg 2,0 kg Temos: CVE 5 100 2,85 % 175 e CVP 2 100 2,94 % 68 Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estuturas. 60 Prof a Paula Francis Benevides Estatística AULA 6 - Exercícios 1) As alturas dos jogadores de um time de basquete são, em centímetros, 195, 198, 201, 192 e 204. Nessas condições, determine: a) a média das alturas b) o desvio médio 2) A tabela seguinte mostra o número de operários acidentados por mês numa fábrica, durante o ano Fev. Mar. Abril. Maio. Junho Julho Agosto. Set. Out. Nov. Dez. Mês Jan. de 2000. 4 8 3 6 7 7 3 8 4 4 3 3 Operários Organize uma tabela de distribuição de frequências e determine: a) a média aritmética dessa distribuição b) o desvio médio 3) Determine a média aritmética e o desvio médio, dos valores apresentados na tabela seguinte: xi 2 3 4 5 6 7 fi 5 10 15 12 5 3 4) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga de representante no conselho da escola. 3A 3B 3C 3D 3E 3F VITOR 12 15 12 16 14 15 RAFAEL 12 11 18 9 19 15 Calcule o desvio padrão de cada um desses candidatos. Qual dos dois candidatos é o mais regular? 5) Calcule a variância e o desvio padrão da seguinte distribuição: Classe fi O | 4 2 4 | 8 6 8 | 12 8 12 | 16 3 16 | 20 1 61 Prof a Paula Francis Benevides Estatística 6) As velocidades máximas das cinco voltas dadas em um teste de Fórmula 1, em km/h, foram: 190, 198, 196, 204 e 202. Nessas condições, determine: a) a média das velocidades b) a variância c) o desvio padrão 7) Dez canções concorrentes a um festival foram apreciadas por um júri que lhes atribuiu as seguintes pontuações: 1, 5, 4, 3, 2, 1, 1, 1, 5, 2. a) elabore uma tabela com as frequências e com os quadrados dos desvios para a média b) calcule a moda e a mediana c) desvio padrão 8) O tempo gasto por seis alunos para fazer um trabalho foi, em minutos, 6, 5, 5, 3, 3, 2. Nessas condições, calcule a média aritmética, o desvio médio, a variância e o desvio padrão dessa distribuição. 9) Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10, 11, 15, 16, 18 n= xi xi2 8 64 ∑= ∑= 2 ..... ..... ......... ........... isto é: s = 3,56 Logo: s ..... ..... 10) Comprove a primeira propriedade do desvio padrão somando 5 a cada valor da variável do exercício anterior. 11) Comprove a segunda propriedade do desvio padrão multiplicando por 2 cada valor da variável do exercício 9. 12) Complete o esquema para o cálculo do desvio padrão da distribuição: xi 1 2 3 4 5 6 fi 2 5 8 6 3 1 Temos: 62 Prof a Paula Francis Benevides Estatística xi fi fixi fixi2 1 2 2 2 ∑= ∑= ∑= 2 3 4 5 6 Logo: 2 ..... ..... s ...... (........) 2 ....... ........... isto é: s = 1,24 ..... ..... 13) Calcule a amplitude total e os desvios padrões dos conjuntos de dados: a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 22, 20 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 d) – 10, - 6, 2, 3, 7, 9, 10 14) Calcule os desvios padrões e a amplitude total das distribuições: a) xi 2 3 4 5 6 7 8 fi 1 3 5 8 5 4 2 b) Classes 1,5 | 1,6 | 1,7 | 1,8 | 1,9 | 2,0 | 2,1 | 2,2 fi 4 8 12 15 12 8 4 63 Prof a Paula Francis Benevides Estatística AULA 7 13.MEDIDAS DE ASSIMETRIA: A medida de assimetria indica o grau de distorção da distribuição em relação e uma distribuição simétrica. 13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA: Uma distribuição é dita simétrica se existe um eixo de simetria no gráfico gerado pela tabela de frequência. Esse eixo divide o gráfico em duas partes iguais, de modo que, se rebatermos uma na outra, elas se sobrepõem completamente. Como mostra as figuras abaixo. Sempre que os dados tiverem média, mediana e moda iguais, a distribuição será simétrica. x =Md=Mo 13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA: Se a distribuição não for simétrica, podemos ter dois casos de assimetria: assimetria positiva e assimetria negativa. A assimetria será negativa se a cauda da distribuição estiver do lado esquerdo do gráfico, como mostra a figura 13.2a, e será positiva se a cauda da distribuição estiver do lado direito do gráfico, como mostra a figura 13.2b. A assimetria geralmente ocorre devido à extensão de uma das caudas da distribuição. Uma vez que os valores da cauda afetam muito a média, mas não a mediana e a moda, a média sempre acompanha o lado da cauda da distribuição, como mostra a figura 13.1. 64 Prof a Paula Francis Benevides Estatística 13.2 - Distribuições assimétricas Das figuras 13.3a e 13.3b, podemos verificar que a distância da média em relação à moda e a mediana será maior, quanto maior for a extensão da cauda da distribuição e, conseqüentemente, maior será a assimetria da distribuição. 13.3 – Distribuições assimétricas positivas Moda Mediana Média Mo< Md < x X< Md< Mo A natureza da assimetria já foi estudada no capítulo 11, item 11.4, quando vimos que, sendo a distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior que a moda. Baseando-se nessas relações entre média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim, assim calculando o valor da diferença: x Mo se: x - Mo = 0 assimetria nula ou distribuição simétrica x - Mo < 0 assimetria negativa ou à esquerda x - Mo > 0 assimetria positiva ou à direita 65 Prof a Paula Francis Benevides Estatística 13.3 COEFICIENTE DE ASSIMETRIA: A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo, daremos preferência ao coeficiente de assimetria de Pearson, dado por: As 3( x Md ) s ou As x Mo s Dependendo do valor de As, podemos classificar a distribuição em: Simétrica, se |As| < 0,15 Assimétrica moderada, se 0,15 ≤ |As| <1,0 Assimétrica forte, se |As| ≥ 1,0 A análise da assimetria pode ser feita por outras expressões, como: n ( xi x ) 3 i 1 As n s3 ou As (Q3 mediana ) (mediana Q1 ) (coeficiente de Bowley) (Q3 mediana ) (mediana Q1 ) Exemplo: DISTRIBUIÇÃO A Pesos(kg) fi 2 | 6 6 6 | 10 12 10 | 14 24 14 | 18 12 18 | 22 6 ∑ = 60 x =12 kg Md = 12 kg Mo = 12 kg s = 4,42 kg 66 Prof a Paula Francis Benevides Estatística DISTRIBUIÇÃO B Pesos(kg) fi 2 | 6 6 6 | 10 12 10 | 14 24 14 | 18 30 6 18 | 22 ∑ = 78 x =12,9 kg Md = 13,5 kg Mo = 16 kg s = 4,20 kg Mo = 8 kg s = 4,20 kg DISTRIBUIÇÃO C Pesos(kg) fi 2 | 6 6 6 | 10 30 10 | 14 24 14 | 18 12 6 18 | 22 ∑ = 78 x =11,1 kg Md = 10,5 kg Logo: A: 12 – 12 = 0 a distribuição é simétrica B: 12,9 – 16 = - 3,1 a distribuição é assimétrica negativa C: 11,1 – 8 = 3,1 a distribuição é assimétrica positiva Considerando os gráficos das distribuições anteriores, temos: 67 Prof a Paula Francis Benevides Estatística 14.MEDIDAS DE CURTOSE: Denominamos de curtose o grau de achatamento de uma distribuição em relação a uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (ou mais achatada na sua parte superior), ela é chamada de platicúrtica. A curva normal, que é a nossa referencial, recebe o nome de mesocúrtica. 14.1 COEFICIENTE DE CURTOSE: A curtose pode ser medida pela seguinte expressão: c Q3 Q1 2( P90 P10 ) Essa fórmula é conhecida como coeficiente percentílico de curtose. Relativamente a curva normal, temos; c = 0,263 68 Prof a Paula Francis Benevides Estatística Assim: C = 0,263 curva mesocúrtica C < 0,263 curva leptocúrtica C > 0,263 curva platicúrtica Exemplo: Sabendo-se que uma distribuição apresenta as seguintes medidas: Q1 = 24,4 cm, Q3 = 41,2 cm, P10 =20,2 cm e P90 =49,4 cm, temos: C 41,2 24,4 16,8 0,2866 C 0,287 2( 49,5 20,2) 58,5 Como: 0,287>0,263, concluímos que a distribuição é platicúrtica, em relação a normal. AULA 07 - Exercícios 1) Uma escola faz uma pesquisa sobre o tempo, em horas, que os estudantes dedicam ao estudo durante o dia, fora da aula. Com uma amostra aleatória de 60 estudantes, obtiveram-se os dados da tabela de frequência a seguir. Calcule a média, a moda e o desvio padrão e classifique a assimetria da distribuição de frequência obtida. Horas de Estudo No de alunos 0,5 | 1,5 25 1,5 | 2,5 17 2,5 | 3,5 10 3,5 | 5,5 6 5,5 | 8,5 2 2) Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os dados obtidos são: 25 23 21 28 41 18 19 23 20 22 23 Considerando os dados como amostrais, calcule a média, a mediana e o desvio padrão desses dados. Classifique os dados em relação a assimetria. 69 Prof a Paula Francis Benevides Estatística 3) O gasto mensal de energia elétrica de cada apartamento de um prédio esta tabelado a seguir: Gasto Mensal Número de apartamentos 5,00 | 10,00 10,00 | 15,00 15,00 | 20,00 20,00 | 30,00 30,00 |40,00 40,00 |60,00 60,00 | 90,00 90,00 | 120,00 120,00 | 150,00 4 9 18 26 18 11 8 4 2 Calcule a média e a moda dos dados. Calcule o desvio padrão dos dados Calcule a assimetria através do coeficiente de Pearson e classifique esta assimetria. 4) Considere os seguintes resultados relativos a três distribuições de frequência e determine o tipo de assimetria de cada uma delas. Distribuições x Mo A 52 52 B 45 50 C 48 46 5) Uma distribuição de frequência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2, 12. Calcule o coeficiente de assimetria. 6) Observou-se o número dos 100 sapatos vendidos em uma loja de calçados. Os resultados obtidos estão em forma de tabela, a seguir: Número de sapato Frequência 25 | 28 2 28 | 31 9 31 | 34 17 34| 37 35 37 | 40 40 | 43 43 |46 20 10 7 Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose desses dados. 70 Prof a Paula Francis Benevides Estatística 7) Um hospital observou o tempo, em minutos, que 100 pacientes tiveram que esperar até serem atendidos por um médico. Os dados obtidos estão na tabela a seguir. Tempo de espera Número de pacientes 0 | 5 13 5 | 10 25 10 | 15 30 15 | 20 16 9 20 | 30 5 30 |45 2 45 | 60 Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose desses dados. 8) Considere as seguintes medidas, relativas a três distribuições de frequência: Distribuições Qi Q2 P10 P90 A 814 935 772 1012 B 63,7 80,3 55,0 86,6 C 28,8 45,6 20,5 49,8 Calcule os respectivos graus de curtose Classifique cada uma das distribuições em relação à curva normal. 9) Determine o grau de curtose e classifique a distribuição em relação à curva normal: Pesos (kg) No de operários 50 | 58 | 66 | 74 | 82 | 90 | 98 10 15 25 24 16 10 71 Prof a Paula Francis Benevides Estatística AULA 8 15.PROBABILIDADE: 15.1 INTRODUÇÃO: Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão nesta matéria se justifica pelo fato de que a maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou probabilística. 15.2 EXPERIMENTO ALEATÓRIO: Todos sabemos de experimentos científicos e de engenharia. A experimentação é útil, pois podemos assumir que, se executarmos certos experimentos sob condições quase idênticas, chegaremos essencialmente aos mesmos resultados. Nestas circunstâncias, somos capazes de controlar o valor das variáveis que afetam o resultado do experimento. Entretanto, em alguns experimentos, não somos capazes de conhecer nem controlar o valor de certas variáveis, pois os resultados irão variar de uma realização do experimento para outra, mesmo que as condições, em sua maioria, sejam as mesmas. Estes experimentos são ditos aleatórios. Experimentos ou Fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Exemplo: o lançamento de uma moeda o lançamento de um dado 15.3 ESPAÇO AMOSTRAL: A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6. Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto universo, representado por S. A cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral. Assim, no lançamento de um dado, 2 S 2 é um ponto amostral de S. Se um espaço amostral tem um número finito de pontos é chamado de espaço amostral finito. Se ele tem tantos pontos quanto no conjunto dos números naturais 1, 2, 3,..., é chamado de espaço amostral infinito contável. Se ele tem tantos pontos quanto existem em algum intervalo sobre o eixo x, tal como 0 ≤ x ≤ 1, ele é dito um espaço amostral infinito não contável. Um 72 Prof a Paula Francis Benevides Estatística espaço amostral finito ou infinito contável é dito espaço amostral discreto, enquanto que um infinito não contável é dito espaço amostral não discreto. 15.4 EVENTOS: Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório. Considere o experimento aleatório: lançamento de dois dados, um branco e outro vermelho. O espaço amostral que descreve essa experiência é: S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6) (3,1), (3,2), (3,3), (3,4), (3,5), (3,6) (4,1), (4,2), (4,3), (4,4), (4,5), (4,6) (5,1), (5,2), (5,3), (5,4), (5,5), (5,6) (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} O primeiro de cada par acima indica o resultado no dado branco, e o segundo número indica o resultado no dado vermelho. Por exemplo, (3,6) é 3 no dado branco e 6 no vermelho. Considere, agora, os seguintes eventos: A: a soma dos resultados nos dois dados é menor que 4 A = {(1,1), (1,2), (2,1)} B: a soma dos resultados nos dois dados é menor que 1 B= Neste caso, quando o evento é o conjunto vazio, dizemos que o evento é impossível. C: a soma dos resultados nos dois dados é igual a 12 ou menor que 12. C=S Neste caso, quando o evento é o próprio espaço amostral S, dizemos que o evento é certo. D: o resultado do primeiro dado é 5 e no segundo dado é 3 O evento, neste caso, é D = {(5,3)} Quando o evento é um conjunto unitário, dizemos que o evento é simples ou elementar. E: o resultado no dado branco é um número impar 73 Prof a Paula Francis Benevides Estatística F: o resultado no dado branco é um número par Então, E = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6)} F = {((2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} Observe que E F = S Neste caso, dizemos que os eventos E e F são complementares. Indicamos o complementar de um evento A por A´ G: a soma dos resultados é igual a 5 H: a soma dos resultados é menor ou igual a 3. G = {((1,4), (2,3), (3,2), (4,1)} H = {(1,1), (1,2), (2,1)} Observe que G H = Neste caso, dizemos que os eventos G e H são eventos mutuamente exclusivos. I: nos dois dados, os resultados devem ser números ímpares. J: a soma dos resultados nos dois dados devem ser um número par. I = {(1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5)} J = {(1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3), (5,5), (6,2), (6,4), (6,6)} Observe que I J Neste caso, dizemos que o evento I implica no evento J. 15.5 PROBABILIDADE: Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável. Chamamos de probabilidade de um evento A (A S) o número real P(A), tal que; P( A) n( A) n( S ) onde: n(A) é o número de elementos de A n(S) é o número de elementos de S. 74 Prof a Paula Francis Benevides Estatística Exemplo: No lançamento de um dado, determinar a probabilidade de se obter: o número 2 um número par um número múltiplo de 3 a) O espaço amostral S = {1, 2, 3, 4, 5, 6}, portanto n(S) = 6 Ocorrência do número 2: A = {2}, portanto n(A) = 1 P(A) = n(A)/n(S) = 1/6 = 0,1666 ou 16% b) ocorrência de um número par: B = {2, 4, 6} P(B) = 3/6 = ½ = 0,5 ou 50 % c) ocorrência de um número múltiplo de 3 C = {3, 6}, portanto n(C) = 2 P(C) = 2/6 = 1/3 = 0,3333 ou 33% 15.6 EVENTOS COMPLEMENTARES: Sejam A e A´ dois eventos complementares de um espaço amostrar S, então: P(A) + P(A´) = 1 Exemplo: Considere um conjunto de 10 frutas em que 3 estão estragadas. Escolhendo-se aleatoriamente 2 frutas desse conjunto, determinar a probabilidade de: a) ambas não estarem estragadas b) pelo menos uma estar estragada a) Cálculo do número de maneiras de escolher duas frutas entre dez: n(S) = C10,2 = 45 Seja A o evento ―ambas as frutas não estão estragadas‖. Cálculo do número de maneiras de escolher duas frutas não estragadas entre sete. n(A) = C7,2 = 21 75 Prof a Paula Francis Benevides Estatística Logo, a probabilidade desse evento é: P(A) = n(A)/n(s) = 21/45 = 7/15 b) o evento B ―pelo menos uma esteja estragada‖ significa que uma fruta ou duas frutas devem estar estragadas. Esse evento B é o complementar A´ do evento A. Logo P(A) + P(A´) = 1 1 – 7/15 = 8/15 15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS: Algumas vezes necessitamos saber a probabilidade da ocorrência de duas condições e da ocorrência dessas condições serem simultâneas. Exemplo: Numa pesquisa sobre a preferência em relação a dois jornais, foram consultadas470 pessoas e o resultado foi o seguinte: 250 delas lêem o jornal A, 180 lêem o jornal B e 60 lêem os jornais A e B. Escolhendo um dos entrevistados ao acaso, qual a probabilidade de que ele seja: leitor dos jornais A e B leitor do jornal A ou do jornal B? a) A 190 B 60 120 Como 60 pessoas lêem os jornais A e B, marcamos 60 na intersecção de A com B. Se 250 lêem o jornal A, marcamos 190 (250 – 60 = 190) na parte de A que não esta em B. se 180 lêem o jornal B, marcamos 120 (180 – 60 = 120) na parte de B que não esta em A. Como foram consultadas 470 pessoas e já marcamos 370 (190 + 60 + 120), concluímos que 100 pessoas não lêem nenhum dos dois jornais. Assim a probabilidade de que a pessoa leia os dois jornais A e B, é: P( A B) n( A b) 60 6 n( S ) 470 47 76 Prof a Paula Francis Benevides Estatística b) Quando somamos o número de pessoas que lêem o jornal A com o número de pessoas que lêem o jornal B, contamos duas vezes aquelas que lêem os dois jornais. P(A B) = P(A) + P(B) – P(A B) Portanto, a probabilidade de ocorrer um evento A ou um evento B é dada pela soma das probabilidades de os dois eventos ocorrerem separadamente, menos à probabilidade deles ocorrerem simultaneamente. Logo, P(A B) = 25/47 + 18/47 – 6/47 = 37/47 15.8 EVENTOS INDEPENDENTES: Dizemos que dois eventos são independentes quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: P = p1 x p2 Exemplos: 1) Retirando-se duas cartas ao acaso, sem reposição, de um baralho de 52 cartas, qual a probabilidade do naipe da primeira ser de paus e da segunda ser de copas? Das 52 cartas do baralho, 13 são de paus, 13 de copas, 13 de ouros e 13 de espadas. A probabilidade de ocorrer o evento independente A: ―A primeira carta é de paus‖ é: 13/52 = ¼ Como a segunda carta é retirada sem reposição da primeira, restam 51 cartas no baralho (retiramos uma carta de paus). A probabilidade de ocorrer o evento independente B: ―a segunda carta é de copas‖ é; 13/51. A probabilidade de a primeira carta ser de paus e a segunda ser de copas é dada pelo produto: 1 13 13 P( A B) P( A).P( B) 4 51 204 77 Prof a Paula Francis Benevides Estatística 2) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara? Neste problema vamos usar o conceito de eventos complementares, vamos calcular a probabilidade de nenhuma ser cara e depois diminuir de 1(ou 100%). P(A) = probabilidade de não sair nenhuma cara P( A) 1 1 1 1 1 2 2 2 2 16 cada multiplicação equivale a um lançamento Portanto, a probabilidade de sair pelo menos uma cara é: 1 – P(A) = 1 – 1/16 = 15/16 15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS: Um experimento é dito não equiprovável, quando os eventos elementares do espaço amostrar não apresentam a mesma probabilidade de ocorrência. Exemplo: Numa moeda viciada, a chance de ocorrer cara num lançamento é igual a quatro vezes a chance de ocorrer coroa. Calcular a probabilidade de ocorrer cara num lançamento dessa moeda. Sejam os eventos: C: ocorrer ―cara‖ K: ocorrer ―coroa‖ Com P(C) = 4P(K) e como os eventos são exclusivos e complementares, temos: P(C) + P(K) = 1 P(C) + ¼ P(C) = 1 P(C) = 4/5 AULA 7 – Exercícios 1) Com os algarismos 3, 5 e 7 formamos todos os números de 3 algarismos possíveis, sem repetição. Escolhendo um desses números ao acaso, qual a probabilidade dessa escolha recair em um número: a) múltiplo de 3? (100%) b) par? (0%) 2) Numa gaveta há 3 canetas que escrevem em azul, 2 em preto, 4 em verde e 3 que não possuem carga. Escolhendo ao acaso, uma dessas canetas, ache a probabilidade de que a caneta: a) escreva (3/4) b) não escreva (1/4) c) escreva em azul (1/4) 3) Uma urna contém 500 bolas, cada uma delas identificada por um número; para essa identificação foram utilizados todos os números da progressão aritmética (1, 3, 5, 7,...,999). Retirando-se 78 Estatística Prof a Paula Francis Benevides aleatoriamente da urna uma única bola, calcule a probabilidade, em porcentagem, de que o número dessa bola tenha o algarismo das unidades igual a 3. (20%). 4) Numa máquina caça níquel, cada resultado é formado pr três quaisquer de cinco frutas diferentes, podendo haver repetição. Calcule a probabilidade de um resultado ter duas frutas iguais e uma diferente. (12/25) 5) Escolhendo aleatoriamente um natural no conjunto {1, 2,...,100} de naturais sucessivos, seja p a probabilidade deste natural ser divisível por 2 ou por 3. Indique 100p. (67) 6) Dentro de um armário há 3 pares de sapatos de cores diferentes. Retiram-se ao acaso dois sapatos. Qual a probabilidade de: a) eles serem do mesmo par? (1/5) b) um ser do pé direito e outro do pé esquerdo? (3/5) 7) Dois jogadores, Kleber e Arnaldo, lançam um dado uma única vez cada um. Vence o jogo quem tirar o maior número. Sabendo que Kleber tirou 4, qual a probabilidade de: a) Kleber vencer o jogo ( ½) b) haver empate (1/6) c) Arnaldo vencer o jogo? (1/3) 8) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara? (15/16) 9) Considere duas caixas, I e II. Na caixa I há 4 bolas pretas e 6 azuis e na caixa II há 8 bolas pretas e 2 azuis. Escolhi ao acaso uma caixa e, em seguida, tirei uma bola. Qual a probabilidade desta bola ser preta? (3/5) 10) Qual a probabilidade de um casal ter 4 filhos e todos do sexo feminino? (1/16) 11) Retiram-se duas cartas de um baralho de 52 cartas. Qual a probabilidade de que pelo menos uma seja de ouros? ( 44,12%) 12) Num certo pais, 10% das declarações de imposto de renda são suspeitas e submetidas a uma análise detalhada; entre estas verificou-se que 20% são fraudulentas. Entre as não suspeitas, 2% são fraudulentas. a) Se uma declaração é escolhida ao acaso, qual a probabilidade de ela ser suspeita e fraudulenta? (2%) b) Se uma declaração é fraudulenta, qual a probabilidade de ela ter sido suspeita? (52,6%) 13) Três carros A, B e C participam de uma corrida. A tem duas vezes mais chances de ganhar do que B, e B tem três vezes mais chances de ganhar de que C. Determine as probabilidades de vitória de cada carro. (A=3/5, B = 3/10 e C = 1/10) 79 Prof a Paula Francis Benevides Estatística AULA 9 15.10 PROBABILIDADE CONDICIONADA: Se a condição de independência estatística não for satisfeita, deve ser usada uma fórmula mais geral, envolvendo probabilidades condicionadas. Dados dois eventos, A e B, e a probabilidade de que o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade condicionada de B, escrita por P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de A, condicionada à ocorrência de B, como P(B/A) (lê-se probabilidade de A dado que B tenha ocorrido, ou probabilidade de A condicionada à ocorrência de B). Suponha que existam 10 rótulos de papel que podem ser distinguidos pelo número e pela cor: por exemplo, os rótulos numerados por 1, 2 e 3 são amarelos e os restantes, brancos. Se todos forem colocados em uma urna e retirados ao acaso, a probabilidade de se extrair um rótulo particular é 1/10. Se, porém, após retirar um rótulo ao acaso, ele for amarelo, como calcular a probabilidade de que um certo rótulo,por exemplo, aquele com o número 1, seja extraído? Evidentemente, o número possível de acontecimentos favoráveis está agora reduzido de 10 para três, em outras palavras, o rótulo desejado deve ter o número 1 e ser amarelo. Calculamos a probabilidade condicionada pela razão P rótulo n o 1 / amarelo P(rótulo n o 1 e amarelo) 1 / 10 1 P(amarelo) 3 / 10 3 De modo geral, dados dois eventos a e B, que não são independentes, a probabilidade condicionada de A, dado B, é definida como: P( A / B) P ( A B ) n( A B ) P( B) n( B ) Ou seja, como a razão entre a probabilidade e o evento conjunto A e B ocorrer e a probabilidade da ocorrência de B. Exemplos: 1) Uma carta é retirada de um baralho. Qual a probabilidade de ser um rei preto, dado que a carta retirada foi uma ―figura‖ (valete, damas ou rei)? Sejam: A: rei preto B: figura 2 Então: P(A/B) = 52 2 1 12 12 6 52 80 Prof a Paula Francis Benevides Estatística Veja: no baralho, existem dois reis pretos, os quais também são figuras, portanto: P(A∩B0 = 2/52 Doze cartas são figuras, logo P(B) = 12/52, Então a probabilidade de um rei preto, condicionada a ocorrência de uma figura é 1/6 ou 17%. 2) Numa classe de 60 alunos, 40 estudam só Matemática, 10 estudam só Física e 5 estudam Matemática e Física. Determine a probabilidade de um aluno que estuda Matemática, estudar também Física. F: estudam Física M: estudam Matemática n(F∩M) = 5 n(M) = 45 ( pois tem os que só estudam Matemática e mais os que estudam Matemática e Física) Logo, P(F/M) = 4/45 = 1/9 15.11 DISTRIBUIÇÃO BINOMIAL: Neste item, vamos considerar experimentos que satisfaçam as seguintes condições: a. O experimento dever ser repetido, nas mesmas condições, um número finito de vezes (n) b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q 1 p) do insucesso manter-se-ão constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: n P p k q n k k na qual: p é a probabilidade de que o evento se realize em uma só prova – sucesso q é a probabilidade de que o evento não se realize no decurso dessa prova – insucesso n é o número de tentativas k número de vezes que o evento deve ocorrer. Exemplo: 81 Prof a Paula Francis Benevides Estatística 1) Um dado é lançado cinco vezes. Calcular a probabilidade de ocorrer um 3 ou um 4 duas vezes. Quando lançamos um dado podemos obter 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6 A probabilidade de ocorrer um 3 ou um 4 em cada lançamento é p = 2/6 = 1/3 Logo: n=5 k=2 p = 1/3 q = 2/3 5 1 2 80 P 33% 240 2 3 3 2 3 2) Um jogador de xadrez tem 2/5 de probabilidade de vitória quando joga. Na realização de cinco partidas, determinar a probabilidade de esse jogador vencer: duas partidas: p = 2/5, q = 3/5, r = 2 e k = 5 substituindo na fórmula temos P = 216/625 = 34,56% mais que a metade das partidas. O jogador vence mais da metade das partidas se vencer 3, 4 ou 5 partidas, logo: 5 2 3 5 2 3 5 2 3 992 ~ 31,74% 3125 3 5 5 4 5 5 5 5 5 3 Ptotal 2 4 1 5 0 AULA 8 - Exercícios 1) A probabilidade de se escolher uma peça defeituosa em uma loja é de 1/5. Calcule a probabilidade de ao se escolher 4 peças, 3 delas sejam defeituosas. (2,56%) 2) A probabilidade de um atirador acertar o alvo em um único tiro é 0,25. Dando 4 tiros, qual a probabilidade de acertar o alvo pelo menos duas vezes? (26,17%) 3) Uma prova do tipo múltipla escolha contém 10 testes, com 5 alternativas cada um. Somente uma alternativa é correta para cada teste. Qual a probabilidade de um aluno, ―chutar‖ os dez testes, acertar a metade das respostas? (2,64%) 4) Uma cadela teve cinco filhotes em uma ninhada, sendo três machos e duas fêmeas. Qual a probabilidade de se obter uma ninhada como esta? (5/16) 82 Estatística Prof a Paula Francis Benevides 5) Num jogo de basquete, a probabilidade de um jogador fazer a cesta a certa distância é 0,4. Ache a probabilidade de que em 5 tentativas ele: a) não faça nenhuma cesta (7,78%) b) faça duas cestas (34,56%) c) faça alguma cesta (92,22%) 6) Determine a probabilidade de um casal ter 6 filhos do sexo masculino. (1/64) 7) Numa caixa existem cinco cartões numerados de 1 a 5. Retirando-se dois cartões sucessivamente, sem reposição do primeiro, determine a probabilidade de que os dois números retirados sejam ímpares. (30%) 8) Em uma amostra de 500 peças, existem exatamente quatro defeituosas. Retirando-se, ao acaso, uma peça dessa amostra, qual a probabilidade que ela seja perfeita? (99,2%) 9) O código de acesso de um cartão de crédito é formado por seis dígitos decimais. Cada dígito é um número inteiro que pode assumir qualquer valor entre 0 e 9. Tendo extraviado seu cartão de crédito, Tongomiro receia que um estranho o encontre e tente descobrir o código. Calcule a probabilidade aproximada de alguém acertar o código do cartão de Tongomiro num total de 1000 tentativas aleatórias e distintas. (0,1%) 10) Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o dobro de frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não viciado. Qual a frequência da face 1? (1/9) 11) Um dado honesto é lançado duas vezes. Encontre a probabilidade de obter 4, 5, ou 6 no primeiro lançamento e 1, 2, 3, ou 4 no segundo lançamento. (1/3) 12) Roberto J., administrador recém formado, envia um currículo para duas empresas A e B, à procura de emprego. A probabilidade de ser aceito pela empresa A é de 25% e a de ser aceito pela empresa B é de 20%; a probabilidade de ser aceito por ambas é 8%. a) Qual a probabilidade de ser aceito por ao menos uma das empresas? (37%) b) Qual a probabilidade de ser aceito exatamente por uma empresa? (29%) 83 Prof a Paula Francis Benevides Estatística AULA 10 16.DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS: 16.1 INTRODUÇÃO: Neste capítulo, são apresentadas as distribuições de probabilidade de populações. A distribuição de frequência é uma amostra é uma estimativa de distribuição de probabilidade da população correspondente. Se o tamanho da amostra for grande, podemos esperar que a distribuição de frequência da amostra seja uma boa aproximação da distribuição de probabilidade da população. As análises das distribuições de probabilidades possibilitam a construção de modelos que nos auxiliam no entendimento de fenômenos do mundo real. 16.2 VARIÁVEIS ALEATÓRIAS: Seja um experimento aleatório e S o espaço amostral associado ao experimento. Uma função X que associe a cada elemento s S um número real X(s) é denominado variável aleatória. Observe que, apesar do nome, variável aleatória é uma função cujo domínio é o conjunto S, e o contradomínio o conjunto de todos os valores possíveis de X, os X(s). 16.2.1 VARIÁVEL ALEATÓRIA DISCRETA: Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito numerável, denominaremos X de variável aleatória discreta. 16.2.2 VARIÁVEL ALEATÓRIA CONTÍNUA: Seja X uma variável aleatória. Se o contradomínio de X é um intervalo, ou uma coleção de intervalos, denominaremos X de variável aleatória contínua. Neste capítulo iremos estudar as variáveis aleatórias discretas e, no próximo, as variáveis aleatórias contínuas. 84 Prof a Paula Francis Benevides Estatística Exemplos: a) X: número de caras obtidas no lançamento de duas moedas (variável aleatória) Então: = lançamento de duas moedas S = {cc, ck, kc, kk}, c = cara e k = coroa A variável X poderá assumir os valores, 0, 1 e 2 Assim: X = 0 corresponde ao resultado do evento kk (nenhuma cara) X = 1 corresponde ao resultado ck ou kc (uma cara) X = 2 corresponde ao resultado kk (duas caras) (variável aleatória discreta) b) X: altura dos alunos entre 1,60m e 1,70 m (variável aleatória contínua) 16.3 FUNÇÃO DE PROBABILIDADE: Seja X a variável aleatória discreta. Sejam x1, x2, x3,...seus possíveis valores. A cada resultado de xi, associaremos um número p(xi) = P(X =xi), denominado probabilidade de xi, tal que: a) p (xi) ≥ 0 para todos os xi p( x ) 1 b) i 1 i Essa função é denominada função de probabilidade da variável aleatória X. A distribuição de probabilidade de X é dada pelos pares [x i; p(xi)], i = 1, 2, 3,... e poderá ser expressa por uma tabela, gráfico ou fórmula. Exemplo: Vamos encontrar a distribuição discreta de probabilidade da variável número de caras encontradas no lançamento de três moedas. Logo, = lançamento de três moedas S = {ccc, cck, ckc, kck, kcc, kkc, kkk} X = número de caras = 0, 1, 2,... X = 0 → kkk X = 1 → kkc, kck, ckk 85 Prof a Paula Francis Benevides Estatística X = 2 → cck, ckc, kcc X = 3 → ccc Eis a distribuição de probabilidade expressa por uma tabela: xi 0 1 2 3 p(xi) 1 8 3 8 3 8 1 8 16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA: Se X for uma variável aleatória discreta, define-se Função de Distribuição Acumulada em um ponto x como a soma das probabilidades dos valores xi, menores ou iguais a x. Isto é: F ( x) p ( x i ) xi x Exemplo: Em uma caixa, tem-se cinco peças boas e quatro defeituosas. São retiradas aleatoriamente três peças sem reposição. Façamos X a variável aleatória: número de peças boas entre as três peças retiradas. Logo, os valores de X são: 0 (nenhuma peça boa), 1, 2 e 3 Para a montagem da tabela de distribuição de probabilidade, necessitamos calcular as p(xi). n(S)= C9,3 = 84 (5 das peças boas + 4 das peças defeituosas) p(x = 0) = p(x = 1) = p(x= 2) = p(x = 3) = C 4,3 84 4 4 84 21 C 4, 2 C 5,1 84 C 4,1 C 5, 2 84 C 5, 3 84 30 5 84 14 40 10 84 21 10 5 84 42 86 Prof a Paula Francis Benevides Estatística Portanto, a distribuição de probabilidade pode ser expressa pela tabela: xi 0 1 2 3 p(xi) 4 84 30 84 40 84 10 84 Com referência à função acumulativa de probabilidade, temos os seguintes exemplos, considerando os dados já calculados: Observe a tabela anterior. a) b) c) d) e) f) g) F(-0,7) = 0 F(0,5) = 4/84 F(1) = 34/84 F(1,8) = 34/24 F(2,1) = 74/84 F(3) = 84/84 = 1 F(8) = 1 Quanto às probabilidades, temos: a) b) c) d) P(2 ≤ x ≤ 3) = 50/84= 25/42 P(x< 1) = 4/84 = 1/21 P(x > 3) = 0 Probabilidade de pelo menos uma peça boa P(x ≥ 1) = P(X = 1) + P(X = 2) + P(X = 3)= 30/84 + 40/84 + 10/84 = 80/84 = 20/21 Ou P(X ≥ 1) = 1 – P(x = 0) = 1 – 4/84 = 80/84 = 20/21 16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA: Seja X uma variável aleatória discreta, com valores x 1, x2, ..., xk, o valor esperado de X (ou esperança matemática de x), ou simplesmente média de X é definida como: k ( x ) [ x] xi p( xi ) i 1 87 Prof a Paula Francis Benevides Estatística Exemplo: Considere um jogo no qual se lançam três moedas, não viciadas, e se recebe um dólar por cada cara que apareça. Quanto se esperaria ganhar, se pudesse fazer o jogo apenas uma vez? Ou de outra maneira: qual é o valor esperado de uma jogada? A distribuição de probabilidade será: 0 1 2 3 Xi : valor a ser recebido ($) 0 1 2 3 3/8 3/8 Número de Caras 1/8 Probabilidades: p(xi) 1 8 3 8 3 8 1/8 1 8 ( x ) [ x] 0 1 2 3 $1,50 O valor esperado é uma média a longo prazo. No caso, após várias jogadas se esperaria ganhar $1,50. 16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA: Como já vimos anteriormente, a variância é uma medida de dispersão – avalia o grau de homogeneidade dos valores da variável em torno da média. A definição de variância de uma variável aleatória discreta x é dada por: s (2x ) [ x 2 ] (2x ) onde: k k [ x 2 ] xi2 p( xi ) e ( x ) xi p( xi ) i 1 i 1 desvio padrão é igual à raiz quadrada positiva da variância: s ( x ) s (2x ) Exemplo: Suponha que um gerente de loja tenha construído a seguinte distribuição para as vendas de fogões por semana: xi (vendas) p(xi) 0 1 2 3 4 0,20 0,30 0,30 0,15 0,05 88 Prof a Paula Francis Benevides Estatística O número esperado de venda semanal será: ( x ) [ x] = 0.(0,20) + 1.(0,30) + 2.(0,30) + 3.(0,15) + 4.(0,05) = 1,55 fogões Quanto à variância: E[x2] = 02.(0,20) + 12.(0,30) + 22.(0,30) + 32.(0,15) + 42.(0,05) = 3,65 s (2x ) [ x 2 ] (2x ) = 3,65 – (1,55) = 1,25 2 E o desvio padrão será de: s ( x ) s (2x ) = 1,25 1,1180 =1,12 fogões 16.7 DISTRIBUIÇÃO BINOMIAL: Como já foi visto na aula anterior, trata-se de um modelo que dá a probabilidade do número de sucessos quando são realizadas n provas do mesmo tipo – o experimento é repetido n vezes. Cada experimento admite dois resultados – sucesso ou fracasso – com probabilidade p de sucesso e 1 – p = q de fracasso, constantes em cada uma das provas. Relembrando a fórmula para o cálculo da probabilidade de distribuição binomial: n P p k q n k k 16.7.1 MEDIDAS CARACTERÍSTICAS: Média ou valor esperado: (k ) E[ k ] = np Variância: s2(k)=Var [ k ] = npq Desvio padrão: s ( k ) npq Moda: O valor mais provável (modal) de uma distribuição binomial é o número inteiro compreendido entre np + p e np – p. A moda toma um valor próximo da média np. No caso particular de p = q = ½ e n ímpar, os dois extremos np + p e np – p serão inteiros que diferem de 1; neste caso, a distribuição será bimodal. 89 Prof a Paula Francis Benevides Estatística Exemplo: Admite-se que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0,3 de funcionar mais de 600h. Se ensaiarmos 10 válvulas, qual será a probabilidade de que entre elas, exatamente 3 funcionem mais de 600 h? Determine também a média, a variância, o desvio padrão e a moda. Temos: k = variável aleatória: número de sucessos nos 10 ensaios. Assim, k = 4 p = 0,3 probabilidade de sucesso de cada válvula funcionar mais de 600h q = 1 – 0,3 = 0,7 probabilidade de fracasso de cada válvula funcionar menos de 600h n = 10 ensaios Então: 10 P (0,3) 3 .(0,7) 7 = 120 x 0,027 x 0,0823543 =0,2668 3 Média: μ(k) = 10.(0,3) = 3 Variância: s2 = 10.(0,3).(0,7) = 2,1 Desvio padrão: s = √2,1 = 1,45 Moda: np+p = 10.(0,3) + 3 + 3,3 np – p = 10.(0,3) – 0,3 = 2,7 Logo, Mo = 3 (inteiro entre 2,7 e 3,3) 90 Prof a Paula Francis Benevides Estatística Observações importantes: 1. Uma distribuição binomial fica caracterizada pelos parâmetros n e p. 2. Se n for pequeno, os cálculos serão relativamente fáceis. Contudo, se n for relativamente grande, os cálculos tornam-se cansativos. Felizmente, dispomos de calculadoras, tabelas apropriadas, e também poderemos aproximar a distribuição binomial pela de Poisson, como veremos no próximo item. 3. Para qualquer n, a distribuição binomial será simétrica, se p = q = 0,5; será assimétrica á direita se p > q, e assimétrica à esquerda, se p < q. 16.8 DISTRIBUIÇÃO DE POISSON: A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de um grande número de fenômenos observáveis. Eis alguns exemplos: Chamadas telefônicas por unidade de tempo. Defeitos por unidade de área. Acidentes por unidade de tempo. Chegada de clientes a um supermercado por unidade de tempo. Número de glóbulos sangüíneos visíveis ao microscópio por unidade de área. Número de partículas emitidas por uma fonte de material radioativo por unidade de tempo. Seja X uma variável aleatória igual ao número de ocorrências (sucessos) quando se realizam (ou se observam) resultados de fenômenos semelhantes aos dos exemplos anteriores, X poderá assumir os valores: 0, 1, 2, ... Ao aplicar o modelo de Poisson, o interesse poderá ser, por exemplo, calcular a probabilidade de receber cinco chamadas telefônicas, em três minutos, em dado aparelho: P(X = 5,3 minutos). De início, poderíamos pensar no uso do modelo binomial, porém, não sabemos qual o número de provas (n = ?), nem a quantidade de fracassos: quantos chamados não ocorreram? Se adotamos algumas hipóteses quanto à taxa de frequência ( λ ) dessas ocorrências por uma pequena unidade de tempo: ( Δt ), ou, conforme o caso: ( Δs ) = unidade de área..., e algumas outras premissas, enunciadas a seguir, obtemos o modelo de Poisson como limite da distribuição binomial, quando n tende ao infinito. 91 Prof a Paula Francis Benevides Estatística 16.8.1 HIPÓTESE DO MODELO DE POISSON: A expressão que dá a probabilidade de x sucessos em um intervalo t (tempo, área,...) é: P ( X x, t ) (t ) x .e t x! onde: λ = coeficiente de proporcionalidade, ou taxa de frequência por unidade de tempo, área, t = tempo, área, e = base dos logaritmos naturais (2,71828) x = número de ocorrências (sucessos) Considerando que a média da distribuição é dada por λt, ou seja, μ = λt, temos x .e P ( X x, t ) x! A variância da distribuição também é dada por λt, ou seja: s2 = λt. A moda corresponde ao maior inteiro contido em λt. Se λt for inteiro, então haverá duas modas os pontos: x = λt e x – 1 = λt – 1. Exemplo: Experiências passadas indicam que, em média, há duas chamadas por hora em certo telefone. Vamos calcular as probabilidades de, em uma hora, o telefone receber: nenhuma chamada, uma, duas, três,... Sabe-se que μ = λt, logo 2 = μ1, consequentemente, λ = 2, ou ainda μ = 2 Nenhuma chamada P(X = 0,1h) = Uma chamada P(X = 1,1h) = x .e x! = 2 0 .e 2 = 0,1353 0! 21.e 2 = 0,2706 1! 2 2 .e 2 Duas chamadas P(X = 2,1h) = = 0,1804 2! Três chamadas P(X = 3,1h) = 0,1804 92 Prof a Paula Francis Benevides Estatística Quatro chamadas P(X = 4,1h) = 0,0902 Cinco chamadas P(X = 5,1h) = 0,0361 Seis chamadas P(X = 6,1h) = 0,0120 Sete chamadas P(X = 7,1h) = 0,0034 Oito chamadas P(X = 8,1h) = 0,0009 Nove chamadas P(X = 9,1h) = 0,0002 A tabela de distribuição de probabilidade da variável X: número de chamadas telefônicas será: X 0 1 2 3 4 5 6 7 8 9 P(Xi) 0,1353 0,2706 0,2706 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002 Quanto às medidas de posição: Média: μ=2 Moda: como λt = 2, inteiro, temos duas modas, M1 = 2 e M2 = 1 Quanto às medidas de dispersão: Variância: s2 = λt = 2 Desvio Padrão: s =√2 = 1,4142 Coeficiente de variação: CV s 100 x CV = 1,4142 100 = 70,71% 2 93 Prof a Paula Francis Benevides Estatística 16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES DA DISTRIBUIÇÃO DE POISSON: Na aplicação do modelo de distribuição binomial, quando n for grande (n > 50) e np < 5, é possível obter as probabilidades binomiais por meio do modelo de Poisson. Exemplo: Em um cruzamento de duas avenidas de tráfego intenso, a probabilidade de um carro sofrer acidente é de 0,0001. Se entre as 17h e 19h passam 1000 veículos nesse cruzamento, qual é a probabilidade de que dois ou mais acidentes ocorram durante esse período? Solução pela distribuição binomial: Temos: p = 0,0001 n = 1000 q = 1 – 0,0001 = 0,9999 P(k ≥ 2) = 1 – [P(k = 0) + P(k = 1)] = 1000 1000 .(0,0001) 0 .(0,9999)1000 .(0,0001)1 .(0,9999) 999 = 1 - 1 0 É evidente, o cálculo desse resultado cria sérias dificuldades. Como n > 50 e np = 1000 =0,1 < 5, podemos obter o resultado desejado pelo modelo de Poisson. Assim, μ = np μ = 1000 x 0,0001 = 0,1 P(k ≥ 2) = 1 – [P(x=0) + P(x = 1)] (x = 0) = 0,10 .e 0,1 =0,905 0! P(x=1) = 0,11.e 0,1 = 0,090 1! P(k ≥ 2) = 1 – (0,905 + 0,090) = 0,00045 Ou seja, a probabilidade aproximada da ocorrência de dois ou mais acidentes é de 0,045% 94 Prof a Paula Francis Benevides Estatística AULA 9 – Exercícios 1) Faça X a variável aleatória soma dos pontos obtidos no lançamento de dois dados. Determine: a) Tabela da distribuição de probabilidade de x b) P(3 ≤ x ≤ 10) 8/9 c) P(x > 7) 5/12 d) P(x ≤ 5) 5/18 e) Probabilidade de soma máxima 6 5/36 f) Probabilidade de se obter pelo menos soma 3 35/36 g) F(4) 1/6 h) F(8) 13/18 i) F(15) 1 j) F(1) 0 k) F(5,5) 5/18 l) F(12) 1 2) Uma variável aleatória discreta pode assumir cinco valores, conforme a distribuição de probabilidade: 1 2 0,20 0,25 3 4 5 X p(x) a) b) c) d) … 0,30 0,10 Encontre o valor de p(3) 0,15 Qual é o valor da função acumulativa para x = 5? 0,90 Encontre a média da distribuição 3,45 Calcule a variância e o desvio padrão 4,55 e 2,13 3) Uma moeda é jogada 10 vezes. Calcule as seguintes probabilidades: a) de ocorrer seis caras; 105/512 b) de dar pelo menos duas caras; 1013/1024 c) de não dar nenhuma coroa; 1/1024 d) de dar pelo menos uma coroa; 1023/1024 e) de não dar 5 caras e 5 coroas; 193/256 4) O pessoal de inspeção de qualidade afirma que os rolos de fita isolante apresentam, em média, uma emenda a cada 50 metros. Admitindo-se que a distribuição do número de emendas é dada pela Poisson, calcular as probabilidades: a) de nenhuma emenda em um rolo de 125 metros. 0,0821 b) de ocorrerem no máximo duas emendas em um rolo de 125 metros 0,5440 c) de ocorrer pelo menos uma emenda em um rolo de 100 metros 0,8647 5) Uma loja atende em média dois clientes por hora. Calcule a probabilidade de em uma hora: a) atender exatamente dois clientes 0,27 b) atender três clientes 0,18 6) Suponha 400 erros de impressão distribuídos aleatoriamente em um livro de 500 páginas. Encontre a probabilidade de que cada página contenha: a) nenhum erro 0,449 b) exatamente dois erros 0,1437 95 Prof a Paula Francis Benevides Estatística AULA 11 17.DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS: 17.1 DISTRIBUIÇÃO NORMAL: Entre as distribuições teóricas de variáveis aleatórias contínuas, uma das mais empregadas é a distribuição normal. Muitas das variáveis analisadas na pesquisa socioeconômicas correspondem à distribuição normal ou delas se aproximam. A distribuição normal é também conhecida como distribuição de Gauss, distribuição de Laplace, ou ainda, distribuição de Laplace-Gauss. A distribuição de Gauss constitui a base teórica de toda inferência estatística, além de sua utilidade prática. O gráfico da distribuição normal assemelha-se muito a um sino, e seu formato dependerá dos valores dos parâmetros e s. Eis dois exemplos de gráficos da distribuição normal. Figura 17.1 – Gráfico de distribuições normais. Observando os gráficos, é possível identificar algumas características importantes das distribuições normais: A variável aleatória X pode assumir todo e qualquer valor real. A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média ( ), que recebe o nome de curva normal ou de Gauss. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas, sem, contudo, alcança-lo. Como a curva é simétrica em torno de X, a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5, assim: média = mediana = moda. 96 Prof a Paula Francis Benevides Estatística Quando temos em mão uma variável aleatória com distribuição normal nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos como proceder, por meio de um exemplo concreto. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão s= 0,04 cm. Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com valor entre ―a‖ e ―b‖ cm. É fácil notar que essa probabilidade, indicada por P(a < x < b), corresponde à área hachurada na figura abaixo. Figura 17.2 – Ilustração: probabilidade de os valores de uma distribuição Normal pertencerem a um intervalo específico O valor numérico dessa área hachurada e o resultado da integral de f(x) entre a e b, isto é: 1 x 2 1 P ( a x b) e 2 a s 2 b 2 dx Essa integração não pode ser calculada analiticamente e deve ser computada por métodos numéricos (desenvolvimento de série). Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de média e desvio padrão s, então a variável : z x s tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1. As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não havendo necessidade de serem calculadas A tabela de distribuição normal padrão, nos dá a probabilidade de Z tomar qualquer valor entre a média O e um dado valor z, isto é; P(0 < Z < z). Temos, então, que se X é uma variável aleatória com distribuição normal de média e desvio padrão s, podemos escrever: P( < X < x) = P() < Z <z), com z x s 97 Prof a Paula Francis Benevides Estatística Voltemos então ao nosso problema: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão s= 0,04 cm. Queremos calcular a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 cm. P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde à x = 2,05. Temos então: z x 2,05 2 0,05 = 1,25 s 0,04 0,04 donde: P (2 < X < 2,05) = P(0 < Z < 1,25). Procuremos agora na tabela o valor de z = 1,25. Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos na primeira linha o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z < 1,25) = 0,3944 Assim a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a média = 2 e o valor x = 2, 05 é 0,3944. Escrevemos então: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44% A função densidade de probabilidade de uma variável X com distribuição normal é dada por: 1 x 2 s 1 f ( x) e 2 s 2 1 z 1 e 2 ou f ( x) s 2 2 sendo que; e = 2,71828... = 3,14159... = média da população s = desvio padrão da população x = qualquer valor real da variável aleatória contínua 98 Prof a Paula Francis Benevides Estatística DEPARTAMENTO DE MATEMÁTICA DISCIPLINA: ESTATÍSTICA – PROF.a PAULA TABELA - Distribuição Normal Padrão Z~N(0,1) P(0 Z zc) zc 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 *0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 *0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,10 ou + 0,4999 NOTA: Para valores de Z acima de 3,09, use 0,4999 como área. 99 Prof a Paula Francis Benevides Estatística 17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA: Há vários tipos de tabelas que oferecem as áreas sob a curva normal padrão. O tipo mais comum é a tabela de faixa central cuja cópia esta na página anterior. A tabela de faixa central dá a área sob a curva normal padrão entre z = 0 e outros valores positivos da variável Z. A simetria da distribuição Z em relação a sua média (z = 0) permite obter áreas entre z = 0 e outros valores negativos da variável, já que a área entre z = 0 e z o será igual à área entre – zo e z = 0. Veja o gráfico a seguir. A área hachurada é obtida na tabela. Figura 17.3 – Área(probabilidade) obtida em uma tabela de faixa central Assim, P(0 < z < 1,17) será obtida por meio da consulta à tabela. Lembre-se: 1,17 = 1,1 + 0,07 Z 0,00 0,01 ... ... 0,07 ... 0,09 0,0 0,1 M 1,1 0,3790 M Graficamente: Figura 17.4 – Probabilidade de (0 < z < 1,17) 100 Prof a Paula Francis Benevides Estatística Exemplos: 1) Desejam-se as probabilidades: a) P ( z > 1,17) = ? Construindo o gráfico: Como P(z > 0 ) = 0,5 P(z > 1,17) = 0,5 – 0,3790 = 0,1210 ou 12,10% b) P (z < 1,17) = ? Construindo o gráfico; Como P( z < 0 ) = 0,5 P (z < 1,17) = 0,5 + 0,3790 = 0,8790 ou 87,90% c) P(- 1,17 < z < 0) = ? Construindo o gráfico: Lembrando que: P(0 < z < zo) = P( - zo < z < 0), devido à simetria, então: 101 Prof a Paula Francis Benevides Estatística P( - 1,17 < z < 0) = P(0 < z < 1,17) = 0,3790 ou 37,90% d) P (2,05 < z < 2,93) = ? Construindo o gráfico: P(0 < z < 2,93) = 0,4983 P(0 < z < 2,05) = 0,4798 Portanto, P(2,05 < z < 2,93) = 0,4983 – 0,4798 = 0,0185 ou 1,85% e) P(- 0,85 < z < 1,75) = ? Construindo o gráfico : P(- 0,85 < z < 0) = 0,3023 P(0 < z < 1,75) = 0,4599 Portanto, P(- 0,85 < z < 1,75) = 0,3023 + 0,4599 = 0,7622 ou 76,22% 2) Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de R$500, com desvio padrão de R$40. Calcule a probabilidade de um operário ter um salário semanal situado entre R$490 e R$520. Devemos, inicialmente, determinar os valores de distribuição normal reduzida, assim: z1 490 500 0,25 40 e z2 520 500 40 0,5 Logo, a probabilidade procurada é dada por: P(490 < x < 520) = P(-0,25 < z< 0,5) = P(-0,25<z<0) + P(0<z<0,5) = 0,0987 + 0,1915 = 0,2902 É de se esperar que, em média, 29,02% dos operários tenham salários entre R$490 e R$520. 102 Prof a Paula Francis Benevides Estatística AULA 10 – Exercícios 1) Sendo Z uma variável com distribuição normal reduzida, calcule: a) P(0 < z < 1,44) b) P(-0,85 < z < 0) c) P(-1,48 < z < 2,05) d) P(0,72 < z < 1,89) e) P(z > -2,03) f) P(z > 1,08) g) P(z < - 0,66) h) P(z < 0,60) 2) Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a) maior de 120 b) maior que 80 c) entre 85 e 115 d) maior que 100 3) Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão 5,5 kg. Determine o número de estudantes que pesam: a) entre 60 e 70 kg b) mais que 63,2 kg c) menos que 68 kg 4) a duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar: a) entre 700 e 1000 dias b) mais de 800 dias c) menos de 750 dias 103 Prof a Paula Francis Benevides Estatística AULA 12 17.3 DISTRIBUIÇÃO T DE STUDENT: 2, Sejam Z e V variáveis aleatórias independentes com distribuições: N(0,1) e X respectivamente. Define-se distribuição t de Student com graus de liberdade, como: t Z V Onde: Média da distribuição: E t t 0 Variância da distribuição: Var t s 2 (t ) 2' 2 gráfico da distribuição t é simétrico em relação a sua média. Assemelha-se à distribuição Normal Padronizada: N(0,1). A distribuição t é mais dispersa do que a N(0,1). À medida que aumenta, a dispersão diminui, sendo que para valores de > 30 temos praticamente iguais as distribuições Normal Padronizada e de Student. Eis uma ilustração para = 4 Lembre-se: a área sob cada uma dessas curvas vale 1, ou 100% 104 Prof a Paula Francis Benevides Estatística 17.3.1 USO DA TABELA DA DISTRIBUIÇÃO T DE STUDENT: A distribuição t esta tabelada. Encontram-se abscissas da distribuição, dado um parâmetro (grau de liberdade) e uma área na cauda direita da curva. Assim: 0,25 ........ . . . ..... Valor da abscissa que deixa a probabilidade na cauda à direita . 105 Prof a Paula Francis Benevides Estatística DEPARTAMENTO DE MATEMÁTICA DISCIPLINA: ESTATÍSTICA – PROF.a PAULA = graus de liberdade 25% 10% TABELA - Distribuição t de Student (Unicaudal e Bicaudal) 5% 2,5% 1% 0,5% 25% 10% 5% 2,5% 1% 0,5% 1 2 3 4 5 1,0000 0,8165 0,7649 0,7407 0,7267 3,0777 1,8856 1,6377 1,5332 1,4759 6,3138 2,9200 2,3534 2,1318 2,0150 12,7062 4,3027 3,1824 2,7764 2,5706 31,8207 6,9646 4,5407 3,7469 3,3649 63,6574 9,9248 5,8409 4,6041 4,0322 46 47 48 49 50 0,6799 0,6797 0,6796 0,6795 0,6794 1,3002 1,2998 1,2994 1,2991 1,2987 1,6787 1,6779 1,6772 1,6766 1,6759 2,0129 2,0117 2,0106 2,0096 2,0086 2,4102 2,4083 2,4066 2,4049 2,4033 2,6870 2,6846 2,6822 2,6800 2,6778 6 7 8 9 10 0,7176 0,7111 0,7064 0,7027 0,6998 1,4398 1,4149 1,3968 1,3830 1,3722 1,9432 1,8946 1,8595 1,8331 1,8125 2,4469 2,3646 2,3060 2,2622 2,2281 3,1427 2,9980 2,8965 2,8214 2,7638 3,7074 3,4995 3,3554 3,2498 3,1693 51 52 53 54 55 0,6793 0,6792 0,6791 0,6791 0,6790 1,2984 1,2980 1,2977 1,2974 1,2971 1,6753 1,6747 1,6741 1,6736 1,6730 2,0076 2,0066 2,0057 2,0049 2,0040 2,4017 2,4002 2,3988 2,3974 2,3961 2,6757 2,6737 2,6718 2,6700 2,6682 11 12 13 14 15 0,6974 0,6955 0,6938 0,6924 0,6912 1,3634 1,3562 1,3502 1,3450 1,3406 1,7959 1,7823 1,7709 1,7613 1,7531 2,2010 2,1788 2,1604 2,1448 2,1315 2,7181 2,6810 2,6503 2,6245 2,6025 3,1058 3,0545 3,0123 2,9768 2,9467 56 57 58 59 60 0,6789 0,6788 0,6787 0,6787 0,6786 1,2969 1,2966 1,2963 1,2961 1,2958 1,6725 1,6720 1,6716 1,6711 1,6706 2,0032 2,0025 2,0017 2,0010 2,0003 2,3948 2,3936 2,3924 2,3912 2,3901 2,6665 2,6649 2,6633 2,6618 2,6603 16 17 18 19 20 0,6901 0,6892 0,6884 0,6876 0,6870 1,3368 1,3334 1,3304 1,3277 1,3253 1,7459 1,7396 1,7341 1,7291 1,7247 2,1199 2,1098 2,1009 2,0930 2,0860 2,5835 2,5669 2,5524 2,5395 2,5280 2,9208 2,8982 2,8784 2,8609 2,8453 61 62 63 64 65 0,6785 0,6785 0,6784 0,6783 0,6783 1,2956 1,2954 1,2951 1,2949 1,2947 1,6702 1,6698 1,6694 1,6690 1,6686 1,9996 1,9990 1,9983 1,9977 1,9971 2,3890 2,3880 2,3870 2,3860 2,3851 2,6589 2,6575 2,6561 2,6549 2,6536 21 22 23 24 25 0,6864 0,6858 0,6853 0,6848 0,6844 1,3232 1,3212 1,3195 1,3178 1,3163 1,7207 1,7171 1,7139 1,7109 1,7081 2,0796 2,0739 2,0687 2,0639 2,0595 2,5177 2,5083 2,4999 2,4922 2,4851 2,8314 2,8188 2,8073 2,7969 2,7874 66 67 68 69 70 0,6782 0,6782 0,6781 0,6781 0,6780 1,2945 1,2943 1,2941 1,2939 1,2938 1,6683 1,6679 1,6676 1,6672 1,6669 1,9966 1,9960 1,9955 1,9949 1,9944 2,3842 2,3833 2,3824 2,3816 2,3808 2,6524 2,6512 2,6501 2,6490 2,6479 26 27 28 29 30 0,6840 0,6837 0,6834 0,6830 0,6828 1,3150 1,3137 1,3125 1,3114 1,3104 1,7056 1,7033 1,7011 1,6991 1,6973 2,0555 2,0518 2,0484 2,0452 2,0423 2,4786 2,4727 2,4671 2,4620 2,4573 2,7787 2,7707 2,7633 2,7564 2,7500 71 72 73 74 75 0,6780 0,6779 0,6779 0,6778 0,6778 1,2936 1,2934 1,2933 1,2931 1,2929 1,6666 1,6663 1,6660 1,6657 1,6654 1,9939 1,9935 1,9930 1,9925 1,9921 2,3800 2,3793 2,3785 2,3778 2,3771 2,6469 2,6459 2,6449 2,6439 2,6430 31 32 33 34 35 0,6825 0,6822 0,6820 0,6818 0,6816 1,3095 1,3086 1,3077 1,3070 1,3062 1,6955 1,6939 1,6924 1,6909 1,6896 2,0395 2,0369 2,0345 2,0322 2,0301 2,4528 2,4487 2,4448 2,4411 2,4377 2,7440 2,7385 2,7333 2,7284 2,7238 76 77 78 79 80 0,6777 0,6777 0,6776 0,6776 0,6776 1,2928 1,2926 1,2925 1,2924 1,2922 1,6652 1,6649 1,6646 1,6644 1,6641 1,9917 1,9913 1,9908 1,9905 1,9901 2,3764 2,3758 2,3751 2,3745 2,3739 2,6421 2,6412 2,6403 2,6395 2,6387 36 37 38 39 40 0,6814 0,6812 0,6810 0,6808 0,6807 1,3055 1,3049 1,3042 1,3036 1,3031 1,6883 1,6871 1,6860 1,6849 1,6839 2,0281 2,0262 2,0244 2,0227 2,0211 2,4345 2,4314 2,4286 2,4258 2,4233 2,7195 2,7154 2,7116 2,7079 2,7045 81 82 83 84 85 0,6775 0,6775 0,6775 0,6774 0,6774 1,2921 1,2920 1,2918 1,2917 1,2916 1,6639 1,6636 1,6634 1,6632 1,6630 1,9897 1,9893 1,9890 1,9886 1,9883 2,3733 2,3727 2,3721 2,3716 2,3710 2,6379 2,6371 2,6364 2,6356 2,6349 41 42 43 44 45 0,6805 0,6804 0,6802 0,6801 0,6800 1,3025 1,3020 1,3016 1,3011 1,3006 1,6829 1,6820 1,6811 1,6802 1,6794 2,0195 2,0181 2,0167 2,0154 2,0141 2,4208 2,4185 2,4163 2,4141 2,4121 2,7012 2,6981 2,6951 2,6923 2,6896 86 87 88 89 90 0,6774 0,6773 0,6773 0,6773 0,6772 1,2915 1,2914 1,2912 1,2911 1,2910 1,6628 1,6626 1,6624 1,6622 1,6620 1,9879 1,9876 1,9873 1,9870 1,9867 2,3705 2,3700 2,3695 2,3690 2,3685 2,6342 2,6335 2,6329 2,6322 2,6316 100 0,677 1,290 1,660 1,984 2,364 2,626 120 0,677 1,289 1,658 1,980 2,358 2,617 0,674 1,282 1,645 1,960 2,326 2,576 106 Prof a Paula Francis Benevides Estatística Exemplos: 1) Admita parâmetro 9, ou seja = 9 e = 5% Entrando na 1o coluna com = 9 e na primeira linha com = 0,05 (5%), encontramos, na interseção dessa linha e coluna, o número 1,8331. Graficamente: Obs.: Como a distribuição t é simétrica em relação a origem t = 0, a abscissa – 1,8331 deixará 0,05 = 5% de área (probabilidade) à esquerda. 2) Sendo = 25 e = 10%, temos: 3) Considere uma distribuição t com parâmetro 18. Encontre a média, a variância, o desvio padrão, a mediana, o 1o quartil e o 95o percentil. Média : E t t 0 Variância : s 2 (t18 ) 18 1,13 18 2 Desvio Padrão : s(t18) = 1,13 =1,06 107 Prof a Paula Francis Benevides Estatística Mediana: Logo, Md (t18) = 0 1o Quartil: Como a distribuição é simétrica, temos Q3 = 0,6884 95o Percentil: 108 Prof a Paula Francis Benevides Estatística 17.4 DISTRIBUIÇÃO F: Desenvolvida por R.A. Fischer, a distribuição F possui importante aplicação na Análise da Variância. Sejam: X 2 e X 2 duas variáveis aleatórias independentes com distribuições Qui2 1 Quadrado. Define-se como distribuição F com parâmetros 1 e 2 ( 1 = grau de liberdade do numerador e 2 = grau de liberdade do denominador), como: F (1 , 2 ) X 21 2 X2 2 1 11 2 2 Observe que: F( 1, 2) > 0 Média da distribuição: 2 2 2 , 2 >2 2 22 (1 2 2) Variância da distribuição: s , 2 > 4 1 ( 2 4)( 2 2) 2 2 2 2 , 1 2 A distribuição tem uma única moda, no valor: Mo 1 1 2 2 Para cada par ( 1, 2), temos diferentes gráficos: 109 Prof a Paula Francis Benevides Estatística 17.4.1 USO DA TABELA DA DISTRIBUIÇÃO F: Na tabela encontram-se abscissas da distribuição F dados os parâmetros 1 e 2 e, admitindo-se áreas ( ) de 5% na cauda à direita. Assim: Para consultar a tabela: 1 2 1 ........ . . Valor da abscissa que deixa a probabilidade direita na cauda à . Para encontrarmos o valor da abscissa F95% ( 1, 2), utilizamos a seguinte fórmula: F95% (1 , 2 ) 1 F5% ( 2 ,1 ) Graficamente, temos: A fórmula também é válida para F97,5%( 1, 2) e F2,5%( 1, 2) 110 Prof a Paula Francis Benevides Estatística DEPARTAMENTO DE MATEMÁTICA DISCIPLINA: ESTATÍSTICA – PROF.a PAULA = 5% TABELA - Distribuição F de Fisher Graus de liberdade para o numerador 1 Graus de liberdade para o denominador 2 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 24 30 40 60 120 1 2 3 4 5 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,4 245,9 246,5 247,3 248,0 249,1 250,1 251,1 252,2 253,3 254,3 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,42 19,43 19,43 19,44 19,45 19,45 19,46 19,47 19,48 19,49 19,50 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,72 8,70 8,69 8,67 8,66 8,64 8,62 8,59 8,57 8,55 8,53 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5,86 5,84 5,82 5,80 5,77 5,75 5,72 5,69 5,66 5,63 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 4,62 4,60 4,58 4,56 4,53 4,50 4,46 4,43 4,40 4,36 6 7 8 9 10 5,99 5,59 5,32 5,12 4,96 5,14 4,74 4,46 4,26 4,10 4,76 4,35 4,07 3,86 3,71 4,53 4,12 3,84 3,63 3,48 4,39 3,97 3,69 3,48 3,33 4,28 3,87 3,58 3,37 3,22 4,21 3,79 3,50 3,29 3,14 4,15 3,73 3,44 3,23 3,07 4,10 3,68 3,39 3,18 3,02 4,06 3,64 3,35 3,14 2,98 4,00 3,57 3,28 3,07 2,91 3,96 3,53 3,24 3,03 2,87 3,94 3,51 3,22 3,01 2,85 3,92 3,49 3,20 2,99 2,83 3,90 3,47 3,17 2,96 2,80 3,87 3,44 3,15 2,94 2,77 3,84 3,41 3,12 2,90 2,74 3,81 3,38 3,08 2,86 2,70 3,77 3,34 3,04 2,83 2,66 3,74 3,30 3,01 2,79 2,62 3,70 3,27 2,97 2,75 2,58 3,67 3,23 2,93 2,71 2,54 11 12 13 14 15 4,84 4,75 4,67 4,60 4,54 3,98 3,89 3,81 3,74 3,68 3,59 3,49 3,41 3,34 3,29 3,36 3,26 3,18 3,11 3,06 3,20 3,11 3,03 2,96 2,90 3,09 3,00 2,92 2,85 2,79 3,01 2,91 2,83 2,76 2,71 2,95 2,85 2,77 2,70 2,64 2,90 2,80 2,71 2,65 2,59 2,85 2,75 2,67 2,60 2,54 2,79 2,69 2,60 2,53 2,48 2,74 2,64 2,55 2,48 2,42 2,72 2,62 2,53 2,46 2,40 2,70 2,60 2,52 2,44 2,39 2,67 2,57 2,48 2,41 2,35 2,65 2,54 2,46 2,39 2,33 2,61 2,51 2,42 2,35 2,29 2,57 2,47 2,38 2,31 2,25 2,53 2,43 2,34 2,27 2,20 2,49 2,38 2,30 2,22 2,16 2,45 2,34 2,25 2,18 2,11 2,40 2,30 2,21 2,13 2,07 16 17 18 19 20 4,49 4,45 4,41 4,38 4,35 3,63 3,59 3,55 3,52 3,49 3,24 3,20 3,16 3,13 3,10 3,01 2,96 2,93 2,90 2,87 2,85 2,81 2,77 2,74 2,71 2,74 2,70 2,66 2,63 2,60 2,66 2,61 2,58 2,54 2,51 2,59 2,55 2,51 2,48 2,45 2,54 2,49 2,46 2,42 2,39 2,49 2,45 2,41 2,38 2,35 2,42 2,38 2,34 2,31 2,28 2,37 2,34 2,29 2,26 2,22 2,35 2,31 2,27 2,23 2,20 2,33 2,29 2,25 2,22 2,18 2,30 2,26 2,22 2,18 2,15 2,28 2,23 2,19 2,16 2,12 2,24 2,19 2,15 2,11 2,08 2,19 2,15 2,11 2,07 2,04 2,15 2,10 2,06 2,03 1,99 2,11 2,06 2,02 1,98 1,95 2,06 2,01 1,97 1,93 1,90 2,01 1,96 1,92 1,88 1,84 21 22 23 24 25 4,32 4,30 4,28 4,26 4,24 3,47 3,44 3,42 3,40 3,39 3,07 3,05 3,03 3,01 2,99 2,84 2,82 2,80 2,78 2,76 2,68 2,66 2,64 2,62 2,60 2,57 2,55 2,53 2,51 2,49 2,49 2,46 2,44 2,42 2,40 2,42 2,40 2,37 2,36 2,34 2,37 2,34 2,32 2,30 2,28 2,32 2,30 2,27 2,25 2,24 2,25 2,23 2,20 2,18 2,16 2,20 2,17 2,15 2,13 2,11 2,18 2,15 2,13 2,11 2,09 2,16 2,13 2,11 2,09 2,07 2,12 2,10 2,08 2,05 2,04 2,10 2,07 2,05 2,03 2,01 2,05 2,03 2,01 1,98 1,96 2,01 1,98 1,96 1,94 1,92 1,96 1,94 1,91 1,89 1,87 1,92 1,89 1,86 1,84 1,82 1,87 1,84 1,81 1,79 1,77 1,81 1,78 1,76 1,73 1,71 26 27 28 29 30 4,23 4,21 4,20 4,18 4,17 3,37 3,35 3,34 3,33 3,32 2,98 2,96 2,95 2,93 2,92 2,74 2,73 2,71 2,70 2,69 2,59 2,57 2,56 2,55 2,53 2,47 2,46 2,45 2,43 2,42 2,39 2,37 2,36 2,35 2,33 2,32 2,31 2,29 2,28 2,27 2,27 2,25 2,24 2,22 2,21 2,22 2,20 2,19 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,09 2,08 2,06 2,05 2,04 2,07 2,06 2,04 2,03 2,01 2,05 2,04 2,02 2,01 1,99 2,02 2,00 1,99 1,97 1,96 1,99 1,97 1,96 1,94 1,93 1,95 1,93 1,91 1,90 1,89 1,90 1,88 1,87 1,85 1,84 1,85 1,84 1,82 1,81 1,79 1,80 1,79 1,77 1,75 1,74 1,75 1,73 1,71 1,70 1,68 1,69 1,67 1,65 1,64 1,62 40 60 120 4,08 4,00 3,92 3,23 3,15 3,07 2,84 2,76 2,68 2,61 2,53 2,45 2,45 2,37 2,29 2,34 2,25 2,17 2,25 2,17 2,09 2,18 2,10 2,02 2,12 2,04 1,96 2,08 1,99 1,91 2,00 1,92 1,83 1,95 1,86 1,77 1,92 1,84 1,75 1,90 1,81 1,72 1,87 1,78 1,69 1,84 1,75 1,66 1,79 1,70 1,61 1,74 1,65 1,55 1,69 1,59 1,50 1,64 1,53 1,43 1,58 1,47 1,35 1,51 1,39 1,25 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69 1,67 1,63 1,60 1,57 1,52 1,46 1,39 1,32 1,22 1,00 111 Prof a Paula Francis Benevides Estatística EXEMPLO: Sendo 1 = 20 e 2 = 18, determinar o 95% e o 5% percentis. Graficamente: Para determinar o P95 (95o percentil), entramos na 1o linha da tabela com 20 ( 1 = 20) e na 1o coluna com 18 ( 2 = 18), encontrando 2,19. Logo: P95 = 2,19 112 Estatística Prof a Paula Francis Benevides REFERÊNCIAS AKANIME, C.T.; YAMAMOTO, R.K. Estatística Descritiva. Editora Érica, 2000 CRESPO, A.A. Estatística Fácil. 17 ed. Saraiva, 2002. GIOVANNI, J.R.; BONJORNO, J.R.; JR GIOVANNI, J.R. Matemática Fundamental. Uma nova abordagem. Volume Único. Editora FTD, 2002. JAMES, B. R. Probabilidade: um curso em nível intermediário. 3 ed. IMPA, 2006. MUCELIN, C.A. Estatística. Editora do Livro Técnico. 2004 113