APOSTILA de Probabilidade e Estatística Adriane Guarienti [email protected] [email protected] 2012 Professora Adriane Guarienti UNIFRA Disciplina: Probabilidade e Estatistica 1 MÉTODOS ESTATÍSTICOS 1 – CONCEITO 1.1 - Estatística A Estatística é um conjunto de métodos destinados à coleta, organização, resumo, apresentação e análise de dados de observação, bem como da tomada de decisões razoáveis baseadas em tais análises. A Estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos ou de massa. 1.2 – Divisão da Estatística A Estatística divide-se em duas partes Geral e Aplicada. Geral ou metodológica Aplicada – Descritiva – Indutiva ou inferencial – Biometria – Econometria – Mecânica estatística – Demografia – Psicometria – Sociometria 1.2.1 Estatística geral ou metodológica Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. tendo por finalidade o estudo das propriedades matemáticas desses fenômenos e a dedução e demonstração rigorosa dos procedimentos e fórmulas usadas freqüentemente. Estatística Descritiva Suponha que se tenha informações de um conjunto de notas de estudantes matriculados em uma disciplina de Estatística. Na terminologia estatística, o conjunto de notas desses estudantes é chamado de conjunto de dados, e a nota individual de cada estudante é chamada de observação. Dessa maneira reduz-se o conjunto de dados, tornando-o mais maleável, constituindo tabelas, gráficos ou sumarizando os seus valores através de medidas descritivas, como a média. A parte da estatística que nos ajuda neste tipo de análise é chamada de estatística descritiva. Estatística Inferencial O conjunto de todos os elementos de interesse é chamado de população. A retirada de uma parte dessa população é chamada de amostra. UNIFRA Disciplina: Probabilidade e Estatistica 2 A maior parte dos objetivos estatísticos, como decisões, inferências e previsões sobre populações são baseadas em resultados obtidos de amostras. A área da estatística que tem por objetivo tomar decisões, com base em amostras, é chamada de estatística inferencial ou estatística indutiva. 1.2.2 Estatística aplicada A diversidade de atuação é um dos grandes atrativos da Estatística, que pode promover a melhoria da eficiência e também, a solução de vários problemas práticos importantes em quase todas as áreas do saber: das Ciências Naturais às Sociais. O que modernamente se conhece como Estatística, é um conjunto de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento e análise das informações e a disseminação dessas informações. O desenvolvimento e o aperfeiçoamento de técnicas estatísticas, de obtenção e de análise de informações, permitem o controle e o estudo adequado de fenômenos, fatos, eventos e ocorrências, em diversas áreas do conhecimento. A Estatística tem por objetivo fornecer métodos e técnicas para lidarmos, racionalmente, com situações sujeitas a incertezas. 2 – DEFINIÇÕES 2.1 - População x Amostra População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo ser finita ou infinita. Finita - apresenta um número limitado de observações, que é passível de contagem. Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente esta associada a processos. Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. 2.2 - Censo x Amostragem Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem. Censo: É a coleta exaustiva de informações das "N" unidades populacionais. Amostragem: É o processo de retirada de informações dos "n" elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). 2.3 - Parâmetros x Estatísticas Parâmetros: são medidas populacionais quando se investiga a população em sua totalidade, neste caso é impossível fazer inferências, pois toda a população foi investigada. UNIFRA Disciplina: Probabilidade e Estatistica 3 Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível neste caso utilizarmos as teorias inferências para que possamos fazer conclusões sobre a população. 2.4 - Dado x Variável Dados estatísticos: é qualquer característica que possa ser observada ou medida de alguma maneira. As matérias-primas da estatística são os dados observáveis. Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. As variáveis podem ser classificadas dos seguintes modos: - Qualitativas (ou atributos): São características de uma população que não pode ser medidas. - Quantitativas: São características populacionais que podem ser quantificadas, sendo classificadas em discretas e contínuas. Discretas: são aquelas variáveis que pode assumir somente valores inteiros num conjunto de valores. É gerada pelo processo de contagem, como o número de veículos que passa em um posto de gasolina, o número de estudantes nesta sala de aula. Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o volume de água em um reservatório ou o peso de um pacote de cereal. 2.5 - Arredondamento de Dados 1ª) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes. Ex.: 7,34856 (para décimos) 7,3 2ª) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes. Ex.: 1,2734 (para décimos) 1,3 3ª) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, desprezando os seguintes. Ex.: 6,2500 (para décimos) 6,2 12,350 (para décimos) 12,4 Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos uma unidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para décimos) 8,3 8,4503 (para décimos) 8,5 UNIFRA Disciplina: Probabilidade e Estatistica 4 2.6 – Fases do método estatístico O método estatístico abrange as seguintes fases: a) Definição do Problema Consiste na: - formulação correta do problema; - examinar outros levantamentos realizados no mesmo campo (revisão da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) b) Planejamento Determinar o procedimento necessário para resolver o problema: - Como levantar informações; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma , Custos, etc. c) Coleta ou levantamento dos dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). d) Apuração dos Dados ou sumarização Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de coordenação e de tabulação. Apuração: manual, mecânica, eletrônica e eletromecânica. e) Apresentação dos dados É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. Esta apresentação pode ser: Tabular ou Gráfica f) Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o pesquisador a resolver seu problema. UNIFRA Disciplina: Probabilidade e Estatistica 5 3 – APRESENTAÇÃO DE DADOS Quando se realiza um estudo e se quer apresentar os resultados, pode-se optar por três maneiras: tabelas, quadros e/ou gráficos. Cada um destes tipos de apresentação possui suas características próprias, as quais serão mostrados no decorrer do capítulo. 3.1 Apresentação tabular Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução n. 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As normas de apresentação são editadas pelo Instituto Brasileira de Geografia e Estatística (IBGE). 3.1.1 Representação Exemplo: Estrutura Empresarial, cidade de Santa Maria, ano de 2006 Ramo de Atividade nº de unidades Agricultura, pecuária, silvicultura e exploração florestal Indústrias de transformação Indústrias extrativas Construção Produção e distribuição de eletricidade, gás e água Comércio, reparação de veículos, objetos pessoais e domésticos Alojamento e alimentação Transporte, armazenagem e comunicações Intermediação financeira, seguros, previdência complementar Atividades imobiliárias e serviços prestados às empresas Administração pública, defesa e seguridade social Educação Saúde e serviços sociais Outros serviços coletivos, sociais e pessoais 52 934 13 380 15 7485 813 521 163 1573 71 215 282 1007 Fonte: IBGE,Cadastro Central de Empresas 2006 3.1.2 Elementos de uma tabela Título Estrutura Empresarial, cidade de Santa Maria, ano de 2006 O título é a parte superior da tabela e deve conter um conteúdo suficiente para responder três perguntas: - O que? Assunto a ser representado: Estrutura Empresarial - Onde? O lugar onde ocorreu o fenômeno: Santa Maria - Quando? A época que ocorreu o fenômeno: 2006 Cabeçalho É a parte da tabela na qual se indica a natureza do conteúdo de cada coluna. Ramo de Atividade nº de unidades Corpo É a parte da tabela composta por linhas e colunas. Casa ou célula É a parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodapé UNIFRA Disciplina: Probabilidade e Estatistica 6 É o espaço aproveitado abaixo na tabela, onde são colocados detalhes do conteúdo da tabela de natureza informativo (fonte, notas de observações). Fonte: IBGE,Cadastro Central de Empresas 2006 3.2 Distribuição de Freqüência Os dados são colocados em classes pré calculadas, registrando a freqüência de ocorrência. Uma distribuição de freqüência pode ser classificada em discreta (pontual) e intervalar. 3.2.1 Distribuição de Freqüência Discreta ou Pontual É uma série de dados agrupados na qual o número de observações está relacionado com um número real. Idade de 15 alunos da ADM, 1º semetre da UNIFRA, 2010/1 Idade (xi) Nº alunos (fi) 17 2 18 3 19 5 20 2 21 3 15 Fonte: Dados Hipotéticos 3.2.2 Distribuição de Freqüências Intervalar Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à classe a que permanece determinado elemento. O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, representado pelo símbolo: |---. Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1 150 158 166 174 182 Altura (cm) Ponto médio (xi) |--158 154 |--166 162 |--174 170 |--182 178 |--190 186 --- Fonte: Dados Hipotéticos nº alunos (fi) 4 12 20 13 5 54 Etapas para a construção de uma distribuição de freqüências: 1ª) Coleta dos dados Consiste em obter os dados brutos, que são os dados coletados na ordem na qual aparecem e que ainda não estão prontos para que se realize uma análise mais detalhada. 2ª) Formação do rol É a organização dos dados brutos, em uma determinada ordem, que poderá ser crescente ou decrescente. UNIFRA Disciplina: Probabilidade e Estatistica 7 3ª) Determinar o número de classes (k) É aconselhável usar de 4 a 20 classes. Para se determinar o número de classes (k), a partir do rol, usa-se a Fórmula de Sturges ou o Método da Raiz. Fórmula de Sturges n > 40 k 1 3,3 log n Método da Raiz n ≤ 40 k n onde n é o no de observações coletadas. 4ª) Amplitude do intervalo de classe h H k H = (X máximo – X mínimo) / k onde: H = Maior valor coletado – menor valor coletado (amplitude total) Obs.: A amplitude do intervalo de classe poderá sofrer um arredondamento adequado em função do tipo de dado coletado. Esse valor geralmente será arredondado para cima, de preferência na casa decimal dos dados. O intervalo de classe deverá ser preferencialmente constante em toda a distribuição de freqüência. 5ª) Intervalo de classe Consiste em definir a simbologia de representação do intervalo de classe, bem como os limites de classe, em função do número de classes estabelecidas. (|--- , ---|, |---| e ---) 6ª) Ponto médio de classe (Xi) É a média aritmética simples do limite inferior com o limite superior de uma mesma classe. Xi li Li 2 7ª) Freqüência absoluta (fi) É a número de indivíduos por classe. Deve-se cuidar a contagem dos indivíduos nas classes, em função do tipo de intervalo utilizado. 8ª) Freqüência absoluta acumulada (Fi) É o somatório da freqüência absoluta da i-ésima classe com a freqüência absoluta das classes anteriores, ou a freqüência acumulada da classe anterior. 9ª) Freqüência Relativa (fr): É o quociente entre a freqüência absoluta da i-ésima classe pelo somatório das freqüências. UNIFRA Disciplina: Probabilidade e Estatistica 8 10ª) Freqüência Relativa Acumulada (Fr): É o somatório da freqüência relativa da i-ésima classe com as freqüências relativas das classes anteriores. Lista de exercicios: Faça uma tabela com intervalos de classe com a tabela primitiva abaixo: 166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153 160 173 155 157 165 160 169 156 167 155 151 158 164 164 170 158 160 168 164 161 1) Dado o rol do número de erros de impressão da primeira página de um jornal durante 50 dias, obteve-se os seguintes resultados: 5 5 5 6 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 9 10 10 10 10 10 11 11 11 11 12 12 12 12 12 12 12 12 12 13 14 14 14 14 14 14 14 15 16 19 22 Complete a tabela de distribuição de freqüência: Segundo nos mostra a tabela acima responda: i) ii) iii) iv) v) Qual o valor de k (número de classe)? Qual o intervalo de cada classe (h)? Qual o valor das freqüências acima pedidas? Qual é a mediana? Faça o hitosgrama da tabela encontrada. 2) Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve os seguintes dados e monte a tabela de distribuição de freqüência com intervalos 10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26 -24 - 20 -7 -18 -17 -28 -3522 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 16 -12 -20 3) Conhecidas as notas de 55 alunos: e monte a tabela de distribuição de freqüência com intervalos. 33 -33 -35 -35 -39 -41 -41 -42 -45 -45 -47 -48 -50 -52 -53 -54 -55 -55 -56 -57-59 -60 -61 -64 65 -65 -65 -66 -67- 68 -68 -69 -71 -73 -73 -73 -74 -74 -76 -77-78 -80 -81 -84 -85 -85 -88 -89 91 -94 -94 -98 -98 -98 -98 4) Monte a tabela de distribuição de freqüência com intervalos com os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 -5 -2 -6 -4 -3 -6 -2 -6 -5 -1 -6 -3 -3 -5 -1 -3 -6 -3 -4 -5 -4 -3 -1 -3-5 -4 -4 -2 -6 -2 -2 -5 -2-5 -1 3 -6 -5 -1 -5 -6 -2 -4 -6 -1 -5 -2 -4 -3 UNIFRA Disciplina: Probabilidade e Estatistica 9 5) Considerando as notas de um teste de inteligência aplicado a 55 alunos: Monte a tabela de distribuição de freqüência com intervalos 64 -64 -64 -66 -66 -70 -70 -73 -73 -73 -73 -74 -75 -76 -76 -76 -78 -78 -78 -78-79 -80 -80 -81 82 -82 -83 -84 -84- 85 -85 -85 -85 -86 -86 -86 -86 -86 -86 -87-87 -89 -90 -90 -92 -92 -93 -95 98 -101 -102 -103 -103 -103 -103 3.3 Apresentação gráfica A representação gráfica é uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de fácil leitura. O tipo de gráfico depende da variável em estudo. a) Gráficos de Linhas Serve para representar séries simples ou compostas, geralmente utilizado para ilustrar uma série temporal. Quando se utiliza um gráfico de linhas compostas, ele servirá tanto para informação quanto para se fazer comparações. Exemplo 1: Venda de Combustível Automotivo, cidade de Santa Maria, período de 2001 à 2007 50.000.000 49.000.000 48.000.000 47.000.000 litros 46.000.000 45.000.000 44.000.000 43.000.000 42.000.000 41.000.000 40.000.000 2001 2002 2003 2004 2005 2006 2007 Fonte: www.fee.rs.gov.br Exemplo 2: Venda de Combustível Automotivo, cidade de Santa Maria e Passo Fundo, período de 2001 à 2007 50.000.000 48.000.000 46.000.000 44.000.000 litros 42.000.000 40.000.000 38.000.000 36.000.000 34.000.000 32.000.000 30.000.000 2001 2002 2003 2004 Santa Maria 2005 Passo Fundo Fonte: www.fee.rs.gov.br 2006 2007 UNIFRA Disciplina: Probabilidade e Estatistica 10 b) Gráficos de Colunas Os gráficos de colunas são formados por retângulos no eixo horizontal. Pode-se construir gráficos de colunas simples, que serve para a representação de uma série simples e o gráfico de colunas compostas, que é indicado para séries compostas, podendo ser de colunas justapostas ou sobrepostas. Esses tipos de gráficos compostos são utilizados para ilustrar qualquer tipo de série e também servem para comparação. b.1) Colunas simples Exemplo:2 Emprego no Brasil, jan/2009 45.000 nº de pessoas (1.000) 40.000 35.000 30.000 25.000 20.000 15.000 10.000 5.000 0 P o pulação em P o pulação Idade A tiva Eco no micamente A tiva P o pulação Ocupada P o pulação Deso cupada P o pulação não Eco no micamente A tiva Fonte: www.sidra.ibge.gov.br As larguras das colunas devem ser todas iguais e não têm nenhum significado neste caso, podendo ser adotada qualquer dimensão conveniente, desde que não se superponham. b.2) Colunas justapostas Exemplo: Poupalçao em Idade Ativa e Economicamente Ativa no Brasil, jan/2009 Nº de pessoas (1.000) 25.000 20.000 15.000 Homem 10.000 Mulher 5.000 0 População em Idade Ativa População Economicamente Ativa Fonte: www.sidra.ibge.gov.br c) Gráfico de barras As regras usadas para o gráfico de barras são iguais àquelas usadas no gráfico de colunas, porém com a inversão dos eixos. Exemplo: Estrutura Empresarial no município de Santa Maria – RS, 2006 UNIFRA Disciplina: Probabilidade e Estatistica 11 Saúde e serviço s so ciais Educação A dministração pública, defesa e seguridade so cial A tividades imo biliárias, aluguéis e serviço s prestado s às empresas Intermediação financeira, seguro s, previdência co mplementar Transpo rte, armazenagem e co municaçõ es A lo jamento e alimentação Co mércio , reparação de veículo s, o bjeto s pesso ais e do méstico s Co nstrução Indústrias de transfo rmação A gricultura, pecuária, silvicultura e explo ração flo restal Outro s serviço s co letivo s, so ciais e pesso ais 0 1000 2000 3000 4000 5000 6000 7000 8000 nº de unidades locais 2 Fonte: www.ibge.gov.br d) Gráfico de setores (pizza) É a representação gráfica da freqüência relativa (percentagem) de cada categoria dos dados. Este gráfico é utilizado para variáveis nominais e ordinais. Poderá ser uma opção ao gráfico de barras, quando se pretende dar ênfase à comparação das percentagens de cada categoria. Exemplo:Tipo de Frota no município de Santa Maria – RS, 2007 Motocicleta 22% Ônibus/Micro-ônibus 2% Caminhonete 3% Automóvel 73% Fonte: www.ibge.gov.br Características: - A área do gráfico equivale à totalidade de casos (100%); - Cada 'fatia' representa a percentagem de cada categoria representada. e) Gráficos pictoriais Tipo de gráfico cuja característica principal é a analogia entre o dado representado e o tipo de figura utilizado na sua representação. É bastante utilizado na propaganda, fazendo o apelo visual e percepção imediata do que se está falando. Tem por objetivo despertar a atenção do público em geral. Muitos desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados. Evolução da frota nacional de carros a álcool, de 1979 à 1987 3.631.647 1987 2.473.581 1985 1.277.107 1983 9.645 1979 Fonte: Anfavea UNIFRA Disciplina: Probabilidade e Estatistica 12 Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canadá - 2000 Goma de mascar com nicotina mais sessões de apoio psicológico 34% Internamento em hospital e uso de drogas relaxantes 30% Acupuntura 27% 19,5% Hipnose 18,5% Injeção de Clonidina, droga que reduz os efeitos da abstinência Fonte: Sem origem da informação Devastação Selvagem: extração de madeiras no Brasil - 2000 Pinus 6,8% Madeira nativa Eucalipto 24,4% 68,8% Fonte: Sociedade Brasileira de Silvicultura f) Histograma Destina-se a representar uma distribuição de freqüência intervalar. Os dados são representados por colunas justapostas. Onde a base representa os intervalos e altura apresenta as freqüências absolutas ou freqüências relativas dentro de cada intervalo. Altura dos dos Alunos da Sistemas da Inf. 1º semetre da UNIFRA, 2012/1 25 20 fi 15 10 5 0 150 158 166 174 182 190 Fonte: Dados Hipotéticos 3 - MEDIDAS ESTATÍSTICAS Tem por objetivo descrever um conjunto de dados de forma organizada e compacta que possibilita a visualização do conjunto estudado por meio de suas medidas estatísticas. 3.1 - Médias São medidas descritivas que tem por finalidade representar um conjunto de dados. UNIFRA Disciplina: Probabilidade e Estatistica 13 3.1.1. - Média Aritmética Símbolo: Amostral ( x ); Populacional () a) Dados Não Tabelados n X x i 1 N i n ou = X i 1 i N Exemplo: Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/2: 19 22 20 16 26 b) Dados Tabelados b.1) Tabela de frequências Média Aritmética Ponderada ( x ), (onde fi é a frequencia) n X X i 1 fi i n f i 1 i Exemplo: Altura dos dos Alunos UNIFRA, 1º semetre, 2012/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos b.1) Tabela com Valores Ponderados Média Aritmética Ponderada ( X w ), (onde Wi é o peso) n Xw X i 1 i Wi n W i 1 i Exemplo: Nota do aluno "X" 1 semestre de 2008 Notas (Xi) Pesos (W i) 7,8 2 8,3 3 9,2 2 5,8 3 10 Fonte: Dados Hipotéticos UNIFRA Disciplina: Probabilidade e Estatistica 14 Exercicios: 1) Considerando as distribuições de frequencia seguinte, ache a media aritmética: i PESOS (kg) fi 1 40 |----- 44 2 2 44 |----- 48 5 3 48 |------52 9 4 52 |------56 6 5 56 |------60 4 = 26 i 2) 1 2 3 4 5 ESTATURAS (cm) 150 |----- 156 156 |----- 162 162 |------168 168 |------174 174 |------180 fi 1 5 8 13 3 = 30 3) ÁREAS (m2) Nº de lotes 300 |---400 |---500 |---600 |---700 |---800 |---900 |---1000 |--- 1100 |---1200 14 46 58 76 68 62 48 22 6 4) Conhecidas as notas de 50 alunos: 68 71 80 41 94 85 35 61 55 98 33 81 41 78 66 52 50 91 48 66 65 35 55 69 73 77 64 73 85 42 84 74 59 67 65 65 47 53 39 94 74 54 77 60 88 57 68 45 76 89 Determine: a) a distribuição de frequencia começando por 30 e adotando o intervalo de classe de amplitude igual a 10; b) as frequencias acumuladas c) as frequencias relativas d) o histograma UNIFRA Disciplina: Probabilidade e Estatistica 15 3- Separatrizes (Mediana) São medidas de posição que divide o conjunto de dados em partes proporcionais, quando os mesmos são ordenados. a) Dados Não Tabelados Antes de determinarmos a MEDIANA devemos em primeiro lugar encontrar a posição da mesma. A Mediana será o elemento de ordem: P(md ) n 1 2 Exemplos: 1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/1: 19 22 20 16 26 2) Idade de seis alunos da ADM, 1º semetre da UNIFRA, 2010/1: 19 22 20 16 26 23 b) Dados Tabelados b.1) Distribuição de freqüências pontual Segue a mesma regra usada para dados não tabelados. Exemplo: Idade de 15 alunos da ADM, 1º semetre da UNIFRA, 2010/1 Idade (xi) Nº alunos (fi) 17 2 18 3 19 5 20 2 21 3 15 Fonte: Dados Hipotéticos b.2) Distribuição de freqüências intervalar n P (md ) 2 fi l * F (ant ).h * 2 Mediana -> md f* fi l * F (ant ).h * 4 Quartil 1 -> q 1 f* Sendo: l* = limite inferior L* = limite superior F(ant) = freq. acumulada anterior h*= amplitude de classe f* = freqüência simples da classe 3 fi l * F (ant ).h * 4 Quartil 3 -> q 3 f* onde: l md limite inferior da classe que contém a separatriz; n posição da separatriz; 2 Fant freqüência acumulada da classe anterior a que contém a mediana; f md freqüência absoluta da classe que contém a mediana; h amplitude do intervalo de classe; UNIFRA Disciplina: Probabilidade e Estatistica 16 Exemplo: Altura dos dos Alunos de SI, 1º semetre da UNIFRA, 2012/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos 3.3 - Moda (Mo) É definida como sendo a observação de maior freqüência. a) Dados Não Tabelados Exemplo: 3 4 4 4 5 5 6 6 7 8 9 Mo = 4 (unimodal) (amodal) 5 6 7 8 9 10 11 12 13 Mo = 1 1 2 2 3 3 3 4 5 5 5 Mo1 = 3 Mo2 = 5 (bimodal) (amodal) 5 5 6 6 7 7 8 8 Mo = 5 5 6 6 7 7 8 Mo1 = 5 Mo2 = 6 Mo3 = 7 (trimodal) Obs.: Acima de 4 modas usamos o termo polimodal. b) Dados Tabelados b.1) Distribuição de freqüências pontual Moda -> mo L * l * 2 - Moda Bruta (Mob): é o ponto médio da classe de maior freqüência b.2) Distribuição de freqüências intervalar - Moda de Czuber (Moc) O processo para determinar a moda usado por Czuber leva em consideração as freqüências anteriores e posteriores à classe modal. 1 f Mo f ant 1 .h Mo c l Mo 1 2 2 f Mo f pos onde: l Mo fMo h fant f pos limite inferior da classe modal; freqüência absoluta da classe modal; amplitude do intervalo de classe; freqüência absoluta da classe anterior a classe modal; freqüência absoluta da classe posterior a classe modal; UNIFRA Disciplina: Probabilidade e Estatistica 17 Exemplo: Altura dos dos Alunos de SI, 1º semetre da UNIFRA, 2012/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos Exercicios: 1) Ache a mediana e moda na tabela abaixo e seu histograma: a) Um grau de nebulosidade, registrano em décimos, ocorre de acordo com a distribuição abaixo: NEBUL fi b) 0 |--- 0,5 |---1,5 |---2,5 |---3,5 |--- 4,5 |---5,5 |---6.5 |---7,5 |--- 8,5 |--- 9,5 |--- 10,5 320 125 75 65 45 45 55 65 90 145 676 Ache a media aritmética e moda na tabela abaixo: Peso (Kg) 4,0 Freqüência 4,3 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,5 total 3 5 8 6 5 4 3 3 2 41 2 UNIFRA Disciplina: Probabilidade e Estatistica 18 c) d) 4 - MEDIDAS DE VARIABILIDADE OU DISPERSÃO Visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central (representativo) chamado média. Informa se um conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade). 4.1 - Desvio Quadrático ou Variância - S2 (amostra) ou 2 (populacional) a) para dados não tabelados: (Fórmula sem freqüência) Variância -> s 2 x n Desvio Padrão -> s 2 i xi n x n 2 i 2 xi n 2 UNIFRA Disciplina: Probabilidade e Estatistica 19 Exemplo: Idade de cinco alunos de SI. 1º semetre da UNIFRA, 2012/1: 19 22 20 16 26 Exercicios: Ache a variância e o Desvio Padrão dos dados abaixo: Sem intervalo de freqüência. a) 40 , 45, 48 , 52 , 54 , 62 , 70 b) 21,25, 28,29, 30, 33, 35, 40, 41, 50 c) 10,12,13,14,18,19,21,25 b) para dados tabelados (Fórmula com freqüência) Variância -> s 2 fx i 2 i n f i xi n fx Desvio Padrão -> s i n 2 i 2 f i xi n 2 Exemplo: Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos Exercicios: 1) A tabela abaixo apresenta a distribuição de freqüência dos salários mensais em reais, de 65 empregados da companhia P & R. Calcule a variancia e o desvio padrão. Salários (R$) 5.000 ---- 6.000 6.000 ---- 7.000 Nº de Empregados 8 10 7.000 ---- 8.000 16 8.000 ---- 9.000 14 9.000 ---- 10.000 10 10.000 ---- 11.000 5 11.000 ---- 12.000 2 Total 65 UNIFRA Disciplina: Probabilidade e Estatistica 20 2) Foi feito um inquérito a 40 pessoas que compraram carro novo com o objetivo de se saber quantas reparações, ou substituições de peças, foram feitas durante o primeiro ano utilização dos veículos. Obtiveram: 1 3 5 2 4 2 1 1 1 3 2 1 2 1 4 3 2 0 2 1 3 1 1 0 3 2 3 4 2 7 1 2 1 4 0 3 2 3 1 5 Organize os dados numa tabela de freqüências. (freqüências absolutas, relativas, e freqüências acumuladas, absolutas e relativas), ache a Mediana os Quartis (Q 1 e Q3) o desvio padrão e a variância. 4.2 - Desvio Padrão [S (amostra) ou (população)] ou S Variância Exemplos: 1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2009/1: 19 22 20 16 26 2) Altura dos dos Alunos de SI, 1º semetre da UNIFRA, 2012/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos 4.3 - Medidas de Dispersão Relativa 4.3.1 - Coeficiente de Variação de Pearson É a medida de variabilidade em geral expressa em porcentagem, e tem por função determinar o grau de concentração dos dados em torno da média. C.V . x 100 População C.V . S x 100 X Amostra UNIFRA Obs.: Disciplina: Probabilidade e Estatistica 21 0% C.V.P. 100% C.V.P 50% a média é representativa C.V.P. 0 é a maior representatividade da média (S = 0) Exemplos: 1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/1: 19 22 20 16 26 2) Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1 Altura (cm) xi fi 150 |--158 154 4 158 |--166 162 12 166 |--174 170 20 174 |--182 178 13 182 |--190 186 5 ---54 Fonte: Dados Hipotéticos 5 – NOÇÕES DE AMOSTRAGEM 5.1 - Conceitos em Amostragem Inferência Estatística - é o processo de obter informações sobre uma população a partir de resultados observados ma Amostra. Amostragem - É o processo de retirada de informações dos "n" elementos amostrais, na qual deve seguir um método adequado (tipos de amostragem). FIGURA 1 – Inferência e amostragerm 5.2 - Plano de Amostragem 1º) Definir os Objetivos da Pesquisa UNIFRA Disciplina: Probabilidade e Estatistica 22 2º) População a ser Amostrada Parâmetros a ser Estimados (Objetivos) 3º) Definição da Unidade Amostral Seleção dos Elementos que farão parte da amostra 4º) Forma de seleção dos elementos da população aleatória simples sistemática Tipo de Amostragem: estratificada conglomerados 5º) Tamanho da Amostra Exemplo: Moradores de uma Cidade (população alvo) própria Objetivo: Tipo de Residência alugada emprestada Unidade Amostral: Domicílios (residências) Elementos da População: Família por domicílio aleatória simples Tipo de Amostragem: sistemática estratificada 5.3 - Tipos de Amostragem 5.3.1 - Amostragem Simples ou Ocasional É o processo mais elementar e freqüentemente utilizado. Todos os elementos da população tem igual probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição. Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos da população pode-se usar a Tabela de Números Aleatórios ou gerar números aleatórios por meio de um software; 5.3.2 - Amostragem Sistemática Trata-se de uma variação da Amostragem Aleatória Ocasional, conveniente quando a população está naturalmente ordenada, como fichas em um fichário, lista telefônica, etc. Ex.: N = 500 (População) n = 50 (Amostra) então r N 100 , (teremos uma Progressão Aritmética (PA) de razão 10) n Sorteia-se usando a Tabela de Números Aleatórios um número entre 1 e 10, (x=3), o número sorteado refere-se ao 1o elemento da amostra, logo os elementos da amostra serão: UNIFRA Disciplina: Probabilidade e Estatistica 23 3 13 23 33 43 ...... Para determinar qualquer elemento da amostra podemos usar a fórmula do termo geral de uma P.A. an a1 (n 1).r 5.3.3 - Amostragem Estratificada É um processo de amostragem usado quando nos depararmos com populações heterogêneas, na qual pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos. Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada uma subpopulação (estrato). As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos números de elementos dos estratos, e guardarem a proporcionalidade em relação a variabilidade de cada estrato, obtendo-se uma estratificação ótima. Tipos de variáveis que podem ser usadas em estratificação: idade, classes sociais, sexo, profissão, salário, procedência, etc. 5.3.4 - Amostragem por Conglomerados (ou Agrupamentos) Algumas populações não permitem, ou tornam-se extremamente difícel que se identifiquem seus elementos, mas podemos identificar subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) podem ser escolhida, e uma contagem completa deve ser feita no conglomerado sorteado. Agregados típicos são: quarteirões, famílias, organizações, agências, edifícios, etc. 5.4 – Tamanho da Amostra 5.4.1 - Introdução Os pesquisadores de todo o mundo, na realização de pesquisas científicas, em qualquer setor da atividade humana, utilizam as técnicas de amostragem no planejamento de seus trabalhos, não só pela impraticabilidade de poderem observar, numericamente, em sua totalidade determinada população em estudo, como devido ao aspecto econômico dessas investigações, conduzidos com um menor custo operacional, dentro de um menor tempo, além de possibilitar maior precisão nos respectivos resultados, ao contrário, do que ocorre com os trabalhos realizados pelo proceso censitário. A técnica da amostragem, a despeito de sua larga utilização, ainda necessita de alguma didática mais adequada aos pesquisadores iniciantes. Na teoria da amostragem, são consideradas duas dimensões: 1ª) Dimensionamento da Amostra; 2ª) Composição da Amostra. UNIFRA Disciplina: Probabilidade e Estatistica 24 Tabela utilizada para saber sem fazer calculos quantas amostras podemos utilizar para n população: Tamanho da Amostra Obs.: um passo importante antes de iniciar o cálculo do tamanho da amostra é definir qual o erro amostral tolerável para o estudo que será realizado. Observe a seguinte fórmula: , onde: n0 é a primeira aproximação do tamanho da amostra E0 é o erro amostral tolerável (Ex.: 2% = 0,02 ) , onde: N é o número de elementos da população n é o tamanho da amostra Observe o seguinte exemplo para compreender melhor: UNIFRA Disciplina: Probabilidade e Estatistica 25 Exemplo 1) Em uma empresa que contém 2000 colaboradores, deseja-se fazer uma pesquisa de satisfação. Quantos colaboradores devem ser entrevistados para tal estudo? Resolução N = 2000 Definindo o erro amostral tolerável em 2% E0 = 0,02 n0 = 1 / (E0)2 n0 = 1 / (0,02)2 n0 = 2500 n = (N . n0) / (N + n0) n = (2000 . 2500) / (2000 + 2500) n = 1111 colaboradores 2) Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para a pesquisa. Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%. N = 2000 E0 = 0,04 n0 = 1 / (E0)2 n0 = 1 / (0,04)2 n0 = 625 n = (N . n0) / (N + n0) n = (2000 . 625) / (2000 + 625) n = 476 colaboradores Através deste segundo cálculo, é possível observar que, quando aumentamos a margem de erro, o tamanho da amostra reduz. 3) E se houvesse 300.000 colaboradores na empresa? N = 300.000 E0 = 0,04 n0 = 1 / (E0)2 n0 = 1 / (0,04)2 n0 = 625 n = (N . n0) / (N + n0) n = (300.000 . 625) / (300.000 + 625) n = 623 colaboradores Observe que a diferença entre n e n0, neste último cálculo, é muito pequena. Portanto: se o número de elementos da população (N) é muito grande, a primeira aproximação do tamanho da amostra já é suficiente. Fórmula para populações finitas( revisando) 1 Primeira aproximação E 02 N .n0 Tamanho da amostra pedida n N n0 n0 Exercícios: 1) Temos 200 famílias com erro amostral de 4% qual deve ser o tamanho da minha amostra? 2) E para N = 20.000 famílias? UNIFRA Disciplina: Probabilidade e Estatistica 26 3) Numa pesquisa para uma população presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se deseja garantir um erro amostral não superior a 2%? 4) Numa escola com 1000 alunos, deseja-se estimar a percentagem dos que estão satisfeitos com a direção. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%? 5) Qual deve ser o tamanho mínimo de uma amostra aleatória simples tais que possamos admitir com alta confiança, que os erros amostrais não ultrapassem 7%: a) Para 5500 pessoas? b) Para 25000 pessoas? c) Para 100.000 pessoas? 6) Numa empresa de 10000 funcionários, deseja-se estimar a percentagem de funcionários favoráveis a certo programa de treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta com alto nível de confiança, com erro amostral não superior a 4,3% ? 7) Numa pesquisa, queremos investigar informações a respeito de 800 pessoas pesquisando apenas parte destes, sem correr o risco de errar com mais de 3,7%. Quantas pessoas deverão consultar? 8) Para dar a porcentagem de defeitos das 3000 peças fabricadas por dia com um erro amostral de 4,1 %, quantas peças devemos verificar? UNIFRA Disciplina: Probabilidade e Estatistica 27 Revisão para Probabilidade: ARRANJO Arranjos simples de n elementos tomados s a s (s ≤ n) são os diferentes agrupamentos ordenados que se podem formar com p dos n elementos dados. Indica-se por An,s ou desses agrupamentos, que calculamos assim: o total Exemplos: A8,4 (onde n = 8 e p = 4) Exemplo 1: Calcular a) b) A 6,2 A5, 4 A3, 2 A4, 2 A2,1 Exemplo 2: Calcular E = A7,3 + A3,2 – A5,4 Exemplo 3: Quantos números de 3 algarismos podemos formar com os algarismos 1, 2, 3, 4, 5 e 7 , sem repeti-los? Exemplo 4: Quantos números pares de 4 algarismos podemos formar com os algarismos 0, 1, 2, 3, 4, 5 e 6, sem repeti-los? UNIFRA Disciplina: Probabilidade e Estatistica 28 Exemplo 5: Numa sala de 20 alunos, deseja-se formar grupos de estudos de três elementos, que tenham projetos diferentes. a) De quantos modos diferentes se podem escolher os alunos? De quantas maneiras se podem escolher os alunos sabendo que dois dos alunos não podem b) pertencer ao mesmo grupo? Exercícios: Calcule: 1) Quantos números de 5 algarismos distintos podemos formar com os algarismos 1, 2, 3, 4, 5, 6, 7, 8 e 9? 2) Quantos números de 3 letras, sem repetição, podemos formar com as 9 primeiras letras do nosso alfabeto? 3) Quantos números de 3 algarismos, sem repetição, podemos formar com os algarismos 1, 2, 3, 4, 5, 6, 7, 8 e 9, incluindo sempre o algarismo 4? 4) Quantos números de 4 algarismos distintos podemos formar com os algarismos 0,1, 2, 3, 4, 5, 6, 7, 8 e 9 ? 5) Quantos são os números compreendidos entre 2 000 e 3 000, formados por algarismos distintos escolhidos entre 1, 2, 3, 4, 5, 6, 7, 8 e 9 ? 6) Cinco homens e uma mulher pretendem utilizar um banco de cinco lugares. De quantas maneiras diferentes podem sentar-se,nunca fincando em pé a mulher? UNIFRA Disciplina: Probabilidade e Estatistica 29 PERMUTAÇÃO Quando k = n, isto é, quando os arranjos abrangem a totalidade dos elementos, temos o que se chama PERMUTAÇÃO de n elementos, cuja representação simbólica é Pn. Pn = n! Exemplo: Considere uma urna com 5 bolas numeradas de 1 a 5. De quantas maneiras diferentes podemos retirar, sem reposição, as 5 bolas. Solução: Aqui teremos uma seqüência de 5 bolas numeradas onde cada seqüência nos fornece um número diferente e o quantitativo de bolas selecionada é o quantitativo que se encontra na urna. Logo temos uma permutação de 5 bolas ou um arranjo de 5 bolas tomadas 4 a 4: P5 = 5 . 4 . 3 . 2 . 1 = 120 maneiras diferentes Exercícios: 1) Calcular E, sendo E= P P4 P5 2. 6 P2 2) Quantos números de4algarismos distintos podem ser formados, usando-se os algarismos 1, 3, 5 e 7? 3) Considere os números obtidos do número 12345, efetuando-se todas as permutações de seus algarismos. Colocando esses números em ordem crescente, qual o lugar ocupado pelo número 43521? 4) Formados e dispostos em ordem alfabética todos os anagramas da palavra ESAN, determine a posição que ocupará apalavra NASE? 5) Calcule o número de permutação que podem ser feitas com as letras da palavra CAPITULO, de forma que não fiquem juntas duas vogais e duas consoantes. UNIFRA Disciplina: Probabilidade e Estatistica 30 COMBINAÇÃO Quando necessitamos formar conjuntos de k elementos não importando a ordem dos elementos, não podemos utilizar a definição de arranjo onde a ordem é relevante. Temos então a definição de combinação de n elementos tomados k a k, cuja definição é: n! n C nK k k!(n k )! Exemplo: Considere o lançamento de 6 moedas. De quantas maneiras diferentes podemos obter 4 caras? Solução: Este experimento leva em consideração somente o total de caras e coroas, não importando a ordem com que os resultados aparecem. Assim, estamos no âmbito das combinações, ou seja, Exercícios: 1) De quantas maneiras podemos escalar um time de futebol de salão disposto de 8 jogadores? 2) Numa sala, temos 5 rapazes e6moças.quantos grupos podemos formar de 2 rapazes e 3 moças? 3) Numa classe de10 estudantes, um grupo de 4 será selecionada para uma excursão.De quantas maneiras o grupo poderá ser formado se dois dos 10 são marido e mulher e só irão juntos? 4) Numa turma de 30 alunos, 9 tem motocicleta e outros 8 tem bicicleta.quantos grupos diferentes de 7 alunos se podem formar naquela turma, de modo a haver em cada grupo 4 motocicletas e 2 bicicletas? 5) Num plano temos 16 pontos; 9 deles pertencem a uma reta. Quantas circunferências podem passar por 3 quaisquer daqueles pontos? UNIFRA Disciplina: Probabilidade e Estatistica 31 6) Sobre uma reta, marcam-se 8 pontos e sobre uma outra reta, pararela a primeira marcam-se 5 pontos. Quantos triângulos obteremos unindo 3 quaisquer desses pontos? Introdução à Probabilidade As origens da probabilidade remontam ao século XVI. As aplicações iniciais referiam-se quase todas, a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das probabilidades para planejar estratégias de apostas. Atualmente a utilização das probabilidades ultrapassou de muito o âmbito desses jogos. Hoje os governos, as empresas, as organizações profissionais incorporam a teoria das probabilidades em seus processos diários de deliberações. Independentemente de qual seja a aplicação em particular, a utilização das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um evento futuro. Assim é que, em muitos casos, pode ser virtualmente impossível afirmar por antecipação o que ocorrerá, mas é possível dizer o que pode ocorrer. Há numerosos exemplos de tais situações no campo dos negócios e do governo. A previsão da procura de um novo produto, o cálculo dos custos da produção, a previsão das safras, a compra de apólices de seguros, a avaliação da redução de impostos sobre a inflação. As probabilidades são úteis, pois ajudam a desenvolver estratégias. O ponto central em todas as situações é a possibilidade de quantificar quão provável é determinado evento. As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento. O estudo das probabilidades é importante pois elas são a base para o estudo estatístico. Experimento aleatório Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Características dos experimentos aleatórios: 1. Podem ser repetidos indefinidamente sob as mesmas condições. 2. Não se pode adiantar um resultado particular, mas podem-se descrever todos os resultados possíveis. 3. Se repetidos muitas vezes apresentarão uma regularidade em termos de freqüência de resultados. Exemplos: lançamento de uma moeda, lançamento de um dado, aposta na loteria, .... Ao descrever um experimento aleatório deve-se especificar não somente que operação ou procedimento deva ser realizado, mas também o que deverá ser observado. (Note a diferença entre o 2º e o 3º) Joga-se um dado e observa-se o número obtido na face superior. Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido. Joga-se uma moeda 4 vezes e observa-se a seqüência de caras e coroas. Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição) até que a última defeituosa seja encontrada. Conta-se o número de peças retiradas. Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. Lança-se uma moeda até que ocorra uma cara e conta-se então o número de lançamentos necessários. Lançam-se dois dados e anota-se o total de pontos obtidos. Lançam-se dois dados e anota-se o par obtido. UNIFRA Disciplina: Probabilidade e Estatistica 32 Espaço amostral O espaço amostral (S) de um experimento aleatório é o conjunto de todos os possíveis resultados do experimento. n(S) é o número de elementos do conjunto S, ou o número de resultados possíveis. Exemplo: Um experimento é o lançamento de uma moeda. Os possíveis resultados são cara ou coroa, então, S={cara, coroa}. Em dois lançamentos de uma moeda, sendo interessante observar a ordem dos resultados, os possíveis resultados são: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e coroa. O espaço amostral é S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4 Eventos Chama-se de evento qualquer subconjunto do espaço amostral S de um experimento aleatório, ou seja, qualquer resultado do espaço amostral. n(A) é o número de resultados associados ao evento A. Exemplo: no lançamento de uma moeda S = {cara, coroa}. Um evento de interesse A pode ser “obter cara no lançamento de uma moeda” e n (A) = 1. No lançamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3. A probabilidade de um evento Seja A um evento. A probabilidade de este evento ocorrer é dada por P(A), que é um número entre 0 e 1. Quanto mais próxima a probabilidade estiver de 1, maior será sua chance de ocorrência. A um evento impossível atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1. Há três maneiras diferentes de calcular ou estimar probabilidades: o método clássico, quanto o espaço amostral tem resultados igualmente prováveis. O método empírico, que se baseiam na freqüência relativa de ocorrência de um evento num grande número de provas repetidas e o método subjetivo, que utiliza estimativas pessoais de probabilidade, baseadas num certo grau de crença. Em geral vamos utilizar o método clássico de cálculo de probabilidades.Quando os resultados são equiprováveis, a probabilidade de cada resultado é função do número de resultados possíveis: P(A) = número de resultados associados ao evento A número total de resultados possíveis Exemplo: Experimento: lançar um dado e observar a face superior Espaço amostral: S= {1,2,3,4,5,6} n(S) = 6 Evento A: face par n(A)=3 P(A)= 3/6 = ½ = 0,5 ou 50% UNIFRA Disciplina: Probabilidade e Estatistica 33 Exercícios 1) No lançamento de um dado, determinar a probabilidade de se obter: a) o número 2 b) um número par c) um número múltiplo de 3 2) De um baralho com 52 cartas tiram-se, sucessivamente, sem reposição, duas cartas. Determinar a probabilidade dos eventos: a) as duas cartas são “damas”, b) as duas cartas são de “ouro”. 3) Complete a tabela com os valores calculados da probabilidade dos eventos ocorrerem. Experimento Evento P(Evento) Cara Lançar uma moeda uma vez Face 3 Lançar um dado uma vez 6 vermelho Extrair uma carta de um baralho com 52 cartas Valete de ouros Extrair uma carta de um baralho de 52 cartas Cálculo das probabilidades Muitas aplicações da estatística exigem a determinação da probabilidade de combinações dos eventos. Há duas características de combinações. Pode ser necessário determinar a probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles, A ou B, ou seja, P(A ou B). Em um prédio com 2 elevadores, poderíamos perguntar: Qual a probabilidade de ambos elevadores estarem em serviço? Ou então, Qual a probabilidade de um ou outro elevador estar em serviço? Ambos implica P(A e B) Um ou outro implica P(A ou B) UNIFRA Disciplina: Probabilidade e Estatistica 34 Regra da adição: A regra da adição leva em conta a ocorrência do evento A ou do evento B ou de ambos os eventos e é denotada por P(AUB). P(A ou B) = P(A) + P(B) – P(A e B) A B P(A U B) = P(A) + P(B) – P(A B) P(A B) Quando os eventos são mutuamente excludentes (não tem elementos em comum), então a probabilidade de ambos é nula e o termo P(A e B) será zero. Se A e B são mutuamente excludentes P(A U B) = P(A) + P(B) Exercícios: 1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. Qual a probabilidade do número ser par ou maior que 4? 2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. Qual a probabilidade do número ser um número primo ou maior que 8? 3.Qual a probabilidade de se jogar um dado e se obter o número 3 ou o numero ímpar? 4.Numa caixa estão 20 bolas numeradas de 1 a 20. Retira-se 1 bola ao acaso.qual é a probabilidade de se obter maior que o numero 16 ou um numero múltiplo de 4. UNIFRA Disciplina: Probabilidade e Estatistica 35 EVENTOS COMPLEMENTARES Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de q ele não ocorra (insucesso), para que um mesmo evento existe sempre a relação: p + q = 1 => q = 1 – p Assim, se a probabilidade de se realizar um evento é p=1/5, a probabilidade de que ele não ocorra é: q = 1 – p => q = 1 – (1/5) = 4/5 Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p = 1/6. logo a probabilidade de não tirar o 4 no lançamento de um dado é: q = 1 – (1/6) = > q = 5/6 Outro modo de aplicarmos a probabilidade de um evento completar é quando que usar a fórmula de COMBINAÇÃO para resolvermos o exercício: Sejam A e A dois eventos de um espaço amostral U; sendo A o evento complementar de A, temos: P(A) + P(A) = 1 A U A A+A=U n(A) + n(A) = n(U) => n( A) n( A) n(U ) P( A) P( A) 1 n(U ) n(U ) n(U ) Exemplo: Consideramos um conjunto de 10 frutas, das quais 3 estão estragadas. Escolhendose aleatoriamente 2 frutas desse conjunto, determinar a probabilidade de que: a) ambas não estejam estragadas b)pelo menos uma esteja estragada Resolução: a) Calculo do número de maneiras pelas quais duas frutas podem ser escolhidas: Cálculo do número de maneiras pelas quais duas frutas podem se ser escolhidas sem estarem estragadas: b) A é o evento: pelo menos uma fruta esta estragada Exercícios: 1) De um lote de 14 peças, das quais 5 são defeituosas, escolhemos 2, aleatoriamente. Determine: a) a probabilidade de que ambas sejam defeituosas; b) a probabilidade de que ambas não sejam defeituosas; c) a probabilidade de que uma seja defeituosa. UNIFRA Disciplina: Probabilidade e Estatistica 36 2) Uma urna contém 3 bolas brancas e 4 pretas. Tiramos, sucessivamente, 2 bolas. Determine a probabilidade de: a) as bolas terem a mesma cor; b) as bolas terem cores diferentes. EVENTOS INDEPENDENTES Dizemos que dois eventos são independentes quando a realização ou a não realização de um dos eventos afeta a probabilidade de realização do outro e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, sendo p1, a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: p = p1 x p2 Exemplo: Lançamento de dois dados. A probabilidade de obtermos 1 no primeiro dado é: p1=1/6. A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6 Logo a probabilidade de obtermos simultaneamente, 1 no primeiro e 5 no segundo é: p = 1 1 1 x 6 6 36 Eventos Mutuamente Exclusivos Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa”, são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: p = p 1 + p2 Exemplo: Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é: p= 1 1 2 1 , pois, como vimos dois eventos são mutuamente exclusivos. 6 6 6 3 Exercícios: 1) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a segunda carta ser 5 de paus? UNIFRA Disciplina: Probabilidade e Estatistica 37 2) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca , preta e verde? 3) No lançamento de um dado, qual a probabilidade de se obter um numero não inferior a 5? 4) São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma dama e um rei, não necessariamente nessa ordem? 5) Dois dados são lançados conjuntamente. Determine a probabilidade de soma ser 10 ou mais que 10. 6) Uma moeda é lançada 4 vezes. Qual a probabilidade de que apareça coroa nas quatro vezes? 7) Retirando-se duas cartas ao acaso, sem reposição, de um baralho de 52 cartas, qual a probabilidade de ser a primeira de paus e a segunda de copas? 8) Considerem-se duas caixas, I e II. Na caixa I, há 4 bolas pretas e 6 bolas azuis, e na caixa II, há 8 bolas pretas e 2 bolas azuis. Escolhe-se ao acaso, uma caixa e, em seguida, dela se tira uma bola. Qual a probabilidade de que esta bola seja : a) preta? b) azul? UNIFRA Disciplina: Probabilidade e Estatistica 38 Distribuições Discretas mais Importantes As principais distribuições discretas são: Distribuição Binomial e Distribuição Poisson e Distribuiç. Distribuição Binomial Seja um processo composto de uma seqüência de observações independentes, onde o resultado de cada observação pode ser um sucesso ou uma falha. Se a probabilidade de sucesso é constante e igual a p, a distribuição do número de sucessos seguirá o modelo Binomial. A distribuição Binomial é usada com freqüência no controle de qualidade. É o modelo apropriado quando a amostragem é feita sobre uma população infinita ou muito grande. A distribuição binomial possui quatro propriedades essenciais: 1. As observações possíveis podem ser obtidas através de dois diferentes métodos de amostragem. Cada observação pode ser considerada como se tivesse sido selecionada a partir de uma população infinita sem reposição ou a partir de uma população finita com reposição. 2. Cada observação pode ser classificada em uma de duas categorias mutuamente excludentes e coletivamente exaustivas, usualmente chamadas sucesso ou falha. 3. A probabilidade de uma observação ser classificada como sucesso (p) é constante de observação para observação. Assim sendo, a probabilidade de fracasso 1-p também é constante. 4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do resultado de qualquer outra observação. Em aplicações de controle da qualidade, x em geral representa o número de defeituosos observados em uma amostra de n itens. 2. Cada observação pode ser classificada em uma de duas categorias mutuamente excludentes e coletivamente exaustivas, usualmente chamadas sucesso ou falha. 3. A probabilidade de uma observação ser classificada como sucesso (p) é constante de observação para observação. Assim sendo, a probabilidade de fracasso q =1-p também é constante. 4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do resultado de qualquer outra observação. Em aplicações de controle da qualidade, x em geral representa o número de defeituosos observados em uma amostra de n itens. n , representa o número de combinações de n objetos tomados x de cada vez. x P(x) = probabilidade de x sucessos uma vez que n e p são conhecidos n = tamanho da amostra p = probabilidade de sucesso => 1-p = probabilidade de falha x = número de sucessos na amostra (x=0, 1, 2, ..., n) Essa expressão é conhecida como lei binomial das probabilidades. Só pode ser aplicada a experiências aleatórias com as seguintes características: 1º) A experiência é repetida um número n de vezes, nas mesmas condições. 2º) Após cada experiência ocorre evento A (sucesso) ou evento A (fracasso). 3º) p é constante em todas as n experiências. 4º) As experiências são independentes uma da outra. Exemplo: 1)Um dado é lançado 6 vezes. Calcular a probabilidade de ocorrer um 3 ou um 4 duas vezes. Resolução: Quando lançamos um dado podemos obter 6 resultados possíveis: 1,2,3,4,5 ou 6. a probabilidade de ocorrer um 3 ou um 4 em cada lançamento é: P= 2 1 . 6 3 UNIFRA Disciplina: Probabilidade e Estatistica 39 A probabilidade de não ocorrer um 3 ou um 4 é q = 1- 1 2 . O numero de sucessos é x=2 logo: => 3 3 P(x) = 2 4 80 6 1 2 P(x) = . ou p= 32,92% 243 2 3 3 2) Um jogador de xadrez tem 2/5 de probabilidade de vitória quando joga. Na realização de cinco partidas, determinar a probabilidade de esse jogador vencer: a) duas partidas b) mais que a metade das partidas 3) Um processo industrial opera com média de 1% de defeituosos. Baseado em amostras de 100 unidades, calcule as probabilidades de uma amostra apresentar 0, 1, 2, 3 e 4 defeituosos. Plote a distribuição de probabilidade correspondente. 4)Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25 unidades, qual a probabilidade de uma amostra selecionada apresentar 2 defeituosos ou menos. 5) Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e o critério para parar o processo e procurar causas especiais fosse x = 1 ou mais. Calcule a percentagem de vezes que o processo seria interrompido logo após a amostragem. UNIFRA Disciplina: Probabilidade e Estatistica 40 Distribuição de Poisson A aplicação típica da distribuição de Poisson no controle da qualidade é como um modelo para o número de defeitos (não-conformidades) que ocorre por unidade de produto (por m 2, por volume ou por tempo). Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa área de oportunidade – um intervalo contínuo (de tempo, de comprimento, de área,...) de maneira tal que, se encurtarmos a área de oportunidade ou intervalo suficientemente: 1. A probabilidade de se observar exatamente um sucesso no intervalo é estável; 2. A probabilidade de se observar mais de um sucesso no intervalo é zero; 3. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em qualquer outro intervalo. A distribuição de Poisson tem um parâmetro (lambda) que é a média ou o número esperado de sucessos por unidade. A variância desta distribuição é s2 = . O número de sucessos x da variável aleatória de Poisson varia de 0 a . A expressão matemática para a distribuição de Poisson para se obterem x sucessos, dado que sucessos são esperados é: P( x) e . x x! onde x = 0,1,2,.... Sendo que: P(x) = probabilidade de x sucessos, dado o conhecimento de = número esperado de sucessos e = constante matemática (aproximadamente 2,71828) x = número de sucessos por unidade . Exemplos: 1) Suponha que o número de defeitos no cordão de solda de uma carroceria siga uma distribuição de Poisson com = 2. Então a probabilidade de uma carroceria apresentar mais de 3 defeitos será: Então a probabilidade de uma carroceria apresentar mais de 3 defeitos será: P( x> 3) = 1 – P( x < 3) = 1-[ P(x= 0) + P(x= 1) + P(x= 2) + P(x= 3)] 2) Se chegam em média 2 carros por minuto em um posto de gasolina, qual a probabilidade de que cheguem exatamente 5 carros em dois minutos? Neste caso o tempo é diferente do tempo correspondente ao l. Então se deve transformar o para que ele corresponda ao tempo de 2 minutos. Chegam em média 2 carros por minuto => chegam em média 4 carros em 2 minutos. UNIFRA Disciplina: Probabilidade e Estatistica 41 Exercícios: 1. O setor financeiro de uma loja de departamentos está tentando controlar o número de erros cometidos na emissão das notas fiscais. Suponha que esses erros sigam o modelo de Poisson com média l = 0,03. Qual a probabilidade de uma nota selecionada ao acaso conter 1 ou mais erros? 2. Em uma indústria automotiva, defeitos superficiais de pintura ocorrem a uma taxa de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao acaso apresente 1 ou mais defeitos superficiais. 3. Em uma empresa industrial ocorrem, em média, 3 acidentes por mês. Qual a probabilidade de que em um determinado mês, ocorra apenas um acidente? 4. Dez por cento das ferramentas produzidas por um certo processo de fabricação revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o emprego da distribuição de Poisson. 5. Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da injeção de um determinado soro é 0,001, qual a probabilidade de, entre 2000 indivíduos: a) exatamente 3 sofrerem aquela reação? b) Mais de 2 sofrerem a reação? UNIFRA Disciplina: Probabilidade e Estatistica 42 Distribuição Normal A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística. Esta distribuição tem uma forma de sino. A equação da curva Normal é especificada usando 2 parâmetros: a média populacional desvio padrão populacional , ou equivalentemente a variância populacional , e o . Denotamos N( ) à curva Normal com média e variância . A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento de curva. A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. Para referência, a equação da curva é Felizmente, você não tem que memorizar esta equação. O importante é que você entenda como a curva é afetada pelos valores numéricos de e . isto é mostrado no diagrama abaixo. UNIFRA Disciplina: Probabilidade e Estatistica 43 A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é 1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a curva entre esses dois valores. Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são: Range Proportion 68.3% 95.5% 99.7% Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe podem ser descritos por uma distribuição normal, com média 140mm e desvio padrão 15mm. Podemos calcular a proporção dos peixes que têm comprimentos entre 110 e 170mm, por exemplo, como a proporção da área sob a curva entre 110 e 170mm. Então em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm. Na prática desejamos calcular probabilidades para diferentes valores de e . Para isso, a variável cuja distribuição é é transformada numa forma padronizada com distribuição (distribuição normal padrão) pois tal distribuição é tabelada. A quantidade é dada por: Exemplo: A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm? A solução do problema resume-se em determinar a proporção da distribuição que está acima de 10 ppm, ie . Usando a estatística z temos: Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do tempo. UNIFRA Disciplina: Probabilidade e Estatistica 44 Exercício: A concentração de cadmio em cinzas de um certo lixo radioativo tem distribuição N(1,0.72). Quais são as chances de que uma amostra aleatória das cinzas tenha uma concentração de cadmio entre 0.5 e 1.75 ppm? Aplicação Ainda na Escala de X, o tempo central é a média de 75 segundos Na Escala de Z, a média é 0 e os intervalos tem como base o desvio padrão. Mas, assim como X, a varivél Z é contínua •Pergunta: como 87, na Escala de X, pode ser relacionado a 2σ, na Escala de Z? este deslocamento é annálogo (75+2*6=87) •Outra forma de relacionar estes valores ・através anteriormente: da fórmula de transforma鈬o apresentada Suponha agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundos para montar uma pe軋, ou seja, P(75≤X≤81). Como proceder? ➔Transformar as variáveis X em vari疱eis normais padronizadas Z: UNIFRA Disciplina: Probabilidade e Estatistica 45 Logo temos a probabilidade P(0≤Z≤1), que é ilustrada a seguir, e cujo valor é determinado consultando a tabela: Aplicação – Significado prático para o que aprendemos 4) Consultando a tabela, encontramos o valor da área indicada, que significa a probabilidade Este resultado nos informa que ha probabilidade de 0,3413 de um trabalhador levar um tempo entre 75 e 81 segundos para montar um peça. Outra interpretação é que 34,13% dos trabalhadores levarão um tempo dentro do intervalo de 75 a 81 segundos. 5) Um marinheiro recebe um telefonema avisando que sua esposa deu a luz naquele dia, 308 dias após sua última visita. Sendfo que os prazos de gravidez tem distribuição normal média de 268 dias e desvio padrão de 15 dias, pergunta-se: o marinhieor deve se preocupar....? Em anexo mais exercícios das Distribuições Binomial, Poisson e Normal.