MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Curso de Tecnologia em Manutenção Industrial 1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS 2 MEDIDAS NUMERICAS DESCRITIVAS 3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC 1 MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Curso de Tecnologia em Manutenção Industrial Sumário 3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA.................................................................................................................................1 CAPITULO 1 ..........................................................................................................................4 1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS..................................................4 1.1 ORGANIZANDO DADOS NUMÉRICOS.....................................................................9 1.1.1Exercicios .................................................................................................................9 Diagrama de ramos e folhas.................................................................................................10 1.3 TABELAS E GRÁFICOS PARA DADOS NUMÉRICOS...................................13 1.3.1Exercicios...........................................................................................................13 1.3.2 A Distribuição de Frequencia Relativa e a Distribuição de Percentagem..............14 Veículos mais vendidos - outubro de 2012.................................................................15 1.3.4 A Distribuição Acumulada......................................................................................15 ...................................................................................................................................15 1.3.5 Exercicios..............................................................................................................16 1.3.6 Histograma............................................................................................................16 1.3.7 Exercicios..............................................................................................................16 1.4 ELABORANDO GRÁFICOS DE DADOS NUMÉRICOS BIVARIADOS.................17 1.4.1 Exercicios...............................................................................................................18 1.5 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS........18 1.6 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS BIVARIADOS......................................................................................................................20 1.6.1 Exercicios...............................................................................................................20 1.7 EXCELÊNCIA GRÁFICA.............................................................................................22 CAPITULO 2 .........................................................................................................................23 2 MEDIDAS NUMERICAS DESCRITIVAS..........................................................................23 O QUE É DESVIO PADRÃO?............................................................................................27 2.1.1 Exercicios...............................................................................................................32 2.2 ANÁLISE EXPLORATÓRIA DE DADOS...................................................................36 2.3 O COEFICIENTE DE CORRELAÇÃO........................................................................37 CAPITULO 3............................................................................................................................40 3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA...............................................................................................................................40 3.1 Conceitue os Básicos de Probabilidade.........................................................................40 3.1.1Exercicios................................................................................................................42 3.2 TABELA DE CONTINGENCIA..................................................................................45 3.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos.....................48 3.4 Probabilidade Condicional.............................................................................................50 3.5 Teorema de Bayes...........................................................................................................57 3.5.1 Exercicios...............................................................................................................59 3.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL ALEATÓRIA DISCRETA....................................................................................................63 3.6.1 VARIÁVEL ALEATÓRIA DISCRETA......................................................................63 3.6.2 Exercicios...............................................................................................................64 Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC 2 MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Curso de Tecnologia em Manutenção Industrial solução: ...........................................................................................................................65 3.6.3 Distribuições de probabilidades discretas...............................................................65 3.6.3 EXERCICIOS.........................................................................................................73 3.6.4 Distribuição de Poisson (lê-se : poassom)..............................................................74 3.6.5 Exercicios...............................................................................................................75 3.6.6 Distribuição hipergeométrica..................................................................................76 3. 6.7 Exercicios..............................................................................................................78 3.6.8 Exercicios...............................................................................................................79 Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC 3 CAPITULO 1 1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS Estatística: é a ciência que coleta, organiza, analisa e interpreta dados para tomada de decisões. Dados consistem em informações que vem de observações, contagens, medições ou respostas. Dois tipos de dados: população e amostra. • População : é uma coleção de todos os resultados, respostas, medições ou contagens que são de interesse. • Amostra: é um subgrupo de uma população. Identificando conjunto de dados 1) O departamento de energia dos EUA conduz uma pesquisas semanais em aproximadamente 800 postos de gasolina para determinar o preço por galão de gasolina comum. Em 12 fevereiro de 2007, o preço médio era de $2,24 por galão. Identifique a população e a amostra. • Identificando a população: consiste dos preços por galão de gasolina comum em todos os postos de gasolina dos EUA. • Identifique a amostra: consiste dos preços por galão de gasolina comum em 800 postos pesquisados. • Do que consiste o conjunto de dados: o conjunto de dados consiste em 800 preços. Parâmetro: descrição numerica populacional Estatistica: descrição numérica amostral 2)Decida se o valor numérico descreve um parâmetro populacional ou estatistica amostral. • Uma pesquisa recente de uma amostra de MBAS reportou que o salário médio para uma MBA é mais do que $82000. • Resposta: em razão da média de $82000 ser baseada em um subgrupo de uma população é uma estatistica amostral. • Os salarios iniciais para 667 MBAS graduados na Escola de Negocios da Universidade de Chicago aumentaram 8,5 % em comparação ao ano anterior. • Resposta: devido ao fato de o aumento porcentual de 8,5% ser baseado em salarios iniciais de todos os 667 graduandos, é um parametro populacional. Estatistica descritiva: é o ramo da estatistica que envolve a organização, o resumo e a representação dos dados. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 4 Estatistica inferencial: é o ramo da estatistica que envolve o uso de uma amostra para chegar a conclusões sobre uma população. Uma ferramenta básica no estudo da estatistica inferencial é a probabilidade. Exemplo:FARBER(2009, p.6) Uma grande amostra de homens, com 48 anos de idade, foi estudada durante 18 anos. Conforme o gráfico estão vivos aos 65 anos de idade. 90,00% 70,00% solteiros casados FARBER(2009, p.3­9) Classificação dos dados Dados qualitativos: consistem em atributos, rótulos ou entradas não numericas. Dados quantitativos: consistem de medidas numéricas ou contagens. Dados qualitativos Dados quantitativos modelo Preço base fusion $17795 F150 $18710 FARBER (2009, p.9) Níveis de mensuração nominal Nomes, rótulos ou qualidades. Nao são realizados calculos matematicos. ordinal Qualitativos ou quantitativos- podem ser organizados em ordem ou posição, mas a diferença entre as entradas de dados não são significantes. intervalar Podem ser ordenados e poderá calcular diferenças significativas entre as entradas de dados. Um registro nulo simplesmente representa uma posiçao em uma escala; a entrada não é um zero inerente. Ex: temperatura: zero graus. racional Similares ao intervalar com uma propriedade adicionada; neste nível, um registro nulo é um zero inerente( não significa nada).Uma razão de dois valores dados pode ser formada de modo que um valor de dado possa ser significativamente expresso com multiplo do outro.ex: zero dólares na poupança Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 5 ordinal os cincos primeiros de Tv mais assistidos nominal afiliadas das redes em Pittsburg wtae wpxi kdka wpgh 1. american idol terça feira 2.american idol-quarta feira 3.grey's anatomy 4.house 5.csi intervalar vitorias do New York Yankees 1923 1927 1938 1939 1950 1951 1961 1962 1999 2000 totais de home runs da liga Americana Baltimore 164 Boston 192 Chicago 236 Cleveland 196 nivel de categorizar os ordenar mensuração dados dados nominal sim não ordinal sim sim intervalar sim sim racional sim sim • subtrair os valores dados não não sim sim determinar se os um valor dado dos é multiplo do outro não não não sim FARBER(2009, p.15) planejamento de estudo estatístico 1 identifique a variável de interesse e a população do estudo 2 desenvolva um plano detalhado para a coleta de dados. se usar uma amostra tenha certeza de que a amostra representa a população 3 colete dos dados 4 descreva os dados usando técnicas de estatistica descritiva 5 interprete os dados e tome decisões sobre a população usando estatistica inferencial 6 identifique quaisquer possíveis erros Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 6 COLETA DE DADOS faça um estudo observacional o pesquisador observa e mede as caracteristicas de interesse de parte de uma população, mas não altera as condições existentes. realize um experimento um tratamento é aplicado em uma parte da população e as respostas são observadas use uma simulação uso de um modelo matemático ou fisico para reproduzir as condições de uma situação ou processo. use um levantamento ou pesquisa de mercado é uma investigação de uma ou mais características de uma população. PLANEJAMENTO EXPERIMENTAL Planejamento experimental produzir resultados significativos e não tendenciosos, os experimentos devem ser cuidadosamente planejados Um experimento bem planejado são controle, aleatorização e replicação. CONTROLE: variável confouding ( “ confusão”) ocorre quando um pesquisador não pode dizer a diferença entre os efeitos de diferentes fatores em uma variável. técnica cega o sujeito não sabe se está recebendo tratamento ou placebo Experimento duplamente cego ( double-blind) nem o sujeito nem a pesquisador sabem se o sujeito está recebendo tratamento ou placebo Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 7 ALEATORIZAÇÃO:processo de se designar sujeitos aleatoriamente para diferentes grupos de tratamento. 30 a 39 anos todos os sujeitos controle tratamento 40 a 49 anos controle tratamento mais de 50 anos controle tratamento REPLICAÇÃO:é a repetição de um experimento usando um grande grupo de sujeitos. Exemplo: A empresa identifica 10 adultos que são fumantes . 5 deles recebem uma nova goma de mascar e os outros 5 placebo. Depois de 2 meses eles são avaliados e descobre­se que os 5 sujeitos que estão usando a nova goma de mascar pararam de fumar. Solução: o tamanho da amostra usado não é grande suficiente para validar os resultados. O experimento deve ser replicado para melhorar a validade. TÉCNICAS DE AMOSTRAGEM 1 censo 2 amostragem 3 erro de amostragem 4 amostra aleatória 5 amostra aleatória simples população inteira parte da população diferença entre os erros da amostra e população membros de uma população tem chances iguais de serem selecionados toda amostra possível de mesmo tamanho tem a mesma chance de ser selecionada Exemplo de amostra aleatória simples: 731 estudantes se inscreveram no curso de estatistica em uma universidade. Formar uma amostra de 8 estudantes para responder questões de uma pesquisa.Selecionar os estudantes que pertencerão a amostra aleatória simples. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 8 amostra estratificada Grupo 1 renda baixa Grupo 2 renda média Grupo 3 renda alta amostra por agrupamento Zona 1 Zona 2 Zona 3 Zona 4 amostra sistemática - atribuído um numero a cada membro da população FARBER(2009, p.29­30)Usando a tecnologia na estatistica • os números aleatóros pode ser uma lista gerada que serve para selecionar membros da amostra ou realizar simulações. • Na planilha Calc : • Sintaxe • ALEATÓRIOENTRE (Inferior; Superior) 1.1 ORGANIZANDO DADOS NUMÉRICOS • Para LEVINE (2005), uma disposição ordenada consiste em uma seqüência de dados brutos, com ordem de classificação partindo da menor observação para maior observação. • A disposição ordenada torna mais fácil a separação de extremos, de valores típicos e da área na qual a maioria dos valores encontra­se concentrada. 1.1.1Exercicios 1) Um departamento de controle de qualidade esta testando 25 celulares de um carregamento de 300 telefones com cameras. Faça uma lista aleatória de 25 numeros de 1 a 300 e ordene a lista. * na classificação dos dados não vincular a formula ALEATÓRIOENTRE (Inferior; Superior) Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 9 2) Considere a população de 41 numeros inteiros de 0 a 40. Qual é a média desses numeros? Selecione tres amostras aleatórias de 7 numeros dessa lista. Encontre a média de cada amostra. Compare seus resultados com a média da população inteira. 1.2 DISPOSIÇÃO RAMO-e-FOLHA • Em LEVINE (2005), a disposição ramo e folha organiza um conjunto de dados e compreende melhor a maneira como os valores se distribuem e se agrupam ao longo da amplitude das observações no conjunto de dados. • Segundo MONTGOMERY (2003), é uma boa maneira de obter uma apresentação visual informativa de um conjunto de dados em que cada x I consiste no mínimo dois dígitos. • Para construir o diagrama de ramos e folhas dividimos cada número xi duas partes:ramo consiste em um ou mais dígitos e uma folha consiste nos dígitos restantes. • Geralmente é escolhido entre 5 e 20 ramos, uma vez escolhidos , eles são listados ao longo da margem esquerda do diagrama. . ramo folha freqüência Valor mínimo Valor máximo Maior concentração dos dados Menor concentração dos dados Distribuição da simetria em torno do valor central. 3) Exemplo: Diagrama de ramos e folhas • Este tipo de gráfico é um modo simples de organizar os dados e que pode facilitar a construção de tabelas de freqüências. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 10 • Podem ser usados para dados quantitativos (numéricos), mas não qualitativos (por exemplo, dados nominais ou por categorias). • Seja o seguinte exemplo: considere que se tenha anotado 20 valores relativos ao tempo de uma atividade, e que se deseja organizá­los em um diagrama de ramos e folhas. • Os valores são os seguintes: 23 ­ 31 ­ 42 ­ 45 ­ 51 ­ 52 ­ 57 ­ 61 ­ 61 ­ 64 ­ 68 ­ 69 ­ 73 ­ 75 ­ 75 ­ 82 ­ 89 ­ 94 ­ 118 – 120, • (1) determina­se o menor e o maior valores; neste exemplo, 23 minutos o menor valor e 120 minutos o maior. • (2) constróem­se categorias nas quais se deseja agrupar os dados a partir menor dezena até a maior, ver Figura 1. • Nas colunas, o 2 representa a dezena dos "20" minutos and o 12 representa a dezena dos "120 minutos". Dezenas de minutos 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| Figura 1. Passo inicial da construção de um gráfico de ramos e folhas • (3) retorna­se aos dados originais e simplesmente coloca­se as unidades referentes às dezenas em cada uma das linhas, ordenadamente. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 11 • Por exemplo, o número 23 é representado por um 3 colocado na linha 2, e 118 pode ser representado na linha 11 por um 8. • Uma vez feito para todos os valores, o diagrama fica com o aspecto da Figura 2. Dezenas de minutos Minutos 2| 3 3| 1 4| 2 5 5| 1 2 7 6| 1 1 4 8 9 7| 3 5 5 8| 2 9 9| 4 10| 11| 8 12| 0 Figura 2. Diagrama de ramos e folhas fonte: http://www.estatistica.eng.br/ramosefolhas.htm 1.2.1 Exercicios 4)FARBER(2009, p.30)O Securities and Excange Comission esta investigando uma empresa de serviços financeiros que tem 86 corretores.O SEC decide revisar os registros de uma amostra aleatória de 10 corretores. Gerar uma lista de 10 numeros aleatórios de 1 a 86 e construa o grafico de ramo e folha. 5) FARBER (2009, p.53)Notas de exames .Use um diagrama ramo­e­folha para representar os dados . O dados representam as notas de uma turma de biologia em um teste. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 12 75 83 88 95 85 92 95 87 90 94 91 76 80 68 73 91 87 75 80 85 67 91 82 79 1.3 TABELAS E GRÁFICOS PARA DADOS NUMÉRICOS • FARBER (2009, p.32)Distribuição de freqüência: é uma tabela que mostra classes ou intervalos das entradas de dados com uma contagem do numero de entradas em cada classe. • A frequencia f de uma classe é o numero de dados em uma classe. • O numero de classes deve estar entre 5 e 20. Construção da distribuição de freqüência Número de grupos de classe para a tabela Intervalo ou amplitude de cada classe Limite de cada grupo. OBTENDO OS INTERVALOS DE CLASSES Amplitude do intervalo= valor máximo ­ valor mínimo número de grupos de classes desejado 1.3.1Exercicios 6) FARBER (2009, p.40) Use as entradas de dados minimas e máximas e o numero de classes para encontrar a largura da classe, os limites inferiores e superiores da classe. a) minimo: 7 maximo:58 6 classes b)minimo: 11 maximo:94 8 classes 7) FARBER (2009, p.41) Use a distribuição de frequencia para construir uma distribuição de frequencia expandida: Cleveland, OH- temperaturas altas ( F) classe frequencia 20-30 19 31-41 43 Prof. Jorge Roberto Grobe 11/09/14 15:35:40 Ponto médio ES34MTEC Frequencia (%) relativa Frequencia acumulada 13 42-52 68 53-63 69 64-74 74 75-85 68 86-96 24 Sintaxe FREQÜÊNCIA(Dados; Classes) Dados representa a referência para os valores que serão computados. Classes representa a matriz dos valores limites ou pode acrescentar também a matriz de dados para fazer uma contagem de quantos de cada dado amostra se repetem. Chamamos de freqüência os números de elementos da população ou amostra pesquisada que correspondem a cada faixa do fenômeno estudado. TROTTA(1988) 1.3.2 A Distribuição de Frequencia Relativa e a Distribuição de Percentagem Freqüência relativa : n = numero total de pesquisados , ni =freqüência correspondente , onde a freqüência relativa é dada em porcentagem (%). FARBER (2009, p.34) A frequência relativa de uma classe é a porção ou porcentagem de dados que está em determinada classe. frequencia relativa= frequencia da classe tamanho da amostra Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 14 1.3.3 Exercicios 8) RANKING Veículos mais vendidos - outubro de 2012 1º 2º 3º 4º 5º 6º 7º 8º 9º VOLKSWAGEN GOL FIAT UNO FIAT PALIO VOLKSWAGEN FOX FIAT SIENA CHEVROLET CELTA FIAT STRADA VOLKSWAGEN VOYAGE RENAULT SANDERO CHEVROLET CORSA SEDAN 10º 27737 21370 18824 13191 12512 12074 11643 9710 9429 8505 Fonte:http://carros.ig.com.br/ 8.1 Em 1982 no estado do Acre , havia 62279 alunos matriculados no 1 0 grau , 4221 no 2o grau e 1713 no ensino superior. Construa a tabela de distribuição de freqüências e o correspondente gráfico. Tipos de freqüência Freqüência relativa porcentagem Acumulada % ensino 1o grau 20 grau Superior total 1.3.4 A Distribuição Acumulada É uma tabela de percentagens acumuladas, conhecida como distribuição de percentagem acumulada. A distribuição acumulada e seu respectivo polígono acumulado fornecem informações sobre conjuntos de dados que não podem ser obtidas a partir da própria distribuição de freqüência. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 15 1.3.5 Exercicios 9) FARBER (2009, p.42­43) Construa a distribuição de frequencia , o grafico em barras ou histograma , poligono de frequencia, para o conjunto de dados usando o numero de classes. Vendas: 6 classes 4278 3981 4105 5835 4608 1030 1643 3183 1512 2478 2000 1858 1931 1697 1077 1500 1355 2478 1.3.6 Histograma É um gráfico no qual as barras retangulares são construídas nos limites de cada classe. • PODE­SE CONSTRUIR AUTOMÁTICO SEM O LIMITE SUPERIOR 1.3.7 Exercicios 10) LEVINE(2005, p.56) Os dados daqui exibidos representam o custo de energia eletrica durante o mês de julho, para uma amostra aleatoria de dois quartos, em uma cidade grande. 102 153 197 127 82 157 185 90 116 172 Tarifas de Serviços ( em dólares) 111 141 128 148 149 144 213 206 168 130 175 109 165 123 167 95 163 150 154 130 143 187 166 139 149 108 119 183 151 114 135 191 137 129 158 a) forme uma distribuição de frequencia que possua : (1) cinco intervalos de classes. (2)seis intervalos de classes (3) sete intervalos de classes. Dica:para ajudar na decisão sobre a melhor forma de construir os limites de classe deve­se posicionar os dados brutos em uma disposição de ramo­e­folha ( deixando que as folhas sejam os dígitos secundarios) ou em uma disposição ordenada. b) forme uma distribuição de frequencia que possua sete intervalos de classe com limites de classes superiores iguais a $99, $119 e assim por diante. Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34MTEC 16 c) forme a distribuição de percentagem, com base na distribuição de frequência desenvolvida no item (b). d) desenhe o histograma ou grafico em barras da frequencia. * para fazer o grafico do histograma deixar o limite inferior e superior como texto e intervalo de dados em linhas. e)desenhe o poligono de percentagem. f) forme a distribuição de frequência acumulada. g) forme a distribuição de percentagem acumulada. h) desenhar a ogiva ( poligono de percentagem acumulada). i) em torno de que valor o custo mensal de energia eletrica está concentrado? j) qual dos graficos que é melhor para representar a distribuição do custo de energia eletrica? 11) Forme uma distribuição de freqüência que possua 7 intervalos de classes com limites de classes superiores iguais a $ 99, $119 e assim por diante. Gerar uma lista de 20 numeros aleatorios entre o limite inferior da primeira classe e limite superior da ultima classe. limite inferior si 1 2 3 4 5 6 7 limite superior frequencia media das classes 99 119 1.4 ELABORANDO GRÁFICOS DE DADOS NUMÉRICOS BIVARIADOS • A partir de uma variável numérica, o histograma, o polígono e a ogiva ou polígono acumulado são ferramentas gráficas apropriadas para fins de utilização. • Para examinar duas variáveis pode­se utilizar outra ferramenta gráfica denominada diagrama de dispersão. • O desenho de duas variáveis numéricas foi popularizado no século 19 por Sir Francis Galton. • Quanto a relação das variáveis elas podem ser crescentes (positiva ) ou decrescentes (negativas) em que uma variável cresce e a outra decresce. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 17 1.4.1 Exercicios 12) A tabela a seguir representa um conjunto de dados, a partir de uma amostra de n =11 itens: x 7 5 8 3 6 10 12 4 9 15 y 21 15 24 9 18 30 36 12 27 45 18 54 a) desenhe o diagrama de dispersão b) existe uma relação entre X e Y? Explique 13) Os dados a seguir representam o preço aproximado de varejo( em dólares), bem como o custo da energia elétrica por ano ( em dólares) de 10 refrigeradores do tipo dúplex de tamanho médio : preço custo da energia elétrica por ano ($) 850 760 900 870 1100 800 650 750 750 570 48 54 58 66 77 66 70 81 72 78 a) com custo de energia elétrica no eixo X e o preço no eixo Y, construa um gráfico de dispersão. b)parece haver uma relação entre o preço e o custo da energia?Em caso afirmativo, a relação é positiva ou negativa? c)você poderia supor que os refrigeradores com preços mais elevados tivessem maior eficácia no consumo de energia elétrica? Isto é identificado através de dados? 1.5 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS Ao lidar com variáveis categóricas as observações são alocadas em tabelas resumidas e podem ser exibidas em gráficos de barras, pizzas ou diagrama de Pareto. Gráficos em barras : cada categoria é ilustrada por uma barra, cujo comprimento representa a freqüência ou porcentagem das observações que se enquadram na categoria Gráficos de pizza: expressam dados em dados categóricos a partir de uma tabela resumida. Ele se baseia no circulo de 360oe mostra a porcentagem de cada categoria .e que perfazem ao todo 100% O diagrama de Pareto : fornece mais informações que os dois gráficos citados acima. O diagrama de Pareto é um tipo especial de gráfico de barras verticais, no qual as respostas categóricas são desenhadas em ordem de classificação decrescente em relação as suas freqüências, e combinadas com um polígono acumulado no mesmo gráfico. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 18 Ele atinge sua máxima utilidade quando a variável categórica de interesse contem muitas categorias. No eixo vertical á esquerda pode conter as freqüências ou percentagens. Uma característica importante que norteia este dispositivo é a capacidade de separar os “poucos dados vitais” e dos “muitos dados triviais”, possibilitando que seja dada a atenção as categorias importantes. • selecionar as duas colunas/dados/classificar/2a coluna/decrescente 1.5.1 Exercicios 14) Uma variável categórica possuía 4 categorias com as seguintes percentagens de ocorrência: categoria Percentagem Categoria Percentagem A 12 C 35 B 29 D 24 a) construa um gráfico de barras b)construa um gráfico de pizza 15) Um analista de rede registrou as causas que deram origem a quedas de sistemas de rede durante os últimos 6 meses: Motivo para a falha Conexão física Software do servidor Falha de energia Hardware do servidor Servidor sem memória Largura de banda inadequada Freqüência 1 29 3 2 32 1 * selecionar as duas colunas/dados/classificar/2a coluna/decrescente Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 19 a) elabore um diagrama de Pareto 35 30 Servidor sem memória Software do servidor Falha de energia Hardware do servidor Conexão física Largura de banda inadequada 25 20 15 10 5 0 b)discuta sobre os “poucos dados vitais“ em relação aos “muitos dados triviais” correspondentes às causas que dão origem a queda no sistema de rede. 1.6 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS BIVARIADOS • Uma maneira de visualizar dados categóricos bivariados ao procurar padrões ou relações é pela construção de gráficos de barras paralelas ou agrupadas. 1.6.1 Exercicios 16)Os resultados de um estudo realizado como parte de um esforço para otimizar a produção em uma fábrica de semi condutores forneceram dados sobre defeitos para uma amostra de 450 placas. A tabela a seguir apresenta um resumo das respostas as duas perguntas: foi encontrada alguma partícula na matriz que produziu a placa? E a placa é adequada ou inadequada? Qualidade nenhuma da placa partícula adequada inadequada totais Prof. Jorge Roberto Grobe 11/09/14 15:35:41 partícula 320 80 400 ES34MTEC totais 14 36 50 334 116 450 20 * selecionar a tabela inteira ­ gráficos de barras a) construa um gráfico de barras paralelas ou agrupadas da qualidade da placa baseada na condição da matriz? b)construa uma tabela de percentagens totais c)construa uma tabela de percentagens de linhas d)construa uma tabela de percentagens de colunas 17) Um banco de investimentos realizou uma pesquisa de satisfação uma pesquisa de satisfação de clientes numa base mensal, para medir a satisfação em relação a várias áreas de serviços oferecidos pelas suas agências. Os resultados a partir de uma amostra de 200 clientes se deram da seguinte forma: área de serviço tempo de espera no caixa caixa eletrônico aconselhamento sobre investimentos serviço de cheques de viagem segurança de depósitos serviços de manutenção de conta numero de pessoas satisfeitas 123 73 43 25 24 46 numero de pessoas insatisfeitas 65 7 6 11 5 4 Repare que, uma vez nem todos os clientes utilizaram todos os serviços, o número de respostas para cada área de serviço é diferente. a) construa a tabela de percentagens por linha. b) construa a tabela de percentagens por coluna c) construa a tabela de percentagens totais. d)que tipo de porcentagem­ de linha, de coluna ou total­ você acha que serve de maior auxilio na compreensão desses dados? Por que? R: os percentuais de linha são úteis para demonstrar diferentes taxas de satisfação em relação a vários serviços bancários. e)construa o gráfico de barras paralelas de satisfação do cliente por área de serviço. f)os clientes parecem igualmente satisfeitos com relação a todas as áreas de serviço? Quais áreas parecem precisar de melhorias mais do que as outras ? comente. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 21 R: os clientes não estão igualmente satisfeitos com todas as áreas de serviço do banco. Mais de 91% estão satisfeitos com os caixas eletrônicos, mas somente 65,4% estão satisfeitos com o tempo de espera no caixa. O banco poderia melhorar o nível de satisfação geral dos clientes diminuindo o tempo de espera no caixa. 1.7 EXCELÊNCIA GRÁFICA Descreve e comunica informações estatísticas o Funções de dados gráficos o Mostrar os dados o Fazer com que o observador se concentre na essência do gráfico, e não forma como o gráfico foi desenvolvido. o Evitar distorções o Incentivar comparação de dados o Servir a um propósito claro. o Estar integrado com as descrições estatísticas e verbais do gráfico. Princípios da excelência gráfica Apresentações bem elaboradas de dados, que fornece substância, estatística e forma. Comunica idéias complexas com clareza, precisão e eficiência Fornece ao observador o maior número de idéias, no menor espaço de tempo, com menor volume de impressão. Envolve várias dimensões. Exige que seja transmitida a verdade sobre os dados. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 22 CAPITULO 2 2 MEDIDAS NUMERICAS DESCRITIVAS • Para CRESPO (1993),a coleta , a organização e a descrição dos dados estão a cargo da estatística descritiva. • Conforme WITTE(2005),a estatística descritiva, oferece uma serie de ferramentas, tais como tabelas, gráficos e médias, no sentido de organizar e resumir informações em relação a um conjunto de observações existentes . 2.1 MEDIDAS DE TENDENCIA CENTRAL, VARIAÇÃO E FORMATO • FARBER (2009, p.55) é um valor que representa uma entrada típica ou central do conjunto de dados. • As tres medidas da tendencia central mais comum são : • média , mediana e a moda A MEDIA ARITMÉTICA É a medida mais utilizada X= n X ∑ i=1 i n Xi = i-ésima observação da variável X n = numero de observações da variável X Quando utilizar a média aritmética • O calculo é baseado em todas as observações, a média aritmética é altamente afetada por um ou mais valores extremos. • Então a média aritmética apresenta distorções daquilo que os dados estão representados, assim sendo, a média aritmética não seria a melhor medida de tendência central a ser utilizada para descrever ou resumir um conjunto de dados que possua valores extremos. A MEDIANA é o valor do meio em uma seqüência ordenada de dados. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 23 Mediana é o valor para o qual 50% das observações são menores e 50% das observações são maiores. observações classificadas impar: par = media dos valores numéricos centrais n1 2 MED • Retorna a mediana de um conjunto de números. Em um conjunto contendo um número ímpar de valores, a mediana será o número do meio do conjunto e, em um conjunto contendo um número par de valores, ela será a média dos dois valores do meio do conjunto. Sintaxe • MED(Número 1; Número 2; ...Número 30) Número 1; Número 2;...Número 30 são valores ou intervalos e representam um exemplo. Os números também podem ser substituídos por uma referência. A MODA • È o valor que aparece mais freqüentemente em um conjunto de dados. • A moda não é afetada pela ocorrência de quaisquer valores extremos. • Pode não existir a moda. MODO • Retorna o valor mais comum em um conjunto de dados. • Se houver vários valores com a mesma freqüência, o menor valor será retornado. Um erro ocorre quando um valor não aparece duas vezes. Sintaxe MODO(Número 1; Número 2; ...Número 30) Número 1; Número 2;...Número 30 são intervalos ou valores numéricos. Exemplo =MODO(A1:A50) Média ponderada e média de dados agrupados Definição: é a media de um conjunto de dados cujas entradas tem pesos variados. Onde w é o peso de cada entrada x. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 24 X= ∑ x∗w ∑w Percentis e outros fractis • quartis: divide um conjunto de dados em 4 partes iguais • decis:divide um conjunto de dados em 10 partes iguais • percentis:divide um conjunto de dados em 100 partes iguais • exemplo: se o peso de uma criança de 6 meses de idade esta no 78 percentil, a criança pesa mais que 78% de todas as crianças da mesma idade. • Exemplo: o 72 percentil corresponde a uma nota no teste de 1700, significa que 72% dos estudantes teve uma nota de 1700 ou menos. FARBER (2004, p.89,90) QUARTIS • São mais amplamente empregadas medidas de localização não central, e são utilizados para descrever as propriedades de grandes conjuntos de dados numéricos. • Os quartis são medidas que dividem os dados ordenados em 4 partes (quartos). O primeiro quartil Q1 observação ordenada Q1 é valor que faz com que 25% das observações sejam menores e 75% das observações sejam maiores. O Terceiro quartil Q3 Q3 é valor que faz com que 75% das observações sejam menores e 25% das observações sejam maiores. observação ordenada. As regras que são utilizadas para obter os valores de quartil: Se o ponto de posicionamento resultante for um numero inteiro, a observação numérica em questão, correspondente aquele ponto de posicionamento, é escolhida para ser o quartil. Se o ponto de posicionamento resultante estiver entre dois números inteiros, a media de seu respectivos valores é selecionada para ser o quartil. Se o ponto de posicionamento resultante não se tratar de um numero inteiro, nem corresponder ao valor equivalente a metade do caminho entre dois números inteiros, uma regra simples consiste em fazer arredondamento ate o numero inteiro mais próximo e, em seguida, selecionar o valor numérico relativo a observação correspondente. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 25 QUARTIL Retorna o quartil de um conjunto de dados. Sintaxe QUARTIL(Dados; Tipo) Dados representa o vetor de dados na amostra. Tipo representa o tipo de percentil. (0 = MÍN, 1 = 25%, 2 = 50% (MÉDIO), 3 = 75% e 4 = MÁX.) Exemplo QUARTIL(A1:A50; 2) retorna o valor do qual 25% da escala corresponde aos valores mais baixos e mais altos no intervalo A1:A50. AMPLITUDE INTERQUARTIL ( ou dispersão média) Esta medida considera a dispersão nos dados que estão entre os 50% de observações centrais • ou seja chamados de termos do meio. VARIÂNCIA DA AMOSTRA • S 2= mede a variabilidade através dos desvios n X −X 2 ∑ i=1 i n−1 VAR Estima a variância com base em uma amostra. Sintaxe VAR(Número 1; número 2; ...número 30) Número 1,número 2,...número 30 são valores ou intervalos numéricos que representam um exemplo com base em uma população inteira. Calcule a variância da amostra e o desvio padrão. DESVIO PADRÃO DA AMOSTRA S= n X −X 2 ∑ i=1 i n−1 Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 26 O QUE É DESVIO PADRÃO? • Parâmetro que indica o grau de variação de um conjunto de elementos. • Exemplos: a) Dada a temperatura maxima durantes 3 dias em uma cidade A e obteve-se os seguintes valores, 28°, 29° e 30°, a média calcula é : X = 29°. b) Em outra cidade B foi coletado as temperaturas maxima 22°, 29° e 35°. E média calculada é de: X = 29°. • As médias têm o mesmo valor, mas os moradores da cidade A viveram três dias de calor, enquanto os cidade B tiveram dois dias de calor e um de frio. • Para diferenciar uma média da outra, foi criada a noção de desvio padrão, que serve para dizer o quanto os valores dos quais se extraiu a média são próximos ou distantes da própria média. • O desvio padrão da cidade B é muito maior que o da cidade A. Fonte:http://www.carlosescossia.com/2009/09/o-que-e-desvio-padrao.html *''menor o desvio padrão, mais homogênea é a minha amostra''. Fonte:http://fisioterapiahumberto.blogspot.com.br/2009/12/desvio-padrao-afinal-de-contas-para- que.html TAKAHASHI(2010, p.51) comparando duas amostras A e B, o desvio-padrão que for menor , indica que os valores estãos parecidos. O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: o desvio padrão é sempre não negativo e será tanto maior, quanto mais variabilidade houver entre os dados. se s = 0, então não existe variabilidade, isto é, os dados são todos iguais. Interpretando a variância e o desvio padrão. Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 27 • A variância e o desvio padrão medem a dispersão média em torno da média aritmética, isto é, como as observações maiores flutuam acima da média aritmética e como as observações menores se distribuem abaixo dela. DESVPAD Estima o desvio padrão com base em um exemplo. Sintaxe DESVPAD(Número 1;número 2;...número 30) Número 1, número 2, ... número 30 são valores ou intervalos numéricos que representam uma amostra com base em uma população inteira. Exemplo =DESVPAD(A1:A50) retorna o desvio padrão estimado com base nos dados indicados. O que desvio padrão indica Neste exemplo 9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2 O desvio padrão é de 7,71, isto indica que eles estão se agrupando em torno deste valor e da sua média 19,29 ou seja e [19,29 – S (7,71); 19,29 + S (7,71)]=[11,58 ; 27] Entendendo a variação dos dados Quanto mais espalhados ou dispersos estiverem os dados, maior serão a amplitude, amplitude interquartil, a variância e o desvio padrão. Quanto menos espalhados ou dispersos estiverem os dados, menores serão a amplitude, amplitude interquartil, a variância e o desvio padrão. Se as observações forem todas as iguais (não exista variação dos dados) a amplitude, amplitude interquartil, a variância e o desvio padrão serão todos iguais a zero. Todas essas medidas são maiores que zero. COEFICIENTE VARIAÇÃO S CV = ∗100 % x S= desvio padrão X = media da amostra • Caracteriza a dispersão ou variabilidade dos dados em termos relativos a seu valor médio. • Mede a dispersão dos dados em relação a média aritmética FORMATO Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 28 regra empirica Significado de Empírico adj. Que se apóia exclusivamente na experiência e na observação, e não em uma teoria: medicina empírica. Fonte: http://www.dicio.com.br/ FARBER( 2004, p.73) , quando os dados estiverem uma distribuição simétrica com formato de curva, o desvio padrão tem as seguintes caracteristicas: • 68% dos dados esta dentro de 1 desvio padrão em relação a média; • 95% dos dados esta dentro 2 desvio padrão em relação a média; • 99,7% dos dados esta dentro 3 desvio padrão em relação a média: Estes percentuais estão descritos na figura 1 a seguir: FIGURA 1: DISTRIBUIÇÃO EM FORMA DE SINO Fonte:http://lauromartins.com/o-ibovespa-e-a-curva-normal/ FARBER (2004,p.74) Teorema de Chebychev • distribuição desconhecida • pode se aplicar as todas as distribuições que não estão em forma de sino (simétrica) • A porção de qualquer conjunto de dados que estejam dentro de k desvio padrao (k>1) 1 da média, pelo menos : 1− 2 k Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 29 • k=2 em qualquer conjunto de dados, 75% dos dados estão dentro de 2 desvios padrão em relação a média. • K=3 88,5% dos dados estao dentro de 3 desvios padrões em relação a média. LEVINE (2005, p.113) Uma outra maneira de verificar o conjunto de dados é seu formato( como os dados estão distribuidos). A distribuição pode ser simetrica ou assimétrica ( distorcida) i) Média aritmética > mediana ;positiva ou assimétrica à direita ( alongamento a direita) Quando a média aritmética é aumentada em função de alguns valores elevados incomuns. Longa cauda a direita, é causada por valores extremamente elevados. Empurram a média para cima. ii)Média aritmética = mediana ;simétrica Os valores baixos e altos estão equilibrados iii)Média aritmética < mediana ;negativa ou simétrica à esquerda (alongamento a esquerda) Quando a média aritmética é reduzida em função de alguns valores elevados incomuns Quando a média aritmética é reduzida em função de alguns valores extremamente baixos. Os valores baixos puxam a média aritmética para baixo. Fonte:http://aprendamatematica.com/site/wp-content/uploads/2012/02/assimetria.jpg Prof. Jorge Roberto Grobe 11/09/14 15:35:41 ES34MTEC 30 Curtose: o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva de sino), utilizada na distribuição de frequencia coeficiente percentílico de curtose C= Q3−Q1 2 P 90−P10 C = 0,263 calculo baseado na curva normal. Condições das curvas C = 0,263 curva mesocúrtica é a própria normal C < 0,263 curva leptocúrtica (apresenta uma curva de freqüência mais fechada que a normal ou mais aguda em sua parte superior) C > 0,263 curva platitúrtica (mais aberta que a normal ou mais achatada na sua parte superior). COEFICIENTE DE CURTOSE DO BR.OFFICE CALC MAGRINI (2008), o Coeficiente de Curtose do CALC (CC) é calculado pela fórmula abaixo, quando registramos a função CURT( ) (KURT() na versão em inglês). Esta função do Calc se aplica a Tabelas Primitivas ou Rol e não a Distribuição de freqüências. n n 1 CC n 1. n 2 . n 3 Xi X Sx 4 3 n 1 n 2. n 3 2 A interpretação dos valores assumidos pelo CC é mostrada a seguir, destacando-se que este coeficiente estabelece uma comparação da distribuição em estudo com a Distribuição Normal. CC = 0 CC < 0 CC > 0 Prof. Jorge Roberto Grobe 11/09/14 15:35:41 Distribuição Mesocúrtica Distribuição Platicúrtica Distribuição Leptocúrtica ES34MTEC 31 CURT Retorna o valor de kurtosis de um conjunto de dados (são necessários ao menos 4 valores). Sintaxe CURT(Número 1; Número 2; ...Número 30) Número 1, Número 2,... Número 30 são argumentos numéricos ou intervalos que representam uma amostra de distribuição aleatória. Exemplo =curt(A1;A2;A3;A4;A5;A6) exemplo: 9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2 Calcule a curtose. CC > 0 • Coeficiente de assimetria Distribuição Leptocúrtica de Pearson: ou COMANDO DISTORÇÃO (ASSIMETRIA) : O valor enviesado caracteriza o grau de assimetria de uma distribuição em torno de sua média. • Um valor enviesado positivo indica uma distribuição com uma ponta assimétrica que se estende em direção a valores mais positivos. • Um valor enviesado negativo indica uma distribuição com uma ponta assimétrica que se estende em direção a valores mais negativos. exemplo: 9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2 Calcule a distorcao ou assimetria 2.1.1 Exercicios 1) FARBER (2009, p. 63-66) Encontre a média, a mediana e a moda dos dados, se possível. 30 35 19 22 Prof. Jorge Roberto Grobe 11/09/14 15:35:42 20 ES34MTEC 20 23 21 35 25 32 2) Encontre a média ponderada dos dados das notas e porcentagens na nota final para um aluno de estatistica. Qual é a nota média do aluno? nota Porcentagem na nota final Dever de casa 85 5,00% testes 80 35,00% projetos 100 20,00% apresentações 90 15,00% Teste final Resposta: 89 93 25,00% 3) Os salarios médios iniciais por graduação atingida para 25 funcionários em uma empresa são dados a seguir. Qual é a média dos salários iniciais para esses funcionários? 8 com MBA: $ 45500 Resposta : e 17 com bacharelado em administração :$32000. 8∗45500+ 17∗32000 =$ 36320 8+ 17 4) Estudantes em uma aula de psicologia experimental realizaram uma pesquisa sobre depressão como sinal de estresse. Um teste foi administrado com uma amostra de 30 estudantes. As notas são fornecidas: 44 51 11 90 76 36 64 37 43 72 53 62 36 74 51 72 37 28 38 61 47 63 36 41 22 37 51 46 85 13 a) encontre a média e a mediana. Resposta: media mediana 49,2333 46,5000 b) desenhe um grafico de ramo e folha para os dados usando uma fileira por ramo. Localize a média e a mediana no grafico. Resposta: ramo folha 1 1 2 2 3 6 4 1 5 1 6 1 7 2 8 5 9 0 3 8 6 3 1 2 2 Prof. Jorge Roberto Grobe 11/09/14 15:35:42 6 4 1 2 4 7 6 3 3 6 ES34MTEC 33 c) descreva a forma da distribuição. Resposta: Média aritmética=49,23 é maior que mediana=46,5 ;positiva ou assimétrica à direita ( alongamento a direita) Quando a média aritmética é aumentada em função de alguns valores elevados incomuns. Longa cauda a direita, é causada por valores extremamente elevados. Empurram a média para cima. 5) FARBER (2009, p.78) Listamos uma amostra dos salários anuais em milhares de dólares para os funcionários municipais de Los Angeles e Long Beach: Los 20,2 26,1 20,9 32,1 35,9 23 28,2 31,6 18,3 20,9 18,2 20,8 21,1 26,5 26,9 24,2 25,1 22,2 Angeles Long Beach a) encontre a amplitude, a variância , desvio padrão , coeficiente de variação e formato dos dados. amplitude variancia desvio padrão media coeficiente de variação mediana 17,6000 37,3478 6,1113 26,2556 23,28% 26,100 8,7000 8,7144 2,9520 22,8778 12,90% 22,200 b) interprete os resultados no contexto de um cenário real. 6) FARBER (2004,p.79) O valor médio de terras e construções por acre de uma amostra de fazendas é $1500, com desvio padrão de $200. O conjunto de dados tem distribuição em forma de sino. Estime a porcentagem de fazendas cujos valores das construções e terras por acre estejam entre $1300 e $1700. * use a regra empírica resposta: 68% dos dados esta dentro de um desvio padrão em relação a média ou seja [1500-200; 1500+200] = [1300;1700]. Prof. Jorge Roberto Grobe 11/09/14 15:35:42 ES34MTEC 34 7) FARBER (2004,p.80) Teorema de Chebychev.O tempo médio de mulheres em uma corrida de 400 metros rasos é de 57,07 segundos, com desvio padrão de 1,05. Aplique o teorema de Chebychev para dos dados usando k=2. Interprete os resultados. • k=2 em qualquer conjunto de dados, 75% dos dados estão dentro de 2 desvios padrão 1 1− 2 em relação a média. k 8) FARBER (2004,p.81) A tabela a seguir mostra as alturas em polegadas e pesos em libras dos membros de um time de basquete. Encontre o coeficiente de variação para cada conjunto de dados. Qual a conclusao? altura peso 72 180 74 168 68 225 76 201 74 189 69 192 72 197 70 162 69 174 77 185 73 210 9) FARBER (2004,p.81) Teorema de Chebychev Pelo menos 99% dos dados em qualquer conjunto de dados fica dentro de quantos desvios padrão da média? Explique como você obteve essa resposta. Solução: 0,99=1− 1 k=10 desvio padrões. k2 Prof. Jorge Roberto Grobe 11/09/14 15:35:42 ES34MTEC 35 2.2 ANÁLISE EXPLORATÓRIA DE DADOS • LEVINE (2005) O resumo dos 5 números: X menor Q1 Mediana Q 3 X maior • • para serem perfeitamente simétricos as distâncias entres eles tem que ser o mesmo, caso contrário terá uma assimetria a esquerda ou a direita. • O BOX PLOT ( pode ser chamado de Box and Whisker Plot diagrama caixa e bigode; • Box é caixa representando a caixa do gráfico e whisker (bigode) representando as linhas laterais. • È uma representação gráfica que descreve simultaneamente várias características importantes de um conjunto de dados, tais como centro, dispersão, desvio de simetria e identificação das observações que estão longe dos dados.(outliers) • Maior variabilidade é indicado através da caixa de maior tamanho e pelas linhas mais longas. • Ela é valiosa quando se compara dois ou mais categorias. 10) FARBER (2004,p.90-91-92) Os gols marcados por um jogo de um time de futebol representam o primeiro quartil para todos os times da liga. O que podemos concluir sobre gols marcados pelo time por jogo? 11) O numero de dias de férias usadas por uma amostra de 20 funcionários em um ano recente. 3 9 2 1 7 5 3 2 2 6 4 0 10 0 3 5 7 8 6 5 a) encontrar o primeiro, o segundo e o terceiro quartis do conjunto de dados. TIPOS minimo Q1 Q2=MEDIANA Q3 maximo 0,000 2,000 4,500 6,250 10,000 Prof. Jorge Roberto Grobe 11/09/14 15:35:42 0 1 2 3 4 ES34MTEC 36 b) desenhar grafico de caixa e bigode que representam o conjunto de dados. 12) ASSISTINDO TV . O numero de horas que uma amostra de 28 pessoas assiste TV diariamente. 2 4 1 5 7 2 5 4 4 2 3 6 4 3 5 2 0 3 5 9 4 5 2 1 3 6 7 2 a) até quantas horas 75% das pessoas assistem TV diariamente? Resposta: até 5 horas tem 75% das pessoas que assistem televisão. b) qual a porcentagem de pessoas que assistem mais do que 4 horas de TV por dia? Resposta: ate 4 horas é 50% das pessoas que assistem televisao. c) se selecionarmos uma pessoa aleatoriamente a partir da amostra, qual é a probabilidade desta pessoa assistir menos do que 2 horas de TV por dia? Escreva a resposta em porcentagem. Resposta: 25% 2.3 O COEFICIENTE DE CORRELAÇÃO • Coeficiente de correlação (ρ) cujos valores se estendem para -1 para uma correlação perfeitamente negativa, se for +1 correlação perfeitamente positiva. • Perfeito significa se todos os pontos forem desenhados em um diagrama de dispersão, eles podem estar ligados a uma reta. • Então o coeficiente de correlação mede o grau de associação entre duas variáveis. Prof. Jorge Roberto Grobe 11/09/14 15:35:42 ES34MTEC 37 as duas matrizes tem que ser do mesmo tamanho coeficiente aproximando de +1 ou -1 torna-se mais forte aproximando de zero , existe pouca ou nenhuma relação linear. Comandos : correl ou pearson Fórmula do coeficiente de correlação de Pearson Sejam xi e yi os valores das variáveis X e Y. e são respectivamente as médias dos valores xi e yi. A fórmula do coeficiente de correlação de Pearson é então, fonte: http://stat2.med.up.pt/cursop/regressao/imagens/formula_correlacao.html 13)Os dados a seguir, representam os valores relativos a tarifas cobradas em função de cheques devolvidos ($) em uma amostra de 23 bancos, correspondendo a clientes de conta corrente que mantém um saldo de $ 100, e as tarifas mensais ($) cobradas, caso o saldo médio do cliente permaneça abaixo do saldo mínimo exigido, correspondendo a uma amostra de 26 bancos, para clientes de conta corrente que mantém um saldo médio de $1500. tarifas de cheques devolvidos Prof. Jorge Roberto Grobe 11/09/14 15:35:48 26 28 20 20 21 22 25 25 18 25 15 20 18 20 25 25 22 ES34MTEC30 30 15 20 29 0 0 tarifas de serviços mensais 12 8 5 5 6 6 10 10 9 7 7 5 0 10 6 9 12 0 5 10 8 5 5 9 38 a) calcule a correlação entre as duas amostras. R: -0,0611 correlação fraca, não existe um grau de associação entre tarifas de cheques devolvidos e tarifas de serviços mensais. 14) O gerente de operações de uma industria que manufatura pneus deseja comparar o real diâmetro interno de dois tipos de pneus, cada um dos quais devendo ser igual a 575 mm. Uma amostra de 5 pneus de cada tipo foi selecionada , e os resultados, representando os diâmetros internos desses pneus, ordenados do menor para o maior ,são os seguintes: tipo x 568 570 575 578 584 tipo y 573 574 575 577 578 a) calcule o coeficiente de correlação . b)o quão forte é a relação entre x e y? Explique Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 39 CAPITULO 3 3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA 3.1 CONCEITUE OS Básicos de Probabilidade ◦ FARBER(2009, p.105) exemplo simples do uso de termo experimento de probabilidade, espaço amostral, evento e resultado: ◦ Experimento de probabilidade: lançamento de um dado de 6 lados ◦ Espaço amostral: {1,2,3,4,5,6} ◦ Evento : sair um numero par {2,4,6} ◦ Resultado : rolar um numero 2 : {2} ◦ Em WITTE(2005), probabilidade refere-se a proporção, ou fração, de vezes que um determinado resultado é passível de ocorrer. • Segundo LEVINE (2005), probabilidade é a chance ou possibilidade de que um determinado evento venha ocorrer. • Valores entre 0 e 1 • Evento impossível – não tem chance de ocorrer é igual a zero • Evento certo igual a 1 • FARBER (2009,p.109), Probabilidade clássica ou teórica é usada quando cada resultado em um espaço amostral é igualmente possível de ocorrer. • • A probabilidade clássica para um evento E é dada por: P E = numero resultados no evento E numero total de resultados no espaço amostral Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 40 • Jogando um dado de 6 lados : • Evento A: lançar um 3 R:1/6 • Evento B: lançar um 7 R:0 • Evento C: lançar um numero menor que 5. R:4/6=2/3 PROBABILIDADE EMPÍRICA ( ou estatistica) FARBER (2009, p.110), basea-se em observações obtidas de experimentos de probabilidades. A probabilidade empírica de um evento E é a frequência relativa do evento E. P E = frequencia do evento E frequencia total 15) Uma empresa esta conduzindo uma pesquisa on-line com indivíduos selecionados aleatoriamente para determinar se o congestionamento no transito é um problema em sua comunidade. A distribuição de frequência mostra os resultados . Qual é a probabilidade de que a próxima pessoa que responda a essa pesquisa diga que o congestionamento é um problema sério em sua comunidade? resposta Numero de vezes f É um problema sério 123 É um problema moderado 115 Não é um problema 82 320 Resposta: 123 =0,3844=38,44 % 320 EVENTOS E ESPAÇOS AMOSTRAIS • Para MONTGOMERY(2003), um experimento é a medição de uma corrente em um fio de cobre. • Com repetições diárias de medidas, os resultados podem diferir levemente, devido a pequenas variações nas temperaturas ambientes, nos medidores, química do fio, etc. Evento Simples FARBER(2009, p.106): consiste um único resultado 16) Determine o numero de resultados em cada evento. Escreva se cada evento é simples ou não. • Para um controle de qualidade, selecionar aleatoriamente uma peça de maquina de um lote que foi fabricado naquele dia.O evento A é selecionar uma peça de maquina com um defeito específico. R: evento simples Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 41 • Lançar um dado de 6 lados. O evento B é rolar pelo menos um numero 4. R:nao é simples. 17)DOMENICO (pag. 127), • lançamento de uma moeda • a aposta em um jogo qualquer da loteria esportiva. Espaço amostral- é o conjunto de todos os resultados possíveis de um experimento aleatório. 18)DOMENICO ( pag.127) , no lançamento de um dado, o espaço amostral dos números voltados para cima é o conjunto: S={1,2,3,4,5,6}, o numero de elementos de S é n(S)=6. Evento- é um subconjunto do espaço amostral de um experimento aleatório. 19) DOMENICO ( pag.127), seja o experimento aleatório jogar um dado e verificar se a face voltada para cima é impar. O espaço amostral é: S={1,2,3,4,5,6} O evento A é : {1,3,5} EVENTOS Evento certo: é um evento igual ao espaço amostral. S={1,2,3,4,5,6} Evento impossível: {} Evento elemento : {5} 3. 2EVENTOS UNIÃO , INTERSECÇÃO E COMPLEMENTAR União- são os resultados que estão contidos nos dois eventos. E1∪E2 Intersecção- são os resultados que estão contidos em ambos os eventos. E1∩ E2 Complemento – são os resultados que não estão no evento E. E’=S-E MONTGOMERY(2003). 3.1.1Exercicios DECIDA SE O EVENTO É SIMPLES OU NÃO NOS EXERCICIOS 1 E 2. 21)FARBER(2009,p.115) Um computador é usado para selecionar aleatoriamente um numero entre 1 e 2000. O evento A é selecionar 359. RESPOSTA: EVENTO SIMPLES 22)FARBER(2009,p.115) um computador é usado para selecionar aleatoriamente um numero entre 1 e 2000. O evento B é selecionar um numero menor que 200. R: não é um evento simples , pois tem mais de um resultado. Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 42 23) Jogar uma moeda e selecionar aleatoriamente um numero de 0 a 9. Qual a probabilidade de obter coroa e selecionar um 3? R:1/2* 1/10= 0,05 24) (DOMENICO, pag.128) Seja o lançamento de um dado; forneça os eventos ao encontrar na face voltada para cima: a) números pares b) números ímpares c) números menores que 3 d) números primos 25) DOMENICO ( pag. 128), seja o lançamento de um dado e a verificação da face voltada para cima, o espaço amostral:S={1,2,3,4,5,6}, sejam os eventos : a) face par : A= {2,4,6} b) divisores de 6: B= {1,2,3,6} c) múltiplo de 5:C={5} i) A∪B = {1,2,3,4,6} A∩B = ii) {2,6} A∩C = { } * A e C são mutuamente exclusivos, pois não ocorrem ao mesmo tempo. iii) • se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral S um espaço equiprovável ou uniforme. • Espaço não -equiprovável : onde todos os pontos amostrais de um evento tem diferentes possibilidades de ocorrência. • p1+p2+...+pn=1 26) DOMENICO ( pag. 130), na disputa de um campeonato mundial de futebol , a chance do Brasil ser campeão é o dobro de chance da Argentina ser campeã. Qual é a probabilidade do Brasil ser o campeão? Solução : P(Argentina)= p P(Brasil)=2p P(A)+P(B)=1 P(B) =2/3 27) DOMENICO ( p.129-130) Suponha que numa caixa existem 7 bolas, sendo 2 pretas, 3 brancas e 2 vermelhas. Sendo o espaço amostral equiprovável, determine, na retirada de uma bola da caixa, a probabilidade: a) vermelha b) não preta c) preta ou branca d) preta ou vermelha 28) Internacional, Cruzeiro , Corinthians e Flamengo vao disputar o titulo do campeonato brasileiro de futebol. As chances do Corinthians e do Cruzeiro serem vencedores são iguais, mas a chance do Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 43 Internacional é o dobro da chance do Cruzeiro e a chance do Flamengo é o triplo da chance do Internacional. a) qual é a probabilidade do Corinthians ser campeão? R:1/10 b) qual é a probabilidade do Flamengo ser campeão: R:3/5 • P(A)+P(B)+P(C)+P(D)=1 29) Medidas do tempo necessário para completar uma reação química podem ser modeladas com o espaço amostral S = 0 ;∞ . Dados os eventos : E1=[1;10) E2=(3;118). a) E1∪ E2 b) E1’=S-E1 c) E1∩ E2 d)E1’∩ E2 respostas:a) [1;118[; b) ]0;1[UNIAO [10;inf [ ;c) ]3;10[;d) [10;118[ 30) FARBER (2009, p.116) Dias de sol e chuva .Uma viagem de 4 dias para Seatle, Washington , em outubro. a) faça um diagrama de arvore dos dias de sol e chuva para sua viagem. b) liste o espaço amostral c) liste os resultados para o evento que ira chover exatamente em um dia. Dia 1 sol chuva 31) FARBER (2009, p.117) use a distribuição de frequencia, que mostra o numero de eleitores americanos ( em milhoes), de acordo com a idade: Idade dos eleitores Frequencia ( em milhoes) 18 a 20 anos 5,8 21 a 24 anos 8,5 25 a 34 anos 21,7 35 a 44 anos 27,7 45 a 64 anos 51,7 Acima de 65 anos 26,7 Encontre a probabilidade de que um eleitor , escolhido aleatoriamente, esteja: a) entre 21 e 24 anos Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 44 resposta: 8,5 =5,98 porcento 142,1 b) entre 35 e 44 anos c) não esteja entre 18 e 20 anos d) não esteja entre 25 e 34 anos. 3.2 TABELA DE CONTINGENCIA Em LEVINE (2005), o comportamento de compra com relação a aparelho de televisão com tela grande. efetivamente comprou planejou em adquirir sim (A) não (A') total sim Não (B) (B') total 200 50 250 100 650 750 300 700 1000 • Espaço amostral: coleção de todos os eventos possíveis. • O espaço amostral é de 1000 famílias • O complemento de A inclui todos os eventos que não fazem parte de A pode ser escrito por A’. PROBABILIDADE SIMPLES (marginal) Em LEVINE (2005), a probabilidade simples é chamada de probabilidade marginal, uma vez que ela pode ser obtida através da margem apropriada n o de familias que adquiriu 250 P planejou em adquirir= = =25 % total de familias 1000 È a chance de 25% de uma família tenha planejado em adquirir uma tv com tela grande. 32) PROBABILIDADE SIMPLES ( MARGINAL) Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 45 P(B)=250/1000 pode-se escrever P(B e A1)+P(B e A2)=200/1000+50/1000=250/1000 33)Calculando a probabilidade de um aparelho de tv com tela grande adquirido seja HDTV nos últimos 12 meses, dado pela tabela de contingência: comprou DVD (B) comprou HDTV (A) HDTV (sim) HDTV (não) total sim Nao 38 70 108 total 42 150 192 80 220 300 a) Encontre a probabilidade de que uma família que tenha adquirido um aparelho de tv HDTV. Resposta: 80/300, existe uma chance de 26,7% de que uma compra aleatoriamente selecionada de um aparelho de televisão com tela grande seja de um HDTV (televisão de alta definição) Probabilidade Combinada Envolvem mais de dois eventos Eles ocorrem simultaneamente 34)EXEMPLO: Uma vez que esse grupo em 200 familias , a probabilidade de escolher uma família que tenha planejado adquirir e comprou uma tv com tela grande é : efetivamente comprou planejou em adquirir sim não total sim não total 200 50 250 100 650 750 300 700 1000 P A e B = P A ∩ B resposta: 200 1000 =20% 35) Encontre a probabilidade de que uma família tenha comprado HDTV e um DVD. comprou DVD (B) Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 46 comprou HDTV (A) HDTV Não HDTV total sim Nao 38 70 108 total 42 150 192 80 220 300 resposta: existe uma chance de 12,7 % de que uma família, aleatoriamente selecionada que tenha adquirido um aparelho de tv com tela grande tenha adquirido um HDTV e um aparelho de DVD. 38 300 =12,7% Calculando a probabilidade marginal P(A)= P(A e B1 )+...+P(A e Bk) são eventos mutuamente excludentes se ambos não ocorrem ao mesmo tempo. 36) Calcular a probabilidade marginal de planejar em adquirir um aparelho de Tv com tela grande. efetivamente comprou planejou em adquirir sim não total resposta: sim não total 200 50 250 100 650 750 300 700 1000 200 50 = 25 % 1000 1000 Regra geral de Adição P A ∪ B = P A P B − P A∩ B P( AouB) P(A ) P( B) P(AeB) 37) DOMENICO (p.131) , seja o lançamento de um dado { 1,2,3,4.6} com eventos equiprováveis. Qual é probabilidade de ocorrer um número par ou um número múltiplo de 3? resposta: P (A∪ B)=P (A)+ P (B)−P ( A∩B) = 3 2 1 4 + − = 6 6 6 6 38) Planejou em adquirir ou efetivamente comprou, calcule esta probabilidade referente a compra de uma tv com tela grande. Use a regra geral da adição. R: 35% Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 47 efetivamente comprou planejou em adquirir sim não total A=efetivamente comprou sim não total 200 50 250 100 650 750 300 700 1000 B=planejou em adquirir P A ∪ B = P A P B − P A∩ B 300 250 200 − =35 % 1000 1000 1000 39) Encontre a probabilidade de que uma família tenha comprado HDTV ou DVD.R:50% comprou DVD (B) comprou HDTV (A) HDTV Não HDTV total sim não 38 70 108 total 42 150 192 80 220 300 3.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos Os eventos são mutuamente excludentes se ambos os eventos não puderem ocorrer ao mesmo tempo. P(A ou B)= P(A) +P(B) ou P A ∪ B = P A P B Em WITTE (2005), resultados mutuamente excludentes não podem ocorrer conjuntamente. Regra da Adição- some conjuntamente as probabilidades em separado de vários resultados mutuamente excludentes para encontrar a probabilidade de que qualquer um desses resultados venha ocorrer. 40) DOMENICO (p.131), seja o lançamento de um dado com eventos equiprováveis. Qual é a probabilidade de ocorrer um número par ou um número multiplo de 5? resposta: 4/6 Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 48 • se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral S um espaço equiprovável ou uniforme. 41) Assumindo que todas as pessoas seja igualmente possiveis de nascer durante qualquer um dos 12 meses do ano, qual é a probabilidade de que Jack tenha nascido: a) em junho? resposta: 1 12 b) em qualquer mês que não seja junho? c)em maio ou junho? 42) Qual é a probabilidade de que uma família, tenha adquirido uma tv com tela grande tenha feito através da net ou do correio? tipo de numero de compra entrevistados loja 183 net 87 correio 30 87 30 MAIS = 39% 300 300 43) Ao longo dos últimos anos, empresas de cartão de credito realizaram um esforço intensivo a fim de obter novas contas de alunos de faculdades. Suponha que um amostra de 200 alunos em sua faculdade tenha indicado as seguintes informações em relação ao fato de os alunos possuírem um cartão de credito bancário e/ou cartão para turismo e lazer: cartão de credito para turismo e lazer cartão de crédito bancario sim não sim 60 60 não 15 65 a) forneça um evento simples resposta : possuir cartão de crédito bancário =0,60 b)evento combinado resposta: possuir os dois cartões c)qual o complemento de possuir um cartão de credito bancário? resposta: não possuir um cartão de credito bancário Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 49 d) por que possuir um cartão de credito bancário e possuir um cartão de credito para turismo e lazer é um evento combinado? Se um aluno for selecionado qual é a probabilidade de que: e) o aluno possua cartão de credito bancário? f)o aluno possua cartão de credito para turismo e lazer? g)o aluno possua um cartão de credito bancário e um cartão de credito para turismo e lazer? resposta: h)o aluno não possua nenhum cartão? resposta: i) a aluno possua cartão de credito bancário ou para turismo e lazer? resposta: j)o aluno não possua um cartão de credito bancário ou possua um cartão de credito para turismo e lazer? Respostas:e)0,6 f)0,375 g)0,3 h)0,325 i)0,675 j)0,7 3.4 Probabilidade Condicional Em LEVINE (2005), ao calcular a probabilidade de um determinado evento, A, sendo conhecida informações sobre a ocorrência de um outro evento B, P(A / B)= probabilidade de A dado que ocorreu B. P A/ B= P A e B P B ou P A∩B P B P(B/A)= probabilidade de B dado que ocorreu A P B / A= P B e A P A ou P B∩A P A P(A e B)= probabilidade combinada de A e B P(A) e P(B) = probabilidades marginais de A e B • Para DOMENICO (p.133), sendo S o espaço amostral de um conjunto de torcedores de futebol, A o evento constituído por torcedores do Palmeiras e B o evento constituídos por torcedores do Flamengo. Prof. Jorge Roberto Grobe 11/09/14 15:35:48 ES34MTEC 50 • Sendo P(A) é a probabilidade de um torcedor que, escolhido aleatoriamente em S, seja palmeirense, enquanto que P(A/B) é a probabilidade de um torcedor flamenguista, escolhido ao acaso, ser também palmeirense. 44) DOMENICO ( p.133), sejam 100 torcedores n(S)=100, 20 torcedores do Palmeiras, 30 torcedores do Flamengo e 10 torcedores do Palmeiras e Flamengo. Qual é a probabilidade de que um flamenguista escolhido seja palmeirense P(A/B): solução: * fazer o diagrama de Venn P A/ B= n A∩B 10 1 = = nB 30 3 S=100 P=20 F=30 F e P=10 10 10 100 20 45) Suponha que fosse informado de que uma família planejava adquirir um aparelho de televisão com tela grande. efetivamente comprou (B) planejou em adquirir (A) sim A não A' total Não sim B B' total 200 50 250 100 650 750 300 700 1000 a)Qual é a probabilidade de que uma família tenha efetivamente comprado o aparelho de Tv com tela grande, sabendo –se que essa família tenha planejado em adquiri-lo? P( B/ A)= P( A∩B) 200 = =0,8 P( A) 250 B= efetivamente comprou A = planejou em adquirir resposta :0,8 46) Qual a probabilidade de que uma família adquiriu um DVD (A) dado que comprou um HDTV (B): Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 51 Comprou DVD Comprou HDTV Sim não HDTV Não HDTV 38 70 total 42 150 80 220 P(A)= adquiriu um aparelho de DVD P(B)= adquiriu um HDTV SOLUÇÃO: 38 P A∩B 300 P A /B= = = 0,475= 47,5% PB 80 300 ARVORES DE DECISÃO 47) Arvore de decisão da empresa de produtos eletrônicos. efetivamente comprou (B) planejou em adquirir (A) sim não total sim 200 50 250 não Total 100 300 650 700 750 1000 conjunto inteiro das famílias A'=750/1000 A =250/1000 B' B P(A'e B')=650/100 P(A' e B)=100/1000 B P(A e B)=200/1000 B' P( A e B')=50/1000 Calculo da probabilidade de P(B). Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 52 P(B/A)= probabilidade de B dado que ocorreu A 200 P B∩ A 1000 P B/ A= = =80% P A 250 1000 entao a P(B)=80%=200/250 A P(A e B)= P(A)*P(B)=200/1000 resulta o valor da tabela 48) MOTGOMERY( 2003, p.40), uma historia de 266 amostras de ar foi classificada com base na presença de duas moléculas raras. Faça A denotar o evento que consiste em todas as amostras de ar em que a molécula rara 1 esteja presente. Faça B denotar o evento que consiste em todas as amostras de ar em que a molécula rara 2 esteja presente. Conforme tabela : Tabela 1: Moléculas em Amostra de Ar MOLECULA 1 PRESENTE (A) MOLECULA 2 PRESENTE (B) nao sim nao 212 24 236 sim 18 12 30 230 36 266 12 P( B∩ A) 266 12 = = Solução: P( B/ A)= P( A) 36 36 266 Molecula 1 presente 230/266 ( nao) 36/266 ( sim) Molecula 2 esta presente 212/230 nao 18/230 sim Prof. Jorge Roberto Grobe 11/09/14 15:35:49 24/36 nao 12/36 sim ES34MTEC 53 INDEPENDÊNCIA ESTATÍSTICA Em WITTE (2005), a ocorrência de um resultado não possui nenhum efeito sobre a • probabilidade de que o outro resultado venha ocorrer. Regra da multiplicação para resultados independentes P(A e B)= P(A) *P(B) Multiplicar as probabilidades em separado de vários resultados independentes para encontrar • a probabilidade de que esses resultados venham ocorrer conjuntamente. Para LEVINE (20005), a independência estatística pode ser determinada utilizando-se a • equação: P(A / B)=P(A) ou P(B/A)=P(B) • MILONE (2004, p.120), independentes são aqueles em que a ocorrencia de um não altera a chance de os outros acontecerem; • • cada um comporta-se a sua própria maneira , sem afetar nem ser influenciado pelos demais. No lançamento de uma moeda , o fato de ter saido cara em uma jogada não modifica a probabilidade de sair cara na seguinte; • a chance de um jogador receber um ás permanece igual se a carta retirada é reposta no baralho antes da próxima extração; • o fato de ter caido cara no lançamento de uma moeda não afeta a possibilidade de sair par no lançamento de um dado; • lançados dois dados, sair face tres em um deles não modifica a chance de sair face 4 no outro. • Exemplo: MILONE ( 2004,p.138) qual a probabilidade de se obter, no lançamento de duas moedas: a) só coroas • b) uma coroa e uma cara Como os eventos são independentes. Soluçaõ : P(Ke K)= p(k) * p(k)=0,25 P(Ke C)= p(k)*p(c) =0,25 • Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 54 49) DOMENICO ( p.134), a probabilidade de quem um casal o marido esteja vivo aos 70 anos é 1/8 e que a mulher esteja viva aos 70 anos é 1/10. Qual é a probabilidade do casal estar vivo aos 70 anos? Solução : 1 1 1 P A∩B= ∗ = 8 10 80 50) DOMENICO (p. 134), seja uma moeda, sendo A={cara, coroa} e um dado , com B={1,2,3,4,5,6}. Qual é a probabilidade de ser obtido o evento coroa na moeda e número impar no dado? Resposta: 1 3 1 ∗ = 2 6 4 51) FARBER( 2009, p.126) Computadores e acesso a internet. Um estudo descobriu que 62% das residencias nos EUA tem computador. Desses 62%, 88% tem acesso a internet. Encontre a probabilidade de que uma residencia americana selecionada aleatoriamente tenha computador e acesso a internet. Resposta:0,62*0,88=0,546 * diagrama da arvore. 52) FARBER( 2009, p.125) A tabela mostra os resultados de uma pesquisa na qual 146 famílias foram questionadas se tem computado e se vao tirar férias de verão este ano. Férias de verão este ano Tem computador sim nao sim 46 11 nao 55 34 total total a) encontre a probabilidade de selecionar aleatoriamente uma família que não vá tirar férias de verao este ano. R:0,3082 b) encontre a probabilidade de que uma família selecionada aleatoriamente tenha computador. R:0,3904 c) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verao este ano, dado que tem computador. R:0,807 P ( B / A)= P ( Ae B) 46/146 46 = = P( A) 57/146 57 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 55 d) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verão este ano e tenha computador. R:0,315 e) os eventos de ter um computador e tirar férias de verão são eventos dependentes ou independentes? solução : P (B / A)= P( B) para ser independentes. P ( B / A)= 46 e 57 P (B)= 101 146 como as duas probabilidades P(B/A) é diferente de P(B) os eventos são dependentes. 53) FARBER (2009, p.135) A tabela mostra o numero de homens e mulheres matriculados em enfermagem no centro de saude da Universidade de Oklahoma em um semestre recente. Um estudante é selecionado aleatoriamente. Encontre a probabilidade de cada evento. Estudantes de enfermagem Estudantes de outros total cursos homens 95 1015 mulheres 700 1727 total a) o estudante é homem ou estuda enfermagem. R:0,512 b) o estudante é mulher ou não estuda enfermagem. R: 0,762 c) o estudante não é mulher ou estudante de enfermagem. R:0,589 d) os eventos ser homem e ser estudante de enfermagem são mutuamente exclusivos? Explique. R: não são mutuamente exclusivos, por que um homem pode estudar enfermagem. MILONE (2004, p.139) Probabilidade de ocorrencia disjunta dos eventos A e B. Mutuamente excludentes Mutuamente não excludentes P(A ou B)=P(A) + P(B) P(A ou B)=P(A) + P(B)- P(Ae B) 54) Qual a probabilidade de se retirar , de um baralho, em uma única tentativa: a) um ás ou valete solução : a) b) um ás ou uma carta de espadas 13 4 4∗13 4 4 4 2 + = + − = b) 52 52 13 52 52 52∗52 13 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 56 3.5 Teorema de Bayes • Segundo LEVINE (2005), a probabilidade condicional leva em consideração informações sobre a ocorrência de um evento para encontrar a probabilidade de um outro evento. • Determina a probabilidade de que um determinado efeito tenha ocorrido em função de uma causa específica. P Bi / A= P A/ Bi P Bi P A/ B1 P B1P A /B 2 P B 2...P A/ BK P B K 55)LEVINE( 2005, p.162 ) A empresa está avaliando a comercialização de um novo modelo de aparelho de televisão. No passado, 40% dos televisores introduzidos pela empresa obtiveram sucesso e 60% não. Antes de introduzir o aparelho de televisão no mercado, o departamento de pesquisas de mercado realiza um amplo estudo e divulga um relatório favorável ou desfavorável. Anteriormente, 80% dos aparelhos de televisão haviam recebido um relatório favorável da pesquisa de mercado, e 30% dos aparelhos de televisão que não obtiveram sucesso haviam recebido um relatório favorável. Qual é a probabilidade de que o televisor obterá sucesso? Solução: Sejam os eventos S= tv bem sucedida S’=tv mal sucedido F = relatório favorável F’=relatório nao favorável Dados as probabilidades: Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 57 P(S)=0,4 P(S’)=0,6 P(F/S)=0,8 P(F/S’)=0,3 P ( S / F )= P (S / F ) P (S ) P ( F / S) P ( S)+ P (F / S ' ) P (S ' ) Qual é a probabilidade de que o televisor obterá sucesso? P(S/F)? P( S /F )= 0,40∗0,80 0,40∗0,80+ 0,60∗0,30 Resposta: a probabilidade de um modelo de TV ser bem sucedido , sendo conhecido que foi recebido um relatório favorável , é igual a P(S /F) =0,64 ARVORE DA DECISÃO S S' 0,4 F 0,6 F' 0,8 0,8*0,4 F F' 0,2 0,3 0,7 0,4*0,2 0,6*0,3 0,6*0,7 Cálculos do Teorema de Bayes Probabilidades Event Condicion Combina o A Priori al da Revisada S 0,4 0,8 0,32 0,64 S' 0,6 0,3 0,18 0,36 Total: 0,5 digitar os dados conforme está pedindo no problema. No CAL PARA RESOLVER 1 Cálculos do Teorema de Bayes 2 3 Probabilidades A Eve Prio Condici Combin Revisad 4 nto ri onal ada a =D5/$D7 5 S X Z =B5*C5 $ =D6/$D7 6 S' Y T =B6*C6 $ Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 58 7 Total: =D5+D 6 *X e Y a soma é 100% (Verdadeiro e Falso) *Z e T é a condicional é dado no problema. 3.5.1 Exercicios 56) A probabilidade de que uma pessoa seja portadora de uma certa enfermidade é 0,03. Testes diagnósticos médicos encontram-se disponíveis para determinar se a pessoa efetivamente é portadora de uma enfermidade. Se a enfermidade estiver realmente presente, a probabilidade de que o teste diagnóstico médico apresente um resultado positivo(indicando) que a enfermidade está presente) é 0,9. Se a enfermidade não estiver efetivamente presente , a probabilidade de um resultado positivo para o teste (indicando que a enfermidade está presente) é 0,02.Suponha que o teste para diagnóstico médico tenha apresentado um resultado positivo( indicando que a enfermidade está presente). Qual é a probabilidade de que a enfermidade esteja efetivamente presente? Qual é a probabilidade de um resultado positivo para o teste? Solução :evento D=é portador D’=não é portador T=o teste é positivo T’= o teste não é positivo fazer a arvore de decisão P(D e T )=P( T / D)*P(D)=probabilidade de T dado que saiu D vezes a probabilidade de D. Resolver na planilha eletrônica do libreOffice Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 59 EVENTOS EVENTOS F1 F2 F3 Ai 0,0270 REVISADA P(A/Ai) 0,5819 0,0000 0,0000 0,0194 0,4181 P(B') 0,0000 0,0000 P(C) 0,0000 0,0000 P(C') 0,0000 0,0000 CONDICIONAL COMBINADA P(A/Ai) P(A e Ai)*P(A) P(A) P(F1) 0,9000 0,0300 P(A') P(F2) 0,9700 P(B) P(F3) 0,0200 1 probabilidade total 0,0464 Resposta: P(T/D) = 0,5819 ( é a probabilidade de que o teste seja positivo e a pessoa seja portadora da enfermidade) 57) Conforme exercício anterior, suponha que a probabilidade de um teste para diagnóstico médico ofereça um resultado positivo, sem que haja presença da enfermidade, seja reduzida de 0,02 para 0,01. Sendo conhecida esta informação: a) se o teste para diagnóstico médico tiver apresentado um resultado positivo (indicando que enfermidade está presente), qual é a probabilidade de que a enfermidade esteja efetivamente presente? R:0,736 Cálculos do Teorema de Bayes Evento S S' A Priori 0,03 0,97 Probabilidades Condicional Combinada 0,9 0,03 0,01 0,01 Total: 0,04 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC Revisada 0,7357 0,26 60 b)se o teste para diagnóstico médico tiver apresentando um resultado negativo (indicando que a enfermidade não está presente), qual é a probabilidade de que a enfermidade não está efetivamente presente? R: 0,997 EVENTOS EVENTOS F1 F2 F3 Ai 0,0000 REVISADA P(A/Ai) 0,0000 0,0030 0,0031 0,0000 0,0000 0,9506 0,9969 P(C) 0,0000 #DIV/0! P(C') 0,0000 0,0000 CONDICIONAL COMBINADA P(A/Ai) P(A e Ai)*P(A) P(A) P(F1) 0,0300 P(A') P(F2) 0,9700 0,1000 P(B) P(B') P(F3) 0,9800 1 probabilidade total 0,9536 58)MILONE( 2006, p.146) o medicamento M cura 65% das ocorrências da doença D. Se ministrado as dois pacientes, qual a probabilidade de: a) curar os dois? R: 0,65*0,65=0,4225 b) não curar nenhum? R:0,35*0,35=0,1225 c) curar só um deles? R: 0,65*0,35 + 0,35*0,65 =0,455 * use o diagrama da arvore 59) MILONE( 2006, p.145) A pé na Tábua LTDA verificou que 2 em 15 de seus veículos pifam por defeito mecânico e 3 em 15 por falha elétrica . Seu departamento de manutenção também levantou que , por viagem 18% dos veículos apresentam defeito mecânico e 29% falha elétrica. Qual a chance de um defeito mecânico impedir um dos veículos de chegar ao destino? R:29,27% • teorema de Bayes • calculo da probabilidade: • evento D:defeito mecanico 2/15∗0,18 =0,2927 2/ 15∗0,18+ 3/15∗0,29 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 61 • evento D': defeito elétrico Cálculos do Teorema de Bayes Evento D D' C A Priori 0,1333 0,2000 Probabilidades Condicional Combinada 0,18 0,0240 0,29 0,0580 0 0,0000 Total: 0,0820 Revisada 0,2927 0,7073 0,0000 1 60) MILONE( 2006, p.145) Se 89% dos indivíduos atendidos por um ambulatório são RH- , qual a chance de 5 pacientes aleatoriamente escolhidos serem RH+? solução: 0,11*0,11*0,11*0,11*0,11=0,0000161051 61) MILONE( 2006, p.145) Se as probabilidades de Romeu e Julieta estarem vivos daqui a 25 anos são, respectivamente , 63% e 66%, e se o casamento deles tem 10% de probabilidade de acabar em divórcio antes, qual a chance de : a) eles estiverem bodas de prata? R:0,3742 =0,63*0,66*0,9 b) ela estar viuva naquela ocasião? R: 0,2442=0,37*0,66 c) pelo menos um deles estar vivo? R: 0,8742=0,63*0,34+0,37*0,66+0,63*0,66 d) ele estar vivo naquela ocasião? R:0,2142=0,63*0,34 • fazer o diagrama da arvore Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 62 3.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL ALEATÓRIA DISCRETA 3.6.1 VARIÁVEL ALEATÓRIA DISCRETA • Definição de Variável aleatória: MONTGOMERY(2003, p.48) “uma variável aleatória é uma função que confere um número real a cada resultado no espaço amostral de um experimento aleatório”. • MILONE(2004, p.148) a variável aleatória pode ser denominada variável aleatória, estocástica ou indicadora. Definição de Variável aleatória : FARBER(2009, p.155) :''uma variável aleatoria x • representa um valor numérico associado a cada resultado de um experimento de probabilidade ''. • MILONE(2004, p.148)As variáveis aleatórias são indicadas por X e é indicável por X={x1,x2,x3,..,xk} e os xk são os elementos. • MONTGOMERY(2003, p.48), após o experimento ser conduzido, o valor medido da variável aleatória é denotado por uma letra minúscula, tal como x=70 miliampéres. • Uma variável aleatória discreta é uma variável aleatória com uma faixa finita ( ou infinita contável). • 1) MILONE(2004, p.149-150)Associe uma variável aleatória conveniente ao evento X={ número de caras} do experimento E={ lançamento de 3 moedas} p1 c k c=cara p2 c k k=coroa p3 c k numeros de caras evento caracteristico variável aleatória nenhuma k,k,k 0 uma (k,c,K)(k,K,c)(c,k,k) 1 duas (k,c,c)(c,k,c)(c,c,k) 2 tres c,c,c 3 62) FARBER(2009, p.155) Um estudo do numero de ligações que um vendedor faz em um único dia. Os possíveis valores da variável aleatória x, são 0,1,2,3,4 assim por diante, pode ser listado, x é uma variável aleatória discreta. FARBER(2009, p. 155) , o resultados de um experimento de probabilidade é uma contagem ou medida, este resultado é chamado de variavel aleatoria. Variavel aleatoria x representa um valor numerico associado a cada resultado de um experimento de probabilidade. Aleatoria significa que x é determinado por acaso. Discreta: numero finito ou contavel de possíveis resultados. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 63 Contínua : numero incontável de possíveis resultados, representados por um intervalo na reta numerica. Discreta:Numero de ligações que um vendedor faz em um único dia. {0,1,2,3,4,...}, pode ser listada os valores possíveis contínua: tempo gasto em horas que um vendedor faz ligações em um dia :[0;24] incluindo frações e decimais, não pode ser listadas os valores possíveis. 3.6.2 Exercicios 63) MONTGOMERY( 2003, p.53) O espaço amostral de um experimento aleatório é { a,b,c,d,e,f} e cada resultado é igualmente provável. Uma variável aleatória é definida como segue: resultado x a b c d e f 0 0 1,5 1,5 2 3 Determine a função de probabilidade de X. respostas: P(X=0)= 1/6+1/6=1/3;P(X=1,5)=1/3;P(X=2)=1/6/; P(X=3)=1/6 64) O setor de comercialização estima que um novo instrumento para análise de amostras de solo terá grande sucesso, moderado sucesso ou não terá sucesso, com probabilidades de 0,3 ; 0,6 e 0,1, respectivamente. A receita anual associada com um produto de grande sucesso , moderado sucesso ou nenhum sucesso é de $ 10 milhoes, $ 5 milhoes e $ 1 milhao , respectivamente. Faça a variável aleatória X denotar a renda anual do produto. Determine a função de probabilidade de X. solução : P(X=10 milhoes)=0,3 e assim por diante 65) Em um processo de fabricação de simcondutores, 3 pastilhas de um lote são testadas. Cada pastilha é classificada como passa ou falha. Suponha que a probabilidade de uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. * diagrama da arvore a) qual é a probabilidade de que todas as 3 pastilhas passem no teste? R:0,512 b) determine a função de probabilidade do número de pastilhas de um lote que passe no teste. Solução : P(X=0)=0,2*0,2*0,2=0,008 ( nenhuma passa no teste) P(X=1)=0,096 ( um passa no teste em qualquer posição) P(X=2)=0,384 P(X=3)=0,512 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 64 66) Um sistema de inspeção óptica deve distinguir diferentes tipos de peças. A probabilidade de uma classificação correta de qualquer peça é de 0,98. Suponha que 3 peças seja inspecionadas e que as classificações sejam independentes. Seja X a variável aleatória que designa o numero de peças classificadas corretamente. Determine a função de probabilidade de X. solução: P(X=0) P(X=1) P(X=2) P(X=3) 0,000008 0,001176 0,057624 0,941192 1 3.6.3 Distribuições de probabilidades discretas • FARBER (2009, p.156) , a distribuição de probabilidade discreta lista cada valor possível que a variavel aleatoria pode assumir, junto com sua probabilidade. • Uma distribuição de probabilidade tem as seguintes condições: • 0≤P x ≤1 • ∑ P x=1 VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA DISCRETA • LEVINE (2005) , é a média ponderada de todos os possíveis resultados X - sendo os pesos as probabilidades P(X) associadas a cada um dos resultados. u =E x = n X i P X i i=1 • FARBER( 2009, p.161), a média de uma variavel aleatoria representa o que ira acontecer em milhares de testes. Variância e Desvio padrão de uma variável aleatória discreta VARIÂNCIA DESVIO PADRÃO 2 = N [ X i−E X ]2 P X i i=1 = N [ X i −E X ]2 P X i i=1 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 65 67) EXEMPLO:Calcule a média ( o valor esperado) , desvio padrão e a variância. Hipotecas de imóveis aprovadas por semana probabilidade 0 0,1 1 0,1 2 0,2 3 0,3 4 0,15 5 0,1 6 0,05 R: 68) FARBER( 2009, p.163) Um sociológo pesquisou as famílias em uma cidade pequena. A variavel aleatoria x representa o numero de criancas na família. x 0 1 2 3 4 P(x) 0,07 0,2 0,38 ? 0,13 R :0,22 69) FARBER (2009, p.163) o numero de computadores por casa, em uma cidade pequena. computadores 0 1 2 3 casas 300 280 95 20 a) use distribuição de frequência para construir a distribuição de probabilidade. b) calcule a média R:0,8 c)variancia R:0,6 d) desvio padrão R:0,8 e) interprete os resultados no contexto da vida real. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 66 70) FARBER (2009, p163) Os alunos de um sala de aula fazem um teste com 8 perguntas. O numero x de perguntas respondidas corretamente pode ser aproximado pela seguinte distribuição de probabilidade. x 0 1 2 3 4 5 6 7 8 P(x) 0,02 0,02 0,06 0,06 0,08 0,22 0,3 0,16 0,08 a) faça um histograma ou grafico em barras. b) calcule a média c) variancia d) desvio padrao e) valor esperado da distribuição de probabilidade. f) interprete os resultados. 71)Utilizando os registros da empresa para os últimos 500 dias úteis, o gerente da Koing Motors, uma agencia de automóveis do subúrbio, fez uma relação do numero de carros vendidos por dia, na tabela a seguir apresentada: Numero de carros Freqüência vendidos De Ocorrência Por dia 0 1 2 3 4 5 6 7 8 9 10 11 Total: 500 40 100 142 66 36 30 26 20 16 14 8 2 a) forme a distribuição de probabilidade para o numero de carros vendidos por dia. b) calcule a média aritmética ou o numero esperado de carros vendidos por dia Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 67 R: c)calcule o desvio padrão R: Qual é a probabilidade de que um determinado dia d) menos de 4 carros sejam vendidos ? RESPOSTA: 69,60% e)no máximo 4 carros sejam vendidos? RESPOSTA:76,80% f) pelo menos 4 carros sejam vendidos? RESPOSTA:30,40% g) exatamente 4 carros sejam vendidos? RESPOSTA:7,20% h) mais de 4 carros sejam vendidos? RESPOSTA: 23,20% 3.6.4 Distribuição Uniforme MONTGOMERY (2003, p.57)Uma variável aleatória discreta unifome,se cada um dos valores em sua faixa, isto é x1,x2,..,xn tiver igual probabilidade . Então : f(xi)=1/n Suponha que X seja uma variável discreta uniforme nos inteiros consecutivos a,a+1,a+2,...,b para a≤b . A média de X é : μ=E ( x )= b+ a 2 o desvio padrão de X é : σ= √ (b−a+1)2−1 ou 12 σ= √ n2−1 12 2) Considere a variavel aleatória X tendo uma distribuição uniforme nos inteiro 0≤x≤100 . Determine a média e a variancia de X. 73) Medidas de espessura em um processo de recobrimento são feitas para centésimo mais próximo a de um milimetro. As medidas de espessura estão unifomemente distribuidas, com valores 0,15 ; Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 68 0,16 ; 0,17; 0,18; 0,19. Determine a média e a variancia da espessura de recobrimento para este processo. 3.6.5 Distribuição binomial • FARBER(2009, p.165), um experimento binomial tem os seguintes critérios: 1. o experimento é repetido por um numero fixo de tentativas, onde cada tentativa é independente das outras. 2. Tem apenas dois resultados possíveis sucesso (S) ou fracasso(F). 3. A probabilidade de um sucesso P(S) é a mesma para cada tentativa. 4. A variavel aleatoria x contabiliza o numero de tentativas com sucesso. 74) FARBER (2009, p.166) Decida se o experimento é binomial ou não. i)Um dado procedimento cirurgico tem 85% de chances de sucesso. Um médico realiza o procedimento em 8 pacientes. A variável aleatória representa o numero de cirurgias com sucesso. • Está de acordo com as 4 condições. • Cada cirurgia representa uma tentativa e há 8 cirurgias e cada uma é independente da outra. • Tem dois resultados possíveis sucesso ou fracasso. • p=sucesso e q=fracasso • (p+q)8= p 8+ 8∗ p7∗q+... • probabilidade de 8 pacientes obtiverem sucesso na cirurgia é 0,858=27,24% • probabilidade de 7 pacientes obtiverem sucesso e 1 fracasso é: 8* 0,857*0,15=38,47% DIAGRAMA DE ARVORE DOIS PACIENTES n=2 SUCESSO p FRACASSO q p 0,85 q 0,15 p 0,85 q 0,15 0,85 0,15 aplicando o binomio de Newton : ( p +q)2 = p 2 +2∗p∗q+ q2=0,852 +2∗0,85∗0,15+ 0,152 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 69 • ii) Um jarra contem 5 bolinhas de gude vermelhas , 9 azuis e 6 verdes. Escolha 3 bolinhas aleatoriamente , sem trocas. A variavel aleatoria representa o numero de bolinhas vermelhas. • O experimento não é binomial porque ele não esta de acordo com as 4 condições de um experimento binomial. • Cada seleção de bolinha de gude representa uma tentativa e selecionar uma bolinha vermelha é um sucesso. • Quando a primeira bolinha é selecionada, a probabilidade de sucesso é 5/20. • Como a bolinha de gude não é colocada de volta a jarra, probabilidade de sucesso por tentativas subsequentes não é mais 5/20. • As tentativas não são independentes e a probabilidade de sucesso não é mais a mesma para uma cada das tentativas. • Primeira tentativa é: 5/20 =0,25 ( bolinhas vermelhas) • segunda tentativa: 4/19=0,21 • terceira tentativa :3/18=0,16 DISTRIBUIÇÃO BINOMIAL ( LEVINE, 2005) P ( X )= n p X (1− p)n− X X ( ) P(X)= probabilidade de X sucessos n= tamanho da amostra p= probabilidade de sucesso 1-p=probabilidade de insucesso ou fracasso X= numero de sucessos na amostra (X=0,1,2,...n) Formato -pode ser simétrica ou assimétrica se p=0,5 é simétrica Para n =13 e p=0,50=50% Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 70 Título principal 0,2500 0,2000 0,1500 Coluna C 0,1000 0,0500 0,0000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 MÉDIA ARITMÉTICA μ= E(x)=np DESVIO PADRÃO σ = √ np(1− p ) Sintaxe DISTRBINOM(X;tentativas;PS;A) X é o número de sucessos em uma série de tentativas. Tentativas é o número de tentativas independentes ( valor de n) PS é a probabilidade de sucesso em cada tentativa( probabilidade) Quando o parâmetro A for igual a 0, será calculada a probabilidade individual e quando o parâmetro A for igual a 1, será calculada a probabilidade cumulativa. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 71 75) FARBER(2009, p.173)ENCONTRANDO E INTERPRETANDO A MÉDIA, A VARIANCIA E O DESVIO PADRÃO. Em Pittsburg , Pensilvania , cerca de 56% dos dias são nublados. Encontre a média , a variancia e o desvio padrão para o numero de dias nublados durante o mês de junho. Interprete os resultados e determine quaisquer valores incomuns. MÉDIA ARITMÉTICA μ= E(x)=np DESVIO PADRÃO σ = np 1− p Solução : n=30 p=0,56 q =0,44 média: 16,8 desvio padrão: 2,7 variancia:7,4 INTERPRETAÇÃO • Em média há 16,8 dias (17 dias) que são nublados no mês de junho. • O desvio padrão é aproximadamente 2,7 dias. • Valores que são mais do que 2 desvios padrões da média são considerados incomuns. • [16,8-2*2,7=11,4 ; 16,8 +2*2,7=22,2], o mês de junho com 11 dias nublados seria incomum, sendo que no mês de junho com 23 dias nublado também seria considerado incomum. 70)FARBER(2009, p.174) Em São Francisco , California , 44% dos dias em 1 ano apresentam tempo limpo. Encontre a média, a variancia e o desvio padrão para o numero de dias limpos durante o mês de maio ( 31 dias). Interprete os resultados e determine quaisquer valores incomuns. a) identifique um sucesso e os valores n , p, q. n=31 p=0,44 q=0,56 b) encontre o produto de n e p para calcular a média media :13,6 c) encontre o produto de n , p, q para a variancia variancia: 7,6 d) encontre a raiz quadrada das variancias para o desvio padrão. Desvio padrão: 2,8 e) interprete os resultados. Em média, há 14 dias claros durante o mês de maio. Um mês de maio com menos de 8 dias de sol ou mais do que 19 dias de sol pode ser incomum. ( duplicando os desvio padrão) Probabilidades Binomiais Dados Tamanho da Amostra (n) Probabilidade de sucesso (p) Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 31 0,4400 Estatísticas Média Variância Desvio Padrão 13,6400 7,6384 2,7638 72 3.6.3 EXERCICIOS 71)LEVINE (2005, p.182) Determine o seguinte: a) Se n=4 e p=0,12 , então qual é a P(X=0)? R:0,5997 b) Se n=10 e p=0,9 , então qual é a P(X)=9? R: 0,38742 72) Se a probabilidade de um formulário de encomendas assinalado for 0,1, qual é a probabilidade de 3 ou mais ( ou seja pelo menos 3) formulários de encomendas assinaladas sejam encontrados, na amostra de 4 formulários de encomendas? Solução : P ( X 3 ) P ( X 0 ) P ( X 1 ) P ( X 2 ) 0 ,9 9 6 3 para obter P ( X 3 ) 1 0 ,9 9 6 3 0 ,0 0 3 7 0 ,3 7 % ou Probabilidades Binomiais Dados Tamanho da Amostra Probabilidade de sucesso Estatísticas Média Variância Desvio Padrão 4 0,1 0,4 0,36 0,6 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 73 73) Registros de certificados de garantia mostram que a probabilidade de que um carro novo necessite de um reparo inerente a garantia, nos primeiros 90 dias , é de 0,05. Se uma amostra de 3 carros novos for selecionada: solução n=3 p=0.05 a) qual é probabilidade de nenhum deles necessite de reparo inerente a garantia? Resposta:0,8574 b) qual é probabilidade de que pelo menos um deles necessite de reparo inerente a garantia? Resposta: P(X=1)+P(X=2)+P(X=3)=0,14 c) qual é probabilidade de que mais de um deles necessite de reparo inerente a garantia? Resposta:P(X=2)+P(X+3)=0,01 d) que premissas são necessárias em (a) até (c)? e) qual é a media aritmética e o desvio padrão? Resposta: média: 0,15 desvio padrão: 0,3775 f)quais seriam as respostas para a até c , se a probabilidade de vir necessitar de um reparo inerente á garantia fosse 0,1? resposta: Estatísticas Média Variância Desvio Padrão 0,3000 0,2700 0,5196 3.6.4 Distribuição de Poisson (lê-se : poassom) • Observação de eventos discretos em um área de oportunidades-intervalo continuo ( de tempo, extensão, área de superficie) de maneira tal que, se a área de oportunidade ou intervalo for suficientemente reduzida. Probabilidade de observar exatamente um sucesso no intervalo é estável. A probabilidade de observar mais de um sucesso no intervalo é zero. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em qualquer outro intervalo P ( X )= e−λ λ X X! P(X)=probabilidade de X sucessos, dado o conhecimento de λ λ= numero esperado de sucessos Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 74 e= constante matemática aproximada por 2,71828 X= numero de sucessos por unidade. MONTGOMERY (2003, p.68) E ( X )=λ=np Média esperada p= λ probabilidade de que um subintervalo contenha uma falha n 2 σ =λ=np variancia Sintaxe POISSON(Número; MV; K) Número representa o valor que serve de base para o cálculo da distribuição de Poisson. MV representa o valor do meio da distribuição de Poisson. K = 0 calcula a função de densidade; K = 1 calcula a distribuição. 73) LEVINE (2005, p.183-184) Suponha que seja examinado o numero de clientes que chegam na hora do almoço, entre 12 h e 13h em uma agencia bancária localizada no centro de uma grande cidade. Qualquer chegada de cliente é um evento discreto, em um determinado ponto do tempo ao longo do intervalo continuo de 1 hora. Durante este intervalo de tempo pode haver uma média de 180 chegadas. Seja o intervalo de 1 hora desmembrando em 3600 intervalos consecutivos de 1 segundo. • O numero esperado ( média) do numero de clientes que chegam em qualquer intervalo de 1 segundo seria de 0,05. • a probabilidade de ter mais de um cliente chegando, em qualquer intervalo de 1 segundo, aproxima-se de zero. • A chegada de um cliente em qualquer intervalo de 1 segundo , não possui nenhum efeito ( ou seja estatisticamente independente) em relação a chegada de qualquer outro cliente, em qualquer outro intervalo de 1 segundo. 3.6.5 Exercicios 74)LEVINE (2005, p.186) Suponha uma distribuição de Poisson: a) Se λ=2,5 , então qual é P(X=2)? Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 75 b) Se λ=8 , então qual é P(X=8)? 75) LEVINE (2005, p.187)Admita que o numero de erros de sistemas de rede ocorridos em um dia em um sistema de rede local (LAN- local de área network) seja distribuído na forma de uma variável aleatória de Poisson. O numero médio de erros de sistemas de rede ocorridos em um dia é 2,4. Qual é a probabilidade de que em um determinado dia: a)zero erro de sistemas de rede irá ocorrer? b) exatamente 1 erro de rede de servidor irá ocorrer? c) dois ou mais erros de sistemas de rede irão ocorrer? Solução :1- [P(X=1)+P(X=0)]=0,691559 d) mais de três erros de sistemas de rede irão ocorrer? Solução :1- [P(X=2 )+P(X=1)+P(X=0)] X 0 1 2 3 P(X) 0,090718 0,217723 0,261268 0,209014 76) FARBER (2009, p.181) A média do numero de acidentes por mês em certa intersecção é 3. Qual é probabilidade de que, em qualquer mês dado, 4 acidentes ocorram nessa intersecção? R:0,168. 77) FARBER (2009, p.182) 2000 mil trutas são colocadas em um pequeno lago. O lago tem um volume de 20000 metros cúbicos. Calcule a probabilidade de 3 das trutas sejam encontradas em um mesmo metro cubico do lago. SOLUÇÃO: média: 2000/20000=1/10 R: 0,0002 3.6.6 Distribuição hipergeométrica • A distribuição binomial e a hipergeométrica estão relacionadas. • O numero de sucessos em uma amostra contendo n observações. • Modelo binomial-dados são extraídos com reposição a partir de uma população finita. • Sem reposição de uma população infinita. • Modelo hipergeométrico- os dados são extraídos sem reposição a partir de uma população finita. • Experimento binomial-a probabilidade de sucesso é p (constante) para todas as observações. • O resultado não depende de outras observações. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 76 Experimento hipergeométrico- o resultado de uma observação é afetado pelos resultados das • observações anteriores • binomial – extraída de uma população infinita • hipergeométrica- extraída de uma população finita P X = A X N −A n−X N n P(X)= probabilidade de sucessos n= tamanho da amostra N= tamanho da população N-A=numero de insucessos na população X= numero de sucessos na amostra A= numero de sucessos na população MEDIA ARITMÉTICA u=E X = nA N DESVIO PADRÃO = nA N − A N −n N−1 N2 fator de correção de população finita que resulta da amostragem sem reposição. N −n N−1 DIST.HIPERGEOM Retorna a distribuição hipergeométrica. Sintaxe DIST.HIPERGEOM(X; n; A; N) DIST.HIPERGEOM(X; NAmostra=n; Sucessos=A; NPopulação=N) X é o número de resultados alcançados na amostra aleatória. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 77 NAmostra é o tamanho da amostra aleatória. Sucessos é o número de resultados possíveis na população total. NPopulação é o tamanho da população total. 3. 6.7 Exercicios 78)LEVINE (2005, p.190) Determine o seguinte: a) Se n=4, N=10 e A=5 , então encontre P(X=3) b) Se n=5, N=12 e A=3 , então encontre P(X=0) c) calcular a media aritmética e o desvio padrão dos itens a e b 79) Em uma remessa de 15 discos rígidos, 5 são defeituosos. Se 4 dos discos forem inspecionados: a) qual é a probabilidade de que exatamente 1 seja defeituoso? P X = A X N −A n−X N n Solução 1: N=15( população) A=5 (sucesso) n=4 (tamanho da amostra) R:0,43956 solução 2 : D ( defeituoso) B ( não é defeituoso) DBBB então : 5∗10∗9∗8 C 5∗C 10 1∗3∗2∗1 600 1 3 = = =0,43956 15∗14∗13∗12 1365 C 15 4 4∗3∗2∗1 b) de que pelo menos 1 seja defeituoso? R:0,8462 c)qual é a probabilidade de que não mais do que 2 sejam defeituosos? R:0,9231 d)qual é o numero médio de discos rígidos defeituosos que você esperaria encontrar na amostra de 4 drives de disco rígido? R:1,33 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 78 3.6.8 Exercicios 80) O reitor de uma escola de negócios deseja formar um comitê executivo de 5 entre 40 professores titulares da faculdade. A seleção deve ser realizada ao acaso, e na escola existem 8 professores titulares em contabilidade. Qual é a probabilidade de o comitê: a) não conter nenhum desses professores? Resposta:P(X=0)= 0,3060 b)conter pelo menos 1 desses professores? Resposta: 1-P(X=0)=1-0,3060=0,6940 c)não mais do que 1 desses professores? Resposta:P(X=0) + P(X=1)=0,7432 d)qual seria a sua resposta para (a) , se o comitê fosse composto de 7 membros? P X = A X N −A n−X N n N=40 A=8 professores de contabilidade X 0 1 2 3 4 5 6 7 n=7 membros P(X) 0,1805 0,3888 0,3024 0,1080 0,0186 0,0015 0,0000 0,0000 REFERENCIAS • MONTGOMERY, D.C. e RUNGER,G.C. Estatística Aplicada e Probabilidade Para Engenheiros. 2a edição RJ. Editora LTC.2003. • LEVINE, David M. et. al. Estatística –Teoria e Aplicações Usando o Microsoft Excel em Português. 3a ed.RJ Editora LTC. 2005. • CRESPO, A. Estatística Fácil. 14a ed .SP. Editora Saraiva.1994 Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 79 • LibreOffice 3.6.22 • disponível em http://technet.microsoft.com/pt-br/library/cc737478(WS.10).aspx acessado em 17/08/2009 • disponível em http://www.estatistica.eng.br/ramosefolhas.htm acessado em 17/08/2009. • disponível em < http://www.novagripe.pr.gov.br/modules/conteudo/conteudo.php? conteudo=19 >acessado em 18/08/2009 • FARBER, Betsy. LARSON, Ron. Estatística Aplicada. São Paulo. 4 edição.2009. Pearson. • Disponivel em www.magrini.eng.br/Disc_Estat/ Apoio/Apostilas/ CAP1.6_ Medidas _de_Forma.doc -acessado em 26/02/2008. • Disponível em http://info.abril.com.br/professional/ acessado em 03/09/2009 • Disponivel em http://stat2.med.up.pt/cursop/regressao/imagens/formula_correlacao.html acessado em 03/10/2010. • disponivel em http://lauromartins.com/o-ibovespa-e-a-curva-normal/, acessado em 29/03/2012. • disponivel em http://aprendamatematica.com/site/wpcontent/uploads/2012/02/assimetria.jpg, aessado em 29/03/2012. • disponivel em http://carros.ig.com.br/ acessado em 26/11/2012. • disponivel em http://www.carlosescossia.com/2009/09/o-que-e-desvio-padrao.html, acessado em 06/12/2012. • Takahashi, Shin. Guia Mangá de Estatistica. SP. Novatec Editora.2010. Prof. Jorge Roberto Grobe 11/09/14 15:35:49 ES34MTEC 80