UTFPR MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Coordenação do Curso Análise e Desenvolvimento de Sistemas UTFPR 4 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA 5 A DISTRIBUIÇAO NORMAL E AS DISTRIBUIÇOES DE AMOSTRAGEM 6 ESTIMATIVA DO INTERVALO DE CONFIANÇA UTFPR MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Coordenação do Curso Análise e Desenvolvimento de Sistemas UTFPR Sumário CAPITULO 4 .............................................................................................................................4 4 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA.................................................................................................................................4 4.1 Conceitos Básicos de Probabilidade................................................................................4 4.1.1Exercicios..................................................................................................................6 4.2 TABELA DE CONTINGENCIA....................................................................................9 4.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos.....................12 4.4 Probabilidade Condicional.............................................................................................14 4.5 Teorema de Bayes...........................................................................................................21 4.5.1 Exercicios...............................................................................................................23 4.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL ALEATÓRIA DISCRETA...................................................................................................25 4.6.1 Distribuições de probabilidades discretas...............................................................25 4.6.1.2 Distribuição de poisson...................................................................................33 4.6.1.3 Exercicios........................................................................................................34 4.6.1.4 Distribuição hipergeométrica..........................................................................35 4. 6.1.4 Exercicios.......................................................................................................36 4.6.1.5 Exercicios........................................................................................................37 5 A DISTRIBUIÇAO NORMAL E AS DISTRIBUIÇOES DE AMOSTRAGEM..................37 5.1 A DISTRIBUIÇÃO NORMAL......................................................................................37 PADRONIZAR.....................................................................................................................38 5.1.1 Exercicios...............................................................................................................39 5.2 AVALIANDO A PREMISSA DA NORMALIDADE....................................................42 5.3 Exercicios.......................................................................................................................44 5.4 A DISTRIBUIÇÃO EXPONENCIAL...........................................................................47 5.5 Exercicios.......................................................................................................................47 5.5 INTRODUÇÃO ÀS DISTRIBUIÇÕES DE AMOSTRAGEM.....................................48 5.6 DISTRIBUIÇÃO DE AMOSTRAGEM DA MEDIA ARITMÉTICA..........................48 5.8 EXERCICIOS................................................................................................................52 5.9 DISTRIBUIÇAO DE AMOSTRAGEM DA PROPORÇÃO.........................................53 5.10 EXERCICIOS..............................................................................................................53 6 ESTIMATIVA DO INTERVALO DE CONFIANÇA............................................................55 6. 1 INTRODUÇAO.............................................................................................................55 6.2 ESTIMATIVA DO INTERVALO DE CONFIANÇA DA MEDIA ARITMETICA.......55 ( conhecido-desvio padrão).................................................................................................55 6.3 EXERCICIOS................................................................................................................56 6.4 estimativa do intervalo de confiança da média aritmética ...........................................57 (σ desconhecido)..................................................................................................................57 6. 5 EXERCICIOS...............................................................................................................58 6.6 estimativa do intervalo de confiança para a proporção..................................................60 6.7 EXERCICIOS................................................................................................................60 6.8 DETERMINANDO O TAMANHO DE UMA AMOSTRA..........................................61 6.9 EXERCICIOS................................................................................................................62 6.10 EXERCICIOS..............................................................................................................62 6.11 APLICAÇÕES DA ESTIMATIVA DO INTERVALO DE CONFIANÇA EM AUDITORIA........................................................................................................................63 6.12 EXERCICIOS..............................................................................................................64 6.2 ATIVIDADES PRÁTICAS PEDAGÓGICAS..............................................................65 Prof. Jorge Roberto Grobe 11 de set de 14 02:19 PM ESTATÍSTICA- ANÁLISE DE DADOS – AD34S ii UTFPR MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Coordenação do Curso Análise e Desenvolvimento de Sistemas UTFPR REFERENCIAS .......................................................................................................................70 Prof. Jorge Roberto Grobe 11 de set de 14 02:19 PM ESTATÍSTICA- ANÁLISE DE DADOS – AD34S iii CAPITULO 4 4 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA VARIÁVEL ALEATÓRIA DISCRETA 4.1 CONCEITOS Básicos de Probabilidade ◦ FARBER(2009, p.105) exemplo simples do uso de termo experimento de probabilidade, espaço amostral, evento e resultado: ◦ Experimento de probabilidade: lançamento de um dado de 6 lados ◦ Espaço amostral: {1,2,3,4,5,6} ◦ Evento : sair um numero par {2,4,6} ◦ Resultado : rolar um numero 2 : {2} ◦ Em WITTE(2005), probabilidade refere-se a proporção, ou fração, de vezes que um determinado resultado é passível de ocorrer. • Segundo LEVINE (2005), probabilidade é a chance ou possibilidade de que um determinado evento venha ocorrer. • Valores entre 0 e 1 • Evento impossível – não tem chance de ocorrer é igual a zero • Evento certo igual a 1 • FARBER (2009,p.109), Probabilidade clássica ou teórica é usada quando cada resultado em um espaço amostral é igualmente possível de ocorrer. • • A probabilidade clássica para um evento E é dada por: P E = numero resultados no evento E numero total de resultados no espaço amostral • Jogando um dado de 6 lados : • Evento A: lançar um 3 R:1/6 • Evento B: lançar um 7 R:0 • Evento C: lançar um numero menor que 5. R:4/6=2/3 PROBABILIDADE EMPÍRICA ( ou estatistica) FARBER (2009, p.110), basea-se em observações obtidas de experimentos de probabilidades. A probabilidade empírica de um evento E é a frequência relativa do evento E. P E = frequencia do evento E frequencia total Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 4 • 1)Exemplo: uma empresa esta conduzindo uma pesquisa on-line com indivíduos selecionados aleatoriamente para determinar se o congestionamento no transito é um problema em sua comunidade. A distribuição de frequência mostra os resultados . Qual é a probabilidade de que a próxima pessoa que responda a essa pesquisa diga que o congestionamento é um problema sério em sua comunidade? resposta Numero de vezes f É um problema sério 123 É um problema moderado 115 Não é um problema 82 320 Resposta: 123 =0,3844=38,44 % 320 EVENTOS E ESPAÇOS AMOSTRAIS • Para MONTGOMERY(2003), um experimento é a medição de uma corrente em um fio de cobre. • Com repetições diárias de medidas, os resultados podem diferir levemente, devido a pequenas variações nas temperaturas ambientes, nos medidores, química do fio, etc. Evento Simples FARBER(2009, p.106): consiste um único resultado 2) Exemplo: determine o numero de resultados em cada evento. Escreva se cada evento é simples ou não. • Para um controle de qualidade, selecionar aleatoriamente uma peça de maquina de um lote que foi fabricado naquele dia.O evento A é selecionar uma peça de maquina com um defeito específico. R: evento simples • Lançar um dado de 6 lados. O evento B é rolar pelo menos um numero 4. R:nao é simples. 3) exemplo: TEMPERATURA DE UM PROCESSADOR • Cada componente é uma variável aleatória. • Experimento aleatório –fornece diferentes resultados, embora seja repetido toda vez da mesma maneira. 4)exemplo :DOMENICO (pag. 127), • lançamento de uma moeda • a aposta em um jogo qualquer da loteria esportiva. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 5 Espaço amostral- é o conjunto de todos os resultados possíveis de um experimento aleatório. 5)exemplo : DOMENICO ( pag.127) , no lançamento de um dado, o espaço amostral dos números voltados para cima é o conjunto: S={1,2,3,4,5,6}, o numero de elementos de S é n(S)=6. Evento- é um subconjunto do espaço amostral de um experimento aleatório. 6) exemplo: DOMENICO ( pag.127), seja o experimento aleatório jogar um dado e verificar se a face voltada para cima é impar. O espaço amostral é: S={1,2,3,4,5,6} O evento A é : {1,3,5} EVENTOS Evento certo: é um evento igual ao espaço amostral. S={1,2,3,4,5,6} Evento impossível: {} Evento elemento : {5} 4. 2EVENTOS UNIÃO , INTERSECÇÃO E COMPLEMENTAR União- são os resultados que estão contidos nos dois eventos. E1∪E2 Intersecção- são os resultados que estão contidos em ambos os eventos. E1∩ E2 Complemento – são os resultados que não estão no evento E. E’=S-E MONTGOMERY(2003). 4.1.1Exercicios DECIDA SE O EVENTO É SIMPLES OU NÃO NOS EXERCICIOS 1 E 2. 1)FARBER(2009,p.115) Um computador é usado para selecionar aleatoriamente um numero entre 1 e 2000. O evento A é selecionar 359. RESPOSTA: EVENTO SIMPLES 2)FARBER(2009,p.115) um computador é usado para selecionar aleatoriamente um numero entre 1 e 2000. O evento B é selecionar um numero menor que 200. R: não é um evento simples , pois tem mais de um resultado. 3) Jogar uma moeda e selecionar aleatoriamente um numero de 0 a 9. Qual a probabilidade de obter coroa e selecionar um 3? R:1/2* 1/10= 0,05 4) (DOMENICO, pag.128) Seja o lançamento de um dado; forneça os eventos ao encontrar na face voltada para cima: a) números pares b) números ímpares Prof jorge roberto grobe AD34S 11/09/2014 c) números menores que 3 d) números primos 14:19:16 6 5) exemplo : DOMENICO ( pag. 128), seja o lançamento de um dado e a verificação da face voltada para cima, o espaço amostral:S={1,2,3,4,5,6}, sejam os eventos : a) face par : A= {2,4,6} b) divisores de 6: B= {1,2,3,6} c) múltiplo de 5:C={5} i) A∪B = A∩B = ii) {1,2,3,4,6} {2,6} A∩C = { } * A e C são mutuamente exclusivos, pois não ocorrem ao mesmo tempo. iii) • se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral S um espaço equiprovável ou uniforme. • Espaço não -equiprovável : onde todos os pontos amostrais de um evento tem diferentes possibilidades de ocorrência. • p1+p2+...+pn=1 6) exemplo: DOMENICO ( pag. 130), na disputa de um campeonato mundial de futebol , a chance do Brasil ser campeão é o dobro de chance da Argentina ser campeã. Qual é a probabilidade do Brasil ser o campeão? Solução : P(Argentina)= p P(Brasil)=2p P(A)+P(B)=1 P(B) =2/3 7) DOMENICO ( p.129-130) Suponha que numa caixa existem 7 bolas, sendo 2 pretas, 3 brancas e 2 vermelhas. Sendo o espaço amostral equiprovável, determine, na retirada de uma bola da caixa, a probabilidade: a) vermelha b) não preta c) preta ou branca d) preta ou vermelha 8) Internacional, Cruzeiro , Corinthians e Flamengo vao disputar o titulo do campeonato brasileiro de futebol. As chances do Corinthians e do Cruzeiro serem vencedores são iguais, mas a chance do Internacional é o dobro da chance do Cruzeiro e a chance do Flamengo é o triplo da chance do Internacional. a) qual é a probabilidade do Corinthians ser campeão? R:1/10 b) qual é a probabilidade do Flamengo ser campeão: R:3/5 • P(A)+P(B)+P(C)+P(D)=1 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 7 9) Medidas do tempo necessário para completar uma reação química podem ser modeladas com o espaço amostral S = 0 ;∞ . Dados os eventos : E1=[1;10) E2=(3;118). a) E1∪ E2 c) E1∩ E2 b) E1’=S-E1 d)E1’∩ E2 10) respostas:a) [1;118[; b) ]0;1[UNIAO [10;inf [ ;c) ]3;10[;d) [10;118[ 11) FARBER (2009, p.116) Dias de sol e chuva .Uma viagem de 4 dias para Seatle, Washington , em outubro. a) faça um diagrama de arvore dos dias de sol e chuva para sua viagem. b) liste o espaço amostral c) liste os resultados para o evento que ira chover exatamente em um dia. Dia 1 sol chuva 12) FARBER (2009, p.117) use a distribuição de frequencia, que mostra o numero de eleitores americanos ( em milhoes), de acordo com a idade: Idade dos eleitores Frequencia ( em milhoes) 18 a 20 anos 5,8 21 a 24 anos 8,5 25 a 34 anos 21,7 35 a 44 anos 27,7 45 a 64 anos 51,7 Acima de 65 anos 26,7 Encontre a probabilidade de que um eleitor , escolhido aleatoriamente, esteja: a) entre 21 e 24 anos resposta: 8,5 =5,98 porcento 142,1 b) entre 35 e 44 anos c) não esteja entre 18 e 20 anos d) não esteja entre 25 e 34 anos. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 8 4.2 TABELA DE CONTINGENCIA Em LEVINE (2005), o comportamento de compra com relação a aparelho de televisão com tela grande. efetivamente comprou planejou em adquirir sim (A) não (A') total sim Não (B) (B') total 200 50 250 100 650 750 300 700 1000 • Espaço amostral: coleção de todos os eventos possíveis. • O espaço amostral é de 1000 famílias • O complemento de A inclui todos os eventos que não fazem parte de A pode ser escrito por A’. PROBABILIDADE SIMPLES (marginal) Em LEVINE (2005), a probabilidade simples é chamada de probabilidade marginal, uma vez que ela pode ser obtida através da margem apropriada P planejou em adquirir = n o de familias que adquiriu 250 = =25 % total de familias 1000 È a chance de 25% de uma família tenha planejado em adquirir uma tv com tela grande. 13)EXEMPLO DE PROBABILIDADE SIMPLES ( MARGINAL) P(B)=250/1000 pode-se escrever P(B e A1)+P(B e A2)=200/1000+50/1000=250/1000 14) EXEMPLO: Calculando a probabilidade de um aparelho de tv com tela grande adquirido seja HDTV nos últimos 12 meses, dado pela tabela de contingência: comprou DVD (B) comprou HDTV (A) HDTV (sim) HDTV (não) total sim Nao 38 70 108 total 42 150 192 80 220 300 a) Encontre a probabilidade de que uma família que tenha adquirido um aparelho de tv HDTV. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 9 Resposta: 80/300, existe uma chance de 26,7% de que uma compra aleatoriamente selecionada de um aparelho de televisão com tela grande seja de um HDTV (televisão de alta definição) Probabilidade Combinada Envolvem mais de dois eventos Eles ocorrem simultaneamente 15)EXEMPLO: Uma vez que esse grupo em 200 familias , a probabilidade de escolher uma família que tenha planejado adquirir e comprou uma tv com tela grande é : efetivamente comprou planejou em adquirir sim não total sim não total 200 50 250 100 650 750 300 700 1000 P A e B = P A ∩ B resposta: 200 1000 =20% 16)EXEMPLO: Encontre a probabilidade de que uma família tenha comprado HDTV e um DVD. comprou DVD (B) comprou HDTV (A) HDTV Não HDTV total sim Nao 38 70 108 total 42 150 192 80 220 300 resposta: existe uma chance de 12,7 % de que uma família, aleatoriamente selecionada que tenha adquirido um aparelho de tv com tela grande tenha adquirido um HDTV e um aparelho de DVD. 38 300 =12,7% Calculando a probabilidade marginal Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 10 P(A)= P(A e B1 )+...+P(A e Bk) são eventos mutuamente excludentes se ambos não ocorrem ao mesmo tempo. 17)EXEMPLO: Calcular a probabilidade marginal de planejar em adquirir um aparelho de Tv com tela grande. efetivamente comprou planejou em adquirir sim não total resposta: sim não total 200 50 250 100 650 750 300 700 1000 200 50 = 25 % 1000 1000 Regra geral de Adição P A ∪ B = P A P B − P A∩ B P( AouB) P(A ) P( B) P(AeB) 18) EXEMPLO: DOMENICO (p.131) , seja o lançamento de um dado { 1,2,3,4.6} com eventos equiprováveis. Qual é probabilidade de ocorrer um número par ou um número múltiplo de 3? resposta: P (A∪ B)=P (A)+ P (B)−P ( A∩B) = 3 2 1 4 + − = 6 6 6 6 19) EXEMPLO: Planejou em adquirir ou efetivamente comprou, calcule esta probabilidade referente a compra de uma tv com tela grande. Use a regra geral da adição. R: 35% efetivamente comprou planejou em adquirir sim não total Prof jorge roberto grobe AD34S 11/09/2014 sim não total 200 50 250 100 650 750 300 700 1000 14:19:16 11 A=efetivamente comprou B=planejou em adquirir P A ∪ B = P A P B − P A∩ B 300 250 200 − =35 % 1000 1000 1000 20) EXEMPLO: Encontre a probabilidade de que uma família tenha comprado HDTV ou DVD.R:50% comprou DVD (B) comprou HDTV (A) HDTV Não HDTV total sim não 38 70 108 total 42 150 192 80 220 300 4.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos Os eventos são mutuamente excludentes se ambos os eventos não puderem ocorrer ao mesmo tempo. P(A ou B)= P(A) +P(B) ou P A ∪ B = P A P B Em WITTE (2005), resultados mutuamente excludentes não podem ocorrer conjuntamente. Regra da Adição- some conjuntamente as probabilidades em separado de vários resultados mutuamente excludentes para encontrar a probabilidade de que qualquer um desses resultados venha ocorrer. 21) EXEMPLO: DOMENICO (p.131), seja o lançamento de um dado com eventos equiprováveis. Qual é a probabilidade de ocorrer um número par ou um número multiplo de 5? resposta: 4/6 • se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral S um espaço equiprovável ou uniforme. 22)EXEMPLO: Assumindo que todas as pessoas seja igualmente possiveis de nascer durante qualquer um dos 12 meses do ano, qual é a probabilidade de que Jack tenha nascido: a) em junho? resposta: 1 12 b) em qualquer mês que não seja junho? c)em maio ou junho? Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 12 23)EXEMPLO: Qual é a probabilidade de que uma família, tenha adquirido uma tv com tela grande tenha feito através da net ou do correio? tipo de numero de compra entrevistados loja 183 net 87 correio 30 87 30 MAIS = 39% 300 300 24) EXEMPLO: Ao longo dos últimos anos, empresas de cartão de credito realizaram um esforço intensivo a fim de obter novas contas de alunos de faculdades. Suponha que um amostra de 200 alunos em sua faculdade tenha indicado as seguintes informações em relação ao fato de os alunos possuírem um cartão de credito bancário e/ou cartão para turismo e lazer: cartão de credito para turismo e lazer cartão de crédito bancario sim não sim 60 60 não 15 65 a) forneça um evento simples resposta : possuir cartão de crédito bancário =0,60 b)evento combinado resposta: possuir os dois cartões c)qual o complemento de possuir um cartão de credito bancário? resposta: não possuir um cartão de credito bancário d) por que possuir um cartão de credito bancário e possuir um cartão de credito para turismo e lazer é um evento combinado? Se um aluno for selecionado qual é a probabilidade de que: e) o aluno possua cartão de credito bancário? f)o aluno possua cartão de credito para turismo e lazer? g)o aluno possua um cartão de credito bancário e um cartão de credito para turismo e lazer? resposta: h)o aluno não possua nenhum cartão? resposta: Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 13 i) a aluno possua cartão de credito bancário ou para turismo e lazer? resposta: j)o aluno não possua um cartão de credito bancário ou possua um cartão de credito para turismo e lazer? Respostas:e)0,6 f)0,375 g)0,3 h)0,325 i)0,675 j)0,7 4.4 Probabilidade Condicional Em LEVINE (2005), ao calcular a probabilidade de um determinado evento, A, sendo conhecida informações sobre a ocorrência de um outro evento B, P(A / B)= probabilidade de A dado que ocorreu B. P A/ B= P A e B P B ou P A∩B P B P(B/A)= probabilidade de B dado que ocorreu A P B / A= P B e A P A ou P B∩A P A P(A e B)= probabilidade combinada de A e B P(A) e P(B) = probabilidades marginais de A e B • Para DOMENICO (p.133), sendo S o espaço amostral de um conjunto de torcedores de futebol, A o evento constituído por torcedores do Palmeiras e B o evento constituídos por torcedores do Flamengo. • Sendo P(A) é a probabilidade de um torcedor que, escolhido aleatoriamente em S, seja palmeirense, enquanto que P(A/B) é a probabilidade de um torcedor flamenguista, escolhido ao acaso, ser também palmeirense. 25) EXEMPLO: DOMENICO ( p.133), sejam 100 torcedores n(S)=100, 20 torcedores do Palmeiras, 30 torcedores do Flamengo e 10 torcedores do Palmeiras e Flamengo. Qual é a probabilidade de que um flamenguista escolhido seja palmeirense P(A/B): solução: * fazer o diagrama de Venn P A/ B= n A∩B 10 1 = = nB 30 3 S=100 P=20 F=30 F e P=10 Prof jorge roberto grobe AD34S 10 10 100 11/09/2014 14:19:16 20 14 26) EXEMPLO: Suponha que fosse informado de que uma família planejava adquirir um aparelho de televisão com tela grande. efetivamente comprou (B) planejou em adquirir (A) sim A não A' total Não sim B B' total 200 50 250 100 650 750 300 700 1000 a)Qual é a probabilidade de que uma família tenha efetivamente comprado o aparelho de Tv com tela grande, sabendo –se que essa família tenha planejado em adquiri-lo? P( B/ A)= P( A∩B) 200 = =0,8 P( A) 250 B= efetivamente comprou A = planejou em adquirir resposta :0,8 27) EXEMPLO: Qual a probabilidade de que uma família adquiriu um DVD (A) dado que comprou um HDTV (B): Comprou DVD Comprou HDTV Sim não HDTV Não HDTV 38 70 total 42 150 80 220 P(A)= adquiriu um aparelho de DVD P(B)= adquiriu um HDTV SOLUÇÃO: 38 P A∩B 300 P A /B= = = 0,475= 47,5% PB 80 300 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 15 ARVORES DE DECISÃO 28) EXEMPLO: Arvore de decisão da empresa de produtos eletrônicos. efetivamente comprou (B) planejou em sim adquirir (A) não total sim não 200 100 50 650 250 750 Total 300 700 1000 conjunto inteiro das famílias A'=750/1000 A =250/1000 B' B P(A'e B')=650/100 P(A' e B)=100/1000 B P(A e B)=200/1000 B' P( A e B')=50/1000 Calculo da probabilidade de P(B). P(B/A)= probabilidade de B dado que ocorreu A 200 P B∩ A 1000 P B/ A= = =80% P A 250 1000 entao a P(B)=80%=200/250 A P(A e B)= P(A)*P(B)=200/1000 resulta o valor da tabela Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 16 29) EXEMPLO: MOTGOMERY( 2003, p.40), uma historia de 266 amostras de ar foi classificada com base na presença de duas moléculas raras. Faça A denotar o evento que consiste em todas as amostras de ar em que a molécula rara 1 esteja presente. Faça B denotar o evento que consiste em todas as amostras de ar em que a molécula rara 2 esteja presente. Conforme tabela : Tabela 1: Moléculas em Amostra de Ar MOLECULA 1 PRESENTE (A) MOLECULA 2 PRESENTE (B) nao sim nao 212 24 236 sim 18 12 30 230 36 266 12 P( B∩ A) 266 12 = = Solução: P( B/ A)= P( A) 36 36 266 Molecula 1 presente 230/266 ( nao) 36/266 ( sim) Molecula 2 esta presente 212/230 nao 18/230 sim Prof jorge roberto grobe AD34S 24/36 nao 12/36 sim 11/09/2014 14:19:16 17 INDEPENDÊNCIA ESTATÍSTICA Em WITTE (2005), a ocorrência de um resultado não possui nenhum efeito sobre a • probabilidade de que o outro resultado venha ocorrer. Regra da multiplicação para resultados independentes P(A e B)= P(A) *P(B) Multiplicar as probabilidades em separado de vários resultados independentes para encontrar • a probabilidade de que esses resultados venham ocorrer conjuntamente. Para LEVINE (20005), a independência estatística pode ser determinada utilizando-se a • equação: P(A / B)=P(A) ou P(B/A)=P(B) • MILONE (2004, p.120), independentes são aqueles em que a ocorrencia de um não altera a chance de os outros acontecerem; • • cada um comporta-se a sua própria maneira , sem afetar nem ser influenciado pelos demais. No lançamento de uma moeda , o fato de ter saido cara em uma jogada não modifica a probabilidade de sair cara na seguinte; • a chance de um jogador receber um ás permanece igual se a carta retirada é reposta no baralho antes da próxima extração; • o fato de ter caido cara no lançamento de uma moeda não afeta a possibilidade de sair par no lançamento de um dado; • lançados dois dados, sair face tres em um deles não modifica a chance de sair face 4 no outro. • Exemplo: MILONE ( 2004,p.138) qual a probabilidade de se obter, no lançamento de duas moedas: a) só coroas • b) uma coroa e uma cara Como os eventos são independentes. Soluçaõ : P(Ke K)= p(k) * p(k)=0,25 P(Ke C)= p(k)*p(c) =0,25 • 30) EXEMPLO: DOMENICO ( p.134), a probabilidade de quem um casal o marido esteja vivo aos 70 anos é 1/8 e que a mulher esteja viva aos 70 anos é 1/10. Qual é a probabilidade do casal estar vivo aos 70 anos? Solução : 1 1 1 P A∩B= ∗ = 8 10 80 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 18 31)EXEMPLO: DOMENICO (p. 134), seja uma moeda, sendo A={cara, coroa} e um dado , com B={1,2,3,4,5,6}. Qual é a probabilidade de ser obtido o evento coroa na moeda e número impar no dado? Resposta: 1 3 1 ∗ = 2 6 4 32) FARBER( 2009, p.126) Computadores e acesso a internet. Um estudo descobriu que 62% das residencias nos EUA tem computador. Desses 62%, 88% tem acesso a internet. Encontre a probabilidade de que uma residencia americana selecionada aleatoriamente tenha computador e acesso a internet. Resposta:0,62*0,88=0,546 * diagrama da arvore. 33) FARBER( 2009, p.125) A tabela mostra os resultados de uma pesquisa na qual 146 famílias foram questionadas se tem computado e se vao tirar férias de verão este ano. Férias de verão este ano Tem computador sim nao sim 46 11 nao 55 34 total total a) encontre a probabilidade de selecionar aleatoriamente uma família que não vá tirar férias de verao este ano. R:0,3082 b) encontre a probabilidade de que uma família selecionada aleatoriamente tenha computador. R:0,3904 c) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verao este ano, dado que tem computador. R:0,807 P ( B / A)= P ( Ae B) 46/146 46 = = P( A) 57/146 57 d) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verão este ano e tenha computador. R:0,315 e) os eventos de ter um computador e tirar férias de verão são eventos dependentes ou independentes? solução : P (B / A)= P( B) para ser independentes. P ( B / A)= 46 e 57 P (B)= 101 146 como as duas probabilidades P(B/A) é diferente de P(B) os eventos são dependentes. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 19 34) FARBER (2009, p.135) A tabela mostra o numero de homens e mulheres matriculados em enfermagem no centro de saude da Universidade de Oklahoma em um semestre recente. Um estudante é selecionado aleatoriamente. Encontre a probabilidade de cada evento. Estudantes de enfermagem Estudantes de outros total cursos homens 95 1015 mulheres 700 1727 total a) o estudante é homem ou estuda enfermagem. R:0,512 b) o estudante é mulher ou não estuda enfermagem. R: 0,762 c) o estudante não é mulher ou estudante de enfermagem. R:0,589 d) os eventos ser homem e ser estudante de enfermagem são mutuamente exclusivos? Explique. R: não são mutuamente exclusivos, por que um homem pode estudar enfermagem. MILONE (2004, p.139) Probabilidade de ocorrencia disjunta dos eventos A e B. Mutuamente excludentes Mutuamente não excludentes P(A ou B)=P(A) + P(B) P(A ou B)=P(A) + P(B)- P(Ae B) Exemplo : Qual a probabilidade de se retirar , de um baralho, em uma única tentativa: a) um ás ou valete solução : a) b) um ás ou uma carta de espadas 13 4 4∗13 4 4 4 2 + = + − = b) 52 52 13 52 52 52∗52 13 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 20 4.5 Teorema de Bayes • Segundo LEVINE (2005), a probabilidade condicional leva em consideração informações sobre a ocorrência de um evento para encontrar a probabilidade de um outro evento. • Determina a probabilidade de que um determinado efeito tenha ocorrido em função de uma causa específica. P Bi / A= P A/ Bi P Bi P A/ B1 P B1P A /B 2 P B 2...P A/ BK P B K 35)EXEMPLO: LEVINE( 2005, p.162 ) A empresa está avaliando a comercialização de um novo modelo de aparelho de televisão. No passado, 40% dos televisores introduzidos pela empresa obtiveram sucesso e 60% não. Antes de introduzir o aparelho de televisão no mercado, o departamento de pesquisas de mercado realiza um amplo estudo e divulga um relatório favorável ou desfavorável. Anteriormente, 80% dos aparelhos de televisão haviam recebido um relatório favorável da pesquisa de mercado, e 30% dos aparelhos de televisão que não obtiveram sucesso haviam recebido um relatório favorável. Qual é a probabilidade de que o televisor obterá sucesso? Solução: Sejam os eventos S= tv bem sucedida S’=tv mal sucedido F = relatório favorável F’=relatório nao favorável Dados as probabilidades: P(S)=0,4 P(S’)=0,6 P(F/S)=0,8 P(F/S’)=0,3 P ( S / F )= P (S / F ) P (S ) P ( F / S) P ( S)+ P (F / S ' ) P (S ' ) Qual é a probabilidade de que o televisor obterá sucesso? P(S/F)? P( S /F )= 0,40∗0,80 0,40∗0,80+ 0,60∗0,30 Resposta: a probabilidade de um modelo de TV ser bem sucedido , sendo conhecido que foi recebido um relatório favorável , é igual a P(S /F) =0,64 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 21 ARVORE DA DECISÃO S S' 0,4 F 0,6 F' 0,8 0,8*0,4 F F' 0,2 0,3 0,7 0,4*0,2 0,6*0,3 0,6*0,7 Cálculos do Teorema de Bayes Probabilidades Event Condicion Combina o A Priori al da Revisada S 0,4 0,8 0,32 0,64 S' 0,6 0,3 0,18 0,36 Total: 0,5 digitar os dados conforme está pedindo no problema. No CAL PARA RESOLVER 1 Cálculos do Teorema de Bayes 2 3 Probabilidades A Eve Prio Condici Combin Revisad 4 nto ri onal ada a =D5/$D7 5 S X Z =B5*C5 $ =D6/$D7 6 S' Y T =B6*C6 $ =D5+D 7 Total: 6 *X e Y a soma é 100% (Verdadeiro e Falso) *Z e T é a condicional é dado no problema. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 22 4.5.1 Exercicios 36) A probabilidade de que uma pessoa seja portadora de uma certa enfermidade é 0,03. Testes diagnósticos médicos encontram-se disponíveis para determinar se a pessoa efetivamente é portadora de uma enfermidade. Se a enfermidade estiver realmente presente, a probabilidade de que o teste diagnóstico médico apresente um resultado positivo(indicando) que a enfermidade está presente) é 0,9. Se a enfermidade não estiver efetivamente presente , a probabilidade de um resultado positivo para o teste (indicando que a enfermidade está presente) é 0,02.Suponha que o teste para diagnóstico médico tenha apresentado um resultado positivo( indicando que a enfermidade está presente). Qual é a probabilidade de que a enfermidade esteja efetivamente presente? Qual é a probabilidade de um resultado positivo para o teste? Solução :evento D=é portador D’=não é portador T=o teste é positivo T’= o teste não é positivo fazer a arvore de decisão P(D e T )=P( T / D)*P(D)=probabilidade de T dado que saiu D vezes a probabilidade de D. Resolver na planilha eletrônica do libreOffice EVENTOS EVENTOS F1 Ai F2 F3 0,0270 REVISADA P(A/Ai) 0,5819 0,0000 0,0000 0,0194 0,4181 P(B') 0,0000 0,0000 P(C) 0,0000 0,0000 P(C') 0,0000 0,0000 CONDICIONAL COMBINADA P(A/Ai) P(A e Ai)*P(A) P(A) P(F1) 0,9000 0,0300 P(A') P(F2) 0,9700 P(F3) P(B) 0,0200 1 probabilidade total Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 0,0464 23 Resposta: P(T/D) = 0,5819 ( é a probabilidade de que o teste seja positivo e a pessoa seja portadora da enfermidade) 37) Conforme exercício anterior, suponha que a probabilidade de um teste para diagnóstico médico ofereça um resultado positivo, sem que haja presença da enfermidade, seja reduzida de 0,02 para 0,01. Sendo conhecida esta informação: a) se o teste para diagnóstico médico tiver apresentado um resultado positivo (indicando que enfermidade está presente), qual é a probabilidade de que a enfermidade esteja efetivamente presente? R:0,736 Cálculos do Teorema de Bayes Evento S S' A Priori 0,03 0,97 Probabilidades Condicional Combinada 0,9 0,03 0,01 0,01 Total: 0,04 Revisada 0,7357 0,26 b)se o teste para diagnóstico médico tiver apresentando um resultado negativo (indicando que a enfermidade não está presente), qual é a probabilidade de que a enfermidade não está efetivamente presente? R: 0,997 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 24 EVENTOS EVENTOS F1 F2 F3 Ai 0,0000 REVISADA P(A/Ai) 0,0000 0,0030 0,0031 0,0000 0,0000 0,9506 0,9969 P(C) 0,0000 #DIV/0! P(C') 0,0000 0,0000 CONDICIONAL COMBINADA P(A/Ai) P(A e Ai)*P(A) P(A) P(F1) 0,0300 P(A') P(F2) 0,9700 0,1000 P(B) P(B') P(F3) 0,9800 1 probabilidade total 0,9536 38)MILONE( 2006, p.146) o medicamento M cura 65% das ocorrências da doença D. Se ministrado as dois pacientes, qual a probabilidade de: a) curar os dois? R: 0,65*0,65=0,4225 b) não curar nenhum? R:0,35*0,35=0,1225 c) curar só um deles? R: 0,65*0,35 + 0,35*0,65 =0,455 * use o diagrama da arvore 39) MILONE( 2006, p.145) A pé na Tábua LTDA verificou que 2 em 15 de seus veículos pifam por defeito mecânico e 3 em 15 por falha elétrica . Seu departamento de manutenção também levantou que , por viagem 18% dos veículos apresentam defeito mecânico e 29% falha elétrica. Qual a chance de um defeito mecânico impedir um dos veículos de chegar ao destino? R:29,27% • teorema de Bayes • calculo da probabilidade: • evento D:defeito mecanico • evento D': defeito elétrico 2/15∗0,18 =0,2927 2/ 15∗0,18+ 3/15∗0,29 Cálculos do Teorema de Bayes Evento D D' C A Priori 0,1333 0,2000 Prof jorge roberto grobe AD34S Probabilidades Condicional Combinada 0,18 0,0240 0,29 0,0580 0 0,0000 Total: 0,0820 11/09/2014 14:19:16 Revisada 0,2927 0,7073 0,0000 1 25 40) MILONE( 2006, p.145) Se 89% dos indivíduos atendidos por um ambulatório são RH- , qual a chance de 5 pacientes aleatoriamente escolhidos serem RH+? solução: 0,11*0,11*0,11*0,11*0,11=0,0000161051 41) MILONE( 2006, p.145) Se as probabilidades de Romeu e Julieta estarem vivos daqui a 25 anos são, respectivamente , 63% e 66%, e se o casamento deles tem 10% de probabilidade de acabar em divórcio antes, qual a chance de : a) eles estiverem bodas de prata? R:0,3742 =0,63*0,66*0,9 b) ela estar viuva naquela ocasião? R: 0,2442=0,37*0,66 c) pelo menos um deles estar vivo? R: 0,8742=0,63*0,34+0,37*0,66+0,63*0,66 d) ele estar vivo naquela ocasião? R:0,2142=0,63*0,34 • fazer o diagrama da arvore 4.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL ALEATÓRIA DISCRETA ◦ VARIÁVEL ALEATÓRIA DISCRETA MONTGOMERY E MEYER ◦ FARBER(2009, p. 155) , o resultados de um experimento de probabilidade é uma contagem ou medida, este resultado é chamado de variavel aleatoria. ◦ Variavel aleatoria x representa um valor numerico associado a cada resultado de um experimento de probabilidade. ◦ Aleatoria significa que x é determinando por acaso. ◦ Discreta: numero finito ou contavel de possíveis resultados. ◦ Contínua : numero incontavel de possíveis resultados, representados por um intervalo na reta numerica. ◦ Discreta:Numero de ligações que um vendedor faz em um único dia. {0,1,2,3,4,...}, pode ser listada os valores possíveis ◦ contínua: tempo gasto em horas que um vendedor faz ligações em um dia :[0;24] ◦ incluindo frações e decimais, não pode ser listadas os valores possíveis. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 26 4.6.1 Distribuições de probabilidades discretas • FARBER (2009, p.156) , a distribuição de probabilidade discreta lista cada valor possível que a variavel aleatoria pode assumir, junto com sua probabilidade. • Uma distribuição de probabilidade tem as seguintes condições: • 0≤P x ≤1 • ∑ P x=1 VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA DISCRETA • LEVINE (2005) , é a média ponderada de todos os possíveis resultados X - sendo os pesos as probabilidades P(X) associadas a cada um dos resultados. u =E x = n X i P X i i=1 • FARBER( 2009, p.161), a média de uma variavel aleatoria representa o que ira acontecer em milhares de testes. Variância e Desvio padrão de uma variável aleatória discreta VARIÂNCIA 2 = N [ X i−E X ]2 P X i i=1 DESVIO PADRÃO = N [ X i −E X ]2 P X i i=1 42) EXEMPLO:Calcule a média ( o valor esperado) , desvio padrão e a variância. Hipotecas de imóveis aprovadas por semana 0 1 2 3 4 5 Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 probabilidade 0,1 0,1 0,2 0,3 0,15 0,1 27 6 0,05 R: 44) FARBER( 2009, p.163) Um sociológo pesquisou as famílias em uma cidade pequena. A variavel aleatoria x representa o numero de criancas na família. x 0 1 2 3 4 P(x) 0,07 0,2 0,38 ? 0,13 R :0,22 45) FARBER (2009, p.163) o numero de computadores por casa, em uma cidade pequena. computadores 0 1 2 3 casas 300 280 95 20 a) use distribuição de frequência para construir a distribuição de probabilidade. b) calcule a média R:0,8 c)variancia R:0,6 d) desvio padrão R:0,8 e) interprete os resultados no contexto da vida real. 46) FARBER (2009, p163) Os alunos de um sala de aula fazem um teste com 8 perguntas. O numero x de perguntas respondidas corretamente pode ser aproximado pela seguinte distribuição de probabilidade. x 0 1 2 3 4 5 6 7 8 P(x) 0,02 0,02 0,06 0,06 0,08 0,22 0,3 0,16 0,08 a) faça um histograma ou grafico em barras. b) calcule a média c) variancia d) desvio padrao e) valor esperado da distribuição de probabilidade. f) interprete os resultados. Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 28 47)Utilizando os registros da empresa para os últimos 500 dias úteis, o gerente da Koing Motors, uma agencia de automóveis do subúrbio, fez uma relação do numero de carros vendidos por dia, na tabela a seguir apresentada: Numero de carros Freqüência vendidos De Ocorrência Por dia 0 1 2 3 4 5 6 7 8 9 10 11 Total: 500 40 100 142 66 36 30 26 20 16 14 8 2 a) forme a distribuição de probabilidade para o numero de carros vendidos por dia. b) calcule a média aritmética ou o numero esperado de carros vendidos por dia R: c)calcule o desvio padrão R: Qual é a probabilidade de que um determinado dia d) menos de 4 carros sejam vendidos ? RESPOSTA: 69,60% Prof jorge roberto grobe AD34S 11/09/2014 14:19:16 29 e)no máximo 4 carros sejam vendidos? RESPOSTA:76,80% f) pelo menos 4 carros sejam vendidos? RESPOSTA:30,40% g) exatamente 4 carros sejam vendidos? RESPOSTA:7,20% h) mais de 4 carros sejam vendidos? RESPOSTA: 23,20% 4.6.1.1 Distribuição binomial • FARBER(2009, p.165), um experimento binomial tem os seguintes critérios: 1. o experimento é repetido por um numero fixo de tentativas, onde cada tentativa é independente das outras. 2. Tem apenas dois resultados possíveis sucesso (S) ou fracasso(F). 3. A probabilidade de um sucesso P(S) é a mesma para cada tentativa. 4. A variavel aleatoria x contabiliza o numero de tentativas com sucesso. Exemplo : FARBER (2009, p.166) Decida se o experimento é binomial ou não. i)Um dado procedimento cirurgico tem 85% de chances de sucesso. Um médico realiza o procedimento em 8 pacientes. A variável aleatória representa o numero de cirurgias com sucesso. • Está de acordo com as 4 condições. • Cada cirurgia representa uma tentativa e há 8 cirurgias e cada uma é independente da outra. • Tem dois resultados possíveis sucesso ou fracasso. • p=sucesso e q=fracasso • (p+q)8= p 8+ 8∗ p7∗q+... • probabilidade de 8 pacientes obtiverem sucesso na cirurgia é 0,858=27,24% • probabilidade de 7 pacientes obtiverem sucesso e 1 fracasso é: 8* 0,857*0,15=38,47% DIAGRAMA DE ARVORE DOIS PACIENTES n=2 SUCESSO p Prof jorge roberto grobe AD34S FRACASSO q p 0,85 q 0,15 14:19:16 p 0,85 q 0,15 0,85 11/09/2014 0,15 30 aplicando o binomio de Newton : ( p +q)2 = p 2 +2∗p∗q+ q2=0,852 +2∗0,85∗0,15+ 0,152 • ii) Um jarra contem 5 bolinhas de gude vermelhas , 9 azuis e 6 verdes. Escolha 3 bolinhas aleatoriamente , sem trocas. A variavel aleatoria representa o numero de bolinhas vermelhas. • O experimento não é binomial porque ele não esta de acordo com as 4 condições de um experimento binomial. • Cada seleção de bolinha de gude representa uma tentativa e selecionar uma bolinha vermelha é um sucesso. • Quando a primeira bolinha é selecionada, a probabilidade de sucesso é 5/20. • Como a bolinha de gude não é colocada de volta a jarra, probabilidade de sucesso por tentativas subsequentes não é mais 5/20. • As tentativas não são independentes e a probabilidade de sucesso não é mais a mesma para uma cada das tentativas. • Primeira tentativa é: 5/20 =0,25 ( bolinhas vermelhas) • segunda tentativa: 4/19=0,21 • terceira tentativa :3/18=0,16 DISTRIBUIÇÃO BINOMIAL ( LEVINE, 2005) X n− X P ( X )= n p (1− p) X ( ) P(X)= probabilidade de X sucessos n= tamanho da amostra p= probabilidade de sucesso 1-p=probabilidade de insucesso ou fracasso X= numero de sucessos na amostra (X=0,1,2,...n) Formato Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 31 -pode ser simétrica ou assimétrica – se p=0,5 é simétrica – Para n =13 e p=0,50=50% Título principal 0,2500 0,2000 0,1500 Coluna C 0,1000 0,0500 0,0000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 MÉDIA ARITMÉTICA μ= E(x)=np DESVIO PADRÃO σ = √ np(1− p ) Sintaxe DISTRBINOM(X;tentativas;PS;A) X é o número de sucessos em uma série de tentativas. Tentativas é o número de tentativas independentes ( valor de n) PS é a probabilidade de sucesso em cada tentativa( probabilidade) Quando o parâmetro A for igual a 0, será calculada a probabilidade individual e quando o parâmetro A for igual a 1, será calculada a probabilidade cumulativa. Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 32 48) FARBER(2009, p.173)ENCONTRANDO E INTERPRETANDO A MÉDIA, A VARIANCIA E O DESVIO PADRÃO. Em Pittsburg , Pensilvania , cerca de 56% dos dias são nublados. Encontre a média , a variancia e o desvio padrão para o numero de dias nublados durante o mês de junho. Interprete os resultados e determine quaisquer valores incomuns. MÉDIA ARITMÉTICA μ= E(x)=np DESVIO PADRÃO σ = np 1− p Solução : n=30 p=0,56 q =0,44 média: 16,8 desvio padrão: 2,7 variancia:7,4 INTERPRETAÇÃO • Em média há 16,8 dias (17 dias) que são nublados no mês de junho. • O desvio padrão é aproximadamente 2,7 dias. • Valores que são mais do que 2 desvios padrões da média são considerados incomuns. • [16,8-2*2,7=11,4 ; 16,8 +2*2,7=22,2], o mês de junho com 11 dias nublados seria incomum, sendo que no mês de junho com 23 dias nublado também seria considerado incomum. 49)FARBER(2009, p.174) Em São Francisco , California , 44% dos dias em 1 ano apresentam tempo limpo. Encontre a média, a variancia e o desvio padrão para o numero de dias limpos durante o mês de maio ( 31 dias). Interprete os resultados e determine quaisquer valores incomuns. a) identifique um sucesso e os valores n , p, q. n=31 p=0,44 q=0,56 b) encontre o produto de n e p para calcular a média media :13,6 c) encontre o produto de n , p, q para a variancia variancia: 7,6 d) encontre a raiz quadrada das variancias para o desvio padrão. Desvio padrão: 2,8 e) interprete os resultados. Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 33 Em média, há 14 dias claros durante o mês de maio. Um mês de maio com menos de 8 dias de sol ou mais do que 19 dias de sol pode ser incomum. ( duplicando os desvio padrão) Probabilidades Binomiais Dados Tamanho da Amostra (n) Probabilidade de sucesso (p) 31 0,4400 Estatísticas Média Variância Desvio Padrão 13,6400 7,6384 2,7638 EXERCICIOS 50)LEVINE (2005, p.182) Determine o seguinte: a) Se n=4 e p=0,12 , então qual é a P(X=0)? R:0,5997 b) Se n=10 e p=0,9 , então qual é a P(X)=9? R: 0,38742 51) Se a probabilidade de um formulário de encomendas assinalado for 0,1, qual é a probabilidade de 3 ou mais ( ou seja pelo menos 3) formulários de encomendas assinaladas sejam encontrados, na amostra de 4 formulários de encomendas? Solução : P ( X 3 ) P ( X 0 ) P ( X 1 ) P ( X 2 ) 0 ,9 9 6 3 para obter P ( X 3 ) 1 0 ,9 9 6 3 0 ,0 0 3 7 0 ,3 7 % ou Probabilidades Binomiais Dados Tamanho da Amostra Probabilidade de sucesso Estatísticas Média Variância Desvio Padrão Prof jorge roberto grobe AD34S 4 0,1 0,4 0,36 0,6 11/09/2014 14:19:17 34 52) Registros de certificados de garantia mostram que a probabilidade de que um carro novo necessite de um reparo inerente a garantia, nos primeiros 90 dias , é de 0,05. Se uma amostra de 3 carros novos for selecionada: solução n=3 p=0.05 a) qual é probabilidade de nenhum deles necessite de reparo inerente a garantia? Resposta:0,8574 b) qual é probabilidade de que pelo menos um deles necessite de reparo inerente a garantia? Resposta: P(X=1)+P(X=2)+P(X=3)=0,14 c) qual é probabilidade de que mais de um deles necessite de reparo inerente a garantia? Resposta:P(X=2)+P(X+3)=0,01 d) que premissas são necessárias em (a) até (c)? e) qual é a media aritmética e o desvio padrão? Resposta: média: 0,15 desvio padrão: 0,3775 f)quais seriam as respostas para a até c , se a probabilidade de vir necessitar de um reparo inerente á garantia fosse 0,1? Estatísticas Média Variância Desvio Padrão resposta: 0,3000 0,2700 0,5196 4.6.1.2 Distribuição de Poisson (lê-se : poassom) • Observação de eventos discretos em um área de oportunidades-intervalo continuo ( de tempo, extensão, área de superficie) de maneira tal que, se a área de oportunidade ou intervalo for suficientemente reduzida. 1. Probabilidade de observar exatamente um sucesso no intervalo é estável. 2. A probabilidade de observar mais de um sucesso no intervalo é zero. 3. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em qualquer outro intervalo −λ P ( X )= e λ X! X P(X)=probabilidade de X sucessos, dado o conhecimento de λ λ= numero esperado de sucessos Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 35 e= constante matemática aproximada por 2,71828 X= numero de sucessos por unidade. Sintaxe POISSON(Número; MV; K) Número representa o valor que serve de base para o cálculo da distribuição de Poisson. MV representa o valor do meio da distribuição de Poisson. K = 0 calcula a função de densidade; K = 1 calcula a distribuição. 53) LEVINE (2005, p.183-184) Suponha que seja examinado o numero de clientes que chegam na hora do almoço, entre 12 h e 13h em uma agencia bancária localizada no centro de uma grande cidade. Qualquer chegada de cliente é um evento discreto, em um determinado ponto do tempo ao longo do intervalo continuo de 1 hora. Durante este intervalo de tempo pode haver uma média de 180 chegadas. Seja o intervalo de 1 hora desmembrando em 3600 intervalos consecutivos de 1 segundo. • O numero esperado ( média) do numero de clientes que chegam em qualquer intervalo de 1 segundo seria de 0,05. • a probabilidade de ter mais de um cliente chegando, em qualquer intervalo de 1 segundo, aproxima-se de zero. • A chegada de um cliente em qualquer intervalo de 1 segundo , não possui nenhum efeito ( ou seja estatisticamente independente) em relação a chegada de qualquer outro cliente, em qualquer outro intervalo de 1 segundo. 4.6.1.3 Exercicios 54)LEVINE (2005, p.186) Suponha uma distribuição de Poisson: a) Se λ=2,5 , então qual é P(X=2)? b) Se λ=8 , então qual é P(X=8)? Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 36 55) LEVINE (2005, p.187)Admita que o numero de erros de sistemas de rede ocorridos em um dia em um sistema de rede local (LAN- local de área network) seja distribuído na forma de uma variável aleatória de Poisson. O numero médio de erros de sistemas de rede ocorridos em um dia é 2,4. Qual é a probabilidade de que em um determinado dia: a)zero erro de sistemas de rede irá ocorrer? b) exatamente 1 erro de rede de servidor irá ocorrer? c) dois ou mais erros de sistemas de rede irão ocorrer? Solução :1- [P(X=1)+P(X=0)]=0,691559 d)menos de três erros de sistemas de rede irão ocorrer? Solução :1- [P(X=2 )+P(X=1)+P(X=0)] X 0 1 2 3 P(X) 0,090718 0,217723 0,261268 0,209014 56) FARBER (2009, p.181) A média do numero de acidentes por mês em certa intersecção é 3. Qual é probabilidade de que, em qualquer mês dado, 4 acidentes ocorram nessa intersecção? R:0,168. 57) FARBER (2009, p.182) 2000 mil trutas são colocadas em um pequeno lago. O lago tem um volume de 20000 metros cúbicos. Calcule a probabilidade de 3 das trutas sejam encontradas em um mesmo metro cubico do lago.SOLUÇÃO: média: 2000/20000=1/10 R: 0,0002 4.6.1.4 Distribuição hipergeométrica • A distribuição binomial e a hipergeométrica estão relacionadas. • O numero de sucessos em uma amostra contendo n observações. • Modelo binomial-dados são extraídos com reposição a partir de uma população finita. • Sem reposição de uma população infinita. • Modelo hipergeométrico- os dados são extraídos sem reposição a partir de uma população finita. • Experimento binomial-a probabilidade de sucesso é p (constante) para todas as observações. • O resultado não depende de outras observações. • Experimento hipergeométrico- o resultado de uma observação é afetado pelos resultados das observações anteriores • binomial – extraída de uma população infinita • hipergeométrica- extraída de uma população finita Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 37 P X = A X N −A n−X N n P(X)= probabilidade de sucessos n= tamanho da amostra N= tamanho da população N-A=numero de insucessos na população X= numero de sucessos na amostra A= numero de sucessos na população MEDIA ARITMÉTICA u=E X = nA N DESVIO PADRÃO = nA N − A N −n N−1 N2 fator de correção de população finita que resulta da amostragem sem reposição. N −n N−1 DIST.HIPERGEOM Retorna a distribuição hipergeométrica. Sintaxe DIST.HIPERGEOM(X; n; A; N) DIST.HIPERGEOM(X; NAmostra=n; Sucessos=A; NPopulação=N) X é o número de resultados alcançados na amostra aleatória. NAmostra é o tamanho da amostra aleatória. Sucessos é o número de resultados possíveis na população total. NPopulação é o tamanho da população total. Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 38 4. 6.1.4 Exercicios 58)LEVINE (2005, p.190) Determine o seguinte: a) Se n=4, N=10 e A=5 , então encontre P(X=3) b) Se n=5, N=12 e A=3 , então encontre P(X=0) c) calcular a media aritmética e o desvio padrão dos itens a e b EXEMPLO 59) Em uma remessa de 15 discos rígidos, 5 são defeituosos. Se 4 dos discos forem inspecionados: a) qual é a probabilidade de que exatamente 1 seja defeituoso? P X = A X N −A n−X N n Solução 1: N=15( população) A=5 (sucesso) n=4 (tamanho da amostra) R:0,43956 solução 2 : D ( defeituoso) B ( não é defeituoso) DBBB então : 5∗10∗9∗8 C 5∗C 10 1∗3∗2∗1 600 1 3 = = =0,43956 15∗14∗13∗12 1365 C 15 4 4∗3∗2∗1 b) de que pelo menos 1 seja defeituoso? R:0,8462 c)qual é a probabilidade de que não mais do que 2 sejam defeituosos? R:0,9231 d)qual é o numero médio de discos rígidos defeituosos que você esperaria encontrar na amostra de 4 drives de disco rígido? R:1,33 Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 39 4.6.1.5 Exercicios 60) O reitor de um escola de negócios deseja formar um comitê executivo de 5 entre 40 professores titulares da faculdade. A seleção deve ser realizada ao acaso, e na escola existem 8 professores titulares em contabilidade. Qual é a probabilidade de o comitê: a) não conter nenhum desses professores? Resposta: 0,3060 b)conter pelo menos 1 desses professores? Resposta: 1-P(X=0)=1-0,3060=0,6940 c)não mais do que 1 desses professores? Resposta:0,7432 d)qual seria a sua resposta para (a) , se o comitê fosse composto de 7 membros? P X = A X N −A n−X N n N=40 A=8 professores de contabilidade X 0 1 2 3 4 5 6 7 n=7 membros P(X) 0,1805 0,3888 0,3024 0,1080 0,0186 0,0015 0,0000 0,0000 Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 40 CAPITULO 5 5 A DISTRIBUIÇAO NORMAL E AS DISTRIBUIÇOES DE AMOSTRAGEM VARIÁVEL ALEATÓRIA CONTÍNUA |( MEYER E MONTGOMERY) 5.1 A DISTRIBUIÇÃO NORMAL Segundo LEVINE (2005, p.206), a distribuição normal envolve uma variável contínua, pode ser chamada de Distribuição de Gauss. Dentre varias distribuições e conhecidas como funções de densidade de probabilidade contínua. Dois tipos de variáveis: Variáveis contínuas (são medidas) peso, altura, mudanças diárias no preço de fechamento de ações, tempo de atendimento ao cliente, tempo de buscas em site da Web... Variáveis discretas (são contadas) Exemplo: tempo – medido e não contado. Importância da distribuição normal: – Inúmeras variáveis continuas parecem segui­las, ou podem ser aproximadas através dela. – a distribuição normal pode ser utilizada para aproximar várias distribuições de probabilidades – a distribuição normal oferece base para a inferência estatística clássica a sua relação com o teorema do limite central. LARSON & FARBER ( 2009, p.193) Propriedades da distribuição normal • a média , moda e a mediana são iguais. • Tem a forma de sino e é simétrica em torno da média. • A medida que a curva normal se distancia cada vez mais da média , ela se aproxima do eixo x, mas nunca o toca. • LEVINE (2005, p.206)Sua dispersão média(amplitude interquartil Q=Q3­Q1) é igual a 1,33 desvio padrão. Significa que a amplitude interquartil está contida dentro de um intervalo de 2/3 de um desvio padrão abaixo da media, até dois terços de um desvio padrão acima da media aritmética. • Sua variável possui amplitude entre ( −∞< x <∞ ) LEVINE ( 2005, p.208­209) o modelo ou expressão matemática que representa a função densidade de probabilidade é representada por f(X). Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 41 FUNÇÃO DENSIDADE DE PROBABILIDADE NORMAL f X = e −1 X − 2 2 σ [ ] σ 2 e = neperiano 2,71828 π = 3,14159 μ =media aritmética da população σ = desvio padrão X= qualquer valor entre ( −∞< x <∞ ) FORMULA DE TRANSFORMAÇÃO Z= X − PADRONIZAR Converte uma variável aleatória em um valor normalizado. Sintaxe PADRONIZAR(Número; MÉDIA; STD) Número é o valor que deverá ser padronizado. MÉDIA é a média aritmética da distribuição. STD é o desvio padrão da distribuição. A FUNÇÃO DE DENSIDADE DA PROBABILIDADE NORMAL PADRONIZADA −1 1 f Z = e2 2 Z2 essa função f(Z) calcula os valores pontuais e não area abaixo da curva. Comando • DIST.NORM(B9;B4;B6;falso()) • DIST.NORM(B9;B4;B6;VERDADEIRO()) calcula area abaixo da curva • Prof jorge roberto grobe AD34S 11/09/2014 14:19:17 42 • dist.normp ( não pode ser utilizada para fazer o grafico por que calcula a função da distribuição acumulada) EXEMPLO: Faça um vetor aleatorio com 25 numeros ou mais , padronizando esses dados e plotando em um grafico de dispersão ( linhas) 5.1.1 Exercicios 61) WITTE (2005), expresse cada um dos seguintes valores como um valor de z. a) o Qi de Margaret é 135, considerando uma média aritmética igual a 100 e um desvio padrão igual a 15. Z= 135−100 X − Z = =2,33 s 15 X=135 µ=100 σ=15 (desvio padrão) b) um resultado de 470 no teste oral SAT I, considerando uma media aritmética igual a 500 e um desvio padrão igual a 100. Z= 470−500 X − =−0,3 Z = 100 s Ou =PADRONIZAR(470;500;100)=­0,30 c) uma produção diária de 2100 unidades, considerando uma media aritmética igual a 2180 unidades e um desvio padrão igual a 50 unidades. Solução: z = 2100−2180 =−1,6 50 d) a estatura de Sam, correspondente a 68 , considerando uma media aritmética igual a 68 e um desvio padrão igual a 3. e)um erro de leitura de medição correspondente a ­3 graus, considerando uma media aritmética igual a zero grau e um desvio padrão igual a 2 graus. respostas: a)2,33 b)­0,30 c)­1,60 d)0 e)­1,50 62) Reproduza na planilha de calculo alguns numeros aleáorios a) Encontre os valores padronizados b) analisar a sua simetria Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 43 63) LEVINE (2005, p.221), dada uma distribuição normal padronizada ( μ=0 e σ =1),calcule as probabilidades: a) P(Z <1,57) Dados Comuns Média Desvio Padrão 0,0000 1,0000 Probabilidade de X <= Valor de X Valor de Z P(X<=1,57) 1,57 1,57 0,9418 b)P(Z >1,84) A probabilidade para Z>1,84 é 0,0329 ou 3,29% Probabilidade para X > Valor de X 1,84 Valor de Z 1,84 P(X>1,84) 0,0329 c) P(1,57<Z<1,84)= P(1,57<=X<=1,84) 0,0253 d) P(1,08<Z<1,96) qual o valor de Z se: P(1,08<=X<=1,96) 0,1151 e)50% de todos os valores possíveis de Z menores do que ele próprio? Sintaxe: Inv.normp( 0,50)= zero ( valor de z) f)somente 15,87% de todos os valores possíveis de Z forem menores do que ele próprio ? Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 44 g)somente 15,87% de todos os valores possíveis de Z forem maiores do que ele próprio ? respostas: a)0,9417 b)0,0328 c)0,0253 d)0,1151 e) 0 f) Z=­1 g) Z=1 64) Dada uma distribuição normal com μ=50 e σ=40, qual é a probabilidade de que: a) X>43? b)X<42 c)42<X<48 f)5% dos valores sejam menores do que qual valor de X? Comando :INV.NORMP( ) g)60% dos valores estejam entre que dois valores de X (simetricamente distribuídos em torno da media aritmética) h) 85% dos valores estejam acima de qual valor de X? Respostas: a) 0,9533 b)0,0228 c)0,2857 d) 0,0301 e)0,118 f)43,42 g)[16,3352; 83,6648] h)54,1457 65) Muitos problemas industriais envolvem a precisão nas junções de peças dos equipamentos, tais como hastes dentro de orifícios de válvulas. Um determinado projeto exige um haste com diâmetro de 22 mm; entretanto, hastes com diâmetro entre 21,9mm e 22,010 mm são aceitáveis. Suponha que o processo de fabricação produza hastes com diâmetros normalmente distribuídos, com média aritmética igual a 22,002 mm e desvio padrão igual a 0,005 mm. a) para este processo, qual a proporção de hastes com um diâmetro entre 21,9 mm e 22 mm? R: 0,344578 b) qual é a probabilidade de uma haste aceitável com diametro de até 22,010 mm? R: 0,945201 c)qual é o diâmetro que será excedido por somente 2% das hastes? R: 21,99173 d)quais seriam as respostas em (a) – (c) se o desvio padrão dos diâmetros das hastes fosse igual a 0,004? Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 45 respostas: a) 0,344578 b) 0,945201 c) 21,99173 d) 0,308538 ; 0,97725 ; 21,99379 66) Dada uma distribuição normal padronizada, determine as seguintes probabilidades: a) P(Z>1,34) b) P(Z <1,17) c) P(0 <Z<1,17) d)P(Z<­1,17) e)P(­1,17 < Z <1,34) f) P(­1,17 <Z <­0,50) respostas: a) 0,0901 b) 0,8790 c)0,3790 d)0,1210 e)0,7889 f)0,1875 5.2 AVALIANDO A PREMISSA DA NORMALIDADE • Para LEVINE (2005),nem todas as variáveis aleatórias continuas são normalmente distribuídas. • Portanto a analise descritiva de qualquer conjunto de dados a questão pratica permanece. • Como e possível determinar se os dados estão aproximadamente distribuídos de forma normal possa ser utilizada? • Duas abordagens descritivas exploratórias serão adotadas, para avaliar se o conjunto de dados parece ser aproximado da distribuição normal: • Comparação entre as características relativas ao conjunto de dados e as propriedades de uma distribuição normal subjacente. • A construção de um gráfico de probabilidade. Verificando a Normalidade construa gráficos e observe sua aparência. Para conjuntos de dados de tamanho pequeno ou moderado, construa uma disposição de ramos e folhas e um Box­plot. Para um conjunto de dados grande, construa a distribuição de freqüência e elabore um histograma. calcule as medidas descritivas resumidas e compare com as características dos dados com as propriedades teóricas e práticas da distribuição normal. obtenha a média aritmética e a mediana, e observe as semelhanças ou diferenças entre essas medidas de tendência central. obtenha a amplitude interquartil e o desvio padrão observe o quanto o intervalo interquartil pode se aproximar de 1,33 vezes o desvio padrão. obtenha a amplitude e observe o quanto ela pode se aproximar de 6 vezes o desvio padrão. Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 46 verifique se aproximadamente 2/3 das observações se encontram entre a X±σ verifique se aproximadamente 4/5 das observações se encontram entre a X ±1,28 verifique se aproximadamente 19 em cada 20 observações se encontram X±2σ CONSTRUINDO O GRÁFICO DA NORMAL DE PROBABILIDADE Um gráfico da normal de probabilidade é um gráfico bidimensional dos valores dos dados observados no eixo vertical, com seus correspondentes valores de quantis, a partir de uma distribuição normal padronizada no eixo horizontal. Passos utilizados na construção de um gráfico da normal de probabilidade. 1. disposição ordenada dos dados 2. calcular os valores padronizados dos quantis 3. nos eixos vertical – dados observados e eixo horizontal –quantis padronizados 4. para normalidade dos dados­ evidencias de uma linha reta i Amostra Quantis Padronizados De dados n=tamanho da amostra (abscissa) (ordenada y) 1 x1 Qi = 2 x2 i n1 Invnormp(Qi) xn n 5.3 Exercicios 67) LEVINE (2005), em uma fábrica de pontas de borracha,a borracha crua é composta em uma misturadora e então cortada em formato de finas tiras. As tiras são prensadas em modeladoras e vulcanizadas nos formatos das pontas de borracha desejadas. Os pesos ( em gramas) de um amostra de pontas de borracha são os seguintes: 8,63 8,59 8,63 8,67 8,64 8,65 8,61 8,67 8,65 8,64 8,57 8,6 8,54 8,69 8,52 8,57 8,66 8,62 8,66 8,69 8,54 8,65 8,65 8,62 8,66 8,69 8,5 8,58 8,63 8,66 8,63 8,61 8,65 8,59 8,61 8,64 8,61 8,67 8,65 8,55 8,57 8,53 8,59 8,66 8,54 8,64 8,51 8,61 8,65 8,62 8,63 8,72 8,58 8,68 8,66 Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 47 8,57 8,58 8,65 8,66 8,56 8,61 8,64 8,73 8,62 8,6 8,59 8,69 8,7 8,54 8,62 8,56 8,64 8,65 8,67 8,61 8,71 8,75 8,56 8,62 8,66 a) construindo um gráfico da normal de probabilidade 8,8 8,75 8,7 8,65 8,6 8,55 8,5 8,45 8,4 8,35 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 é uma distribuição normal , por que os dados estão próximos de uma reta . 68) Problemas relacionados com uma linha telefônica, que impedem o cliente de receber ou fazer ligações , são desagradáveis tanto para o cliente como para a companhia telefônica.Estes problemas podem ser de dois tipos: aqueles que estão localizados dentro de uma central telefônica e o equipamento do cliente. Os dados a seguir representam amostras de 20 problemas informados a duas diferentes centrais telefônicas de uma companhia, e o tempo para a solução destes problemas em minutos, a partir das linhas dos clientes: tempo para a solução dos problemas (em minutos) na central telefonica I 1,48 1,75 0,78 1,02 0,53 0,93 0,52 1,6 4,15 0,8 1,05 6,32 1,48 5,45 3,1 2,85 1,6 3,97 3,93 0,97 tempo para a solução dos problemas (em minutos) na central telefonica II 7,55 1,92 0,52 3,75 1,1 4,23 3,75 0,6 3,3 0,65 0,6 0,08 0,1 1,53 2,1 1,48 0,58 1,65 4,02 0,72 a)construa um gráfico normal de probabilidade Prof jorge roberto grobe AD34S 11/09/2014 14:19:18 48 grafico central telefonica 1 7 f(x) = 1,78x + 2,21 6 R² = 0,85 5 4 Coluna E Linear (Coluna E) 3 2 1 -2,0000 0 0,0000 -1,0000 1,0000 2,0000 grafico central telefonica 2 8 7 6 5 + 2,01 f(x) = 1,94x R² = 0,83 4 Coluna E Linear (Coluna E) 3 2 1 -2,0000 -1,0000 Prof jorge roberto grobe AD34S 0 0,0000 11/09/2014 1,0000 14:19:19 2,0000 49 69) Disposições ordenadas de resultados hipotéticos de provas intermediarias de 19 alunos , em cada um dos quatro períodos de I a IV, de um curso de introdução a economia e os valores ordenados normais padronizados correspondentes. I II III IV Qi Dist. Dist Dist. Dist. Em =i/(n+1) Normal assimétrica a Assimétri formato transforma em z forma esquerda ca retangular Z=inv.normp( ) de sino 48 52 55 57 58 60 61 62 64 65 66 68 69 70 72 73 75 78 82 47 54 58 61 64 66 68 71 73 74 75 76 77 77 78 79 80 82 83 direita 47 48 50 52 53 53 54 54 55 56 57 59 62 64 66 69 72 76 83 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 0,05=­1,65 a 19/20=1,65 Construa o gráfico usando a dispersão dos dados e box­plot. 70) CRESPO (1993), um teste padronizado de escolaridade tem distribuição normal com media 100 e desvio padrão 10. Determine a probabilidade de um individuo submetido ao teste ter nota: a) maior que 120 b)maior que 80 c)entre 85 e 115 d)maior que 100 respostas:a) 0,0228 b) 0,9772 c)0,8664 d)0,5 71) CRESPO (1993), os pesos de 600 estudantes são normalmente distribuídos com media 65,3 kg e desvio padrão 5,5 kg. Determine o numero de estudantes que pesam: a) entre 60 e 70 kg * a probabilidade de encontrar estudantes que pesam entre 60 e 70 kg é aproximadamente 0,6360*600=381 alunos. b)mais que 63,2 kg c)menos que 68 kg respostas:a)0,6360 b)0,6487 c)0,6883 Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 50 72) Conforme dados na tabela 1 de consumo de água ( 03/06 – 01/07) e energia elétrica (jul/06 – ago/05). TABELA 1­ CONSUMO DE AGUA E ENERGIA ELETRICA Datas Água Datas 3 (m ) 03/06 04/06 05/06 06/06 07/06 08/06 09/06 10/06 11/06 12/06 01/07 consumo 16 16 17 17 20 16 15 20 17 17 15 Energia elétrica (kwh) Jul/06 Jun/06 Mai/06 Mar/06 Fev/06 Jan/06 Dez/05 Nov/05 Out/05 Set/05 Ago/05 consumo 294 318 239 243 273 296 257 266 257 291 250 a)verifique se as duas amostras vem de uma distribuição normal. 5.4 A DISTRIBUIÇÃO EXPONENCIAL • Em LEVINE (2005), e uma distribuição de probabilidade contínua, quando são avaliados processos de produção e serviços. • A distribuição exponencial também utilizada na teoria das filas e linhas de espera, para medir o tempo decorrido entre chegadas de clientes em locais de prestação de serviços, tais como caixa eletrônicos e lanchonetes, chegadas de pacientes em pronto socorro e buscas em site da internet. P tempo de chegada X =1−e− X λ=media aritmética da população de números de chegadas por unidade. X=qualquer valor da variável contínua , 0<X<∞ 5.5 Exercicios 73) Suponha que clientes cheguem a uma caixa eletrônico de um banco, numa taxa de 20 por hora.Se um cliente acabou de chegar, qual e a probabilidade de que o próximo cliente chegue dentro de 6 minutos ( ou seja 6/60=0,1 hora)? Dados Média Valor de X Prof jorge roberto grobe AD34S 20 0,1 Resultados P(<=X) 11/09/2014 14:19:19 0,8647 51 Resposta:a probabilidade de um cliente chegue dentro de 6 minutos e igual a 0,8647 ou 86,47%. 74) Dada uma distribuição exponencial com média de λ=10, qual é a probabilidade de que: a) tempo de chegada menor do que X=0,1? b) tempo de chegada maior do que X=0,1? c)o tempo de chegada esteja entre 0,1 e 0,2? d)o tempo de chegada seja menor do que X=0,1 ou maior do que X=0,2? Respostas: a) 0,6321 b)0,3679 c)0,2326 d)0,7674 75) Um acidente de trabalho ocorre uma vez cada 10 dias, em média, em uma montadora de automóveis. Qual e a probabilidade de que o próximo acidente de trabalho ira ocorrer em : a) 10 dias ? λ=0,1 b) 5 dias? λ=0,05 c) 1 dia? λ=0,01 Respostas: a) 0,6321 b)0,3935 c)0,0952 5.5 INTRODUÇÃO ÀS DISTRIBUIÇÕES DE AMOSTRAGEM Conforme LEVINE (2005, p.232), um dos principais objetivos da analise de dados é: utilizar estatísticas tais como media aritmética da amostra e a proporção da amostra, para estimar os parâmetros das referidas populações. Tirar conclusões sobre a população e não sobre a amostra. Uma pesquisa sobre intenções de votos eleitorais estaria interessada nos resultados da amostra, somente como um meio de estimar a real proporção de votos que cada candidato receberia, a partir de uma população de eleitores. 5.6 DISTRIBUIÇÃO DE AMOSTRAGEM DA MEDIA ARITMÉTICA A medida de tendência central mais utilizada é a media aritmética. Para uma população caso seja presumido que seja uma distribuição normal e a melhor medida. • Média aritmetica é tida como sem viés, porque a média de todas as possíveis médias aritmeticas da amostra ( de um determinado tamanho da amostra n) será igual a média aritmetica da população . Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 52 MÉDIA ARITMÉTICA DA POPULAÇAO N ∑ Xi = i=1 N DESVIO PADRÃO σ= N= tamanho da população N ∑i=1 X i−μ 2 N ERRO PADRAO DA MEDIA ARITMETICA O erro padrão da media aritmética, σ X , e igual ao desvio padrão da população , σ , dividido pela raiz quadrada do tamanho da amostra, n: X= n a medida que cresce o tamanho da amostra, o erro padrão da media aritmética ira decrescer em um fator igual a raiz quadrada do tamanho da amostra. Esta equação X= pode ser utilizada como uma aproximação do erro padrão da media n aritmética, quando a amostra e selecionada sem reposição, se a amostra contiver menos de 5% de toda a população. AMOSTRAGEM A PARTIR DE POPULAÇÕES NORMALMENTE DISTRIBUÍDAS Encontrando z para a distribuição de amostragem da média aritmética Z= X −μ x σx = X −μ σ n X =media da amostra =média da população =desvio padrão da população Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 53 5.7 EXERCICIOS 76) FABER( 2010, p.225) A tabela a seguir mostra o periodo que as pessoas passam dirigindo todos os dias. Seleciona aleatoriamente 50 motoristas com idade entre 15 e 19 anos. Qual é probabilidade de que a média de tempo que eles passam dirigindo todos os dias seja entre 24,7 e 25,5 minutos? Suponha que σ=1,5 minutos tempo atras do volante media de tempo gasto por dia, dirigindo, por faixa etaria 15-19 20-24 25-54 55-64 65 mais 25 minutos 52 minutos 64 minutos 58 minutos 39 solução 1: o tamanho da amostra é maior que 30, então pode-se usar o teorema do limite central para concluir que a distribuição de médias das amostras é aproximadamente normal. Solução 2: X=27,7 e X= 25,5 z1=-1,4142 e z2=2,3570 X −μ x X −μ X −25 = σx σ 1,5 √n √(50) resposta:0,9121 Solução 3: interpretaçãoZ= • = na amostra de 50 motoristas de idade entre 15 e 19 anos, 91,21% terá uma média entre 24,7 e 25,5 minutos dirigindo. • Supõe-se que μ=25 esteja correto, somente 8,79% da amostra estará fora do intervalo dado. 77) FARBER (2010, p.227) Um auditor de banco declara que as contas de cartões de credito são normalmente distribuidas, com média de $2870 e um desvio padrão de $ 900. a) qual é a probabilidade de que um titular de cartão de credito aleatoriamente selecionado tenha uma conta menor que $2500? R; P(z<­0,4111)=0,3405 b) Selecionar 25 titulares de cartões de credito de forma aleatoria. Qual é a probabilidade de que a média da conta deles seja menor que $ 2500? R:P(z<­2,06) =0,0197 c) compare as probabilidades de (a) e (b) e interprete sua resposta nos termos da declaração do auditor.R: • Tem uma chance de 34% de que um indivíduo tenha uma conta menor que $2500. • E há somente uma chance de 2% de que a média de uma amostra de 25 pessoas tenha uma conta menor que $ 2500. Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 54 • Como há somente uma chance de 2% que a média de uma amostra de 25 tenha uma conta menor que $2500 , este é um evento incomum. • È possível que a declaração do auditor de que a média $2870 seja incorreta. Amostragem a partir de populações cuja distribuição não é normal • Para LEVINE (2005, p.239), como regra geral, estatísticos acham que em muitas distribuições de população quando o tamanho da amostra é pelo menos igual a 30, com isso a distribuição de amostragem da media aritmética estará próxima da normal. • Quando a população for normalmente distribuída a distribuição de amostragem da media será normalmente distribuída , independentemente do tamanho da amostra. • σ A medida que o tamanho da amostra cresce, a variabilidade descrita σ X= √ n (erro padrão da media) decresce. • Portanto a ausência de viés a media de qualquer distribuição de amostragem e sempre igual a media da população. Teorema do limite central • Afirma que a medida que o tamanho da amostra ( ou seja, o numero de observações em cada amostra) se torna suficientemente grande, a distribuição de amostragem da media aritmética pode ser aproximada pela distribuição normal. • Independe do formato da distribuição dos valores individuais na população. Algumas conclusões sobre o teorema do limite central são mostradas : A normalidade e a distribuição de amostragem da media aritmética 1. Para maior parte das distribuições de população , não dependendo do formato , a distribuição de amostragem da media será distribuída de forma aproximadamente normal, se forem selecionadas de pelo menos 30 observações. 2. Caso a população seja relativamente simétrica, e forem selecionadas pelo menos 15 observaçoes , também será uma aproximação da normal. 3. Se a população é normal a distribuição da media tem uma distribuição normal. O EFEITO DO TAMANHO DE AMOSTRA (n) NO AGRUPAMENTO DE MÉDIAS ARITMÉTICAS NA DISTRIBUIÇÃO DE AMOSTRAGEM Z= Prof jorge roberto grobe AD34S 11/09/2014 X −μ x σx 14:19:19 = X −μ σ √n 55 5.8 EXERCICIOS 78) Dada uma distribuição normal =50 e =5, se uma amostra de n =100 e selecionada: a) qual é a probabilidade de X seja menor do que 47? * padronizar os dados Solução: X −μ x Z= σx = X −μ 47−50 −3 = = =−6 σ 5 0,5 n 100 Z<­6 Probabilidade de X <= Valor de X Valor de Z P(X<=-6) -6 -6,0000 0,000000000987 b) qual e a probabilidade de X esteja entre 47 e 49,5? Z= Z= X −μ x = σx X −μ x σx = X −μ 47−50 −3 = = =−6 σ 5 0,5 n 100 X −μ 49,5−50 −0,5 = = =−1 σ 5 0,5 √n √100 P(­6<z<­1)=0,1587 c) qual e a probabilidade de X esteja acima de 51,1? resposta:0,0139 d) qual e a probabilidade de X esteja entre 49 e 51? R: 0,9544 e)existe uma chance de 35% de que X esteja acima de que valor? Solução:calcular o valor de z para area abaixo de 65% z=0,3853 , então tem ­se 35% de area acima. 0,3853= X −50 X =50,195 0,5 f) quais seriam as respostas (a) ate (e) se n=25. Respostas: 0,00135 ;0,30715; 0,1357; 0,6826; 50,39. Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 56 5.9 DISTRIBUIÇAO DE AMOSTRAGEM DA PROPORÇÃO LEVINE( 2005, p.245) Na variável categórica pode­se trabalhar como possuidor ou não possuidor de uma determinada característica. A proporção da amostra p a= X n o de sucessos = n tamanho da amostra erro padrão da proporção p = a • p 1−p n A média aritmética da amostra é um estimador , sem viés , da média aritmética da populaçaõ μ . • A estatística pa é um estimador, sem viés, da proporção da população p é a media da amostra e um estimador sem viés da media da população (u). • Ao realizar a amostragem com reposição , a partir de uma população finita , a distribuição de amostragem da proporção segue uma distribuição binomial. • LEVINE(2005, p.246) a distribuição normal pode ser utilizada para aproximar a distribuição binomial , quando μ=E ( x )=np ( media aritmetica da binomial) e n(1­p) são pelo menos 5. DIFERENÇA ENTRE A PROPORÇÃO DA AMOSTRA E A PROPORÇÃO DA POPULAÇÃO EM UNIDADES NORMAIS PADRONIZADAS Z= pa −p √ p( 1−p ) n 5.10 EXERCICIOS 79) LEVINE(2005, p.246) Distribuição de amostragem da proporção. Suponha que um gerente de banco afirme que 40% de todos os depositantes possuem contas multiplas no banco. Se for selecionado uma amostra aleatoria composta de 200 depositantes, a probabilidade de que a proporção da amostra de depositantes com contas multiplas não seja maior do que 0,30. solução 1: μ=E ( x )=np =200*0,40=80 n(1­p)=200(1­0,40)=120 , como 80≥5 e 120≥5 a distribuição de amostragem da proporção é distribuida de forma aproximadamente normal. Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 57 Solução 2 : Z= p a−p p 1−p p=0,40 pa=0,30 z=­2,89 P(z<­2,89) =0,0019 n A probabilidade de ser obtida uma proporção de amostras que não seja maior do que 0,30 • ( 60 pessoas) igual 0,0019 – um evento improvável. Isto significa que se a verdadeira proporção de sucessos na população fosse igual a 0,40, • então menos do que 1/5 de 1% das amostras (1/5*0,01=0,002) , de tamanho 200, seria previsto como tendo proporções de amostras menores do que 0,30. 80) De acordo com um artigo de American Demographics , 19% da população total dos EUA ouvem radio pela internet. Se a amostra aleatórias de tamanho 200 fossem selecionadas: a) que proporção terá entre 14% e 24% de ouvintes de radio pela Internet. Resposta:a) 0,9282 Z= p a−p p 1−p n resultado 1 p=0,19 pa=0,14 Z1= ­1,80 DISTRIBUICAO DE AMOSTRAGEM DA PROPORÇAO tamanho da amostra proporçao da populacao proporcao da amostra 1 proporcao da amostra 2 n p pa pa 200 0,19 0,14 0,24 Z Z -1,8025 1,8025 RESULTADO 0,9285 resultado 2: p=0,19 pa=0,24 Z2=1,80 c)que proporção terá entre 9% e 29% de ouvintes pela internet? tamanho da amostra proporçao da populacao proporcao da amostra 1 proporcao da amostra 2 n p pa pa 200 0,19 0,09 0,29 Z Z -3,6049 3,6049 RESULTADO Prof jorge roberto grobe AD34S 0,9997 11/09/2014 14:19:19 58 d)que proporção terá mais do que 30% de ouvintes de radio pela internet+ e)se amostras aleatórias de tamanho 100 fossem selecionadas como isso modificaria suas respostas em (a) ate (c)? CAPITULO 6 6 ESTIMATIVA DO INTERVALO DE CONFIANÇA 6. 1 INTRODUÇAO Para LEVINE (2005, 260), a inferência estatística visa tirar conclusões sobre características de uma população através de uma amostra. Existem dois tipos de estimativas: Estimativa de ponto ­estimar o verdadeiro valor de um parâmetro de uma população. Exemplo: X é uma estimativa do ponto da media aritmética da população Estimativa de intervalo – é relacionado com a verdadeira media aritmética da população, é desenvolvida, e é relacionada com a distribuição de amostragem da media aritmética. Segundo WITTE (2005), o intervalo de confiança é a amplitude entre valores que, com um grau conhecido de certeza, inclui uma característica desconhecida da população , tal como a média aritmética da população. 6.2 ESTIMATIVA DO INTERVALO DE CONFIANÇA DA MEDIA ARITMETICA ( conhecido­desvio padrão) • Em LEVINE (2005), a estimativa do intervalo de confiança de 95% é interpretada da seguinte forma: • Se todas as possíveis amostras de igual tamanho n forem extraídas e suas médias aritméticas de amostra forem calculadas, • significa que 95% dos intervalos incluem a verdadeira média da população, em algum lugar dentro dos limites do intervalo em torno de suas médias aritméticas de amostra, • X ±Z e somente 5% não estão na verdadeira média aritmética da população. n Onde Z =1− Prof jorge roberto grobe AD34S 2 11/09/2014 14:19:19 59 O nível de confiança é através de (1-α) e a proporção das caudas é de α/2. Então 95% de intervalo de confiança estão incluídos e 5% não estão incluídos no intervalo, portanto o valor de Z=10,05/2=97,5% =1,96 e Z=0,025=-1,96 Para 95% Z=[-1,96;1,96] e para 99% Z=[-2,58;2,58] Retorna o inverso da distribuição cumulativa normal padrão. Sintaxe INV.NORMP(Número) Número é a probabilidade para o qual a distribuição normal padrão inversa será calculada. Exemplo INV.NORMP(0,908789) retornará 1,3333. NOTA: OS VALORES SÃO SIMETRICOS [-1,96 E 1,96] LEVINE( 2005, p.263) Na figura 1 o nivel de confiança de 95% de confiança acarreta um valor de z igual a ±1,96 . FIGURA 1: CURVA NORMAL PARA DETERMINAR O VALOR DE Z NECESSÁRIO PARA 95% DE CONFIANÇA fonte:http://www.apis2.com.br/wp-content/uploads/2011/12/Graphic57-b.jpg 6.3 EXERCICIOS 80) Se X =85 (média), σ=8 e n=64, construa uma estimativa para o intervalo de confiança de 95% da media aritmética da população. R:[83,04:86,96] Prof jorge roberto grobe AD34S 11/09/2014 14:19:19 60 81) O gerente de uma loja de tintas deseja estimar a verdadeira quantidade de tinta, contida em latas de 1 galão, adquiridas de um fabricante nacionalmente conhecido. Sabe-se, através das especificações do fabricante, que o desvio padrão da quantidade de tinta é igual a 0,02 galão. Uma amostra aleatória de 50 latas é selecionada, e a média aritmética da amostra de tinta, por lata é de 1 galão, é igual a 0,995 galão. a) construa uma estimativa para o intervalo de confiança de 99% da verdadeira média aritmética da população relativa à quantidade de tinta contida em latas de 1 galão. b)com base em seus resultados, você acredita que o gerente tem o direito de reclamar com o fabricante? por que? c) a média aritmética da população da quantidade de tinta, por lata, precisa ser distribuída de forma normal neste caso? Explique. Sim, para que a media da amostra reflita a verdadeira media da população. d) explique por que um valor observado de 0,98 galão, para uma lata individual, não é incomum, embora esteja fora do intervalo de confiança que você calculou. Resposta:A pretensão da industria é produzir 1 galão(3,6 litros) de tinta por lata, portanto pode-se encontrar latas de tintas com a capacidade máxima ou fora do intervalo de confiança. e) suponha que você tenha utilizado uma estimativa de intervalo de confiança de 95%. Quais seriam suas respostas para (a) e (b)? Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 61 6.4 ESTIMATIVA DO INTERVALO DE CONFIANÇA DA MÉDIA ARITMÉTICA (σ DESCONHECIDO) Para LEVINE (2005), a media aritmética da população padrão da população , é geralmente desconhecida e desvio , também. DISTRIBUIÇÃO t DE STUDENT 4. Seculo XX 5. Estatistico William S. Gosset 6. Funcionário Guinness Breveries –Irlanda 7. Interessado em realizar inferencias sobre a média aritmética, quando σ desconhecido 8. Não era autorizado para publicar 9. Adotou o nick de Student Propriedades 1. É bastante similar a distribuição normal padronizada 2. n>120 pode-se usar a distribuição normal 3. O CONCEITO DE GRAUS DE LIBERDADE 4. n-1 valores da amostra estão livre para variar, significa n-1 graus de liberdade. σ desconhecido da população VERIFICANDO PREMISSAS • Supõe que a variável aleatória Xi na distribuição t seja distribuída de forma normal. • Quando a amostra for grande o suficiente e a população não for muito assimétrica, a distribuição t pode ser utilizada para estimar a media aritmética da população quando sigma (desvio padrão) for desconhecido. • A premissa da normalidade na população pode ser analisada através da avaliação do formato dos dados da amostra, utilizando um histograma, uma disposição ramo e folha, um box plot ou gráfico da normal de probabilidade. A declaração do intervalo de confiança X t n1 S n Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 62 tn-1 é o valor critico da distribuição t, com n-1 graus de liberdade, para uma área correspondente a α/2 na cauda superior. S= desvio padrão da amostra * os valores de t são simétricos INVT Retorna o inverso da distribuição t. Sintaxe INVT(Número: alfa ; graus de liberdade) Número é a probabilidade associada à distribuição t bicaudal. Graus de liberdade (n-1) :representa o número de graus de liberdade para a distribuição t. Exemplo =INVT(0,1; 6) retorna 1,94 6. 5 EXERCICIOS 82)Determine o valor critico de t para cada uma das circunstâncias a seguir: A) 1­α=0,95 n=10 alfa= 1­0,95=0,05 sintaxe : INVT( 0,05; 9) Resposta:2,2622 B) 1­α=0,90 n=16 Resposta:1,7531 83) Se X =75, S=15(desvio padrão da amostra) , n=16, e admitindo que a população seja normalmente distribuída, construa uma estimativa do intervalo de confiança de 99%, correspondente à media aritmética do população u. R:[63,95;86,05] 84) Construa uma estimativa do intervalo de confiança de 95% da média aritmética da população, com base em cada um dos seguintes conjuntos de dados, a admitindo que a população seja normalmente distribuídas: Conjunto 2 Conjunto 1 1 2 3 4 5 6 7 8 1 1 1 1 8 8 8 8 a)Explique por que estes conjuntos de dados possuem diferentes intervalos de confiança, embora possuam a mesma média aritmética e amplitude. Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 63 R: sendo que a média de cada conjuntos 2 e 1 é de 4,5 . Portanto o conjunto 2 a margem de erro é de 2,483 e do conjunto 1 a margem de erro é de 3,1267 como consequencia os dois conjuntos tem intervalos de confiança diferentes ou seja o conjunto 02 é [2,4567;6,5483] e o conjunto 01 é [1,3733;7,6267]. 2,4500 4,5000 8 95% Dados Desvio Padrão da Amostra Média da Amostra Tamanho da Amostra Nível de Confiança 3,7400 4,5000 8 95% Cálculos Intermediários Erro Padrão da Média margem de erro- E Graus de Liberdade Valor t Metade da Amplitude do Intervalo 0,8662 2,0483 7 2,3646 2,0483 Cálculos Intermediários Erro Padrão da Média margem de erro- E Graus de Liberdade Valor t Metade da Amplitude do Intervalo 1,3223 3,1267 7 2,3646 3,1267 Intervalo de Confiança Limite Inferior do Intervalo Limite Superior do Intervalo Intervalo de Confiança Limite Inferior do Intervalo 2,4517 Limite Superior do Intervalo 6,5483 1,3733 7,6267 Dados Desvio Padrão da Amostra Média da Amostra Tamanho da Amostra Nível de Confiança 85) Construa uma estimativa do intervalo de confiança de 95%, da média aritmética da população , com base nos números 1,2,3,4,5,6 e 20. Altere o valor de 20 para 7, e recalcule o intervalo de confiança. Utilizando estes resultados, descreva o efeito de um outlier ( ou seja , um valor extremo) sobre o intervalo de confiança. Dados Desvio Padrão da Amostra Média da Amostra Tamanho da Amostra Nível de Confiança 6,4660 5,8571 7 95% Cálculos Intermediários Erro Padrão da Média margem de erro- E Graus de Liberdade Valor t Metade da Amplitude do Intervalo 2,4439 5,9801 6 2,4469 5,9801 Intervalo de Confiança Limite Inferior do Intervalo Limite Superior do Intervalo -0,1230 11,8372 Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 Dados Desvio Padrão da Amostra Média da Amostra Tamanho da Amostra Nível de Confiança 2,1602 4,0000 7 95% Cálculos Intermediários Erro Padrão da Média margem de erro- E Graus de Liberdade Valor t Metade da Amplitude do Intervalo 0,8165 1,9979 6 2,4469 1,9979 Intervalo de Confiança Limite Inferior do Intervalo Limite Superior do Intervalo 2,0021 5,9979 64 Respostas: dados originais : [­0,1229;11,8371]; dados alterados: [2,022;5,9978]. A presença de um dado extremo (outlier) nos dados originais aumenta o valor da media aritmética da amostra, e inflaciona sobremaneira o desvio padrão da amostra e consequentemente altera a margem de erro. 6.6 ESTIMATIVA DO INTERVALO DE CONFIANÇA PARA A PROPORÇÃO • Segundo LEVINE (2005), o conceito de intervalo de confiança é estendido para dados categóricos, para estimar a proporção da população p, a partir da proporção da amostra pa= • X . n Para que a distribuição binomial possa ser aproximada da distribuição normal é que ambos np e n(1­p) são pelo menos iguais a 5. Então a estimativa do intervalo de confiança (1­alfa)100% para a proporção da população , p, pode ser definida através da equação: p a proporção da amostra X sucessos n amostra p proporção da população Z normal padronizada n tamanho da amostra 6.7 EXERCICIOS 86) Se n =200 e X = 50, construa uma estimativa do intervalo de confiança de 95%, correspondente à proporção da população. Solução: pa=50/200=0,25 Sample size:200 number sucess:50 confidence level :95 Resposta:[0.19;0.31] 87) Uma agencia de automóveis deseja estimar a proporção de clientes que ainda possuem carro adquirido há 5 anos. Uma amostra aleatória de 200 clientes, selecionada a partir dos registros da agencia de automóveis, indica que 82 deles ainda possuem os carros que adquiriram a 5 anos. a) construa um intervalo de confiança de 95% da proporção da população de todos os clientes que ainda possuem carros, 5 anos após aquisição. R:[0,3418;0,4782] b) como os resultados de (a) podem ser utilizados pela agencia de auto, para estudar a satisfação com carros adquiridos na agencia. Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 65 6.8 DETERMINANDO O TAMANHO DE UMA AMOSTRA • Em LEVINE (2005), com relação a estimativa do intervalo de confiança, o tamanho da amostra foi selecionado sem levar em conta a amplitude do intervalo de confiança. • No mundo dos negócios , determinar o tamanho da amostra apropriado é um procedimento complicado, sujeito a restrições de orçamento , tempo e facilidade de seleção. Determinação do tamanho de uma amostra para a média aritmética Na determinação do tamanho da amostra para estimar a média aritmética, é necessário considerar o volume de erro da amostragem e algumas informações sobre o desvio padrão. Z= valor critico por exemplo Z=1,96 (95% de confiança) e=erro de amostragem aceitável ( diferença entre a média amostral e a média populacional) σ= desvio padrão Determinação do tamanho da amostra para a média aritmética Z= X− Z∗ X −= n n n= Z∗ erro= X− X− O tamanho da amostra, n , é igual ao produto entre o valor de Z ao quadrado e a variância, , dividido pelo erro de amostragem, e, ao quadrado. Z22 n e2 Para determinar o tamanho da amostra,tem que conhecer três fatores: • o nível de confiança desejado, que determina o valor de Z, que representa o valor critico a partir da distribuição normal padronizada. • • o erro de amostragem aceitável, e. • o desvio padrão , . Z é utilizado, em vez de t , porque para determinar o valor de critico de t, o tamanho da amostra precisa ser conhecido, mas ainda não é conhecido. Na maioria dos estudos o tamanho da amostra necessário será grande o suficiente para que a distribuição normal padronizada seja uma boa aproximação da distribuição t. Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 66 6.9 EXERCICIOS 88)Se você deseja ter 95% de confiança e estar estimando a média aritmética da população , dentro dos limites de um erro de amostragem de ±5 , e o desvio padrão for admitido igual a 15, que tamanho da amostra é necessário? R:35 89)Se o gerente de uma loja de tintas deseja estimar a média aritmética da quantidade de tinta em uma lata de 1 galão, dentro dos limites de ±0,004 galão, com 95% de confiança, e tambem admite que o desvio padrão é de 0,02 galão, que tamanho da amostra se faz necessário? R:97 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA UMA PROPORÇÃO • Para LEVINE (2005), os métodos para determinação do tamanho da amostra, para estimar uma proporção da população , são semelhantes para estimar a média arimética. • Para determinar o tamanho da amostra utiliza­se a equação: Z= p a− p p 1− p n O erro de amostragem (e) è igual a (pa­ p) a diferença entre a proporção da amostra (pa) e o parâmetro a ser estimado , (p). Isolando­se pa – p , o erro de amostragem é: Determinação do tamanho da amostra para uma proporção n= Z 2 p 1− p e 2 e=Z p 1− p n p a = proporção da amostra = X sucessos = n amostra p= proporção de sucessos Z = normal padronizada n=tamanho da amostra é o proximo valor inteiro Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 67 6.10 EXERCICIOS 90) Se voce deseja ter 95% de confiança de estar estimando a proporção da população, dentro dos limites de um erro de amostragem de ±0,02, e houver evidencia histórica de que uma proporção da população é aproximadamente igual a 0,4, que tamanho de amostra é necessário? Solução: e=0,02 z=1,96 (95%) p=0,4 Dados Estimativa da Verdadeira Proporção Erro de Amostragem Nível de Confiança Cálculos Intermediários Valor de Z Tamanho Calculado da Amostra Resultado Tamanho de Amostra Necessário 0,4000 0,0200 95% -1,96 2304,88 2305 91)Um orgão de pesquisa de opinião pública deseja estimar a proporção de eleitores que irá votar no candidato democrata, em uma campanha eleitoral para a presidência dos EUA. O orgão de pesquisa de opinião pública deseja ter 90% de confiança de que sua previsão está correta, dentro de um intervalo de ±0,04 da proporção da população. a) que tamanho da amostra é necessário? R:423 b) se o órgão de pesquisa de opinião pública deseja ter 95% de confiança, que tamanho de amostra é necessário? c) se ele desejar ter 95% de confiança e um erro de amostragem correspondente a ±0,03, que tamanho de amostra é necessário? d)com base em suas respostas para (a) –(c) , que conclusões gerais podem ser tiradas sobre os efeitos do nível de confiança desejado e o erro de amostragem aceitável, em relação ao tamanho da amostra necessário? discuta Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 68 6.11 ATIVIDADES PRÁTICAS PEDAGÓGICAS 4-distribuições de probabilidade básica e de probabilidade discreta 5-a distribuição normal e as distribuições de amostragem 6-estimativa do intervalo de confiança CAPITULO 4 1. MONTGOMERY( p.33) , o tempo de enchimento de um reator é medido em minutos ( e frações de minutos). Faça o espaço amostral ser formado por numeros reais e positivos . Defina os eventos A e B como : A={ x/x <72,5} e B={ x/x > 52,5}. Descreva cada um dos seguintes eventos . a) A∩B b) A∪B 2. Amostras de espuma de 3 fornecedores são classificados com relação a satisfazer ou não as especificações. Os resultados de 100 amostras são resumidas a seguir: obedece Sim não fornecedores 1 18 2 17 3 50 2 3 10 Faça A denotar o evento em que uma amostra seja proveniente do fornecedor 1 faça B denotar o evento em que uma amostra atenda as especificações. Determine o número de amostras em : a) A '∩B b) A∪B 3.Um pedido de um automóvel pode se especificar se a transmissão é automática ou padrão , com ou sem ar condicionado e qualquer uma das 4 cores: vermelha, azul, preta ou branca. Descreva o conjunto de pedidos possíveis para esse experimento em forma de árvore de decisão. 4. MONTGOMERY (p.36) , pedidos de acessórios de iluminação são resumidos pelas características opcionais que são requeridas. Proporção de pedidos Nenhuma opcional 0,3 Um opcional 0,5 Mais de um opcional 0,2 a) qual é a probabilidade de que um pedido requeira no mínimo uma característica opcional? b) qual é a probabilidade de que um pedido não requeira mais de uma característica opcional? Prof jorge roberto grobe AD34S 11/09/2014 14:19:20 69 5.MONTGOMERY(2003, p.41), em um lote de 100 chips semicondutores, 20 são defeituosos. Dois deles são selecionados ao acaso, sem reposição. a) qual é a probabilidade de que o primeiro chip selecionado seja defeituoso? b) qual é a probabilidade de que o segundo chip selecionado seja defeituoso, dado que o primeiro deles foi defeituoso? 6. MONTGOMERY( 2003, p.43), suponha que 2% dos rolos de tecido de algodão e 3% dos rolos de tecido de nailon contenham falhas, Dos rolos usados por um fabricante, 70% são de algodão e 30% são de nailon . Qual será a probabilidade de que um rolo selecionado aleatóriamente, usado pelo fabricante, contenha falhas? • probabilidade total. MONTGOMERY( p.44-46) INDEPENDENCIA : o resultado de um experimento esteja no evento A não afeta a probabilidade de que o resultado esteja no evento B. DEFINIÇÃO: dois eventos são independentes se qualquer uma das seguintes afirmações for verdadeira. 1) P(A/B)=P(A) 2) P(B/A)=P(B) 3) P A∩B=P A P B 7. Discos de policarbonato plástico, provenientes de um fornecedor, são analisados com relação à resistência a arranhões e choque. Os resultados de 100 discos estão resumidos a seguir: Resistência a arranhão Resistência a choque alta alta baixa 80 9 baixa 6 5 Faça A denotar o evento em que um disco tenha alta resistência a choque e faça B denotar o evento em que um disco tenha alta resistência a arranhão. Os eventos A e B são independentes? 8. Amostras de espuma de 3 fornecedores são classificados com relação a satisfazer ou não as especificações. Os resultados de 126 amostras são resumidas a seguir: obedece fornecedores Sim não 1 80 4 2 40 2 Faça A denotar o evento em que uma amostra seja proveniente do fornecedor 1 e faça B denotar o evento B em que uma amostra atende as especificações. a) A e B são independentes? R: são Prof jorge roberto grobe AD34S 11/09/2014 b) A' e B são independentes?R: são 14:19:21 70 9. Um serviço de emissão de títulos municipais possui três categorias (A, B e C). Suponha que , no ano passado, dentre os títulos municipais emitidos no âmbito dos EUA, 70% foram classificados como A, 20% foram classificados como B e 10% foram classificados como C. Dos títulos municipais classificados como A, 50% foram emitidos por cidades, 40% por subúrbios e 10% por áreas rurais. Dos títulos municipais classificados como B, 60% foram emitidos por cidades, 20% por subúrbios e 20% por áreas rurais. Dos títulos municipais classificados como C, 90% foram emitidos por cidades, 5% por subúrbios e 5% por áreas rurais. a) que proporção de títulos municipais é emitida por cidades? b) se um novo título municipal estiver para ser emitido por uma cidade, qual é a probabilidade de que venha a receber uma cotação de A? 10.Registros de certificados de garantia mostram que a probabilidade de que um carro novo necessite de um reparo inerente à garantia, nos primeiros 90 dias, é de 0,05. Se uma amostra de três carros novos for selecionada. a) qual é a probabilidade de que nenhum deles necessite de um reparo inerente à garantia? b) qual é a probabilidade de que pelo menos um deles necessite de um reparo inerente à garantia? c) qual é a probabilidade de que mais de um deles necessite de um reparo inerente à garantia? d) determine a média aritmética e o desvio padrão, sendo n = 3 e p = 0,05. 11.distribuição de poisson ( probabilidade discreta).Em uma pequena cidade, o número de reclamações relativas a bagagem extraviada, em uma companhia aérea bastante conhecida, gira em torno de um média de 9 por dia. Qual é probabilidade de que, em um determinado dia, haverá: a) menos de três reclamações realizadas? b) exatamente três reclamações realizadas? c)três ou mais reclamações realizadas? 12. A partir de um estoque de 48 carros transportados para a concessionárias locais, 12 tiveram rádios defeituosos instalados. a) qual é a probabilidade de que uma determinada concessionária que receba 8 carros obtenha todos eles com rádios defeituosos? b) qual é a probabilidade de que uma determinada concessionária que receba 8 carros obtenha pelo menos um deles com rádio defeituoso? Prof jorge roberto grobe AD34S 11/09/2014 14:19:21 71 13. APLICAÇÕES NA INFORMÁTICA. O numero de mensagens enviadas por hora , através de uma rede de computadores, tem a seguinte distribuição: x= numero 10 11 12 13 14 15 0,15 0,3 0,2 0,2 0,07 de mensagens f(x) 0,08 Determine a média e o desvio padrão do numero de mensagens enviadas por hora. CAPITULO 5 14. Para uma distribuição normal padronizada, determine as seguintes probabilidades: a) P(Z >1,08 )= b) P(Z<-0,21)= c) P(-1,96<Z<1,08)= 15. Qual é o valor de Z se: a) 50% de todos os valores possíveis de Z forem menores do que ele próprio? b) somente 15,87% de todos os valores possíveis de Z forem maiores do que ele próprio? 16. A disposição ordenada ilustra a quantidade de dinheiro em dólares retirada de um caixa eletrônico por 25 clientes em um banco local: 40 50 50 70 70 80 80 90 100 100 100 100 100 100 110 110 120 120 130 140 140 150 160 160 200 decida se os dados parecem ser distribuídos aproximadamente de forma normal: b) escreva a expressão que ajusta a reta. a) construa o gráfico ( pode ser a mão com uma régua) 17.distribuição exponencial (probabilidade continua).Automóveis chegam a uma cabine de pedágio localizada na entrada de uma ponte a uma taxa de 50 por minuto, no intervalo entre 5 e 6 horas da tarde. a) se um automóvel acabou de chegar, qual é a probabilidade de que o próximo automóvel chegue dentro de 3 segundos (0,05 minuto)? Prof jorge roberto grobe AD34S 11/09/2014 14:19:21 72 b) se um automóvel acabou de chegar, qual é a probabilidade de que o próximo automóvel chegue dentro de 1 segundos (0,0167 minuto)? 18.Dada uma distribuição normal com µ=100 e σ=10, se uma amostra de n=25 é selecionada. * padronizar pela formula : Z= X −μ σ n a) qual é a probabilidade de X seja menor do que 95? b) qual é a probabilidade de X esteja entre 95 e 97,5? c) qual é a probabilidade de que X esteja acima de 102,2? 19. O serviço de atendimento on-line ao cliente é peça chave no comercio varejista on – line. De acordo com o WSJ Market Data Group, 37,5 % dos clientes da Priceline.com utiliza estes serviço. Formula para padronizar os dados Z= p a− p p 1− p n a) se as amostras aleatórias de 200 clientes da Priceline.com fossem selecionadas, que proporção das amostras teria possibilidade de estar entre 35% e 40% daqueles que utilizam o serviço on line para clientes? CAPITULO 6 20. Uma papelaria deseja estimar a média aritmética do preço de varejo de cartões de felicitações que estão em seu estoque. Uma amostra aleatória de 20 cartões de felicitações indica um valor médio de $ 1,67 e um desvio padrão de $ 0,32. a) admitindo que existe uma distribuição normal, construa uma estimativa do intervalo de confiança de 95% da média aritmética do valor de todos os cartões de felicitações no estoque da papelaria. 21. Uma empresa de telefonia deseja estimar a proporção de domicilios que poderiam vir adquirir uma linha telefonica adicional, caso este se tornasse disponível, mediante um custo de instalação substancialmente reduzido. Uma amostra aleatória de 500 domicílios foi selecionada. Os resultados indicam que 135 dos domicílios comprariam a linha telefonica adicional, mediante um custo de instalação substancialmente reduzido. a) construa uma estimativa do intervalo de confiança de 95% da proporção da população, dos domicilios que poderiam adquirir a linha telefonica adicional. 22) Se voce deseja ter 99% de confiança de estar estimando a proporção da população p=0,5, dentro dos limites de um erro de amostragem de ± 0,04, que tamanho de amostra se faz necessário? Prof jorge roberto grobe AD34S 11/09/2014 14:19:21 73 REFERENCIAS • MONTGOMERY, D.C. e RUNGER,G.C. Estatística Aplicada e Probabilidade Para Engenheiros. 2a edição RJ. Editora LTC.2003. • LEVINE, David M. et. al. Estatística –Teoria e Aplicações Usando o Microsoft Excel em Português. 3a ed.RJ Editora LTC. 2005. • CRESPO, A. Estatística Fácil. 14a ed .SP. Editora Saraiva.1994 • BROFFICE • LARSON & FARBER. Estatística Aplicada. 4a edição.SP.Pearson Education.2009. • DOMENICO, Luiz Carlos De. MATEMATICA 3 em 1. Artes Gráficas e Editora- Unificado. Curitiba.PR. • FARBER, Betsy. LARSON, Ron. Estatística Aplicada. São Paulo. 4 edição.2009. Pearson. • MILONE, Giuseppe. Estatistica Geral e Aplicada.São Paulo: Thomson Learning.2006. • Disponivel em http://www.apis2.com.br/wp-content/uploads/2011/12/Graphic57-b.jpg, acessado em 28/05/2012. Prof jorge roberto grobe AD34S 11/09/2014 14:19:21 74