FACULDADE DE TECNOLOGIA DE GUARATINGUETÁ ESTATÍSTICA II Nota de aula 1 Prof. MSc. Herivelto T Marcondes dos Santos Fevereiro /2009 1 Modelos de probabilidade 1.1 Variável aleatória Definição: Sejam ε um experimento e S um espaço amostral associado ao experimento. Uma função X, que associe a cada s∈ ∈S um número real, X(s), é denominada variável aleatória. Exemplo 1: No lançamento independente de duas moedas obtemos as faces: S = {(Cara, Cara), (Cara, Coroa), (Coroa, Cara), (Coroa, Coroa)}. Nesse caso, pode-se afirmar que o número de caras X, associado a cada experimento s∈ ∈S, deve ser considerado um X(s) = {2, 1, 1, 0}. 1.2 Variável aleatória discreta Definição: Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito numerável, denominar-se-á X como variável aleatória discreta. Isto é, os valores possíveis de X, podem ser colocados em listas como x1, x2, x3,..., xn. Definição: Se X é uma variável aleatória discreta então, a cada valor possível de xi, associaremos um número p(xi) = IP[X = xi], denominado probabilidade de xi. Esses valores devem satisfazer as seguintes condições: a. 0, ∀ b. ∑ 1 1.2.1 A função p, definida anteriormente, é denominada função de probabilidade da variável aleatória X. A coleção de pares (xi, p(xi)) é denominada distribuição de probabilidade. 1.3 Variável aleatória contínua Definição: Diz-se que X é uma variável aleatória contínua, se existir uma função f, denominada função densidade de probabilidade (f.d.p.) de X que satisfaça as seguintes condições: a. 0, , b. 1 / c. Para quaisquer a, b, com # ∞ % a % b % &∞, implica que )*+ , - , . 0 1.4 Função distribuição Acumulada Definição: Seja X uma variável aleatória, discreta ou contínua. Define-se a função F como a função distribuição acumulada da variável aleatória X como: 1 )*- , 2 2 Principais modelos discretos de probabilidade 2.1 Modelo Uniforme Discreto Seja X uma variável aleatória cujos valores possíveis são representados por x1, x2, x3,..., xk. Diz-se que X segue o modelo Uniforme Discreto se atribui a mesma probabilidade 1/k a cada um desses k valores, isto é, sua função de probabilidade é dada por )*2- -3 4 1 , 6 1, 2, … , 5 5 Exemplo 2. Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem tem a maior possibilidade de ser sorteado? Solução. Pela definição acima ocorre que todos os 100 bilhetes do sorteio apresentam a mesma probabilidade de serem sorteados, )*9- 3 : ;; , 5 1,2,3, . . . , 100 . Se ambos os indivíduos apresentam o mesmo número de bilhetes, logo a probabilidade de serem sorteados é a mesma )*>21 % - % 25@ ∑AB 3A )*9- B B 3 @ ;; C )*>- @ & )*>- @ & )*>- AD @ & )*>- EF @ & )*>- DG @ ;; Exemplo 3. Sendo X uma variável seguindo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3, ..., 10}, pergunta-se: J a. )*>- 7@ I. ; J b. )*>3 % - , 7 @ I. ; J c. )*>- % 2 KL - 8@ I. ; E d. )*>- 5 KL - N 8@ I. ; A e. )*>- N 3 C - % 6@ I. ; f. J )*>- , 9|- 6@ I. B Exemplo 4. Uma manufatura deve escolher 1 funcionário por semana para fazer inspeção em suas máquinas antes de cada turno de trabalho. Nesse caso poderá haver repetição, ou seja, um mesmo funcionário pode ser escolhido em semanas consecutivas. Se há 10 funcionários nesse setor, qual é a probabilidade algum funcionário ser escolhido para fazer a inspeção? E, se não ocorresse repetição até que o último dos 10 participe da escala, o que muda? 3 2.2 Modelo de Bernoulli [X~b(p)] Diz-se que uma variável X segue o modelo de Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso, respectivamente. Com p representando a probabilidade de sucesso, 0 , , 1, sua função discreta de probabilidade é dada por: )*- 5 R 1 # R , 5 0,1, ou ainda, X 0 1 p(xi) 1-p p A repetição de n ensaios de Bernoulli independentes dá origem à mais importante variável aleatória discreta, denominada modelo Binomial. Exemplo 5. Sabe-se que a ocorrência de peças com algum tipo de imperfeição em uma linha de produção é de 10%. Escolhem-se três peças, ao acaso, e deseja-se verificar o número de peças defeituosas nesse grupo, evento que será representado por D. Construa uma árvore de probabilidades que contemple todas as possibilidades essa averiguação. Defeituosa D 10% D 10% DC 90% Árvore de probabilidades Não defeituosa DC 90% Evento D 10% DC 90% D 10% DC 90% D 10% DC 90% D 10% DC 90% D 10% DC 90% Probabilidade X DDD (0,1)3 3 DDDC (0,9) (0,1)2 2 DDCD (0,9) (0,1)2 2 DCDD (0,9) (0,1)2 2 2 (0,9) (0,1) 1 2 (0,9) (0,1) 1 2 1 DDC DC C C D DD C C D D D (0,9) (0,1) 4 (0,9)3 DCDCDC 0 A tabela anterior permite concluir que a ocorrência de n ensaios independentes de Bernoulli e todos com mesma probabilidade de sucesso p é representada pela função de probabilidade dada por: )* S- 5 T 2UR4R 1 # UR , 5 0, 1, 2, 3, … , V. No caso do exemplo, pode-se representar a variável X: Número de peças que apresentam algum tipo de imperfeição a função de probabilidade será dada por: X pi 0 (0,9) 1 3 2 2 3(0,9) (0,1) 3(0,9)(0,1) 3 2 (0,1)3 G Ou ainda, )* S- 5 T 2R40,1R 1 # 0,1GR , 5 0, 1, 2, 3 Onde: k=0; )*S- 0T 2G;40,1; 1 # 0,1G; 0,9G k=1; )*S- 1T 2G40,1 1 # 0,1G 30,9A 0,1 k=2; )*S- 2T 2GA40,1A 1 # 0,1GA 30,90,1A k=3; )*S- 3T 2GG40,1G 1 # 0,1GG 0,1G 2.3 Modelo Binomial [X~B(n, p)] Considere a repetição de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p. A variável que conta o número total de sucessos é denominada Binomial com parâmetros n e p e sua função de probabilidade é dada por: V V U! )*- 5 W X R 1 # UR , 5 0, 1, 2, … , V e W X R!UR! 5 5 Exemplo 6: Sabe-se, que na maioria das seleções de estágio, a exigência pela fluência em outro idioma é fator requerido e diferencial para o profissional candidato. Por experiência verificou-se que apenas 5% dos candidatos que buscam vagas de estágio em grandes empresas têm a fluência em outro idioma. Uma empresa seleciona ao acaso 15 candidatos para sua seleção de estágio e deseja-se verificar qual a probabilidade de nenhum deles apresentar fluência em outro idioma. E, qual a probabilidade de todos os candidatos serem fluentes em outro idioma? 5 Solução. Suponha que temos 15 ensaios de Bernoulli independentes, dos quais a probabilidade de sucesso, ou seja, a probabilidade de ser fluente em outro idioma é dada por 0,05, logo temos um modelo de probabilidade que representa bem esses eventos dado por: )*S- 5T 2B 40,05R 1 # 0,05BR , 5 0, … , 15, isto é, para a ocorrência de pessoas que são fluentes R em outro idioma, a probabilidade de sucesso é 0,05. Por outro lado, se o desejo é saber qual a possibilidade de ocorrência de pessoas que não são fluentes em outro idioma, a probabilidade de sucesso é 0,95 e o modelo de probabilidade será: )*SZ 5T 2B 40,95R 1 # 0,95BR , 5 0, … , 15. {A mudança de variável é feita apenas para não R ocorrer confusão entre aptos e não aptos}. Logo, a probabilidade de nenhum dos candidatos serem fluentes em outro idioma é igual a )*S- 0T 2B 40,05R 1 # 0,05B; 0,95B 0,4633 e a probabilidade de todos serem fluentes é ; (0,05)15≅ 0. Daí pode-se concluir que a possibilidade não haver pessoas fluentes em outro idioma é de 46,33% porém com a possibilidade de 53,77% de haver ao menos um candidato com as características desejadas. De outra maneira, é improvável que todos os candidatos tenham fluência em outro idioma afinal a probabilidade de todos serem fluentes é nula. 2.4 Modelo Geométrico [X~G(p)] Diz-se que uma variável aleatória X tem distribuição Geométrica de parâmetro p, se sua função de probabilidade tem a forma: )*- 5 R 1 # , 0 , , 1 C 5 0, 1, 2, … Exemplo 7. Uma linha de produção está sendo analisada para efeito de controle de qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que uma peça defeituosa é observada. Se 0,01 é a probabilidade da peça ser defeituosa, deseja-se verificar o comportamento da variável quantidade de peças boas produzidas antes da 1ª defeituosa. Assim temos, )*\ 5 0,010,99R e seu gráfico dado pela Figura 1 6 IP(Q=k) 0 10 20 30 40 50 60 k Figura 1 Gráfico do modelo Geométrico de parâmetro p=0,01 O gráfico permite concluir que a probabilidade reduz a valores pequenos para os maiores valores de k. Em tese, a produção nunca seria interrompida se não houvesse o aparecimento de uma peça defeituosa. 2.5 Modelo de Poisson [X~Po(λ)] Uma variável aleatória X tem distribuição de Poisson com parâmetro λ>0, se sua função de probabilidade é dada por: )*- 5 ] ^_ `a R! , k = 0, 1, 2,... Com parâmetro λ sendo usualmente referido como a taxa de ocorrência. Observação: O modelo de Poisson é usado com freqüência em experimentos físicos e biológicos e, no caso, λ é a freqüência média ou esperada de ocorrências num intervalo de tempo. Uma das aplicações interessantes e que prestam bons resultados pelo uso do modelo de Poisson é a observação de eventos que ocorrem segundo uma taxa de freqüência. Sempre que houver possibilidade de tratar um evento que ocorre segundo um valor médio, ou valor médio esperado, então, pode-se tentar aplicar o modelo de Poisson. Exemplo 8. Engenheiros da companhia telefônica estudam se o modelo de Poisson pode ser ajustado ao número N de chamadas interestaduais que chegam, por hora, a uma central telefônica, durante o período noturno. Os dados coletados, referentes a 650 períodos de uma hora, estão apresentados a seguir: 7 Chamadas 0 1 2 3 4 5 6 7 ≥8 Freqüência observada 9 38 71 115 125 106 79 50 57 Da tabela, tem-se que, por exemplo, em 125 períodos de uma hora ocorreram 4 chamadas. Os engenheiros sugerem uma taxa de ocorrência de 4,5 chamadas por hora no período estudado. Seguindo o modelo indicado, a freqüência esperada de ocorrências com k chamadas é obtida multiplicando 650 (o total de observações) pela probabilidade de k chamadas. Assim, para k =2, tem-se Freqüência esperada para 2 chamadas = 650)* b 2 650 ] ^c,d J,Be A! 73,13. Logo, pode-se construir essa tabela de comparação de resultados observados e esperados. Chamadas Freqüência observada Esperada 0 1 2 3 4 5 6 7 ≥8 9 38 71 115 125 106 79 50 57 7,22 32,50 73,13 109,66 123,37 111,02 83,27 53,56 56,36 O que permite concluir que as freqüências esperadas e observadas têm aderência e o modelo de Poisson parece ser adequado. Tome cuidado para concluir a funcionalidade do modelo, mas já tem um bom indicativo de qual modelo é mais adequado para representar as chamadas da central telefônica. 8