Capı́tulo 3 Modelos Discretos 3.1 3.1.1 Variáveis Aleatórias Discretas Variável Aleatória Considere um experimento com espaço amostral Ω. Uma função definida no espaço Ω é uma variável aleatória. Em outras palavras, imagine que s ∈ Ω seja um evento simples (um resultado em um expermento aleatório), uma variável aleatória X é uma função que atribui um valor X(s) a este evento simples. Os valores que X assume podem ser tanto discretos quanto contı́nuos, implicando em variáveis, respectivamente discretas ou contı́nuas. Neste capı́tulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experimento no qual arremessamos uma moeda dez vezes. O espaço amostral Ω deste experimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma possı́vel variável aleatória seria o número de caras NH assim se s = HHHHT HT T T T , então NH (s) = 5. Note que a função NH toma apenas valores discretos (por exemplo, 0, 1, 2, ...). 3.1.2 Função discreta de probabilidade Lembremos que um modelo probabilı́stico é determinado pela terna hΩ, F, P i, onde Ω é espaço amostral que representa o conjunto de possı́veis resultados para um experimento aleatório, F é a σ-álgebra que representa todos os possı́veis eventos compostos e P é a medida de probabilidade que atribui um valor entre 0 e 1 para cada evento, representado a chance de ocorrência deste particular evento. A definição da medida de probabilidade sobre o espaço amostral e, por conseqüência, sobre todos os eventos compostos (por que?)1 permite que 1 Revise a definição a σ-álgebra. Dá para ver que todos eventos compostos são combinações de pontos do espaço amostral. Se você souber o valor das probabilidades para todos eventos simples, você também saberá, pela simples aplicação das propriedades da probabildiade, seu 27 28 CAPÍTULO 3. MODELOS DISCRETOS calculemos a função discreta de probabilidade para qualquer variável aleatória X. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da variável aleatória X possuir valor x é a probabilidade do evento composto descrito por {s : X(s) = x}, ou seja, é a probabilidade dos pontos do espaço amostral s nos quais a função X(s), que define a variável aleatória, tem valor x. Para economizar sı́mbolos utilizaremos também P (x) significando a mesma coisa (note que estamos reservando letras maı́usculas para representar variáveis aleatórias). Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o exemplo do experimento de arremesso de moeda dez vezes. Qual é a função de probabilidade para o número de Caras em uma execução do experimento? Os eventos de interesse são, porntanto, da forma {s : NH (s) = n}. Supondo que utilizamos uma moeda honesta e que os arremessos são independentes, temos que cada ponto do espaço amostral tem probabildidade de 1/210 . Podemos usar análise combinatória para contarmos quantos pontos do espaço amostral correspondem a cada evento de interesse. Dado n, temos que escolher, não importando a ordem, n entre dez posições na seqüência de arremessos para inserirmos Caras. Isso equivale a combinações de 10 elementos n a n, ou seja 2 : 1 10 P (n) = n 210 para n = 0, 1, 2, 3, 4.... 3.1.3 Distribuições de Probabilidade A rigor, uma distribuição de probabilidades é uma função crescente definida como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos o mesmo termo para se referir também à função discreta de probabilidade. Quando falarmos de variáveis aleatórias contı́nuas ficará mais clara a necessidade da noção de distribuição de probabilidade. Os modelos probabilı́sticos discretos são comumente definidos em termos de distribuições de probabilidade (aqui já estamos nos referindo às funções discretas de probabilidade), nas próximas seções introduziremos vários deles e suas aplicações. 3.2 Modelo Uniforme Suponha que desejamos descrever o simples experimento de lançamento de um dado honesto. A variável aleatória de interesse é simplesmente o resultado do arremesso que chamaremos de X. Qual a distribuição de probabilidade apropriada para descrever este experiemnto? O espaço amostral é Ω = {1, 2, 3, 4, 5, 6}, valor para qualquer evento composto. 2 Se não lembra análise combinatória, recomendo fortemente, Iezzi, G. Matemática Elementar, Vol. 5 - Combinatória. 29 3.3. MODELO GEOMÉTRICO 0.05 0.04 P(x) 0.03 0.02 0.01 0 −5 0 5 x Figura 3.1: Função de probabilidade uniforme discreta. como o dado é honesto temos que P (x) = 1/6, ou seja, a função de probabilidade independe do particular resultado. Este tipo de distribuição é denominada distribuição uniforme discreta. Distribuição Uniforme Discreta. P (xj ) = 1 , n (3.1) onde xj é não nulo em {x1 , x2 , ..., xn }. Exemplo.Número de Caras em Único Arremesso de uma Moeda Honesta. Neste experimento o espaço amostral é Ω = {H, T }. A variável aleatória que descreve o número de Caras em um único arremesso é NH (H) = 1 e NH (T ) = 0. Como a moeda é honesta a distribuição de probabilidades é P (xj ) = 1/2 com xj não nulo em {0, 1}. 3.3 Modelo Geométrico Digamos que você seja responsável pelos planos de manutenção de dos novos aviões da Embraer com sistema de aterrisagem totalmente automático. Você fez alguns testes de laboratório e concluiu que com o tempo a probabilidade de falha do sistema tende a p. Se assumirmos que o avião voará uma vez por dia, qual seria a distribuição do intervalo de tempo transcorrido até a primeira falha? A cada utilização há duas possibilidades que chamaremos de 1 (funcionamento normal) e 0 (falha). Em princı́pio, nosso experimento somente precisa ser repetido até que a primeira falha aconteça, assim o espaço amostral contem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas seqüencias pela posição da primeira falha, assim Ω = {1, 2, 3, 4, ...}. Note que este espaço 30 CAPÍTULO 3. MODELOS DISCRETOS 0.01 0.008 P(n) 0.006 0.004 0.002 0 100 200 300 400 500 n Figura 3.2: Função de probabilidade geométrica com p = 0, 01. amostral tem infinitos pontos, visto que há a possibilidade, infinitamente improvável, de que uma falha nunca ocorra. Probabilidades podem ser atribuı́das a cada seqüência da seguinte forma: a cada utilização do sistema a probabilidade de uma falha é p e a de funcionamento é 1 − p, assim, a probabilidade a ser atribuı́da ao ponto do espaço amostral n é P (n) = (1 − p)n−1 p (por que?)3 , que é chamada distribuição geométrica. Distribuição geométrica. P (n) = (1 − p)n−1 p, (3.2) onde n = 1, 2, 3, .... 3.4 Modelo Binomial Suponha agora que queremos avaliar a probabilidade de em n lançamentos de uma moeda obtermos, não importando a ordem, k Caras. O espaço amostral é composto por todas as seqüências possı́veis de comprimento n (por exemplo, se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade de obtermos uma Cara em um lançamento seja q (a moeda não precisa necessariamente ser honesta). Considerado os lançamentos independentes, podemos atribuir probabilidades para cada ponto do espaço amostral apenas contando o número de Caras e Coroas. Procedendo dessa forma encontramos: q k (1 − q)n−k . Como a ordem não importa temos que utilizar análise combinatória para con3 P (n) significa a probabilidade da primeira falha ocorrer na n-ésima utilização, ou seja, primeiro ocorrem n − 1 funcionamentos normais até que a seqüência é encerrada com uma falha. 31 3.4. MODELO BINOMIAL 0.25 0.2 P(n) 0.15 0.1 0.05 0 0 5 10 15 20 n Figura 3.3: Distribuição Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. Note a simetria e a posição da média em p × n. tarmos o número de seqüências equivalentes (com o mesmo número de Caras, só que em outra ordem). No final obtemos: Distribuição Binomial. n P (k|n, p) = q k (1 − q)n−k (3.3) k para k = 0, 1, 2, 3, 4.... Qualquer evento independente cujo resultado possa ser classificado de apenas duas maneiras (erro ou acerto, sucesso ou falha, etc...) é denominado tentativa de Bernoulli. A distribuição do número k de ocorrências de uma das duas maneiras com probabilidade q em uma seqüência de n tentativas de Bernoulli é Binomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores estão utilizando energia elétrica de forma intermitente. Estamos interessados em estimar a demanda total esperada. Como uma primeira aproximação imagine que a qualquer momento cada trabalhador tem exatamente a mesma probabilidade p de requerer uma unidade de potência. Se considerarmos que os trabalhadores atuam de forma independente teremos que a probabilidade de k deles demandarem energia simultaneamente será binomial P (k|n, p). Se, em média, um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5. Assim, a probabilidade de sete ou mais trabalhadores demandarem energia simultâneamente será P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = 0, 000864. Em outras palavras, se a potência fornecida for suficiente para cobrir 6 trabalhadores simultaneamenente, haverá sobrecarga com probabilidade 0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Eficácia de Medicamentos. A taxa normal de infecção 32 CAPÍTULO 3. MODELOS DISCRETOS 0.35 0.3 P(n) 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 n Figura 3.4: Distribuição Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1. Note a assimetria do caso q = 0, 1. de determinada doença é de 25%. Para testar um novo medicamento, o administramos a n indivı́duos. Como poderı́amos avaliar o resultado do experimento? Se o medicamento for totalmente inútil a probabilidade de exatamente k indivı́duos permanecerem livres de infecção será P (k|n; 0, 75). Por exemplo, para k = n = 10, a probabilidade é de 5, 6%. Para k = n = 12, a probabilidade é de 3, 2%. Assim, isso não seja uma demonstração conclusiva, se de 10 ou 12 indivı́duos nenhum contrair a infecção isso poderia ser visto como uma indicação de que o medicamento fez efeito. 3.5 Modelo Poisson Tomemos novamente a distribuição binomial. Imaginemos que estamos interessados em um fenômeno que acontece raramente com probabilidade q = λ/n, onde λ é o número de ocorrências em um número muito grande n → ∞ de repetições. Reexaminemos a expressão para a distribuição binomial neste regime: n−k k λ λ n 1− lim P (k|n, q = λ/n) = lim k n→∞ n→∞ n n k n−k n! λ λ = lim 1− n→∞ (n − k)!k! n n n −k k λ λ nn−1 n−k+1λ 1− 1− ... = lim n→∞ n n n k! n n = λk −λ e k! 33 3.5. MODELO POISSON 0.2 P(k|λ) 0.15 0.1 0.05 0 0 5 10 15 20 k Figura 3.5: Distribuição de Poisson com λ = 5 (tracejado) e λ = 10. Distribuição de Poisson. P (k|λ) = λk −λ e . k! (3.4) Exemplo.Aniversários. Qual é achance que em um grupo de 500 pessoas 2 façam aniversário no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabilidade q = 1/365. Pela definição λ = nq = 500/365 = 1, 3699... A probabilidade que k pessoas façam aniversário exatamente no dia 7 de Setembro (ou em qualquer dia escolhido) é P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24. Exemplo.Centenários. Ao nascer qualquer pessoa tem uma pequena chance de chegar aos 100 anos. Em uma comunidade grande o número de nascimentos em um ano é grande. Devido a guerras, doenças, etc... as durações das vidas de uma mesma geração não são independentes. No entanto, podemos comparar n nascimentos a n tentativas de Bernoulli com a vida após os 100 anos como sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos é P (k|λ), com λ dependendo do tamanho da população e das condições de saúde. 3.5.1 Distribuição de Poisson no tempo Considere agora uma seqüência de eventos aleatórios ocorrendo no tempo, tais como desintegração radioativa ou acessos a um web server. Suponha que os pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados com sua distribuição (número de pontos em um intervalo de tempo definido). Suponha adicionalmente que: 1. As condições do experimento permanecem constantes com o tempo; 34 CAPÍTULO 3. MODELOS DISCRETOS 2. Intervalos de tempo que não se intersectam são estatisticamente independentes; Quando estudarmos variáveis aleatórias no contı́nuo poderemos tratar este caso diretamente, por hora utilizaremos a idéia de limite. Começamos por dividir uma unidade de tempo em um número grande de intervalos n cada um com duração 1/n. Cada intervalo ou está vazio (falha) ou contém no mı́nimo um ponto (sucesso). A probabilidade de sucesso pn é a mesma para qualquer um dos intervalos. A distribuição de probabilidade de k sucessos em n intervalos é, portanto, binomial P (k|n, pn ). Note que o número de sucessos não é o mesmo que o número de pontos em um dado intervalo, visto que um sucesso pode representar mais de um ponto em um intervalo. Suponhamos então adicionalmente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo de tempo seja desprezı́vel conforme n → ∞. Se fixarmos o número médio de sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k sucessos em uma unidade de tempo terá distribuição de Poisson P (k|λ). Nesta categoria se encaixam: número de carros passando por um pedágio por unidade de tempo; número de erros de digitação em uma página; número de chamadas em um callcenter por unidade de tempo; etc... 3.6 Modelo Hipergeométrico Suponha que em uma caixa há n bolas, n1 vermelhas e n2 = n − n1 pretas. Retiramos da caixa r elementos sem reposição. Qual é a probabilidade de que exatamente k deles sejam bolas vermelhas? O número total de maneiras de n escolhermos r elementos dentre n é . Notemos que o grupo escolhido r tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser n1 formas. As r − k bolas pretas podem ser escolhidas de escolhidas de k n − n1 formas. Para cada escolha de bolas vermelhas pode-se escolher r−k uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos as quantidades. Finalmente obtemos: Distribuição Hipergeométrica: n1 n − n1 k r−k P (k|n, n1 , r) = . (3.5) n r com k = 0, 1, ..., min(r, n1 ). Exemplo. Controle de Qualidade. Uma fábrica produz peças que são embaladas em caixas com 25 unidades. Para aceitar o lote enviado por essa fábrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco peças, sem reposição, dessa mesma 35 3.7. MODELO BINOMIAL NEGATIVO 0.35 0.3 P(k|n,n1,r) 0.25 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 k Figura 3.6: Distribuição Hipergeométrica com n = 30, n1 = 10 e r = 10. caixa. Se constatar no máximo duas defeituosas (k ≤ 2), aceita o lote fornecido pela fábrica. Se a caixa sorteada tivesse 4 peças defeituosas, qual seria a probabilidade de rejeitar o lote? A caixa pode ter peças boas (bolas pretas) ou defeituosas (bolas vermelhas). O número total de peças é n = 25, vamos sortear r = 5 e queremos saber a probabilidade do número de defeituosas n1 = 4 sendo que obtivemos k ≤ 2 peças defeituosas em nosso sorteio. Assim calculamos : 4 21 4 4 21 21 0 5 1 2 4 3 P (k ≤ 2|n, n1 , r) = + + = 0, 984. 25 25 25 5 5 5 Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 peças defeituosas em 25 na caixa sorteada será de 0, 016 (1, 6%). 3.7 Modelo Binomial Negativo Considere uma seqüência de n tentativas de Bernoulli. Quantas tentativas são necessárias para conseguirmos r sucessos? A probabilidade de que r sucessos ocorram após r + k tentativas é idêntica à probabilidade de que k fracassos antecedam o r-ésimo sucesso. Assim teremos uma seqüencia com r + k − 1 tentativas com k fracassos posicionados arbitrariamente seguida por um sucesso. A distribuição de probabilidade do evento “k fracassos antes do r-ésimo acerto”é a distribuição binomial negativa denotada: Distribuição Binomial Negativa. r+k−1 P (k|r, p) = pr (1 − p)k . (3.6) k 36 CAPÍTULO 3. MODELOS DISCRETOS 0.08 0.07 0.06 ur 0.05 0.04 0.03 0.02 0.01 0 0 10 20 30 40 50 Numero de fosforos no outro bolso (r) Figura 3.7: Caixa de Fósforos de Banach. Distribuição de fósforos na caixa que ainda não está vazia. Cada caixa no começo tem exatos 50 fósforos. Quando aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia há exatos r fósforos na outra caixa. Note que o mais provável é que haja poucos fósforos também na outra caixa. A probabilidade de haver até 15 fósforos no outro bolso é de 92% (como calculo isso?) para k = 0, 1, 2, 3, 4.... Exemplo. Caixa de Fósforos de Banach. Um matemático sempre carrega consigo uma caixa de fósforos em seu bolso direito e uma em seu bolso esquerdo. Quando ele quer um fósforo, ele escolhe um bolso ao acaso. A seqüência de bolsos é, portanto, uma seqüência de tentativas de Bernoulli com p = 1/2. Suponha que cada caixa inicialmente contenha N fósforos e considere o momento no qual nosso matemático descobre que uma das caixas está vazia. Neste mesmo momento a outra caixa contém 0, 1, 2, ..., N fósforos com probabilidade ur . Qual é essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo. O bolso esquerdo estará vazio no momento em que o bolso direito contiver exatamente r fósforos se, e somente se, exatametne N − r falhas (bolso direito) precederem o sucesso de número N + 1. A probabilidade disso acontecer será P (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim: 2N − r ur = 2P (N − r|N + 1, 1/2) = 2−2N +r . N 3.8 Modelo Multinomial A distribuição binomial pode ser generalizada para o caso de n tentativas independentes onde cada tentativa pode resultar em r diferentes resultados. Cada resultado Ei ocorre com probabilidade pi . Assim p1 + p2 + ... + pr = 1. A 37 3.9. DISTRIBUIÇÃO DE ZIPF 8 10 Linux reuse data SunOS reuse data Mac OS X reuse data 7 10 6 10 5 Number of uses 10 4 10 3 10 2 10 1 10 0 10 0 10 1 10 2 10 3 4 5 10 10 10 Subroutines ordered by use frequency (n) 6 10 7 10 8 10 Figura 3.8: Distribuição de Zipf para reutilização de código nos sistemas Linux, MacOS e SunOS (referências versus ranking). Esta figura foi extraı́da de Veldhuizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Complexit and Zipf’s Law, cs.SE/0508023. probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes e assim por diante é: Distribuição Multinomial. P (k1 , k2 , ..., kr |p1 , p2 , ..., pr ) = n! pk1 pk2 ...pkr r . k1 !k2 !...kr ! 1 2 (3.7) com k1 + k2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual é a probabilidade de obtermos cada face 2 vezes? Aqui E1 ,...E6 representam as seis faces dos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelo multinomial teremos (12!)(2)−6 (6)−12 = 0, 0034. 3.9 Distribuição de Zipf A distribuição de Zipf é definida como: Distribuição de Zipf. k −s . P (k|s, N ) = PN −s n=1 n (3.8) A distribuição de Zipf (também conhecida como lei de potência) aparece nos lugares mais variados: nas palavras em uma lı́ngua, nas seqüências de DNA, 38 CAPÍTULO 3. MODELOS DISCRETOS na intensidade de terremotos, na popularidade de links na internet, na distribuição de renda dos 3% mais ricos, no número de amigos no Orkut, nomes numa população, população de cidades, tempo transcorrido nas trocas de cartas (ou emails), utilização de palavras chave em um site de busca, tamanho de extinções em massa de espécies, tamanho de grandes flutuações de preços na bolsa, citações de artigos cientı́ficos, etc... A caracterı́stica mais evidente da distribuição de Zipf é o fato de não haver um valor tı́pico (isso mesmo, a média não existe !). Assim quando observamos um modelo usual temos uma variação mas há um tamanho tı́pico (por exemplo, não vemos ninguém com 10 metros de altura, todo mundo mede algo em torno de 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida pela distribuição de Zipf, verı́amos eventualmente (seriam raros, mas verı́amos) pessoas com 10 m, ou 100 m, ou mesmo 1 km de altura! É claro que a altura das pessoas não é um bom exemplo. Mas o número de amigos no Orkut certamente segue um modelo de Zipf (verifique). 3.10 Exercı́cios 1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para dois lançamentos independentes dessa moeda, estude o comportamento da variável número de Caras e faça um gráfico de sua função de distribuição. 2. Uma variável aleatória X tem a seguinte função de distribuição: 0 se x < 10; 0, 2 se 10 ≤ x < 12; 0, 5 se 12 ≤ x < 13; F (x) = 0, 9 se 13 ≤ x < 25; 1 se x ≥ 25. Determine: (a) A função de probabilidade de X; (b) P (X ≤ 12); (c) P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18). 3. Um usuário de transporte coletivo chega pontualmente às 8 horas para pegar o seu ônibus. Devido ao trânsito caótico, a demora pode ser qualquer tmpo entre 1 e 20 minutos (assuma que a unidade mı́nima relevante para o tempo é 1 minuto). Pergunta-se: (a) Qual é a probabilidade de demorar mais de 10 minutos? (b) Qual é a probabilidade de demorar pelo menos 5 minutos não mais que 10 minutos? (c) Qual é a probabilidade da demora não chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo ônibus (que ainda não passou), qual é a probabilidade do amigo atrasado esperar até 3 minutos? 4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para uma famı́lia com três filhos, calcule a probabilidade de que: (a) Exatamente dois sejam do sexo masculino. (b) Pelo menos um deles seja do sexo masculino. (c) Todos sejam do sexo feminino. 3.11. REFERÊNCIAS 39 5. No estudo de desempenho de uma central de computação, o acesso à CPU é descrito por um modelo de Poisson com 4 requisições a cada segundo. Essas requisições podem ser de várias naturezas tais como: imprimir um arquivo, efetuar um cálculo ou enviar uma mensagem pela internet, entre outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual é a probabilidade de haver mais de 2 acessos À CPU? E do número de acessos ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, também escolhido ao acaso, qual é a probabilidade de haver 50 acessos? 6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com outros 16 perfeitos de um certo livro didático. Quatro amigas vão a essa livraria para comprar seus livros escolares. (a) Calcule a probabilidade de 3 levarem livros defeituosos. (b) Qual é a probabilidade de, após a visita dessas meninas,restarem o mesmo número de defeituosso na livraria? E de não restar nenhum? 7. Uma vacina contra a gripe é eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: (a) Pelo menos 18 imunizados. (b) No máximo 4 imunizados. (c) Não mais do que 3 não imunizados. 8. Uma linha de produção está sendo analisada para efeito de controle da qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que uma peça defeituosa é observada . Se 0,01 é a probabilidade da peça ser defeituosa, estude o comportamento da variável Q, quantidade de peças boas produzidas antes da primeira defeituosa. 3.11 Referências Se quiser fazer mais exercı́cios procure por (todos os exercı́cios do texto foram extraı́dos de lá): • Magalhães M.N., de Lima A.C.P., Noções de Probabilidade e Estatı́stica, Edusp,2004. Exemplos foram extraı́dos de: • Feller, W. An introduction to Probability Theory and Its Applications, Volume I, John Wiley & Sons, 1950. • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975. Livros de divulgação cientı́fica relacionados à lei de Zipf: • Bak, P., How Nature Works, Oxford University Press, 1996. • Buchanan, M., Ubiquity, Crown Publishers, 2001.