CAPÍTULO 7 DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE 7.1. Introdução As variáveis aleatórias contínuas são muito usadas para descrever fenômenos físicos, principalmente aqueles que envolvem o tempo. Este capítulo apresentará as distribuições de probabilidade mais usadas para descrever a funcionalidade entre as variáveis aleatórias contínuas. As distribuições contínuas de probabilidade discutidas aqui são: distribuição normal ou gaussiana, distribuição exponencial, distribuição uniforme e distribuição gama. 7.2. Distribuição Normal A distribuição normal foi estudada inicialmente no século 18, quando uma análise de erros experimentais levou a uma curva em forma de sino. Embora ela tenha aparecido pela primeira vez em 1733 através de DeMoivre, a distribuição normal recebe o nome de distribuição gaussiana, em homenagem ao cientista alemão Karl Friedrick Gauss, que foi o primeiro a utilizá-la em 1809. Nos séculos 18 e 19, matemáticos e físicos desenvolveram uma função densidade de probabilidade que descrevia bem os erros experimentais obtidos em medidas físicas. Esta função densidade de probabilidade resultou na bem conhecida curva em forma de sino, chamada de distribuição normal ou gaussiana. Esta distribuição fornece uma boa aproximação de curvas de freqüência para medidas de dimensões e características humanas, como a altura de uma população. Uma variável aleatória contínua X, que assuma valores entre - < x < , tem uma distribuição normal ou gaussiana se a função densidade de probabilidade for dada por: f ( x) 1 2 e ( x )2 2 2 para - < x < , - < < e 2 > 0 (1) em que , média da população, e , desvio-padrão, são parâmetros que especificam completamente uma distribuição normal. Uma forma resumida de dizer que a variável X tem distribuição normal é X~N( , 2). A forma gráfica da Equação (1) é mostrada na Figura 7.1, em que a ordenada é a freqüência relativa e a abscissa representa os valores que a variável X assume. Cada curva de freqüência normal é centrada na média da população, sendo simétrica em torno deste ponto. Para a distribuição normal, a moda e a mediana coincidem com a média. A curva normal nunca toca a abscissa, uma vez que f(x) não será zero no intervalo de - < x < . 1 Figura 7.1 – Curva Normal ou Curva de Freqüência. Como foi dito anteriormente, os parâmetros e especificam completamente a posição e a forma de uma curva normal. A média posiciona o centro, enquanto o desvio-padrão fornece o grau de dispersão. A Figura 7.2 apresenta três curvas normais, representando 3 diferentes populações. Pode-se observar a influência do desvio-padrão no grau de dispersão da curva. Quanto maior o desvio-padrão, mais achatada será a curva. Figura 7.2 – Influência do Desvio-Padrão na Forma da Curva Normal. A área abaixo da curva entre dois valores da variável x representa a probabilidade para variáveis contínuas. Por exemplo, a área central é igual a 0.6826 e isto significa dizer que existe 68% de probabilidade da variável x está na faixa de 10.001 ou entre 0.99 e 1.001. Então a função de distribuição de probabilidade normal é dada por: x F ( x) P( X x) 1 2 e ( y )2 2 2 dy (2) A Figura 7.3 apresenta a função densidade de probabilidade para a variável X, enquanto a Figura 7.4 apresenta a função distribuição de probabilidade. Percebe-se que para x=1,0005, a área abaixo da curva, entre os pontos - a 1,0005 é igual a 0,6915, o que corresponde ao valor da probabilidade de X. Assim: F (1.0005) P( X 1.0005) 0.6915 (3) 2 f(x) =0,001” P(X1,0005)=0,6915 1.0005” Figura 7.3 – Função Densidade de Probabilidade Normal x F(x) 1.0 F(1,0005”)=0,6915 0,6915 x 1,0005” Figura 7.4 – Função Distribuição de Probabilidade A integral da Equação (2) não tem solução analítica, tendo-se que resolvê-la numericamente. Uma forma prática de apresentar a solução para esta equação é usar tabelas. A literatura apresenta uma tabela contendo as probabilidades de uma distribuição normal específica, chamada de distribuição normal padrão. Esta distribuição caracteriza uma variável aleatória normal padrão, chamada Z, representada por uma curva normal com =0 e =1. Conseqüentemente, a Equação (2) é modificada para: z ( z ) P( Z z ) 1 2 e y2 2 dy (4) Valores tabelados da integral acima são dados em anexo. Por exemplo, a probabilidade de Z ser menor ou igual a 1.5 é igual a: (1.5) P( Z 1.5) 0.9332 (5) A probabilidade de Z<15 é também igual a 0.9332, uma vez que Z é uma variável contínua e a probabilidade de um simples ponto é igual a zero neste caso. Assim, P(Z=1.5)=0. A probabilidade de Z>2 é: P( Z 2.0) 1 (2.0) 1 0.9772 0.0228 A probabilidade de Z estar entre dois valores é dada por: (6) P( z1 Z z 2 ) ( z 2 ) ( z1 ) (7) 3 A distribuição normal padrão pode ser usada para se obter a probabilidade aplicável a qualquer distribuição normal. A seguinte mudança de variável deve ser feita: x z (8) A função distribuição de probabilidade para qualquer variável aleatória normal X é igual a: x X x x F ( x ) P ( Z z ) P (9) P Z Exemplo 1: A força (em Newton) com que um tecido sintético se parte é representada por uma distribuição normal, dada por: X~N(800,144). O comprador do tecido requer que o mesmo tenha no mínimo uma força de ruptura igual a 772 N. A amostra de tecido é escolhida aleatoriamente. Calcule P(X 772N). Solução: X 772 800 P( X 772) P P( Z 2.33) (2.33) 0.01 12 P( X 772) 1 0.01 0.99 (10) A Figura 7.5 apresenta as distribuições normal e a normal padronizada. (a) (b) 2=144 2=1 772 =800 x -2.33 =0 Figura 7.5 – Distribuição Normal (a) e Distribuição Normal Padronizada (b). x 7.2.1 Valor Esperado e Variância O valor esperado e a variância de uma distribuição normal são expressas por: E( X ) Var ( X ) 2 (11) (12) 7.2.2. Percentil de uma População Considere uma população de esferas. Seja X a variável aleatória contínua que representa o diâmetro destas esferas. Considere que = 1” e = 0,001”. O diâmetro x de modo que 95% das esferas tenham um diâmetro abaixo ou igual a este diâmetro é calculado por: x z em que z = 1,64, aproximadamente, para 0,95, pela tabela em anexo. Então: (13) x 1. 1.64 * 0.001 1.00164 (14) Assim, tem-se que 95% de todas as esferas da população têm diâmetros menores ou iguais a 1,00164”. 4 7.2.3. Aproximação das Distribuições Binomial e Hipergeométrica pela Distribuição Normal As distribuições que tenham as probabilidades descritas por curvas em forma de sino podem ser aproximadas pela distribuição normal, que é a mais usada em estatística. 7.2.3.1. Aproximação da Distribuição Binomial A equivalência entre as distribuições binomial e normal é dada por: n (15) n (1 ) k k n z n (1 ) (16) (17) A distribuição binomial cumulativa pode ser aproximada pela distribução normal cumulativa, através da seguinte equação: k 0.5 n (18) P ( X k ) B ( k ) n (1 ) A Figura 7.6 apresenta as distribuições cumulativas binomial e normal para n=10 e =0,40, em que a distribuição binomial foi calculada pela Equação (10) do Capítulo 2 e a sua aproximação foi calculada pela Equação (18) e os dados da tabela em anexo. Pela figura, percebe-se que a aproximação foi boa, mesmo para um valor baixo de n. Vale ressaltar que a aproximação deve ser usada quando não se dispõe de valores da distribuição cumulativa binomial, como por exemplo, n=350 com =0,578 ou n=1200 com =0,035. Exemplo 2: Um problema comum em engenharia industrial é decidir quando reparos na maquinaria são necessários. Uma maneira eficiente de detectar problemas na linha de produção de uma fábrica é coletar amostras tão logo os itens sejam produzidos. Uma cervejaria amostra rotineiramente 16 latas de cerveja, a fim de determinar se o número de latas cheias de forma incompleta é grande. Cada hora, uma amostra de 100 latas é tirada da linha de produção, sendo seus volumes precisamente medidos. Considere X o número de latas incompletas e a probabilidade de existir lata incompleta. A política da cervejaria é: Parar a produção e ajustar a máquina, se X>6; Continuar o processo se X6. Verifique se as seguintes exigências foram atendidas: a) Pode haver no máximo 5% de chance de parar o processo, se =0.03; b) Deve haver no máximo 15% de chance de continuar o processo, se =0.10. 5 Figura 7.6 – Funções de Distribuições de Probabilidade para Distribuições Binomial e Normal Solução: P( X 6 | 0.03) 1 P( X 6) | 0.03) 6 0.5 100 * 0.03 1 (2.05) a) P( X 6 | 0.03) 1 100 * 0.03 * (1 0.03) P( X 6 | 0.03) 1 0.9798 0.0202 0.05 Assim, conclui-se que o item (a) é satisfeito. 6 0.50 100 * 0.10 (1.17) 0.1210 b) P( X 6) | 0.10) 100 * 0.10 * (1 0.10) que satisfaz o item (b). (19) (20) A aproximação da distribuição binomial pela distribuição normal é tanto melhor quanto maior for o valor de n e tanto mais próximo de 0.50 for a probabilidade de sucesso, . Existem algumas regras usadas para saber se esta aproximação pode ser usada. Uma delas diz que as duas condições abaixo devem ser satisfeitas para que se possa aproximar a distribuição binomial pela normal: n 5 n(1 ) 5 (21) 7.2.3.2. Aproximação da Distribuição Hipergeométrica Como já visto anteriormente, é possível usar a distribuição binomial para aproximar a distribuição hipergeométrica. Neste caso, a variável z seria dada por: z x 0.50 n n (1 ) N n N 1 (22) 6 7.2.4. Testes para a Distribuição Normal Muitos testes usados em estatística partem do princípio que os dados são provenientes de uma população normal. Dessa forma, testes estatísticos devem ser feitos para verificar esse fato. Existem os testes qualitativos e quantitativos. Dentre os testes qualitativos, existem três gráficos que são comumente utilizados: o de probabilidade normal (normal probability plot), o da probabilidade normal positiva (half-normal probability plot) e o da probabilidade normal sem tendências (detrended normal probability plot). O gráfico de metade da probabilidade normal considera apenas os valores positivos da variável normal padrão. O gráfico da probabilidade normal sem tendências remove a tendência linear antes da elaboração do gráfico. O seu objetivo é mostrar de forma mais clara se existe alguma tendência de comportamento dos dados. Todos os gráficos ordenam, de forma crescente, o valor da variável em estudo (aquela que se quer testar a normalidade) e o transforma na variável normal padrão, calculada pela seguinte fórmula: 3 j 1 z j 1 para o gráfico da probabilidade normal (23) 3n 1 3n 3 j 1 z j 1 para o gráfico da probabilidade normal positiva (24) 6n 1 3 j 1 x j para o gráfico da probabilidade normal sem tendência z j 1 s 3n 1 (25) As Figuras 7.7 a 7.9 apresentam esses gráficos gerados pelo Statistica, usando o módulo Basic Statistics, Descriptive statistics e selecionando-se a variável Pressão. Caso os pontos caiam próximas à linha reta, pode-se dizer que os dados seguem uma distribuição normal. No caso da Figura 7.9, fica claro que não há qualquer tendência característica de comportamento dos dados de pressão. G rá fic o d a P ro b a b ilid a d e N o rm a l P re s s ã o 2 ,0 1 ,5 1 ,0 0 ,5 ValorNormalEsperado 0 ,0 -0 ,5 -1 ,0 -1 ,5 -2 ,0 8 0 9 0 1 0 0 1 1 0 1 2 0 1 3 0 P re s s ã o Figura 7.7 Gráfico da Probabilidade Normal. 7 G rá fic o d a P ro b a b ilid a d e N o rm a lP o s itiv a P re s s ã o 2 ,2 1 ,8 1 ,4 ValorNormalEsperado 1 ,0 0 ,6 0 ,2 -0 ,2 8 0 9 0 1 0 0 1 1 0 1 2 0 1 3 0 P re s s ã o Figura 7.8 Gráfico da Probabilidade Normal Positiva. G rá fic o d a P ro b a b ilid a d e N o rm a ls e m T e n d ê n c ia P re s s ã o 0 ,4 0 ,3 0 ,2 0 ,1 DesviodoValorEsperado 0 ,0 -0 ,1 -0 ,2 -0 ,3 -0 ,4 8 0 9 0 1 0 0 1 1 0 1 2 0 1 3 0 P re s s ã o Figura 7.9 Gráfico da Probabilidade Normal sem Tendência. Os testes quantitativos são mais eficientes, pois independem de qualquer interpretação subjetiva. Eles consistem em calcular uma estatística, característica de cada teste, e verificar se o seu valor é significativo (abaixo de 0,05 ou 0,01, dependendo do nível de significância escolhido). Caso seja, então a hipótese de que os dados seguem uma distribuição normal deve ser rejeitada. Os testes mais usados são: a) Kolmogorov-Smirnov (d) – usado quando a média e o desvio-padrão da população são desconhecidos. Os valores de probabilidade reportados são baseados naqueles tabelados por Massey (1951), que são válidos quando a média e o desvio-padrão da distribuição normal são conhecidos a priori e não estimados a partir dos dados. Entretanto, geralmente esses parâmetros são calculados a partir dos dados reais. b) Lilliefors – usado quando a média e o desvio-padrão da população são conhecidos. c) Shapiro-Wilks (W)– tornou-se o teste preferido devido às suas boas propriedades. Caso se verifique que a população não seja normal, transformações da variável devem ser feitas, a fim de torná-la normal. A transformação de Box-Cox é uma das transformações mais utilizadas. Ela consiste em extrair a raiz quadrada da ou aplicar o logaritmo à variável em estudo. 8 7.2.5. Distribuição Normal Bidimensional Seja X e Y uma variável aleatória bidimensional , tomando todos os valores do plano Euclidiano. Diz-se que (X,Y) tem uma distribuição normal bidimensional se a sua fdp conjunta obedecer à seguinte equação: f X ,Y ( x, y ) 1 2 X Y 1 2 * (23) (x X )2 ( x X )( x Y ) ( y Y ) 2 1 exp 2 2 2 2 2 ( 1 ) X Y X Y para - < x < , - < y < , - < X < , - < Y < , X > 0, Y > 0 e –1 < < 1, onde é o coeficiente de correlação. A Figura 7.10 mostra a fdp expressa pela Equação (23). Figura 7.10 – Função Densidade de Probabilidade para a Distribuição Normal Bidimensional. A distribuição de probabilidade é calculada por: y x FX ,Y ( x, y ) P( X x e Y y ) f X ,Y ( x, y )dudv (24) 7.3 Distribuição Lognormal A distribuição lognormal é muito usada em ciências físicas e sociais e em engenharia, neste último caso para descrever tamanho de partículas, o tempo para haver uma falha no processo (confiabilidade) e o tempo para consertar algo no processo (manutenção). Uma variável X, definida na faixa 0 x < , tem uma distribuição lognormal se logX for normalmente distribuída com média e desvio-padrão dados por: ln X E (ln X ) (25) ln2 X Var (ln X ) A função densidade de probabilidade de X é expressa por: (ln x ) 2 1 , f ( x) exp 2 2 2 com valor esperado e variância calculados por: (26) 9 Var (ln X ) 2 Var ( X ) exp 2 E (ln X ) Var (ln X )(e Var(ln X ) 1) X exp E (ln X ) (27) 7.4 Distribuição Exponencial A distribuição exponencial tem larga aplicação em engenharia. Essa distribuição calcula probabilidades para um certo tempo e espaço entre eventos sucessivos, ocorrendo em um processo de Poisson. É comumente usada para tempos entre chegadas a, por exemplo, cabines de pedágios. Pode-se usar também esta distribuição para calcular probabilidades de falhas, quando do estudo de confiabilidade; ou seja, o intervalo de tempo decorrido entre o instante em que uma peça é sujeita a um esforço mecânico e o instante em que ocorre uma falha (a quebra da peça, por exemplo). A função densidade de probabilidade para uma distribuição exponencial é expressa por: para t 0 (28) f (t ) e t f (t ) 0 para t<0 , (29) em que é a taxa média do processo, que reflete, em média, quantos eventos ocorrem em uma unidade de tempo. A probabilidade que uma variável T esteja ente [a,b] é: b P(a T b) f (t )dt (30) a A função distribuição exponencial de probabilidade é calculada fazendo-se o limite inferior, a, ser igual a zero e o limite superior, b, ser igual a t, ficando-se com: F (t ) P(T t ) 1 e t t0 (31) As Figuras 7.11 e 7.12 apresentam a função densidade de probabilidade e a distribuição exponencial de probabilidade, respectivamente. O valor esperado e a variância são calculados por: 1 1 E( T ) Var( T ) 2 (32) Exemplo 3: Calcule a probabilidade de que o tempo entre chegadas sucessivas de carros na cabine de pedágio da ponte Rio-Niterói seja menor ou igual a 6 segundos (0.1 minuto), sabendo que a taxa média do processo é igual a 5 carros por minuto. Solução: f(t) P(T 0.1) F (0.1) 1 e 5*0.1 1 e 0.5 1 0.6065 0.3935 (33) Área=P(T0.1)=0.3935 t (tempo entre as chegadas) 0,1 Figura 7.11 – Função Densidade de Probabilidade para a Distribuição Exponencial 10 F(t) F(t)=1-e-t 1.0 P(T0.1)=0.3935 t (tempo entre as chegadas) 0.1 Figura 7.12 – Função Distribuição de Probabilidade 7.5 Distribuição Gama Aplica-se a distribuição gama à análise de tempo de vida de equipamentos, de tempo de retorno de mercadorias com falhas e a testes de confiabilidade. A função densidade de probabilidade para a distribuição gama é dada por: r f ( x) x r 1e x para x0 (34) ( r ) f ( x) 0 para x<0 , (35) onde os parâmetros da distribuição gama, que podem assumir qualquer valor positivo, são: , taxa média do processo; r, número específico de eventos que ocorrem até que a variável X (tamanho do segmento de tempo ou espaço) seja atingida.e (r) é a função gama, definida por: (r ) x r 1 e x dx para r>0 (36) 0 Esta função é tabelada, sendo alguns valores dados na tabela em anexo. Algumas propriedades da função gama são: a) (1) 1 b) (r 1) r(r ) c) (r ) (r 1)(r 1) d) ( k 1) k! e) (1 / 2) f) (k 1 / 2) 1 * 3 * 5 * ... * (2k 1) 2k A Figura 7.13 apresenta a função f(x) para vários valores de r. f(x) r=1 r=2 r=3 x Figura 7.13 – Função Densidade de Probabilidade para a Distribuição Gama. No caso especial de r=1, tem-se a distribuição exponencial, pois (1)=1, ficando-se com: (37) f ( x) e x 11 A distribuição gama se reduz à distribuição qui-quadrado, que será vista adiante, quando =1/2 e r=d/2, onde d é um parâmetro inteiro positivo. A distribuição de probabilidade é expressa por: x P( X x) f ( y)dy (38) 0 O valor esperado e a variância são calculados por: r r E( X ) Var( X ) 2 (39) Exemplo 4: Calcule a probabilidade de passado um minuto no máximo, dois carros tenham chegado a uma cabine de pedágio, considerando que =5 carros por minuto. Solução: Neste caso, r=2, ficando-se com: P( X x) 2 1! y 21e y dy 1 e x (1 ) (40) Como =5, tem-se que: P( X 1) 1 e 5*1 (1 5) 1 0.006738 * 6 0.96 (41) 7.6 Distribuição de Weibull A distribuição de Weibull é muito similar à distribuição gama, tendo o mesmo uso. A função densidade de probabilidade é expressa por: (42) f (t ) t 1 e t 0t onde e (dito taxa de falha) são constantes positivas. A Figura 7.14 apresenta a fdp para a distribuição de Weibull, considerando três valores diferentes do parâmetro . f(x) =1 =2 =3 x Figura 7.14 – Função Densidade de Probabilidade para a Distribuição de Weibull. O valor esperado e a variância são calculados por: 1 E ( X ) 1 / 1 Var ( X ) 2 / 2 2 1 1 1 (43) 12 7.7 Distribuição Uniforme Embora com menos aplicações que as demais, a distribuição uniforme é uma das mais importantes em estatística, sendo usada para avaliar avarias causadas para desastres naturais, como o rastro de destruição causado por um tornado, acidentes, guerras. A função densidade de probabilidade é calculada por: 1 f ( x) a xb (44) ba f ( x) 0 caso contrário Todos os valores entre a e b são igualmente prováveis. A probabilidade cumulativa é igual a: x x 1 y F ( x) P( X x) dy ba ba a a F ( x) 0 xa xa F ( x) P( X x) a xb ba F ( x) 1 xb O valor esperado e a variância são iguais a: ab ( b a )2 E( X ) Var( X ) 2 12 (45) (46) (47) Exemplo 5: Calcule a probabilidade de um arranhão em um móvel ser no máximo igual a 7” de comprimento e a probabilidade deste arranhão estar entre 4 e 8”. Calcule também o valor esperado e a variância da distribuição. Considere que todos os arranhões entre 1” e 11” são igualmente prováveis. Solução: As Figuras 7.12 e 7.13 apresentam a fdp e distribuição uniforme de probabilidade para o exemplo em questão. f(x) Área=0.60 1/(b-a) a b x 1” 7” 11” Figura 7.12 – Função Densidade de Probabilidade para a Distribuição Uniforme F(x) P(X7) 0.60 a=1” 7” b=11” x Figura 7.13 – Distribuição de Probabilidade para a Distribuição Uniforme 13 7 1 0,60 11 1 (8 1) (4 1) P(4 X 8) F (8) F (7) 0,40 11 1 1 11 E( X ) 6 2 (11 1) 2 Var ( X ) 8,33 polegadas 2 12 SD( X ) 8,33 2,89" P ( X 7 ) F (7) (48) (49) 14