Prof. Janete Pereira Amador 1 1 Introdução Muitas situações cotidianas podem ser usadas como experimento que dão resultados correspondentes a algum valor, e tais situações podem ser descritas por uma variável aleatória. A palavra aleatória indica que só conhecemos aquele valor depois do experimento ter sido realizado. Desta forma, defini-se variável aleatória como sendo uma função que associa números reais aos eventos de um espaço amostral, ou seja, os resultados do experimento aleatório são dados numéricos. Usa-se as letras maiúscula (X, Y, Z....) para designar as variáveis aleatórias, e minúsculas (x, y, z.....) para indicar particulares valores dessas variáveis. As variáveis aleatórias podem ser discreta e contínuas e o seu comportamento pode ser descrito por uma distribuição de probabilidade. No caso discreto, a distribuição de probabilidade pode ser caracterizada por uma função de probabilidade, que indica diretamente as probabilidades associada a cada valor. No caso contínuo, a distribuição é caracterizada pela função densidade de probabilidade. Uma Variável Aleatória é uma variável (geralmente representada por X) que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento 2 Va riáveis Alea tória s Discretas (VAD) Uma variável aleatória tem comportamento discreto quando ela admite um número finito de valores ou tem uma quantidade enumerável de valores (admite apenas valores inteiros). A definição de uma VAD só fica completa a partir do momento em que se define a função de probabilidade da variável aleatória X. Uma função de probabilidade é a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente, ou seja: Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será formado por um número finito ou enumerável de valores x1; x2;.........A cada possível resultado xi, associaremos um número p(xi) = P(X = xi), i = 1; 2; 3;......, denominado probabilidade de xi. Ou seja Os números p(xi) devem satisfazer às seguintes condições: a) p ( xi ) 0, i ; n b) p( xi ) 1 i 1 Dessa forma função p, definida acima, é denominada função de probabilidade da variável aleatória X e a coleção de pares [xi; p(xi)] i = 1; 2;..........., é denominada distribuição de probabilidade de X. Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os resultados de um espaço amostral; mostra a proporção das vezes em que a variável aleatória tende a assumir cada um dos diversos valores. Prof. Janete Pereira Amador 2 Ex2: Lançam-se dois dados. Seja a v.a. X: soma das probabilidade da variável aleatória X O espaço amostral do experimento corresponde a: 1,1 1,2 1,3 1,4 2,1 2,2 2,3 2,4 3,1 3,2 3,3 3,4 S 4,1 4,2 4,3 4,4 5,1 5,2 5,3 5,4 6,1 6,2 6,3 6,4 O contradomínio de X é dado por: x 2,3,4,5,6,7,8,9,10,11,12 A distribuição de probabilidade de X é dado por: faces. Determinar a distribuição de 1,5 2,5 3,5 4,5 5,5 6,5 1,6 2,6 3,6 4,6 5,6 6,6 A representação gráfica desta distribuição de probabilidade equivale a: 2.1 Grandezas Características As variáveis aleatórias podem ser caracterizadas por uma grandeza de tendência central (média, moda, mediana) e outra de dispersão. A medida caracterizada como grandeza de tendência central é uma média ponderada que recebe o nome particular de esperança matemática (ou valor esperado); as grandezas de dispersão são a variância e o desvio- padrão. 2.1.1 Valor esperado – E(X) Seja X uma VAD, seja p(xi) = P(X=xi) onde p é a função de probabilidade de X. Defini-se valor esperado ou esperança matemática de X anotado por E(X) da seguinte forma. n E(X) xi p ( xi ) i 1 Prof. Janete Pereira Amador 3 E(X) é a média ponderada dos valores de X, onde as ponderações são as probabilidades de cada xi. Diz-se também que E(X) é a media da distribuição de probabilidade da variável aleatória X, algumas vezes anotada por . Se X puder assumir “n” valores igualmente prováveis. Ex3: Considere a variável aleatória definida no Ex2. Calcule a E(X). 11 E(X) xi p ( xi ) x1 p ( x1 ) x2 p ( x 2 ) ..........x11 p ( x11 ) i 1 E ( X ) (2 1 2 3 1 ) (3 ) (4 ) ............................ (12 ) 36 36 36 36 E( X ) 7 2.1.2 Variância – V(X) A variância de uma VAD pode ser definida como a média ponderada das diferenças ao quadrado entre cada resultado possível e sua média aritmética, sendo os pesos as probabilidades de cada um dos respectivos resultados. Assim a variância da variável aleatória discreta X pode ser expressa da seguinte maneira: n V ( X ) ( xi ) 2 P( xi ) onde : I 1 X = variável aleatória discreta de interesse xi = iésimo resultado de x P(xi) = probabilidade de ocorrência do iésimo resultado de x i= 1,2,3......,n A formula mais usual para se calcular a variância 2 V ( X ) xi . pi E ( X ) 2 . corresponde a: Algumas vezes a V(X) é anotada por 2 . A raiz quadrada positiva da variância é denominada desvio padrão e é anotado por ( X ) V ( X ) . Ex4: Considere a variável aleatória definida no Ex2. Calcule a V(X) e o ( X ) V (X ) x 2 i . pi E ( X ) 2 1 2 3 1 1974 V ( X ) (2 2 ) (3 2 ) (4 2 ) ............................ (12 2 ) (7) 2 (7 ) 2 36 36 36 36 36 V ( X ) 5,83 ( X ) V ( X ) 5,83 ( X ) 2,415 Exercícios: 1. A empresa Equilibrada S:A vende três produtos, cujos lucros e as probabilidades de venda estão anotadas a seguir: Produto Lucro unitário (US$) Probabilidade de venda (%) A 15 20 Prof. Janete Pereira Amador B 20 C 10 Pede-se calcular: a) o lucro médio por unidade vendida: b) o desvio padrão: 4 30 50 2. Um empreiteiro faz as seguintes estimativas para o prazo de execução de uma obra: Prazo de execução (dias) Probabilidade de execução (%) 10 30 15 20 22 50 O prazo esperado para execução da obra e o desvio padrão, de acordo com estas estimativas são: 3. Um investidor julga que tem 0,40 de probabilidade de ganhar $ 25.000,00 e 0, 60 de probabilidade de perder $ 15.000,000 num investimento . Seu ganho esperado é: 2.2 Distribuições de Probabilidades para VAD Quando estudamos fenômenos observáveis o que se verifica é se este se adapta as condições de determinado modelo probabilístico conhecido, desta forma torna-se bem mais fácil descrever o comportamento do fenômeno. No caso de variáveis aleatórias discretas os modelos são No caso de variáveis aleatórias discretas as distribuições mais importantes são: a) a distribuição de Binomial b) a distribuição Bernoulli; c) a distribuição de Poisson; d) a distribuição geométrica; e) a distribuição hipergeométrica. : 2.2.1 Distribuição Binomial Consideramos n tentativas independentes, de um experimento aleatório. Cada tentativa admite dois resultados: sucesso com probabilidade p (quando ocorre o evento que estamos interessados) e fracasso com probabilidade q (quando o evento não ocorre), logo a probabilidade total de fracasso ou sucesso p q 1 sendo assim: a probabilidade de fracasso q 1 p Um experimento binomial deve satisfazer as seguintes condições: 1) O experimento deve comportar um número fixo de provas 2) As provas devem ser independentes, isto é, o resultado de qualquer prova não afeta as probabilidades das outras provas. 3) Cada prova deve ter todos os resultados classificados em duas categorias. 4) As probabilidades devem permanecer constantes para cada prova A probabilidade de ocorrer k sucessos em n provas será: Prof. Janete Pereira Amador P(X = k) = C nk = 5 Cnk p k qn-k sendo k = 0, 1, 2, 3, …, n n! , que é a fórmula do Binômio de Newton (p + q)n, daí o nome Binomial. k! n k Desta forma tem-se: n! . p x .q n x para x = 1, 2, .................., n n x ! x! com n número de provas x número de sucessos em n provas p probabilidade de sucesso em qualquer prova q probabilidade de falha (fracasso) em qualquer prova ( q 1 p ) Parâmetros da distribuição: Média, Variância e Desvio padrão da distribuição binomial Média ou valor esperado E(X)= n. p Px Variância V(X)= 2 n. p.q Desvio padrão n. p.q Ex: Dado que 10% população são canhotos, suponha que se queira achar a probabilidade de obter exatamente três estudantes canhotos em uma turma de 15 estudantes. Isso se deve ao fato que algumas carteiras são adaptadas para estudantes canhotos, e a probabilidade resultante poderia afetar o número de tais carteiras a serem encomendadas para as salas de aulas. Calcule também a E(X), V(X) e o . Solução: Satisfazendo as condições para ocorrência de um experimento binomial verifica-se que: 1. O número de provas é fixo 15. 2. As provas são independentes, porque o fato de um estudante ser canhoto ou destro não afeta a probabilidade de outro estudante ser canhoto. 3. Cada prova tem duas categorias de resultado: o estudante é canhoto ou não é. 4. A probabilidade de um estudante ser canhoto (sucesso) é 0,1 e, assim, p =0,1 5. A probabilidade de falha (não-canhoto) é 0,9, logo q = 0,9. Calculando a probabilidade de 3 estudantes canhotos: n! P x . p x .q n x sendo: n = 15; x =3; p = 0,1, q = 0,9 n x ! x! 15! 15.14.13.12! P3 .0,13.0,9153 0,001 0,282429536 455 0,00028243 15 3!3! 12!3! P(3) 0,129 corresponde a probablidade de exatamente 3 estudantes serem canhotos Calculando a E(X) a V(X) e 15.0,1 1,5 ; 2 15.0,1.0,9 1,35 e = 1,16 Exercícios 1. Aplicando a fórmula da probabilidade binomial, determine a probabilidade de obter três estudantes canhotos em uma turma de 15 estudantes, dado que 10% população são canhotos. Prof. Janete Pereira Amador 6 2. A probabilidade de um cliente aleatoriamente escolhido faça uma compra é 0,20. Se um vendedor visita seis clientes, a probabilidade de que ele fará exatamente quatro compras será. 3. Sabe-se que a probabilidade de um estudante que entra na Universidade se formar é 0,3. Determine de que dentre 6 estudantes escolhidos aleatoriamente: a) Nenhum se forme b) Exatamente 4 se formem c) Pelo menos 3 se formem 3 Va riável Alea tória Contínua (VAC) Quando uma variável aleatória apresenta um grande número de resultados possíveis, ou quando a variável aleatória em questão é continua (pode assumir qualquer valor dentro de um intervalo definido de valores), não se pode usar distribuições discretas como a de Poisson ou Binomial para obter probabilidades. Como uma variável contínua inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser adequadamente descrita por uma distribuição discreta. Sendo assim, abordagem mais conveniente é construir uma função densidade de probabilidade, ou curva de probabilidade, baseada na função matemática correspondente. Definição: É aquela que pode tomar qualquer valor em um determinado intervalo. Diz-se que X é uma VAC, se existir uma função f(x), denominada função densidade de probabilidade (fdp) de x que satisfaça às seguintes condições: a) f(x) 0 para todo o x; b) f ( x) dx 1; Observações: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). Sejam a < b, dois números reais. Define-se: , isto é, a probabilidade de que X assuma valores entre os números “a” e “b” é a área sob o gráfico de f(x) entre os pontos x = a e x = b. Neste caso, tem-se também: P(X = a) = 0, isto é, a probabilidade de que uma variável aleatória contínua assuma um valor isolado é igual a zero. Para variáveis contínuas só faz sentido falar em probabilidade em um intervalo, uma vez, que a probabilidade é definida como sendo a área sob o gráfico. f(x) não representa nenhuma probabilidade. Somente quando ela for integrada entre dois limites produzirá uma probabilidade. P(c < x < d) representa a área sob a curva, como exemplificado na figura abaixo da f.d.p. f, entre x = c e x = d. Prof. Janete Pereira Amador 7 Ex: Seja X uma variável aleatória contínua. Com a seguinte função densidade de 2 x para 0 x 1 f ( x) probabilidade verificar se a função é uma 0 para quisquer outros valores fdp da variável X. 1. f(x) 0 1 1 x2 12 0 2 2. f ( x) dx 2 xdx 2 2 1 2 0 2 2 0 Como vemos f(x) é uma um fdp satisfazendo as condições. 3.1 Distribuições Contínuas de Probabilidade Em muitos problemas se torna matematicamente mais simples considerar um espaço amostral “idealizado” para uma variável X, no qual todos os números reais (em algum intervalo específico) passam ser considerados como resultados possíveis. Desta maneira somos levados as variáveis aleatórias contínuas, principalmente quando as observações referem-se a medidas como comprimento, peso, temperatura, etc. Entende-se por distribuição contínua de probabilidade a distribuição que estiver associada a uma variável aleatória contínua – VAC. Assim se uma variável puder assumir um conjunto contínuo de valores de um certo conjunto de dados, então a distribuição de probabilidade P(X) é dita de probabilidade contínua. Desta forma, a seguir estudarmos as seguintes distribuições de probabilidade: Distribuição Normal Distribuição “t” de Student. Distribuição Qui-quadrado ( x2 Distribuição F de Snedecor Prof. Janete Pereira Amador 8 3.1.1 Distribuição Normal É mais importantes distribuição de probabilidade contínua, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da inferência estatística. A distribuição normal serve também como aproximação para um grande número de distribuições. A variável aleatória X que tome todos os valores reais X , tem distribuição normal com parâmetros e 2 se sua função densidade de probabilidade for dada por: f ( x) x 1 1/ 2 e , 2 X A equação da curva Normal é especificada usando 2 parâmetros: a média populacional , e o desvio padrão populacional, ou equivalentemente a variância populacional 2 e devem satisfazer as seguintes condições: a) b) 2 > 0 Denotamos Quando uma variável aleatória X tiver distribuição normal anotaremos. X N ( , 2) A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. A distribuição Normal possui as seguintes características: 1. forma campanular, isto é, possui forma de sino, sendo simétrica em relação a média; 2. a variável aleatória pode assumir qualquer valor real; 3. a área total sob a curva é 1; porque essa área corresponde à probabilidade da variável aleatória assumir qualquer valor real; 4. é uma curva assintótica; 5. possui dois pontos de inflexão; A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição no sentido horizontal. Mudando a variância, muda a dispersão da distribuição fazendo com que o gráfico mais achatado ou mais alongado. Tias configurações estão representadas na figura a seguir: Prof. Janete Pereira Amador 9 Na prática desejamos calcular probabilidades para diferentes valores de e . Para isso, a variável X cuja distribuição é N ( , 2) é transformada numa forma padronizada com distribuição N (0, 1) (distribuição normal padrão) pois tal distribuição é tabelada. Nesse caso a função densidade de probabilidade é dada por: 1 z2 1 f (z) .e 2 . 2 Teorema: Se X tiver uma distribuição normal com média e variância 2 e se Z x então Z terá distribuição normal padronizada. X X N ( , 2) ==> Z N ( 0,1) Esse teorema é usado da seguinte forma: P( x1 < X < x2 ) = P(z1 < Z < z2), onde: x1 x z2 2 Desta forma a variável aleatória X transforma-se em variável normal reduzida Z, como podemos ver graficamente a seguir: z1 68,27% 95,45% 99,73% Prof. Janete Pereira Amador 10 Vê-se que a nova origem é 0 e o desvio padrão é a unidade de medida. Essa transformação não altera a forma da distribuição, apenas refere-se a uma nova escala. A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não superior a Z0: P(Z Z0). Tal probabilidade é representada pela área hachurada na figura a seguir: A importância da distribuição normal padronizada reside no fato de que ela encontrase tabelada, facilitando o cálculo. Ex1: Determinar área sob a curva normal padronizada à esquerda de 1,72. Consultando a tabela, vemos que z = 1,72 corresponde área (probabilidade) 0,9573, ou seja, 95,73% da área sob a curva e acima do eixo da v.a. reduzida estão à esquerda de Z = 1,72. é o mesmo que dizermos que a probabilidade de Z ser menor que 1,72 é 0,9573: P(Z <1,72) = 0,9573. Ex2: Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53. Na tabela, a Z = -0,53 corresponde a área (probabilidade) 0,2981: P(Z < 0,53) = 0,2981, isto é 29,81% da área sob a curva e acima do eixo da v.a. reduzida Z estão abaixo do valor z = -0,53. Ex3: A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm? A solução do problema resume-se em determinar a proporção da distribuição que está acima de 10 ppm, isto é P(X>10). Usando a estatística z temos: Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do tempo. Ex4: Sabe-se que as alturas das plantas de milho de uma certa variedade se distribuem normalmente com média de 2,20m e desvio padrão de 0,20m. Qual a percentagem esperada de plantas com altura compreendida entre 2,30 e 2,35m? X = altura das plantas; X = N (2,20 ; 0,202); P (2,30 < X < 2,35) = P (z1 < Z < z2) 2,30 2,20 0,10 2,35 2,20 z1 = 0,5 e z2 = 0,75 então; 0,2 0,2 0,2 Prof. Janete Pereira Amador 11 P (2,30 < X < 2,35 ) = P (0,5 < X < 0,75) = 0,0819 ou 8,19% corresponde a percentagem de plantas que espera –se alcançar as alturas de 2,30 a 2,35m. Exercícios 1. Determinar área sob a curva normal padronizada à esquerda de 1,82. 2. Calcule as seguintes probabilidades: a) P(- 2,3 < Z < 0) = b) P( 1,50 < Z < 2,32) = 3. As alturas dos alunos de uma determinada escola são normalmente distribuídos com =1,60 m e = 0,30 m. Encontre a probabilidade de 1 aluno medir: a) Entre 1,50 e 1,80 m; b) Mais de 1,75 m; c) Menos de 1,48m;