Prof. Janete Pereira Amador 1 1 Introdução A ciência manteve-se até pouco tempo atrás, firmemente apegada à lei da “causa e efeito”. Quando o efeito esperado não se concretizava, atribuía-se o fato ou a uma falha na experiência ou a uma falha na identificação da causa. Não poderia haver quebra da cadeia lógica. Segundo Laplace (Pierre Simon) uma vez conhecidas a vizinhança, a velocidade e a direção de cada átomo no universo, poder-se-ia, a partir daí, predizer com certeza, o futuro até a eternidade. Sabe-se hoje, através do princípio da incerteza, que não é bem assim. Que não existem meios que permitam determinar os movimentos dos elétrons individuais se conhecido a sua velocidade, conforme o estabelecido em 1927, pelo físico alemão W. Heinsenberg. Nesse sentido, o trabalho estatístico se desenvolve fazendo observação de determinados fenômenos e empregando dados numéricos relacionados aos mesmos, para tirar conclusões que permitam conhecê-los e explicá-los. Conforme J. Neymann, toda a vez que se emprega Matemática com a finalidade de estudar algum fenômeno deve-se começar por construir um modelo matemático. No campo da estatística, os modelos matemáticos utilizados são denominados, modelos não determinísticos (aleatórios) ou probabilísticos, ou seja, que avaliam com que probabilidade os resultados podem ocorrer. Os fenômenos para os quais modelos probabilísticos são adequados são denominados de experimentos aleatórios. Modelo não-determinístico ou probabilístico é um modelo em que de antemão não é possível explicitar ou definir um resultado particular. Este modelo é especificado através de uma distribuição de probabilidade. Normalmente existem diversas possibilidades possíveis de ocorrência de um fenômeno aleatório, sendo a medida numérica da ocorrência de cada uma dessas possibilidades, denominada probabilidade. Ao descrever um experimento aleatório deve-se especificar não somente que operação ou procedimento deva ser realizado, mas também o que é que deverá ser observado. Note-se a diferença entre E2 e E3. E1: Joga-se um dado e observa-se o número obtido na face superior. E2: Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido. E3: Joga-se uma moeda 4 vezes e observa-se a seqüência de caras e coroas. Em oposição aos fenômenos aleatórios, existem os fenômenos determinísticos, que são aqueles cujos resultados são previsíveis, por exemplo se pegarmos um determinado sólido, sabemos que a uma determinada temperatura haverá passagem para o estado líquido. 2 Noções de Experimento, Espaço Amostral e Eventos Ao lidar com problemas de probabilidade, torna-se necessário a compreensão de determinado termos. Desta forma a seguir serão dado alguns conceitos importantes. Prof. Janete Pereira Amador 2 2.1 Experimento aleatório [E] É uma das realizações do fenômeno sob observação. Se o fenômeno seguir um modelo não determinístico, tem-se um experimento aleatório, com as seguintes características: • O experimento pode ser repetido; • Embora não seja possível afirmar que resultado em particular ocorrerá, é possível descrever o conjunto de todos os resultados possíveis do experimento; • A medida que aumenta o número de repetições aparece uma certa regularidade nos resultados que torna possível a construção de um modelo matemático. 2.2 Espaço amostral [S] É o conjunto de todos os possíveis resultados de um experimento aleatório. Ex: Determinar o espaço amostral dos seguintes experimentos. E1: Joga-se um dado e observa-se o número obtido na face superior. S1 = {1, 2, 3, 4, 5, 6} E2: Lança-se uma moeda até que ocorra uma cara e conta-se então o número de lançamentos necessários. S2 = { 1, 2, 3, 4, 5, ... } Ao descrever um espaço amostral de um experimento, deve-se ficar atento para o que se está observando ou mensurando. Deve-se falar em “um” espaço amostral associado a um experimento e não de “o” espaço amostral. Deve-se observar ainda que nem sempre os elementos de um espaço amostral são números. Classificação de um espaço amostral: Um espaço amostral, conforme a sua forma e tamanho pode ser classificado em: 1. Finito. 2. Infinitos. 2.3 Evento É qualquer subconjunto do espaço amostral “S” de um experimento. Como os conjuntos os eventos são denotados por A, B, C...... Álgebra de eventos: Pode-se realizar operações entre eventos da mesma forma que elas são realizadas entre conjuntos. Antes de definir as operações é conveniente conceituar o que se entende por ocorrência de um evento. Seja “E” um experimento com um espaço amostral associado “S”. Seja “A” um evento de “S”. É dito que o evento “A” ocorre se realizada a experiência, isto é, se executado “E”, o resultado for um elemento de “A”. Sejam A e B dois eventos de um mesmo espaço amostral S. Diz-se que ocorre o evento: 1. A união B, anotada por A B , se A ou B ocorre ou ambos ocorrerem. Prof. Janete Pereira Amador 3 2. A interseção B, anotado por A B ou AB, se e somente se A ocorre e B ocorre 3. O complementar de A se e somente se A não ocorre. Eventos mutuamente excludentes: dois eventos A e B são denominados mutuamente excludentes ou exclusivos se eles não puderem ocorrer juntos, isto é, A B = ; Exercícios 1. Observe o diagrama a seguir e responda a) Determine o evento D = {x S x 10} b) Determine o evento E = {x C x 2} c) Determine o evento F = {x C x 19} Prof. Janete Pereira Amador 4 2. Conforme o diagrama responda a) A B b) A B c) A 3. Experimento: Lance um dado e observe o número que aparece em cima. Então o espaço amostral é constituído de 6 números possíveis: S = 1;2;3;4;5; 6. Sendo A o evento em que um número par ocorre, B aquele em que um número ímpar ocorre e C em que um número primo ocorre: Então: AC= BC= C= A= AB= 3 Conceitos de Probabilidade Existem três formas de se definir probabilidade. A definição clássica, a definição empírica ou freqüencial e a definição axiomática. 3.1 Definição clássica É valida para espaços amostrais finitos e equiprováveis. Espaços amostrais equiprovávies: probabilidade que ocorra um evento é igual ao quociente de um número favorável de casos sobre o número total de casos possíveis do experimento, desde que as chances de ocorrência de cada elemento do espaço amostral sejam iguais. Seja E um experimento aleatório e S um espaço amostral associado formado por “n” resultados igualmente prováveis. Seja A S um evento com “m” elementos. A probabilidade de A, anotada por P(A), lê-se probabilidade de A, é definida como sendo: P(A) = m / n. Isto é, a probabilidade do evento A é o quociente entre o número “m” de casos favoráveis e o número “n” de casos possíveis. Ex: Calcular a probabilidade de no lançamento de um dado equilibrado obter-se: a) Um resultado igual a 4. b) Um resultado ímpar. Solução: S = {1, 2, 3, 4, 5, 6} a) A = {4} m = (A) =1 então P (A) = m/n = 1/6 = 16,67 b) B = { 1, 3, 5 } m = (B) = 3 então P(B) = m/n = 3 / 6 = 50% Prof. Janete Pereira Amador 5 Crítica à definição clássica A definição clássica é dúbia, já que a idéia de “igualmente provável” é a mesma de “com probabilidade igual”, isto é, a definição é circular, porque está definindo essencialmente a probabilidade com seus próprios termos. A definição não pode ser aplicada quando o espaço amostral é infinito. 3.2 Definição freqüencial Na prática acontece que nem sempre é possível determinar a probabilidade de um evento. Neste caso é necessário ter um método de aproximação desta probabilidade. Um dos métodos utilizados é a experimentação que objetiva estimar o valor da probabilidade de um evento A com base em valores reais. A probabilidade avaliada através deste processo é denominada de probabilidade empírica. Repetindo-se um experimento E um grande número de vezes e calculando-se a freqüência relativa do evento A, obtém-se um número “p” que pode ser tomado como a probabilidade da ocorrência de A, que nesse caso, poderia ser tomada como: f ( A) números de ocorrência de A P( A) p lim P( A) n n número de repetições do experimento Ex: Um dado foi lançado 100 vezes e a face 6 apareceu 18 vezes. Então a freqüência relativa do evento A = { face 6 } é: Solução: números de ocorrência de A 18 P( A) número de repetições do experimento 100 P ( A) 18% Ao se calcular probabilidades pelo método da freqüência relativa, obtém-se uma aproximação em lugar de um valor exato. A mediada que o número de observações aumenta, as aproximações tendem a ficar cada vez mais próximas da probabilidade efetiva. Essa propriedade é enunciada como um teorema comumente conhecido como a Lei dos Grandes Números. Lei dos Grandes Números Ao se repetir um experimento um grande número de vezes, a probabilidade pela freqüência relativa tende para a probabilidade teórica Crítica à definição freqüencial: Esta definição, embora útil na prática, apresenta dificuldades matemáticas, pois o limite pode não existir. Em virtude dos problemas apresentados pela definição clássica e pela definição freqüencial,foi desenvolvida uma teoria moderna, na qual a probabilidade é um conceito indefinido, como o ponto e a reta o são na geometria. 3.3 Definição axiomática Seja E um experimento e S um espaço amostral associado a E. A cada evento A associa-se um número real representado por P(A) e denominado probabilidade de A, que satisfaça aos seguintes axiomas: A1) 0 P(E) 1 as probabilidade são números reais positivos ou zero. A2) P(S) = 1 o espaço amostral tem probabilidade 1 Prof. Janete Pereira Amador 6 A3) P (A B) = P(A) + P(B); se A e B forem eventos mutuamente excludentes (AB =), a probabilidade de chance de ocorrência de um ou de outro é igual a soma das respectivas probabilidades. P( U in1 E i ) = P(E1) + P(E2) +...+ P(En); Se E1, E2 ,..., En, forem dois a dois eventos mutuamente excludentes Teoremas fundamentais: (como conseqüências dos axiomas) Teorema 1: se for um evento (conjunto) vazio, então: P(Ø) = O; Teorema 2: se A for um evento complementar de A, então :P( A ) = 1 – P(A) Teorema 3: se A B, então: P(A) P (B). Teorema4: se A e B forem eventos quaisquer de S, então: P(A B) = P(A) + P(B) - P(AB); Exercícios 1) O seguinte grupo de pessoas está numa sala de aula : 5 rapazes com mais de 21 anos, 4 rapazes com menos de 21 anos, 6 moças com mais de 21 anos e 3 moças com menos de 21 anos. Uma pessoa é escolhida ao acaso dentre as 18. Calcular a probabilidade dos seguintes eventos: A: a pessoa ter mais de 21 anos B: a pessoa ter menos de 21 anos C: a pessoa é um rapaz D: a pessoa é uma moça E: A pessoa ter menos de 21 anos ou ser uma moça 2) Um grupo de 60 pessoas esta assim constituído: Loiras Olhos verdes 12 Olhos Castanhos 13 Se retirarmos uma pessoa ao acaso, qual a probabilidade de que seja: a) loira de olhos verdes ou morena de olhos castanhos b) morena ou tenha olhos verdes. Morenas 19 16 3) Numa gaveta, estão 15 botões numerados de 1 a 15. Retirando-se um botão ao acaso, qual a probabilidade de que seu número seja múltiplo de 2 ou de 3. 4) Numa assembléia estavam presentes os seguintes professores: Matemática Geografia História 1º Grau 10 9 4 2º Grau 13 7 10 a) Professor do segundo grau ou de geografia; b) Professor de história do primeiro grau ou de matemática do segundo grau ou de geografia do primeiro grau. c) Professor de geografia ou história; 5) Uma caixa contém 10 tampinhas de coca-cola, 12 de fanta, 15 de guaraná e 8 de pepsicola. Se retirarmos uma tampinha ao acaso, qual a probabilidade de que seja de fanta ou de guaraná? Prof. Janete Pereira Amador 7 6) Um conjunto de 80 pessoas tem as características abaixo: Brasileiros Argentinos Homens 18 12 Mulheres 20 5 Se retiramos uma pessoas ao acaso qual a probabilidade de que ela seja a) de nacionalidade brasileira ou uruguaia b) de sexo masculino ou tenha nascido na Argentina Uruguaios 10 15 7) Uma semente é retirada ao acaso de uma urna que contem: 6 sementes de milho, 8 sementes de feijão e 4 sementes de melancia. Determinar a probabilidade da semente ser de: a) Ser milho; b) Não ser de feijão; c) Ser melancia ou feijão. 8) Lance um dado e uma moeda a) Construa o espaço amostral; b) Enumere os seguintes eventos: A = {coroa, marcado por número par} B = {cara, marcado com número ímpar} C = {múltiplos de 3} c) Expresse os eventos: i) B ii) A ou B ocorrem iii) B e C ocorrem iv) A B 9) Dois dados são lançados simultaneamente. Qual a probabilidade de: a) a soma ser menor que 4; b) a soma ser 9; e) o primeiro resultado ser maior do que o segundo. 10) Três cavalos A, B, C, estão em uma corrida; A tem duas vezes mais probabilidade de ganhar que B , e B tem duas vezes mais probabilidade de ganhar que C. a) Quais são as probabilidades de cada um, isto é, P (A), P (B) e P(C)? b) Qual seria a probabilidade de B ou C ganhar. Gabarito: 1) a)61% b)38,8% 2) a)46,6% 3) 66,6% 4) a) 73,58% 5) 60% 6) a) 78,75% 7) a) 33,33% 8) 9) a) 8,33% 10) a) P(A) = 57,14% b)78,33% c)50% b)49,05% c)56,60% b) 60% b) 55,55% c) 66,66% b) 11,11% c) 41,67% P(B) =28,57% P(C) =14,29% d)50% b) 42,86% e)72,22 % Prof. Janete Pereira Amador 8 1 Introdução Muitas situações cotidianas podem ser usadas como experimento que dão resultados correspondentes a algum valor, e tais situações podem ser descritas por uma variável aleatória. A palavra aleatória indica que só conhecemos aquele valor depois do experimento ter sido realizado. Desta forma, defini-se variável aleatória como sendo uma função que associa números reais aos eventos de um espaço amostral, ou seja, os resultados do experimento aleatório são dados numéricos. Usa-se as letras maiúscula (X, Y, Z....) para designar as variáveis aleatórias, e minúsculas (x, y, z.....) para indicar particulares valores dessas variáveis. As variáveis aleatórias podem ser discreta e contínuas e o seu comportamento pode ser descrito por uma distribuição de probabilidade. No caso discreto, a distribuição de probabilidade pode ser caracterizada por uma função de probabilidade, que indica diretamente as probabilidades associada a cada valor. No caso contínuo, a distribuição é caracterizada pela função densidade de probabilidade. Uma Variável Aleatória é uma variável (geralmente representada por X) que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento Exemplos de Variáveis Aleatórias X = número de ovos de lagarta em uma folha X =numero de plantas por hectare. X = número de alunos que não compareceram a aula de estatística hoje. X = altura de um aluno de sexo masculino selecionado aleatoriamente. X = variação do preço do dólar durante o plano real. A seguir vermos variáveis aleatórias discretas e suas principais distribuições e as variáveis aleatórias contínuas assim como suas principais distribuições 2 Variáveis Aleatórias Discretas (VAD) Uma variável aleatória tem comportamento discreto quando ela admite um número finito de valores ou tem uma quantidade enumerável de valores (admite apenas valores inteiros). A definição de uma VAD só fica completa a partir do momento em que se define a função de probabilidade da variável aleatória X. Uma função de probabilidade é a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente, ou seja: Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será formado por um número finito ou enumerável de valores x1; x2;.........A cada possível resultado xi, associaremos um número p(xi) = P(X = xi), i = 1; 2; 3;......, denominado probabilidade de xi. Ou seja Os números p(xi) devem satisfazer às seguintes condições: a) p( xi ) 0, i ; Prof. Janete Pereira Amador 9 n b) p ( xi ) 1 i 1 Dessa forma função p, definida acima, é denominada função de probabilidade da variável aleatória X e a coleção de pares [xi; p(xi)] i = 1; 2;..........., é denominada distribuição de probabilidade de X. Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os resultados de um espaço amostral; mostra a proporção das vezes em que a variável aleatória tende a assumir cada um dos diversos valores. Ex1: Lançam-se dois dados. Seja a v.a. X: soma das probabilidade da variável aleatória X O espaço amostral do experimento corresponde a: 1,1 1,2 1,3 1,4 2,1 2,2 2,3 2,4 3,1 3,2 3,3 3,4 S 4,1 4,2 4,3 4,4 5,1 5,2 5,3 5,4 6,1 6,2 6,3 6,4 O contradomínio de X é dado por: x 2,3,4,5,6,7,8,9,10,11,12 A distribuição de probabilidade de X é dado por: faces. Determinar a distribuição de 1,5 2,5 3,5 4,5 5,5 6,5 1,6 2,6 3,6 4,6 5,6 6,6 A representação gráfica desta distribuição de probabilidade equivale a: 2.1 Grandezas Características As variáveis aleatórias podem ser caracterizadas por uma grandeza de tendência central (média, moda, mediana) e outra de dispersão. A medida caracterizada como grandeza de tendência central é uma média ponderada que recebe o nome particular de Prof. Janete Pereira Amador 10 esperança matemática (ou valor esperado); as grandezas de dispersão são a variância e o desvio- padrão. 2.1.1 Valor esperado – E(X) Seja X uma VAD, seja p(xi) = P(X=xi) onde p é a função de probabilidade de X. Defini-se valor esperado ou esperança matemática de X anotado por E(X) da seguinte forma. n E(X) xi p ( xi ) i 1 E(X) é a média ponderada dos valores de X, onde as ponderações são as probabilidades de cada xi. Diz-se também que E(X) é a media da distribuição de probabilidade da variável aleatória X, algumas vezes anotada por . Se X puder assumir “n” valores igualmente prováveis. Considere a variável aleatória definida no Ex1. Calcule a E(X). 11 E(X) xi p( xi ) x1 p( x1 ) x 2 p( x 2 ) ..........x11 p( x11 ) i 1 E ( X ) (2 1 2 3 1 ) (3 ) (4 ) ............................ (12 ) 36 36 36 36 E( X ) 7 2.1.2 Variância – V(X) A variância de uma VAD pode ser definida como a média ponderada das diferenças ao quadrado entre cada resultado possível e sua média aritmética, sendo os pesos as probabilidades de cada um dos respectivos resultados. Assim a variância da variável aleatória discreta X pode ser expressa da seguinte maneira: n V ( X ) ( xi ) 2 P( xi ) onde : I 1 X = variável aleatória discreta de interesse xi = iésimo resultado de x P(xi) = probabilidade de ocorrência do iésimo resultado de x i= 1,2,3......,n A formula mais usual para se calcular a variância 2 V ( X ) xi . p i E ( X ) 2 . corresponde a: Algumas vezes a V(X) é anotada por 2 . A raiz quadrada positiva da variância é denominada desvio padrão e é anotado por ( X ) V ( X ) . Considere a variável aleatória definida no Ex1. Calcule a V(X) e o (X ) Prof. Janete Pereira Amador V (X ) x 2 i . pi E ( X ) 2 11 1 2 3 1 1974 V ( X ) (2 2 ) (3 2 ) (4 2 ) ............................ (12 2 ) (7) 2 ( 7) 2 36 36 36 36 36 V ( X ) 5,83 ( X ) V ( X ) 5,83 ( X ) 2,415 Exercícios 1) Com os dados: Número de lagartas 0 Número de parcelas 10 Calcular a esperança e a variância 1 8 2 20 3 30 4 4 2) A empresa Equilibrada S:A vende três produtos, cujos lucros e as probabilidades de venda estão anotadas a seguir: Produto Lucro unitário (US$) Probabilidade de venda (%) A 15 20 B 20 30 C 10 50 Pede-se calcular: a) o lucro médio por unidade vendida: b) o desvio padrão: 3) Foi feita a verificação da colinesterase plasmática em 34 vacas leiteiras da raça holondesa. Obteve-se os seguintes resultados. 1,6 1,8 1,5 1,9 2,1 1,3 1,7 Valores 8 4 3 4 1 5 9 N° de vacas a) Determinar o valor médio de colinesterase plasmática b) A variância 2.3 Distribuições de Probabilidades para VAD Quando estudamos fenômenos observáveis o que se verifica é se este se adapta as condições de determinado modelo probabilístico conhecido, desta forma torna-se bem mais fácil descrever o comportamento do fenômeno. Assim nesta seção irmos estudar o modelo distribuição Binomial 2.3.1 Distribuição Binomial Consideramos n tentativas independentes, de um experimento aleatório. Cada tentativa admite dois resultados: sucesso com probabilidade p (quando ocorre o evento que estamos interessados) e fracasso com probabilidade q (quando o evento não ocorre), logo a probabilidade total de fracasso ou sucesso p q 1 sendo assim: a probabilidade de fracasso q 1 p Prof. Janete Pereira Amador 12 Um experimento binomial deve satisfazer as seguintes condições: 1) O experimento deve comportar um número fixo de provas 2) As provas devem ser independentes, isto é, o resultado de qualquer prova não afeta as probabilidades das outras provas. 3) Cada prova deve ter todos os resultados classificados em duas categorias. 4) As probabilidades devem permanecer constantes para cada prova A probabilidade de ocorrer k sucessos em n provas será: P(X = k) = C nk = C nk pk qn-k sendo k = 0, 1, 2, 3, …, n n! , que é a fórmula do Binômio de Newton (p + q)n, daí o nome Binomial. k! n k Desta forma tem-se: n! . p x .q n x para x = 1, 2, .................., n n x ! x! com n número de provas número de sucessos em n provas x p probabilidade de sucesso em qualquer prova q probabilidade de falha (fracasso) em qualquer prova ( q 1 p ) Parâmetros da distribuição: Média, Variância e Desvio padrão da distribuição binomial Média ou valor esperado E(X)= n. p Variância V(X)= 2 n. p.q Px Desvio padrão n. p.q Ex: Dado que 10% população são canhotos, suponha que se queira achar a probabilidade de obter exatamente três estudantes canhotos em uma turma de 15 estudantes. Isso se deve ao fato que algumas carteiras são adaptadas para estudantes canhotos, e a probabilidade resultante poderia afetar o número de tais carteiras a serem encomendadas para as salas de aulas. Calcule também a E(X), V(X) e o . Solução: Satisfazendo as condições para ocorrência de um experimento binomial verifica-se que: 1. O número de provas é fixo 15. 2. As provas são independentes, porque o fato de um estudante ser canhoto ou destro não afeta a probabilidade de outro estudante ser canhoto. 3. Cada prova tem duas categorias de resultado: o estudante é canhoto ou não é. 4. A probabilidade de um estudante ser canhoto (sucesso) é 0,1 e, assim, p =0,1 5. A probabilidade de falha (não-canhoto) é 0,9, logo q = 0,9. Calculando a probabilidade de 3 estudantes canhotos: n! Px . p x .q n x sendo: n = 15; x =3; p = 0,1, q = 0,9 n x ! x! Prof. Janete Pereira Amador P3 13 15! 15.14.13.12! .0,13.0,9153 0,001 0,282429536 455 0,00028243 12!3! 15 3!3! P(3) 0,129 corresponde a probablidade de exatamente 3 estudantes serem canhotos Calculando a E(X) a V(X) e 15.0,1 1,5 ; 2 15.0,1.0,9 1,35 e = 1,16 Exercícios 1) A probabilidade de que um animal de uma determinada população seja do sexo feminino é de 0,20. Se seis animais são selecionados qual, a probabilidade de que teremos exatamente quatro fêmeas. 2) Se a probabilidade de ocorrência de uma determinada doença é de 30%, determinar a média e o desvio padrão da distribuição desta doença em um total de 800 indivíduos. 3) Num hospital 5 pacientes devem submeter-se a um tipo de operação, da qual 80% sobrevivem. Qual a probabilidade de que: a) todos sobrevivam; b) pelo menos dois sobrevivam; c) no máximo três não consigam sobreviver. 4) Em 10000 famílias com 8 filhos cada uma, quantas se esperaria que tivessem: a) exatamente 2 meninos; b) nenhum menino; c) três meninos. 5) Em um lote de sementes de Araucária foi constatado, por análise de laboratório, que o poder germinativo era de 60%. Para produzir mudas foram colocadas 4 sementes em cada embalagem. Qual a probabilidade de ter pelo menos uma planta em cada embalagem. 6) A probabalidade de uma semente germinar é de 88%. Calcule a probabilidade de uma embalagem com 5 sementes germinar mais de 3 Variável Aleatória Contínua (VAC) Quando uma variável aleatória apresenta um grande número de resultados possíveis, ou quando a variável aleatória em questão é continua (pode assumir qualquer valor dentro de um intervalo definido de valores), não se pode usar distribuições discretas como a de Poisson ou Binomial para obter probabilidades. Como uma variável contínua inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser adequadamente descrita por uma distribuição discreta. Sendo assim, abordagem mais conveniente é construir uma função densidade de probabilidade, ou curva de probabilidade, baseada na função matemática correspondente. Definição: É aquela que pode tomar qualquer valor em um determinado intervalo. Diz-se que X é uma VAC, se existir uma função f(x), denominada função densidade de probabilidade (fdp) de x que satisfaça às seguintes condições: Prof. Janete Pereira Amador 14 a) f(x) 0 para todo o x; b) f ( x) dx 1; Observações: Seja X uma variável aleatória contínua com função densidade de probabilidade f(x). Sejam a < b, dois números reais. Define-se: , isto é, a probabilidade de que X assuma valores entre os números “a” e “b” é a área sob o gráfico de f(x) entre os pontos x = a e x = b. Neste caso, tem-se também: P(X = a) = 0, isto é, a probabilidade de que uma variável aleatória contínua assuma um valor isolado é igual a zero. Para variáveis contínuas só faz sentido falar em probabilidade em um intervalo, uma vez, que a probabilidade é definida como sendo a área sob o gráfico. f(x) não representa nenhuma probabilidade. Somente quando ela for integrada entre dois limites produzirá uma probabilidade. P(c < x < d) representa a área sob a curva, como exemplificado na figura abaixo da f.d.p. f, entre x = c e x = d. Ex: Seja X uma variável aleatória contínua. Com a seguinte função densidade de 2 x para 0 x 1 f ( x) probabilidade verificar se a função é uma 0 para quisquer outros valores fdp da variável X. 1. f(x) 0 1 x2 12 0 2 2. f ( x) dx 2 xdx 2 2 1 2 0 2 2 0 Como vemos f(x) é uma um fdp satisfazendo as condições. 1 Prof. Janete Pereira Amador 15 3.3 Distribuições Contínuas de Probabilidade Em muitos problemas se torna matematicamente mais simples considerar um espaço amostral “idealizado” para uma variável X, no qual todos os números reais (em algum intervalo específico) passam ser considerados como resultados possíveis. Desta maneira somos levados as variáveis aleatórias contínuas, principalmente quando as observações referem-se a medidas como comprimento, peso, temperatura, etc. Entende-se por distribuição contínua de probabilidade a distribuição que estiver associada a uma variável aleatória contínua – VAC. Assim se uma variável puder assumir um conjunto contínuo de valores de um certo conjunto de dados, então a distribuição de probabilidade P(X) é dita de probabilidade contínua. Desta forma, a seguir estudarmos as seguintes distribuições de probabilidade: Distribuição Normal Distribuição “t” de Student. Distribuição Qui-quadrado ( x2 Distribuição F de Snedecor 3.3.1 Distribuição Normal É mais importantes distribuição de probabilidade contínua, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da inferência estatística. A distribuição normal serve também como aproximação para um grande número de distribuições. A variável aleatória X que tome todos os valores reais X , tem distribuição normal com parâmetros e 2 se sua função densidade de probabilidade for dada por: x 1 1/ 2 f ( x) e , 2 X A equação da curva Normal é especificada usando 2 parâmetros: a média populacional , e o desvio padrão populacional, ou equivalentemente a variância populacional 2 e devem satisfazer as seguintes condições: a) b) 2 > 0 Denotamos Quando uma variável aleatória X tiver distribuição normal anotaremos. X N ( , 2) A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. A distribuição Normal possui as seguintes características: Prof. Janete Pereira Amador 16 1. forma campanular, isto é, possui forma de sino, sendo simétrica em relação a média; 2. a variável aleatória pode assumir qualquer valor real; 3. a área total sob a curva é 1; porque essa área corresponde à probabilidade da variável aleatória assumir qualquer valor real; 4. é uma curva assintótica; 5. possui dois pontos de inflexão; A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição no sentido horizontal. Mudando a variância, muda a dispersão da distribuição fazendo com que o gráfico mais achatado ou mais alongado. Tias configurações estão representadas na figura a seguir: Na prática desejamos calcular probabilidades para diferentes valores de e . Para isso, a variável X cuja distribuição é N ( , 2) é transformada numa forma padronizada com distribuição N (0, 1) (distribuição normal padrão) pois tal distribuição é tabelada. Nesse caso a função densidade de probabilidade é dada por: 1 z2 1 f ( z) .e 2 . 2 Teorema: Se X tiver uma distribuição normal com média e variância 2 e se Z então Z terá distribuição normal padronizada. X N (0,1) X N ( , 2) ==> Z Esse teorema é usado da seguinte forma: x Prof. Janete Pereira Amador 17 P( x1 < X < x2 ) = P(z1 < Z < z2), onde: x1 x z2 2 Desta forma a variável aleatória X transforma-se em variável normal reduzida Z, como podemos ver graficamente a seguir: z1 68,27% 95,45% 99,73% Vê-se que a nova origem é 0 e o desvio padrão é a unidade de medida. Essa transformação não altera a forma da distribuição, apenas refere-se a uma nova escala. A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não superior a Z0: P(Z Z0). Tal probabilidade é representada pela área hachurada na figura a seguir: A importância da distribuição normal padronizada reside no fato de que ela encontrase tabelada, facilitando o cálculo. Ex1: Determinar área sob a curva normal padronizada à esquerda de 1,72. Consultando a tabela, vemos que z = 1,72 corresponde área (probabilidade) 0,9573, ou seja, 95,73% da área sob a curva e acima do eixo da v.a. reduzida estão à esquerda de Z = 1,72. é o mesmo que dizermos que a probabilidade de Z ser menor que 1,72 é 0,9573: P(Z <1,72) = 0,9573. Ex2: Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53. Prof. Janete Pereira Amador 18 Ex3: A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8, 2,25). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm? Ex4: Sabe-se que as alturas das plantas de milho de uma certa variedade se distribuem normalmente com média de 2,20m e desvio padrão de 0,20m. Qual a percentagem esperada de plantas com altura compreendida entre 2,30 e 2,35m? Exercícios 1. Calcule as seguintes probabilidades: a) P(- 2,3 < Z < 0) = b) P( 1,50 < Z < 2,32) = c) P(1,42<Z<1,53) d) P(-1,53 < Z <– 1,42) e) P(1,14 < Z < 1,0) f) P(-5 < Z < 1,39) 2. As alturas dos alunos de uma determinada escola são normalmente distribuídos com =1,60 m e = 0,30 m. Encontre a probabilidade de 1 aluno medir: a) Entre 1,50 e 1,80 m; b) Mais de 1,75 m; c) Menos de 1,48m; 4. Determinado atacadista efetua suas vendas por telefone. Após alguns meses verificouse que os pedidos distribuem-se normalmente com média de 300 pedidos e variância de 144. Qual a probabilidade de um determinado mês a firma receber menos de 270 pedidos. 5. Suponha que a temperatura média do mês de julho em Santa Maria seja normalmente distribuída com média igual a 11 graus e variância de 9 graus. Calcular a probabilidade da temperatura: a) Ser inferior a 6,7 graus b) Ser superior a 5 graus c) Estar entre 8,8 e 13,2 graus.