55 CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM GESTÃO ESTRATÉGICA ECONÔMICA, FINANCEIRA E CONTÁBIL DISCIPLINA: MÉTODOS QUANTITATIVOS DOCENTE: Emília Satoshi Miyamaru Seo TERCEIRA AULA: MODELOS DE PROBABILIDADES BINOMIAIS E NORMAIS INTRODUÇÃO Consciente ou inconscientemente, a probabilidade é usada por qualquer indivíduo que toma decisões em situações de incerteza. Conhecendo ou não regras de cálculo, muitas pessoas interessam-se por eventos ligados às probabilidades. São várias situações em que é desejável se ter uma medida (avaliação numérica) de quão provável é a ocorrência de determinado evento futuro. Por exemplo: lançamento de um produto, bons lucros em uma operação mercantil, meu time vai ganhar o próximo jogo, etc. Por definição probabilidade pode ser calculada como: P( A) númerodecasosfavoráveisaoeventoA númerodecasospossíveis Como nas distribuições de freqüências, vamos tratar sobre as distribuições de probabilidades de populações. Pode-se dizer que uma distribuição de freqüência de uma amostra é uma estimativa das distribuições de probabilidades da população. As análises das distribuições de probabilidades possibilitam a construção de modelos que nos auxiliam no entendimento de fenômenos do mundo real. VARIÁVEIS ALEATÓRIAS (v.a.) Uma variável aleatória, X = v.a., fornece um meio para descrever por valores numéricos os resultados experimentais. Definição: Uma variável aleatória é uma descrição numérica do resultado de um experimento Classificação: variável aleatória discreta e variável aleatória contínua. Definições: 56 Uma v.a. é considerada discreta se toma valores que podem ser contados, ou seja, pode assumir um número de valores de X for finito como uma seqüência infinita numerável (0, 1, 2, 3, ). Uma v.a. é considerada contínua se pode assumir qualquer valor numérico em um intervalo ou uma coleção de intervalos. Tabela 1 - Exemplos de variáveis aleatórias discretas Experimento Variável aleatória (X) Contatar cinco clientes Número de clientes Possíveis valores para X que 0, 1, 2, 3, 4, 5 colocam um pedido de compra Inspecionar um embarque de 50 Número de rádios defeituosos 0, 1, 2,........48, 49, 50. rádios Operar um restaurante por um Número de clientes 0, 1, 2, 3, ......... dia Vender um automóvel Gênero do cliente 0 se masculino 1 se feminino Tabela 2 - Exemplos de variáveis aleatórias Contínuas Experimento Variável aleatória (X) Possíveis valores para X Operar um banco Tempo entre as chegadas dos X 0 clientes em min. Encher um recipiente de Número de ml 0 X 343 mL refrigerante (max.=343 mL) Trabalhar em um projeto para a % de término do projeto após 6 0 X 100 construção de uma nova meses biblioteca Testar um novo químico processo Temperatura quando a desejada 65 X 100 reação tem lugar (min 65 oC, max. 100 oC) OBS.: A VARIÁVEL ALEATÓRIA (X) SERÁ UTILIZADA PARA ESTABELECER MODELOS TEÓRICOS DE PROBABILIDADE COM A FINALIDADE DE DESCREVER POPULAÇÕES. 57 DISTRIBUIÇÃO DE PROBABILIDADES Uma distribuição de probabilidades é uma distribuição de frequências relativas para os resultados de um espaço amostral; mostra a proporção de vezes em que a v.a. tende a assumir cada um dos diversos valores. Em outras palavras, a distribuição de probabilidades para uma v.a. descreve como as probabilidades estão distribuídas sobre os valores da variável aleatória. Por exemplo: Demanda diária de aluguel de caminhotes durante um período de 50 dias. Demanda possível Número de dias Probabilidade P(X ) X 3 3 0,06 4 7 0,14 5 12 0,24 6 14 0,28 7 10 0,20 8 4 0,08 50 1,00 No exemplo acima: Seja X v.a. que pode assumir os valores xi (3, 4, 5, 6, 7, 8). A cada valor de xi correspondem pontos do espaço amostral. Associamos, então, a cada valor xi, a probabilidade Pi de ocorrência de tais pontos no espaço amostral. Assim temos: Pi = 1 Os valores de xi e seus correspondentes Pi definem uma distribuição de probabilidade. As frequências relativas observadas foram convertidas, na última coluna da tabela, em probabilidades para este período de 50 dias. Então, podemos observar que a probabilidade de serem solicitadas exatamente sete caminhonetes em um dia aleatoriamente escolhido no período é de 0,20 e a probabilidade de serem solicitadas seis ou mais é de 0,56. 58 FUNÇÃO PROBABILIDADE Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P. Esta correspondência define uma função; os valores xi (3, 4, 5, 6, 7, 8) formam o domínio da função e os valores Pi (0,06; 0,14; 0,24; 0,28; 0,20; 0,08), a sua imagem. Esta função é denominada função probabilidade e representada por: f(x) = P(X = xi) A função P(X = xi) determina a distribuição de probabilidade da variável aleatória X. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE – DISTRIBUÇÃO BINOMIAL Para uma variável aleatória discreta, X, a distribuição de probabilidades é definida por uma função de probabilidade, denotada por f(x). A função probabilidade fornece a probabilidade para cada um dos valores da variável aleatória. f(x) = P(X = xi) 0,30 Probabilidades f(x) 0,25 0,20 0,15 0,10 0,05 0,00 3 4 5 6 7 Demanda de aluguel 8 X Representação gráfica da distribuição de probabilidades. A utilização da distribuição binomial exige certas hipóteses. Essas hipóteses são: 1. Há n observações ou provas idênticas; 59 2. Cada prova tem dois resultados possíveis, um chamado “sucesso” e o outro “insucesso”; 3. As probabilidades p de “sucesso” e 1 – p de “insucesso”; permanecem constantes em todas as provas; 4. Os resultados das provas são independentes uns dos outros. Há dois métodos para obter as probabilidades para uma v.a. distribuída binomialmente: I) Utilização da fórmula binomial (não será dado no curso) II) Utilização das tabelas de probabilidades binomiais. UTILIZAÇÃO DAS TABELAS DE PROBABILIDADES BINOMIAIS Há dois tipos de tabelas binomiais. Um dá as probabilidades de resultados individuais de uma v.a. e o outro dá as probabilidades de um conjunto de resultados. O primeiro é utilizado quando há interesse na determinação da probabilidade de um único valor numa distribuição binomial, tal como a probabilidade de exatamente 4 sucessos em 6 observações. O segundo tipo de tabela quando há interesse nos resultados do tipo “mais do que” ou “menos do que” determinado número. Exemplo 01: Calcular a probabilidade de 5 sucessos (x = 5) em 8 observações ( n = 8), quando a probabilidade de sucesso é 0,30. Utilizar a tabelas binomiais. Solução: 1. Procurar no topo da tabela o valor de p indicado; 2. Localizar o n na coluna esquerda da tabela, e procurar o número x de sucessos desejado; 3. A probabilidade de x sucessos se encontra na intersecção da linha achada conforme a parte 2 com a coluna achada conforme a parte 1. Assim, a probabilidade de exatamente 5 sucessos em 8 observações, quando a probabilidade de sucesso em cada observação é 0,30, é 0,0467. Exemplo 02: A probabilidade de 2 ou menos sucessos (isto é, 0, ou 1 ou 2) em 3 observações, com probabilidade de sucesso 0,40. Solução: Utiliza-se a tabela de probabilidades binomiais acumuladas = a tabela dá a probabilidade de x ou menos sucessos, podemos ler diretamente a probabilidade de 2 ou menos 60 [dados n e P(sucesso). Para determinar de mais de 2 sucessos, determinamos a probabilidade de 2 ou menos e a subtraímos de 1,00. O raciocínio é igual à tabelas binomiais individuais Neste caso o valor é 0,9360 para 2 ou menos sucessos = P ( X 2) E probabilidade de mais de 3 sucessos: 1 – 0,9360 = 0,0640 = P(X > 2) OBS.: As tabelas binomiais encontram-se na pág. 554 do livro Anderson, Sweeney and Williams. Estatística Aplicada à Administração e Economia. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE – DISTRIBUIÇÃO NORMAL Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. O aspecto gráfico de uma distribuição normal é o da Figura abaixo: Área sob a curva = probabilidade normalmente distribuída 25 20 15 10 5 0 1 2 3 4 6 7 8 9 10 X 1. 2. 3. 4. 5. 6. 7. Em resumo as características das curvas normais são: A variável aleatória X pode assumir todo e qualquer valor real; A curva normal tem a forma de sino; O ponto mais alto na curva normal está a média, que também é a mediana e a moda também; É simétrica em relação à média (), que recebe o nome de curva normal ou de Gauss; A área total limitada pela curva e pelo eixo das abscissas é igual a 1 = 100%; A curva normal é assintota em relação ao eixo das abscissas, prolonga-se de - a +; A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos; 61 8. Há uma família inteira de distribuições normais de probabilidade. Elas são diferenciadas por suas médias e desvios padrões . 9. As probabilidades para a variável aleatória normal são dadas por áreas sob a curva. Por exemplo: 68,26% dos valores de uma variável aleatória normal estão dentro de um desvio padrão positivo ou negativo de sua média; 99,72% dos valores de uma variável aleatória normal estão dentro de um desvio padrão positivo ou negativo de sua média; 99,72% 68,26% 25 20 15 10 5 0 1 - 32 3 - 14 6 + 1 7 8 + 3 9 10 X Distribuição normal-padrão de probabilidades Diz-se que uma variável aleatória que tem uma distribuição normal com uma média de zero e um desvio padrão de 1 tem uma distribuição normal-padrão de probabilidade. A letra z é comumente usada para designar essa particular variável aleatória normal 25 20 =1 15 10 5 0 1 2 3 4 0 6 7 8 9 10 X z Distribuição normal-padrão de probabilidade Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. 62 Exemplo 03: Seja X a variável aleatória que representa ao diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Pode haver interesse em conhecer a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm. É fácil notar que essa probabilidade, indicada por: P(2 < X < 2,05); Corresponde à área hachurada na Figura abaixo: 25 20 15 10 5 0 1,75 1,80 1,85 1,90 1,95 2,00 2,05 2,10 2,15 2,20 2,25 X Se X é uma variável aleatória com distribuição normal de e desvio padrão , então a variável: X z= Onde: z = número de desvios padrões a contar da média; X = valor arbitrário; = a média da distribuição normal; = o desvio padrão. Podemos escrever: P ( < X < x) = P(0 < Z < z) Note-se que z tem sinal negativo para valores de x inferiores à média e sinal positivo para valores superiores à média. Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z: z= X = 2,05 2 0,05 = = 1,25 0,04 0,04 Donde: P(2 < X < 2,05) = P (0 < Z < 1,25) Procuremos na Tabela de distribuições normal z = 1,25: Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que permite escrever: 63 P(0 < Z < 1,25) = 0,3944 Assim, a probabilidade de um parafuso fabricado por essa máquina apresenta um diâmetro entre a média = 2 e o valor x = 2,05 é 0,3944 OBS.: A tabela Normal encontra-se na pág. 225 do livro Anderson, Sweeney and Williams. Estatística Aplicada à Administração e Economia. EXERCÍCOS DE FIXAÇÃO 1. Usando as tabelas binomiais, determinar: a) b) c) d) e) P(X =5 n = 9, p = 0,50); P(X =7 n = 15, p = 0,60); P(X 3 n = 20, p = 0,05); P(X 18 n = 20, p = 0,90); P(X > 8 n = 10, p = 0,70). 2. Devido às altas taxas de juros, uma firma informa que 30% de suas contas a receber de outras firmas comerciais se encontram vencidas. Se um contador escolhe aleatoriamente uma amostra de cinco contas, determinar a probabilidade de cada um dos seguintes eventos usando a tabela de probabilidades binomiais: (a) nenhuma das contas está vencida, (b) exatamente duas contas estão vencidas, (c) a maioria das contas estão vencidas, (d) exatamente 20% das contas estão vencidas. 3. Uma firma de pedidos pelo correio envia uma carta circular que terá uma taxa de respostas de 10%. Suponha que 20 cartas circulares são endereçadas a uma nova área geográfica como um teste de mercado. Supondo que na nova área é aplicável a taxa de respostas de 10%, determinar as probabilidades dos seguintes eventos: (a) ninguém responde, (b) exatamente duas pessoas respondem. 4. Se X:N(10,4) calcular: a)P(8<X<10), b)P(9X12), c)P(X>10), 5. Se Z:N(0,1) calcular: a)P(0<Z<1,28), b)P(-1,28 Z 0), d)P(-1,28<Z<1,28), e) P(1,89<Z<3,50), g) o valor a tal que P(0<Z<a)= 0,18793, h) o valor b tal que P(Z>b)= 0,0025, i) o valor c tal que P(Z>c)=0,20. d)P(X<8 ou X>11). c)P(Z>1,28),d)P(Z<-2), f)P(Z>-1,22), k)P(Z<2,33), 6. Os salários semanais dos operários industriais são distribuídos normalmente em torno da média de R$ 500,00 com desvio padrão de R$ 40,00. Calcule a probabilidade de um operário ter um salário semanal situado entre R$ 490,00 e R$ 520,00. 7. As vendas de um determinado produto têm distribuição aproximadamente normal, com média 500 e desvio padrão 50.Se a empresa decide fabricar 600 unidades no mês em estudo, qual é a 64 probabilidade de que não possa atender a todos os pedidos desse mês, por estar com a produção esgotada e sem estoque no início do mês. 8. A renda média de uma comunidade têm distribuição aproxim. normal, com média R$1500,00 e desvio padrão R$300,00. a)Que % da população terá renda superior a R$1850,00? b)Que % da população terá renda entre 1600,00 e 1850 reais? 9. As vendas diárias de um restaurante têm distribuição normal com média R$5300,00 e desvio padrão R$1200,00. a)Qual é a probabilidade das vendas excederem R$7000,00 em determinado dia? b)Esse restaurante deve vender, no mínimo, R$3000,00 por dia para não ter prejuízo. Qual é a probabilidade de que, em um certo dia, haja prejuízo.