1 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADES 1. V AR IÁ VEIS ALEATÓRIA S Muitas situações cotidianas podem ser usadas como experimento que dão resultados correspondentes a algum valor, e tais situações podem ser descritas por uma variável aleatória. A palavra aleatória indica que só conhecemos aquele valor depois do experimento ter sido realizado. Definição de Variável Aleatória Uma Variável Aleatória é uma variável (geralmente representada por X) que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento. Exemplos de Variáveis Aleatórias X = número de acidentes de aviões da VARIG dentre sete acidentes aéreos selecionados aleatoriamente. X = número de mulheres entre 10 empregados recém admitidos. X = número de alunos que não compareceram a aula de estatística hoje. X = altura de um aluno de sexo masculino selecionado aleatoriamente. X = variação do preço do dólar durante o plano real. 2 VAR IÁ VEL ALEA TÓRIA DISCR ETA (VAD ) Uma variável aleatória tem comportamento discreto quando ela admite um número finito de valores ou tem uma quantidade enumerável de valores (admite apenas valores inteiros). Uma variável aleatória é considerada discreta quando toma valores que podem ser contados. Ex: números de acidentes numa semana, números de defeitos em sapatos, número de terremotos, Números de jogos empatados, números de livros numa estante etc. DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE DISCRETAS As principais distribuições de probabilidade discretas, são a distribuição Binomial e a de Poisson. Estas distribuições apresentam expressões para o cálculo das probabilidades, isto é, as probabilidades f(x) podem ser avaliadas através de um modelo matemático conhecido. Distribuição Binomial Consideramos n tentativas independentes, de um experimento aleatório. Cada tentativa admite dois resultados: 2 sucesso com probabilidade p (quando ocorre o evento que estamos interessados) e fracasso com probabilidade q (quando o evento não ocorre), logo a probabilidade total de fracasso ou sucesso p q 1 sendo assim: a probabilidade de fracasso q 1 p Em um experimento binomial as probabilidades são calculadas utilizando-se a fórmula da probabilidade binomial: n! . p x .q n x para x = 1, 2, .................., n n x ! x! n número de provas x número de sucessos em n provas p probabilidade de sucesso em qualquer prova q probabilidade de falha (fracasso) em qualquer prova ( q 1 p ) Px com Média, Variância e Desvio padrão da distribuição binomial Média ou valor esperado n. p Variância Desvio padrão 2 n. p.q n. p.q Exercícios: 1. Aplicando a fórmula da probabilidade binomial, determine a probabilidade de obter três estudantes canhotos em uma turma de 15 estudantes, dado que 10% população são canhotos. 2. A probabilidade de um cliente aleatoriamente escolhido faça uma compra é 0,20. Se um vendedor visita seis clientes, a probabilidade de que ele fará exatamente quatro compras será. 3. Se a probabilidade de ocorrência de uma peça defeituosa é de 30%, determinar a média e o desvio padrão da distribuição de peças defeituosas de um total de 800 peças. 3 Distribuição de Poisson A distribuição de Poisson é gerada pela observação de experimentos que fornecem dados, para uma variável aleatória definida como o número de vezes que ocorre um dado evento em um intervalo de tempo ou em um determinado espaço. O intervalo de tempo considerado pode ter qualquer duração, como: ano, meses, dias, minutos. Exemplo: número de chamadas telefônicas em um dia de expediente de um escritório, número de acidentes de tráfego durante o carnaval; O espaço considerado pode ter qualquer dimensão, como: uma linha, um plano ou um volume. Exemplo: número de defeitos em uma chapa metálica; número de partículas dispersas em um litro de óleo. Na distribuição de Poisson a probabilidade de um evento ocorrer x vezes em um determinado intervalo é calculado pela formula: e . k P ( x) k! onde e k 2,718 é a freqüência média de sucessos num intervalo de tempo ou comprimento. ocorrência de uma amostra Média, Variância e Desvio padrão da distribuição Poison Média ou valor esperado ou n. p Variância Desvio padrão 2 Exercícios: 1. Para fins de impactos de bombas V-1 na Segunda Guerra Mundial, o sul de Londres foi subdividido em 576 regiões com área de 0,25 km2 cada. O número médio de impacto por região foi 0,929 bombas. Escolhida aleatoriamente uma região, determine de ela ter sido atingida exatamente duas vezes. 2. A revendedora XY vende em média () 0,5 carros por dia. Determine a probabilidade de que, em um dia qualquer, o número de carros vendidos seja igual a 4. 3. Esta sendo planejado a construção de um hospital para um determinado município de Roraima que ainda não tem hospital próprio. Se neste município tem uma média de 2,25 nascimento por dia, determine a probabilidade de que, em um dia, o número de nascimentos seja igual a 4. 4 3 VAR IÁ VEL ALEA TÓRIA CON TÍNUA (VAC ) Quando uma variável aleatória apresenta um grande número de resultados possíveis, ou quando a variável aleatória em questão é continua (pode assumir qualquer valor dentro de um intervalo definido de valores), não se pode usar distribuições discretas como a de Poisson ou Binomial para obter probabilidades. Uma variável discreta com muitos resultados possíveis exigiria um esforço muito grande na utilização de uma fórmula pra obtenção de probabilidades. Como uma variável contínua inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser adequadamente descrita por uma distribuição discreta. Sendo assim abordagem mais conveniente é construir uma função densidade de probabilidade, ou curva de probabilidade, baseada na função matemática correspondente. DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE CONTÍNUA Algumas distribuições de probabilidade contínuas são a T-Studend, Qui-Quadrado e F-Snedecor Sendo a Distribuição Normal a mais importante das distribuições contínuas. Isto se deve ao fato da maioria dos fenômenos naturais ou dos processos práticos obedecerem a esta distribuição. Exemplos: a dispersão de medidas em uma produção seriada, as alturas das pessoas em uma população e vários outros fenômenos físicos. Distribuição Normal É mais importantes distribuição de probabilidade contínua, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da inferência estatística. É também conhecida como distribuição de Gauss, Lapalce ou Lapalce-Gauss. Seja X uma VAC, X terá distribuição normal se: f ( x) 1 1 x 2 2 .e 2 onde os parâmetros e são respectivamente sua média e variância. Logo diz-se que N N(; 2) ou X: N(; 2). A distribuição Normal possui as seguintes características: 5 1. forma campanular, isto é, possui forma de sino, sendo simétrica em relação a média; 2. a variável aleatória pode assumir qualquer valor real; 3. a área total sob a curva é 1; porque essa área corresponde à probabilidade da variável aleatória assumir qualquer valor real; 4. possui dois pontos de inflexão; Parâmetros da distribuição - Média E(X) = ; - Variância Var(X) = 2 A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição. Mudando a variância, muda a dispersão da distribuição, conforme pode-se ver nas figuras a seguir: Duas distribuições normais de mesma variância e com médias diferentes Duas distribuições normais de mesma média e com variâncias diferentes Na prática é mais fácil trabalhar-se com uma transformação das variáveis. Esta nova variável denomina-se variável normal padronizada, ou reduzida. Sua média é 0 e seu desvio padrão, 1. Com esta transformação, basta construirmos uma única tabela, a da normal reduzida e, através dela, obtermos as probabilidades associadas a todas as distribuições X: N(; 2). Esta transformação é representada pela variável Z, a seguir: Z X N ( 0,1) f (z) 1 2 .e 1 z2 2 Desta forma a variável aleatória X transforma-se em variável normal reduzida Z, como podemos ver graficamente a seguir: 6 68,27% 95,45% 99,73% Vê-se que a nova origem é 0 e o desvio padrão é a unidade de medida. Essa transformação não altera a forma da distribuição, apenas refere-se a uma nova escala A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não superior a Z0: P(Z Z0). Tal probabilidade é representada pela área hachurada na figura a seguir: A importância da distribuição normal padronizada reside no fato de que ela encontra-se tabelada, facilitando o cálculo. Exercícios 1. Determinar área sob a curva normal padronizada à esquerda de 1,72. 2. Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53. 3. Calcule as seguintes probabilidades: a) P(- 2,3 < Z < 0) = b) P( 1,50 < Z < 2,32) = 7 4. As alturas dos alunos de uma determinada escola são normalmente distribuídos com =1,60 m e = 0,30 m. Encontre a probabilidade de 1 aluno medir: a) Entre 1,50 e 1,80 m; b) Mais de 1,75 m; c) Menos de 1,48m;