Capítulo 3 Modelos Estatísticos Resenha Variáveis Aleatórias Distribuição Binomial Distribuição de Poisson Distribuição Normal Distribuição t de Student Distribuição Qui-quadrado Ana M. Abreu - 2006/07 Slide 1 Resenha Slide 2 Este capítulo aborda as distribuições de probabilidade tendo em conta os conhecimentos de estatistica descritiva apresentados no Capítulo 1 e os de probabilidade apresentados no Capítulo 2 . As Distribuições de Probabilidade descrevem o que provavelmente acontecerá em vez de o que realmente aconteceu. Ana M. Abreu - 2006/07 Definições Slide 3 Uma variável aleatória é uma variável (usualmente representada por X) que toma um certo valor numérico, determinado pelo acaso, de cada vez que a experiência é realizada. Uma distribução de probabilidade é um gráfico, tabela, ou fórmula que indica a probabilidade correspondente a cada valor da variável aleatória. Ana M. Abreu - 2006/07 Definições Slide 4 Uma variável aleatória discreta toma um nº finito ou infinito numerável de valores. Uma variável aleatória contínua toma um nº infinito não numerável de valores, os quais podem ser associados com medidas numa escala contínua. Ana M. Abreu - 2006/07 Propriedades das Slide 5 Distribuições de Probabilidade Σ P(x) = 1 onde x toma todos os valores possíveis. 0 ≤ P(x) ≤ 1 para qualquer valor de x. Ana M. Abreu - 2006/07 Média, Variância e Slide 6 Desvio Padrão de uma Variável Aleatória µ = Σ [x • P(x)] Média σ = Σ [(x – µ) • P(x)] Variância σ = [Σ x • P(x)] – µ Variância (forma reduzida) 2 2 2 2 2 σ = Σ [x 2 • P(x)] – µ 2 Desvio Padrão Ana M. Abreu - 2006/07 Definição Slide 7 O Valor Esperado de uma variável aleatória discreta é denotado por E, e representa a média dos resultados. Determina-se através do valor de Σ [x • P(x)]. E = Σ [x • P(x)] Ana M. Abreu - 2006/07 Em resumo Slide 8 Até agora aprendemos sobre: Combinar os métodos da estatística descritiva com os da probabilidade. Variáveis aleatórias e distribuições de probabilidade. Propriedades da distribuição de probabilidade. Média, variância e desvio padrão de uma variável aleatória. Valor esperado. Ana M. Abreu - 2006/07 A Distribuição Binomial Ana M. Abreu - 2006/07 Slide 9 Definições Slide 10 A distribuição binomial verifica as seguintes condições: 1. A experiência tem um nº fixo de provas, n. 2. As provas são independentes. (O resultado de uma prova não afecta a probabilidade de ocorrência das restantes.) 3. Cada prova origina um de dois resultados possíveis: sucesso ou insucesso. 4. A probabilidade de sucesso, denotada por p, é constante em cada prova. Ana M. Abreu - 2006/07 Notação para a Distribuição Binomial n Slide 11 denota o nº de provas (valor fixo à partida). x denota um nº específico de sucessos em n provas, logo x pode ser qualquer nº entre 0 e n, inclusive. p denota a probabilidade de sucesso em cada uma das n provas. q denota a probabilidade de insucesso em cada uma das n provas. P(x) denota a probabilidade de obter exactamente x sucessos em n provas (P(x)=P(X=x)). Ana M. Abreu - 2006/07 Métodos para Determinar as Probabilidades com a Distribuição Binomial Slide 12 Vejamos três métodos possíveis para determinar as probabilidades correspondentes à variável aleatória X com distribuição binomial. Ana M. Abreu - 2006/07 Método 1: Usando a Fórmula da Probabilidade na Distribuição Binomial P(X=x) = n! (n – x)!x! • px • Slide 13 qn-x para x = 0, 1, 2, . . ., n onde n = nº de provas x = nº de sucessos nas n provas p = probabilidade de sucesso em cada prova q = probabilidade de insucesso em cada prova (q = 1 – p) Ana M. Abreu - 2006/07 Método 2: Usando uma Tabela de Probabilidades Slide 14 Reproduz-se em baixo parte da tabela da binomial que vamos usar. Com n = 5 e p = 0.2 na distribuição binomial, as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são 0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373), 0.0512, 0.0064 e 0.0003, respectivamente. n=5 x .01 0 1 2 3 4 p .05 .10 .20 .3277 .7373 .9421 .9933 .9997 Ana M. Abreu - 2006/07 Método 3: Usando a Tecnologia Slide 15 Software Estatístico, Excel e algumas calculadoras fornecem-nos as probabilidades da distribuição binomial. Ana M. Abreu - 2006/07 Distribuição Binomial: Fórmulas Média Slide 16 µ =n•p Variância σ 2 = n • p • q Desvio Padrão σ = n•p•q onde n = nº de provas p = probabilidade de sucesso em cada uma das n provas q = probabilidade de insucesso em cada uma das n provas Ana M. Abreu - 2006/07 Exemplo Slide 17 Determine a média e o desvio padrão para o nº de raparigas em 14 nascimentos. Esta situação pode ser resolvida através da distribuição binomial onde: n = 14 p = 0.5 q = 0.5 Usando as fórmulas da distribuição binomial, temos : µ = (14)(0.5) = 7 raparigas σ = (14)(0.5)(0.5) = 1.871 raparigas Ana M. Abreu - 2006/07 Interpretação dos Resultados Slide 18 É especialmente importante interpretar os resultados. Os valores dizem-se pouco usuais se se encontrarem para além dos seguintes limites: Valores Máximos Usuais = µ + 2 σ Valores Mínimos Usuais = µ – 2 σ Ana M. Abreu - 2006/07 Exemplo Slide 19 Determine se é usual em 100 nascimentos, 68 serem raparigas. Para esta distribuição binomial, µ = 50 raparigas σ = 5 raparigas µ + 2 σ = 50 + 2(5) = 60 µ - 2 σ = 50 - 2(5) = 40 Em 100 nascimentos, é usual nascerem entre 40 e 60 raparigas. Assim, não é usual nascerem 68 raparigas. Ana M. Abreu - 2006/07 Slide 20 A Distribuição de Poisson Ana M. Abreu - 2006/07 Definição Slide 21 A distribuição de Poisson é uma distribuição discreta que se aplica quando ocorre um acontecimento num intervalo especificado. A variável aleatória X representa o nº de ocorrências num determinado intervalo. O intervalo pode se referir a tempo, distância, área, volume, ou algum tipo de medida similar. Fórmula P(X=x)= µ x • e -µ onde e ≈ 2.71828 x! Ana M. Abreu - 2006/07 Condições da Distribuição de Poisson Slide 22 A variável aleatória X designa o nº de acontecimentos nalgum intervalo. Assim, pode tomar quaisquer dos valores 0, 1, 2, …) Os acontecimentos têm que ser aleatórios. Os acontecimentos são independentes. • Parâmetros A média é µ. O desvio padrão é σ= µ. Ana M. Abreu - 2006/07 Diferenças em relação à Distribuição Binomial Slide 23 A distribuição de Poisson difere da distribuição binomial nos seguintes aspectos fundamentais: A distribuição binomial é caracterizada pela dimensão da amostra n e pela probabilidade de sucesso p, enquanto que a distribuição de Poisson é caracterizada apenas pela média µ. Numa distribuição binomial, os valores que a variável aleatória X pode tomar são 0, 1, . . . n, enquanto que na distribuição de Poisson a variável X toma os valores 0, 1, . . . , sem limite superior. Ana M. Abreu - 2006/07 Exemplo Slide 24 Bombas da 2ª Guerra Mundial Em 1945 os alemães bombardearam Londres com as bombas V2. A região londrina está dividida em 576 distritos de superfícies semelhantes, pelo que admitimos que cada distrito tem igual probabilidade de ser bombardeado. Calcula-se que o nº de bombas recebidas por Londres foi de 535. Se um distrito for seleccionado ao acaso, determine a probabilidade de ter sido bombardeado com exactamente 2 bombas. A distribuição de Poisson é adequada porque estamos a lidar com uma situação de ocorrência de acontecimentos (nº de bombas recebidas) num certo intervalo (distrito). Ana M. Abreu - 2006/07 Exemplo Slide 25 O nº médio de bombas por distrito é µ = 535 = 0.929 576 Então, P(X=2) = 0.9292 e-0.929 = 0.170. 2! Assim, a probabilidade de um qualquer distrito ser atingido por exactamente 2 bombas é P(X=2) = 0.170. Ana M. Abreu - 2006/07 Cálculo da probabilidade na Distribuição Slide 26 de Poisson usando uma Tabela Reproduz-se em baixo parte da tabela da distribuição de Poisson que vamos usar. Com µ = 0.20, as probabilidades de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são 0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825), 0.001, e 0.0001, respectivamente. µ x 0 1 2 3 4 .05 .10 .15 .20 .8187 .9825 .9989 .9999 1.0000 Ana M. Abreu - 2006/07 Distribuição Normal Ana M. Abreu - 2006/07 Slide 27 Caracterização Slide 28 Variável aleatória contínua Distribuição Normal x-µ µ2 ( σ) 2 -1 f(x) = e σ 2π Fórmula 3-1 Figura 3-1 Ana M. Abreu - 2006/07 Definições Slide 29 Curva da Densidade (ou da função densidade de probabilidade é o gráfico da distribuição de probabilidade de uma variável aleatória contínua). 1. A área total sob a curva é igual a 1. 2. Todo o ponto sob a curva deve ter uma ordenada de valor igual ou superior a zero. Ana M. Abreu - 2006/07 Uso da Área para determinar a Probabilidade Slide 30 Como a área total sob a curva é igual a 1, existe uma correspondência entre a área e a probabilidade. Figura 3-2 Ana M. Abreu - 2006/07 Alturas de Homens e Mulheres Figura 3-3 Ana M. Abreu - 2006/07 Slide 31 Definição Slide 32 Distribuição Normal Standard : a distribuição Normal que tem média 0 e desvio padrão 1. Figura 3-4 Ana M. Abreu - 2006/07 Notação Slide 33 P(a < z < b) denota a probabilidade de z tomar valores entre aeb P(z > a) denota a probabilidade de z tomar valores maiores do que a P(z < a) denota a probabilidade de z tomar valores menores do que a Ana M. Abreu - 2006/07 Cálculo do valor de z correspondenteSlide 34 a uma certa probabilidade 5% ou 0.05 (o valor de z será positivo) 1.645 Figura 3-5 Cálculo do Percentil 95 Ana M. Abreu - 2006/07 Cálculo do valor de z correspondenteSlide 35 a uma certa probabilidade (Um dos valores de z será negativo e o outro positivo) Figura 3-6 Cálculo dos Percentis 2.5% e 97.5% Ana M. Abreu - 2006/07 Distribuições Normais não Standard µ≠0 σ ≠1 Slide 36 Se ou (ou ambos), teremos que converter os valores usando a Fórmula 3-2; então, os procedimentos passam a ser os mesmos do que os usados com a distribuição Normal Standard. Fórmula 3-2 z= x–µ σ Ana M. Abreu - 2006/07 Conversão para a Distribuição Normal Standard x–µ z= σ Figura 3-7 Ana M. Abreu - 2006/07 Slide 37 Precauções a ter em conta Slide 38 1. Não confunda valores de z com as correspondentes áreas. Os valores de z são distâncias ao longo do eixo horizontal enquanto que as áreas são regiões sob a curva da distribuição Normal. A tabela usada apresenta os valores de z na coluna à esquerda e na linha superior, enquanto que as áreas se encontram no “meio” da tabela. 2. Escolha o lado certo (direito/esquerdo) do gráfico. 3. Um valor de z deve ser negativo sempre que se encontre na metade esquerda da distribuição Normal. 4. As áreas (ou probabilidades) têm valores positivos ou nulos, mas nunca têm valores negativos. Ana M. Abreu - 2006/07 Cálculos usando a Tabela da distribuição Normal Standard Slide 39 Seja Z a variável aleatória com distribuição Normal standard, ou seja, com valor médio zero e desvio padrão 1. Para calcular P(Z<0.32), é necessário consultar a tabela, na página referente aos valores positivos de z, como a seguir se indica: z 0.0 0.1 0.2 0.3 .00 .01 .02 .5080 .5478 .5871 .6255 Assim, P(Z<0.32)=0.6255. Ana M. Abreu - 2006/07 Cálculos usando a Tabela da distribuição Normal Standard Slide 40 De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se consultou a mesma tabela, embora na parte referente aos valores negativos de z. Por outro lado, para encontrar o valor de z correspondente a uma certa probabilidade, por exemplo, 0.975, o valor da probabilidade tem que ser procurado no interior da tabela para, só depois, determinar o valor de z que lhe corresponde. z … .05 .06 … … 1.8 .9686 1.9 .9750 Assim, o valor de z correspondente à probabilidade 0.975 é 1.96, ou seja, se P(Z<t)=0.975, então t=1.96. Ana M. Abreu - 2006/07 Aproximação da Distribuição Binomial Slide 41 pela Distribuição Normal se: np ≥ 5 e nq ≥ 5 então µ = np e σ = npq e a variável aleatória tem uma distribuição Normal Ana M. Abreu - 2006/07 Procedimento para usar a Distribuição Normal para Aproximar a Distribuição Binomial Slide 42 1. Verifique que a distribuição Normal é uma aproximação adequada à distribuição Binomial confirmando que np ≥ 5 e nq ≥ 5. 2. Determine os valores dos parâmetros µ e σ calculando µ = np e σ = npq. 3. Identifique o valor discreto de x (o nº de sucessos). Altere o valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5. Represente a curva da Normal e assinale os correspondentes valores de µ , σ, e de x – 0.5 ou x + 0.5, conforme a situação. 4. Determine a área correspondente à probabilidade desejada. Ana M. Abreu - 2006/07 Definição Slide 43 Quando usamos a distribuição Normal (que é uma distribuição contínua) para aproximar a distribuição Binomial (que é uma distribuição discreta), fazemos uma correção de continuidade ao valor discreto x na distribuição binomial representando o valor x pelo intervalo de x – 0.5 a x + 0.5. Ana M. Abreu - 2006/07 x = pelo menos 120 = 120, 121, 122, . . . x = mais do que 120 = 121, 122, 123, . . . x = no máximo 120 = 0, 1, . . . 118, 119, 120 x = menos do que 120 = 0, 1, . . . 118, 119 Figura 3-8 Ana M. Abreu - 2006/07 Slide 44 Slide 45 x = exactamente 120 Intervalo que representa o valor discreto 120 Ana M. Abreu - 2006/07 Distribuição t de Student Slide 46 A distribuição t de Student é a designação de uma família de distribuições indexada pelo parâmetro ν, que representa o número de graus de liberdade (g.l.). Reproduz-se em seguida parte da tabela desta distribuição. Ana M. Abreu - 2006/07 Slide 47 Distribuição t de Student ν … 9 10 α … .025 .01 … 2.8214 2.7638 Os valores indicados escrevem-se na forma t(0.01; 10) = 2.7638 e lê-se: o percentil 0.01 da distribuição t de Student com 10 graus de liberdade é 2.7638. Ana M. Abreu - 2006/07 Distribuições t de Student com n = 3 e n = 12 Ana M. Abreu - 2006/07 Slide 48 Características importantes da distribuição t de Student Slide 49 1. A distribuição t de Student varia de acordo com a dimensão da amostra (de acordo com a figura anterior, para os casos n = 3 e n = 12). 2. A curva da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de esperar em amostras pequenas. 3. A distribuição t de Student tem valor médio zero (tal como a distribuição Normal standard). 4. O desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior do que 1 (o que não acontece com a distribuição Normal standard, onde σ = 1). 5. Quanto maior a dimensão da amostra, mais a distribuição t de Student se aproximaAna daM.distribuição Normal. Abreu - 2006/07 Distribuição Qui-quadrado Slide 50 A distribuição Qui-quadrado é a designação de uma família de distribuições indexada pelo parâmetro ν, que representa o número de graus de liberdade (g.l.). Reproduz-se em seguida parte da tabela desta distribuição. Ana M. Abreu - 2006/07 Distribuição Qui-quadrado α( gl (df) … 9 10 … Slide 51 dade) .10 .05 … 16.919 18.307 Os valores indicados escrevem-se na forma ℵ2(0.05; 10) = 18.307 e lê-se: o percentil 0.05 da distribuição Quiquadrado com 10 graus de liberdade é 18.307. Ana M. Abreu - 2006/07 Características da distribuição Qui-Quadrado Slide 52 1. A distribuição Qui-quadrado não é simétrica, ao contrário do que sucede com as distribuições Normal e t de Student. À medida que o nº de graus de liberdade aumenta,, a distribuição torna-se mais simétrica. Distribuição Qui-quadrado Distribuição Qui-quadrado para g.l.= 10 e g.l.= 20 Ana M. Abreu - 2006/07 Características da distribuição Qui-Quadrado Slide 53 2. Os valores da distribuição Qui-quadrado podem ser positivos ou nulos, mas não podem ser negativos. 3. A distribuição Qui-quadrado é diferente consoante o nº de graus de liberdade, os quais se escrevem g.l.= n – 1. À medida que o nº de g.l. aumenta, a distribuição aproxima-se da distribuição Normal. Ana M. Abreu - 2006/07