PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano [email protected] Aula 8 11/2014 Distribuição Normal ¨ ¨ ¨ Vamos apresentar distribuições de probabilidades para variáveis aleatórias contínuas. Para ilustrar a correspondência entre área e probabilidade, vamos aprender as . Em seguida, as , que ocorrem frequentemente em aplicações reais e têm papel importante nos métodos de inferência estatística. Aulas 5 – Probabilidade Probabilidade e Estatística 3/41 Distribuição Normal ¨ Se uma variável aleatória contínua tem uma distribuição com um gráfico simétrico e em forma de sino, e que pode ser descrito pela equação a seguir, dizemos que ela tem 2 1 " x−µ % − $ ' 2# σ & e y= σ 2π Depende apenas de µ e σ Aulas 5 – Probabilidade Probabilidade e Estatística 4/41 Distribuição Normal Padrão ¨ A tem as seguintes propriedades: 1. Seu gráfico tem forma de sino; 2. Sua média é igual a 0 (µ = 0); 3. Seu desvio-padrão é igual a 1 (σ = 1). Aulas 5 – Probabilidade Probabilidade e Estatística 5/41 Distribuições Uniformes ¨ O foco será o estudo da Distribuição de Probabilidade Normal, porém iremos começar com a , que nos dará informações para compreender estas duas propriedades importantes: 1. A área sob o gráfico de uma distribuição de probabilidades é igual a 1; 2. Há uma correspondência entre área e probabilidade (ou frequência relativa), de modo que algumas propriedades podem ser encontradas pela identificação das áreas correspondentes. Aulas 5 – Probabilidade Probabilidade e Estatística 6/41 Distribuição Uniforme ¨ Uma variável aleatória contínua tem uma se seus valores se espalham uniformemente sobre a faixa de valores possíveis. ¨ O gráfico de uma Distribuição Uniforme resulta em uma forma retangular. Aulas 5 – Probabilidade Probabilidade e Estatística 7/41 EXEMPLO ¨ A companhia de Energia fornece eletricidade com níveis de voltagem que são uniformemente distribuídos entre 123 e 125 volts. Isto é, qualquer quantidade de voltagem entre 123 e 125 volts é possível, e todos os possíveis valores são equiprováveis. Se selecionamos aleatoriamente um dos níveis de voltagem e representarmos seu valor pela variável aleatória x, então x tem uma distribuição que tem um gráfico como: Aulas 5 – Probabilidade Probabilidade e Estatística 8/41 EXEMPLO ¨ Um gráfico de uma distribuição de probabilidade contínua, como este, é chamado de Aulas 5 – Probabilidade Probabilidade e Estatística . 9/41 EXEMPLO ¨ Dada a distribuição uniforme do nível de voltagem, ache a probabilidade de que um nível de voltagem selecionado aleatoriamente seja maior do que 124,5 volts. Aulas 5 – Probabilidade Probabilidade e Estatística 10/41 Curva de Densidade ¨ Uma curva de densidade deve satisfazer os seguintes requisitos: 1. A área sob a curva tem que ser igual a 1. 2. Cada ponto na curva tem que ter uma altura vertical maior ou igual a 0, ou seja, a curva não pode estar abaixo do eixo x. Aulas 5 – Probabilidade Probabilidade e Estatística 11/41 Área × Probabilidade ¨ Como a área total sob a curva de densidade é igual a 1, existe uma correspondência entre e . ¨ No caso da Distribuição Uniforme, a área abaixo da curva, que é facilmente calculada por: Área = Base × Altura, corresponderá à probabilidade referente a esta área. Aulas 5 – Probabilidade Probabilidade e Estatística 12/41 Área × Probabilidade ¨ Como a curva de densidade de uma Distribuição Normal tem a forma de sino, é mais difícil acharmos a área, porém o princípio básico é o mesmo: Há uma correspondência entre e Aulas 5 – Probabilidade Probabilidade e Estatística 13/41 Distribuição Normal Padrão ¨ A distribuição normal padrão é uma distribuição de probabilidade normal com média µ = 0 e desvio-padrão σ = 1, e a área total sob a curva de densidade é 1. -3 -2 -1 0 1 2 3 Escore z Aulas 5 – Probabilidade Probabilidade e Estatística 14/41 Distribuição Normal Padrão ¨ Não é fácil a determinação de áreas para a curva de densidade da distribuição normal padrão, então necessitamos de valores já calculados previamente e que constam na seguinte tabela: Aulas 5 – Probabilidade Probabilidade e Estatística 15/41 Distribuição Normal Padrão ¨ Ao usar a Tabela da distribuição normal padrão, temos que: 1. A tabela refere-se apenas à , que tem média 0 e desvio padrão 1; 2. A tabela é apresentada em duas páginas, uma para e a outra para ; 3. Cada valor no corpo da tabela é a até uma reta vertical sobre um valor específico do escore z; Aulas 5 – Probabilidade Probabilidade e Estatística 16/41 Distribuição Normal Padrão 4. Ao trabalhar com um gráfico, entre escores z e áreas. Distância na escala horizontal da distribuição normal Escore z padrão; refere-se à coluna à esquerda e à linha do topo da tabela. Área Região sob a curva; refere-se aos valores no corpo da tabela. Aulas 5 – Probabilidade Probabilidade e Estatística 17/41 Distribuição Normal Padrão z -3,4 -3,3 -3,2 -3,1 ,00 0,0003 0,0005 0,0007 0,0010 ,01 0,0003 0,0005 Área 0,0007 0,0009 Aulas 5 – Probabilidade Probabilidade e Estatística 18/41 EXEMPLO 1 ¨ Uma companhia de instrumentos científicos de precisão fabrica termômetros que devem informar temperaturas de 0oC no ponto de congelamento da água. Testes em uma grande amostra desses instrumentos revelam que, no ponto de congelamento da água, alguns termômetros indicam temperaturas abaixo de 0oC e alguns dão temperaturas acima de 0oC. Suponha que a leitura média seja 0oC e que o desvio-padrão das leituras seja 1,00oC. Suponha, também, que as leituras sejam normalmente distribuídas. Se um termômetro é selecionado aleatoriamente, ache a probabilidade de que, no ponto de congelamento da água, a leitura seja menor que 1,27oC. Aulas 5 – Probabilidade Probabilidade e Estatística 19/41 EXEMPLO 1 ¨ Gostaríamos de saber agora, qual a probabilidade de selecionarmos aleatoriamente um termômetro que apresente leitura (no ponto de congelamento da água) superior a -1,23oC. ¨ Agora, determine a probabilidade de selecionarmos aleatoriamente um termômetro que apresente letirua (no ponto de congelamento da água) entre -2,00oC e 1,50oC. Aulas 5 – Probabilidade Probabilidade e Estatística 20/41 ¨ O último resultado do exemplo 1, pode ser generalizado como a seguinte regra: ¨ A área correspondente à região entre dois escores z específicos pode ser encontrada achando-se . Aulas 5 – Probabilidade Probabilidade e Estatística 21/41 ¨ Com uma distribuição de probabilidade contínua, tal como a distribuição normal, a probabilidade de se obter qualquer valor único exato é 0 (P(z=a) = 0). ¨ De modo que: P (a ≤ z ≤ b) = P (a < z < b) ¨ Então, a probabilidade de se obter um escore z no é igual à probabilidade de se obter um escore z . Aulas 5 – Probabilidade Probabilidade e Estatística 22/41 Escores z × Áreas conhecidas ¨ Em muitos casos, temos que: ¨ Dada uma área (ou probabilidade), achar o escore z correspondente. Aulas 5 – Probabilidade Probabilidade e Estatística 23/41 Escores z × Áreas conhecidas ¨ Procedimento para a determinação de um Escore z a partir de uma área conhecida. 1. Desenhe uma curva em forma de sino e identifique a região sob a curva que corresponde à probabilidade dada. Se a região não é uma região acumulada à esquerda, trabalhe com regiões conhecidas que sejam regiões acumuladas à esquerda. 2. Usando a área acumulada à esquerda, localize a probabilidade mais próxima no corpo da tabela da distribuição normal padrão e identifique o escore z correspondente. Aulas 5 – Probabilidade Probabilidade e Estatística 24/41 Escores z × Áreas conhecidas ¨ Se um valor desejado de área o valor ¨ ; Se um valor está a tabela, selecione o ¨ na tabela, selecione Para escores z entre dois valores da ; , podemos usar como uma aproximação para a área acumulada à esquerda; ¨ Para escores z , podemos usar como uma aproximação para a área acumulada à esquerda. Aulas 5 – Probabilidade Probabilidade e Estatística 25/41 EXEMPLO 2 ¨ Use os mesmos termômetros do exemplo anterior, com leituras de temperatura no ponto de congelamento da água normalmente distribuídas, com média de 0oC e desviopadrão de 1oC. ¨ Ache a temperatura correspondente a P95, o 95o percentil. Isto é, ache a temperatura que separa os 95% inferiores dos 5% superiores. ¨ Ache, agora, as temperaturas separando os 2,5% inferiores e os 2,5% superiores. Aulas 5 – Probabilidade Probabilidade e Estatística 26/41 Valores Críticos ¨ Para uma distribuição normal, um valor crítico é um escore z na fronteira que separa os escores z que têm ocorrência provável daqueles que têm ocorrência improvável. ¨ Valores críticos comuns são z = -1,96 e z = 1,96. ¨ Os valores abaixo de 1,96 são improváveis de acontecer, pois ocorrem em apenas 2,5% dos dados, e os valores acima de z = 1,96 também são improváveis de acontecer, pois também ocorrem em apenas 2,5% das leituras. Aulas 5 – Probabilidade Probabilidade e Estatística 27/41 Valores Críticos ¨ ¨ Na expressão zα, faça α = 0,025 e ache o valor de z0,025. ¨ A notação de z0,025 é usada para representar o escore z com uma área de 0,025 à sua direita. ¨ Recorrendo à tabela da distribuição normal, podemos observar que z0,025 = 1,96. Aulas 5 – Probabilidade Probabilidade e Estatística 28/41 Valores Críticos ¨ ¨ Para encontrar o valor de zα , usando a tabela de distribuição normal padrão, use o valor 1 – α. Aulas 5 – Probabilidade Probabilidade e Estatística 29/41 Aplicações da distribuição normal ¨ É pouco comum encontrarmos situações que seguem uma distribuição normal padrão. ¨ As distribuições normais típicas envolvem médias diferentes de 0 e desvios-padrão diferentes de 1. ¨ Nestes casos, devemos ser capazes de encontrar probabilidades correspondentes a valores da variável x e, dado algum valor de probabilidade, devemos ser capazes de encontrar o valor correspondente da variável x. Aulas 5 – Probabilidade Probabilidade e Estatística 30/41 Aplicações da distribuição normal ¨ Para trabalhar com distribuições normais não padronizadas, simplesmente iremos padronizar os valores para usar os mesmo procedimentos aprendidos até aqui. ¨ Se convertermos valores para escores z padronizados usando a fórmula a seguir, os procedimentos usados serão os mesmos usados para a distribuição normal padrão. x−µ z= σ Arredonde os escores z para 2 casas decimais Aulas 5 – Probabilidade Probabilidade e Estatística 31/41 Aplicações da distribuição normal ¨ Procedimento para achar áreas com uma distribuição normal não padronizada: 1. Esboce a curva normal, marque a média e os valores específicos de x e, então, sombreie a região que representa a probabilidade desejada; 2. Para cada valor relevante de x que representa um limite da região sombreada, converta o valor em seu escore z equivalente; 3. Consulte a tabela para achar a área da região sombreada. Aulas 5 – Probabilidade Probabilidade e Estatística 32/41 EXEMPLO 3 ¨ Uma porta típica de uma casa tem uma altura de 2 metros. Dado que as alturas de homens são normalmente distribuídas, com média de 1,725 m e desvio-padrão de 7 cm,. ¨ Ache a porcentagem de homens que passarão por uma portapadrão sem se curvar e sem bater a cabeça. ¨ Essa porcentagem é alta o bastante para que se continue a usar 2 metros como padrão de altura? Aulas 5 – Probabilidade Probabilidade e Estatística 33/41 EXEMPLO 3 ¨ O valor do escore z é 3,93, dando uma área de 0,9999. ¨ Conclui-se que a proporção de homens que podem passar pelas portas com altura-padrão de 2 m é 0,9999 ou 99,99%. ¨ Muitos poucos homens não poderão passar sem abaixarem ou baterem a cabeça. Essa porcentagem é alta o suficiente para justificar o suo de 2 m como altura-padrão para portas. Aulas 5 – Probabilidade Probabilidade e Estatística 34/41 EXEMPLO 4 ¨ Os pesos ao nascer nos Estados Unidos são distribuídos normalmente, com média de 3420 g e desvio-padrão de 495 g. O Hospital Geral de Newport exige tratamento especial para bebês que nasçam com menos de 2450 g (não usualmente leves) ou mais de 4390 g (não usualmente pesados). Qual é a porcentagem de bebês que não requerem tratamento especial por terem pesos ao nascer entre 2450 g e 4390g? Sob essas condições, muitos bebês precisam de cuidados especiais? Aulas 5 – Probabilidade Probabilidade e Estatística 35/41 EXEMPLO 4 ¨ Expressando o resultado em porcentagem, podemos concluir que 95% dos bebês não exigem cuidados especiais por terem pesos entre 2450 g e 4390 g. Segue que 5% dos bebês requerem tratamento especial por serem não usualmente leves ou pesados. ¨ A taxa de 5%, provavelmente, não é muito alta para hospitais típicos. Aulas 5 – Probabilidade Probabilidade e Estatística 36/41 Áreas conhecidas ¨ Não confunda escores z e áreas; ¨ Escolha o lado correto (direito/esquerdo) do gráfico; ¨ Um escore z tem que ser negativo sempre que se localizar na metade esquerda da distribuição normal; ¨ Áreas (ou probabilidades) são valores positivos ou nulos, mas NUNCA negativos. Aulas 5 – Probabilidade Probabilidade e Estatística 37/41 Áreas conhecidas ¨ Procedimento para achar valores a partir de áreas conhecidas 1. Esboce o gráfico da distribuição normal, introduza a probabilidade ou porcentagem dada na região apropriada do gráfico e identifique o(s) valor(es) x de interesse; 2. Use a Tabela para achar o escore z correspondente à área mais próxima e, em seguida, identifique o escore z correspondente; Aulas 5 – Probabilidade Probabilidade e Estatística 38/41 Áreas conhecidas 3. Usando a fórmula de conversão de valores para escore z, encontre o valor de x; x−µ z= σ 4. Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema. Aulas 5 – Probabilidade Probabilidade e Estatística 39/41 EXEMPLO 5 ¨ No planejamento de um ambiente, um critério comum é que se ajuste a 95% da população. Qual a altura de uma porta se 95% dos homens devem passar por ela sem se abaixar e sem bater a cabeça? ¨ Isto é, ache o 95º percentil das alturas dos homens, que são normalmente distribuídas, com média de 1,75m e desviopadrão de 0,07 m. Aulas 5 – Probabilidade Probabilidade e Estatística 40/41 EXEMPLO 5 ¨ O resultado é: x = 1,87 m. ¨ Isto significa que uma altura de porta de 1,87 permitiria que 95% dos homens passassem sem se curvar ou bater a cabeça. Assim, 5% dos homens não passariam por uma porta com altura de 1,87 m. ¨ Como muitos homens passam por portas com muita frequência, esta taxa de 5%, provavelmente, não seria prática. Aulas 5 – Probabilidade Probabilidade e Estatística 41/41 EXEMPLO 6 ¨ O Hospital Geral de Newport deseja redefinir os pesos ao nascer mínimo e máximo que exigem tratamento especial por serem não usualmente baixos ou altos. Depois de considerar fatores relevantes, um comitê recomenda um tratamento especial para os 3% inferiores e os 1% superiores dos pesos ao nascer. Ajude o comitê a identificar os pesos ao nascer que separam os 3% inferiores e os 1% superiores. ¨ Os pesos ao nascer, nos Estados Unidos, são normalmente distribuídos, com média de 3420 g e desvio-padrão de 495g. Aulas 5 – Probabilidade Probabilidade e Estatística 42/41 EXEMPLO 6 ¨ O Resultado nos indica que: ¨ O peso ao nascer de 2489 g (arredondado) separa os 3% inferiores dos pesos ao nascer, e 4573 (arredondado) separa o 1% superior dos pesos ao nascer. ¨ Agora, o hospital tem critérios bem definidos para determinar se um bebê recém-nascido deve receber tratamento especial relativo a um peso ao nascer não usualmente baixo ou alto. Aulas 5 – Probabilidade Probabilidade e Estatística 43/41