CAPÍTULO 5 - INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 5.1 INTRODUÇÃO É freqüente encontrarmos problemas estatísticos do seguinte tipo : temos um grande número de objetos (população) tais que se fossem tomadas as medidas X de todos os objetos teríamos a distribuição exata desta variável. Entretanto, de modo geral ocorre que a obtenção das observações de todos os elementos é inviável por algum motivo (custos, tempo, dados inacessíveis, populações infinitas, etc.) e o estudo é realizado, então, através de uma amostra retirada da população. Por exemplo, suponha que se queira conhecer a altura média dos estudantes de Engenharia do CEFET. Poderíamos obter as medidas das alturas de todos os alunos citados e calcular a sua média exata. Entretanto, podemos obter uma estimativa desta média através de uma amostra retirada do conjunto de todos os alunos considerados e tirar conclusões a respeito do comportamento da variável altura em toda a população. Este procedimento de fazer afirmações (generalizações) sobre características de uma população baseando-se em resultados de uma amostra, é objeto de estudo da INFERÊNCIA ESTATÍSTICA . Esquematicamente temos : População Amostra X θ θ=? X1 , X2 , ... , Xn Inferência Estatística A Inferência Estatística é dividida em duas partes : Estimação e Testes de Hipóteses. Testes de Hipóteses é um processo de aceitar ou rejeitar afirmações feitas sobre características de uma população, enquanto que Estimação trata de estimar valores para características populacionais. A fim de podermos estudar os procedimentos da Inferência Estatística, precisamos conhecer, além dos conceitos de probabilidade e distribuições de probabilidade vistos, alguns elementos básicos dessa teoria, os quais apresentamos a seguir. 90 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ 5.2 POPULAÇÃO E AMOSTRA População é o conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável. Amostra é qualquer subconjunto da população. Por exemplo, imagine que um industrial está interessado em conhecer a duração de vida de um determinado componente eletrônico do seu processo produtivo. A população é formada por todos os componentes deste tipo que tenham sido fabricados ou que ainda venham a ser fabricados nessa indústria. Uma amostra poderia ser formada por 100 destes componentes escolhidos ao acaso segundo algum plano de retirada da amostra. Se a variável de interesse neste estudo for X = duração de vida dos componentes, então a sua caracterização na população poderá ser feita através da distribuição de probabilidade de X. (O modelo exponencial pode ser adequado neste caso). 5.3 PESQUISA POR AMOSTRAGEM Uma vez que constatamos a necessidade de um estudo de interesse ser feito através de uma amostra, temos alguns problemas a resolver. Um deles é definir claramente os elementos da população a ser estudada, chamada de população-alvo , e a indicação das características desta população que serão medidas, ou seja, quais as variáveis que serão avaliadas na pesquisa. Outro problema é definir como a amostra será obtida, qual o seu tamanho e quais os elementos da população irão compor a amostra. Os problemas de amostragem podem ser mais ou menos complexos, dependendo da população e das variáveis do estudo. Entretanto, uma preocupação básica em relação a uma amostra é que ela seja representativa da população-alvo, pois somente assim podemos fazer inferências válidas. Para conseguir representatividade é necessário que o processo de escolha da amostra seja aleatório. Assim, em Inferência Estatística, são utilizadas amostras probabilísticas que são aquelas obtidas quando todos os elementos da população tem probabilidade conhecida, e diferente de zero, de pertencer à amostra. Os métodos mais comuns de extração de amostras probabilísticas são : Amostragem Aleatória Simples, Amostragem por Conglomerado, Amostragem Estratificada e Amostragem Sistemática. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 91 Notas de Aula ______________________________________________________________________________________ 5.4 PARÂMETROS E ESTATÍSTICAS Um parâmetro é uma medida usada para descrever uma característica da população. Por exemplo, se estamos interessados em estudar a v.a. X = altura dos elementos de uma população e esta variável tem Distribuição Normal N(µ,σ2), então a média µ e a variância σ2 são os parâmetros deste modelo. São valores fixos e muitas vezes desconhecidos. Uma estatística é uma característica da amostra. Assim, se X1, X2, ... , Xn é uma amostra aleatória de uma variável X, então θ$ = f (X1, X2, ... , Xn ) é uma estatística. População Amostra X Estatística (X1, X2, ... , Xn) θ$ Parâmetro θ A notação mais comum para alguns parâmetros e estatísticas é : Estatística Parâmetro Média X µ Variância s2 σ2 No de Elementos n N Proporção p$ p _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 92 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ 5.5 DESCRIÇÃO DE UMA AMOSTRA DE MEDIDAS Dados estatísticos (amostras) obtidos de pesquisas, experimentos, ou qualquer série de medidas, são geralmente tão numerosos que se não forem condensados ou reduzidos de forma adequada, poderão ser inúteis. Portanto, existe a necessidade de se resumir estas medidas estatisticamente para que possam ser utilizadas em análises posteriores. Veremos, a seguir, alguns métodos de descrição de dados amostrais. 5.5.1 DESCRIÇÃO GRÁFICA DE UMA AMOSTRA DE MEDIDAS Considere os dados abaixo como sendo os pesos de coberturas de zinco de 80 lâminas de ferro galvanizado de um dado tamanho, tomados de um manual da Sociedade Americana de Testes de Materiais. Os 80 números podem ser vistos como valores de uma variável aleatória X. Para investigar a distribuição de X, uma representação gráfica simples é dada pelo “diagrama de freqüência de pontos”, no qual cada um dos 80 números é indicado por um ponto do eixo x correspondente a tal número. TABELA 1 : Pesos (em ounces) de coberturas de zinco de 80 lâminas de ferro galvanizado. 1,47 1,60 1,58 1,56 1,44 1,62 1,60 1,58 1,39 1,35 1,52 1,38 1,32 1,65 1,53 1,77 1,73 1,62 1,62 1,38 1,55 1,70 1,47 1,53 1,46 1,53 1,60 1,42 1,47 1,44 1,38 1,60 1,45 1,34 1,47 1,37 1,48 1,34 1,58 1,43 1,64 1,51 1,44 1,49 1,64 1,46 1,53 1,56 1,56 1,50 1,63 1,59 1,48 1,54 1,61 1,54 1,50 1,48 1,57 1,42 1,53 1,60 1,55 1,67 1,57 1,34 1,54 1,64 1,47 1,75 1,60 1,57 1,58 1,63 1,47 1,64 1,51 1,44 1,49 1,64 _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 93 Notas de Aula ______________________________________________________________________________________ GRÁFICO 1 : f 30 20 10 1,20 1,30 1,40 1,50 1,60 1,70 1,80 Peso da Cobertura ( ounces ) 5.5.2 DISTRIBUIÇÃO DE FREQÜÊNCIAS É uma tabela que agrupa os dados em um número relativamente pequeno de classes ( intervalos ), listando o número de observações pertencentes a cada classe . Embora se perca alguma informação a respeito dos dados, a distribuição é útil na investigação das características da variável em estudo. Vamos construir uma distribuição de freqüências para os dados da tabela 1, seguindo uma seqüência de procedimentos. 1. Determinar a amplitude total dos dados, isto é, a diferença entre o maior e o menor dado : 1,77 - 1,32 = 0,45 2. Dividir a amplitude total pelo número escolhido de classes ( ou intervalos ) de mesmo tamanho. Geralmente usamos de 10 a 25 classes e um comprimento conveniente de classes é um número “simples”. Neste exemplo, usaremos 10 classes de comprimento 0,05. Poderíamos utilizar 0,04 , 0,03 ou 0,02 , mas evitamos comprimentos tais como 0,033 , 0,035 , etc. 3. Os intervalos de classes devem ser tais que acomodem todos os dados da amostra, isto é, cada valor da amostra deve pertencer a alguma classe. Uma vez definidos tais intervalos, contar o número de dados pertencentes a cada intervalo. Aparecerão, então, as “freqüências de classe”. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 94 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ TABELA 2 : A B C D E F Classes Freqs. Ponto Médio Freqs. Relativas Freqs. Acumls. Freqs. Relat. Acumuls. 1,30 - 1,35 5 1,33 0,0625 5 0,0625 1,35 - 1,40 5 1,38 0,0625 10 0,1250 1,40 - 1,45 8 1,43 0,1000 18 0,2250 1,45 - 1,50 15 1,48 0,1875 33 0,4125 1,50 - 1,55 13 1,53 0,1625 46 0,5750 1,55 - 1,60 17 1,58 0,2125 63 0,7875 1,60 - 1,65 12 1,63 0,1500 75 0,9375 1,65 - 1,70 2 1,68 0,0250 77 0,9625 1,70 - 1,75 2 1,73 0,0250 79 0,9875 1,75 - 1,80 1 1,78 0,0125 80 1,0000 • Na coluna A aparecem os limites de classe : limites inferiores e superiores. • Na coluna C estão os pontos médios de classe, isto é, as médias dos limites de classe. Estes pontos estão representando cada um dos dados pertencentes à classe. Por exemplo, o valor 1,47 , da quarta classe fica aproximado pelo ponto médio 1,48 , que o representa. • As freqüências relativas de classe, na coluna D são as freqüências de classe da coluna B divididas pela freqüência total 80. • As freqüências acumuladas da coluna E são as somas das freqüências de classe. • As freqüências relativas acumuladas da coluna F são as somas das freqüências relativas da coluna D. 5.5.3 HISTOGRAMA E POLÍGONO DE FREQÜÊNCIAS Algumas propriedades importantes das distribuições da freqüências, tais como a sua simetria, achatamento, o número de modas ( freqüências máximas ), etc. podem ser vistas num gráfico. Para representar graficamente dados agrupados em uma distribuição de freqüências, podemos utilizar um “histograma”, um “polígono de freqüências” ou um “polígono de freqüências acumuladas”. Estas freqüências podem ser absolutas ou relativas. Os gráficos abaixo se referem à distribuição de freqüências dos dados da tabela 1 : _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 95 Notas de Aula ______________________________________________________________________________________ GRÁFICO 2 : HISTOGRAMA 18 15 12 Freq. 9 6 3 1.3 1.4 1.5 1.6 1.7 1.8 Pesos GRÁFICO 3 : POLÍGONO DE FREQÜÊNCIAS 18 15 12 Freq. 9 6 3 1.2 1.4 1.6 1.8 2.0 Pesos GRÁFICO 4 : POLÍGONO DE FREQÜÊNCIAS ACUMULADAS 80 60 Freq. Acumul. 40 20 0 1.3 1.4 1.5 1.6 1.7 1.8 Pesos _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 96 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ 5.5.4 MÉDIA DE UMA AMOSTRA DE MEDIDAS A média é uma medida que posiciona o centro da distribuição de uma variável X. Quando temos uma amostra aleatória de tamanho n, a média é simplesmente a média aritmética dos dados observados. Se X1 , X2 , . . . , Xn é uma amostra de n medidas, a média amostral denotada por X é definida por : 1 n X= n ∑X i i=1 Suponha que se tome a diferença entre X e X , ou seja : X1 - X , X2 - X , . . . , X n - X . Se somarmos estas diferenças, teremos : ( X1 - X ) + ( X2 - X ) +... + ( Xn - X ) = (X1 + X2 + ... + Xn) - n X = 0 Portanto, a soma das diferenças entre cada medida numa amostra e a média de todas as medidas é igual a zero. n Em forma de somatório, temos : ∑ ( X i - X ) = 0 i=1 5.5.5 MEDIANA DE UMA AMOSTRA DE MEDIDAS A mediana é também uma medida que posiciona o centro da distribuição de uma variável X. Para uma amostra aleatória de tamanho n , a mediana será definida como sendo o valor tal que 50 % dos dados estão acima dele e 50 % dos dados estão abaixo dele. Para determinar o valor da mediana, Me, primeiro ordenamos os dados ( ordem crescente ou decrescente ). Em seguida, se n for ímpar, então a mediana será o valor central. Se n for par, a mediana será a média aritmética dos dois valores centrais. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 97 Notas de Aula ______________________________________________________________________________________ 5.5.6 MODA DE UMA AMOSTRA DE MEDIDAS A moda de uma amostra de tamanho n será igual ao valor que apresenta maior freqüência. Podemos ter uma amostra com mais de uma moda ou mesmo sem moda. EXEMPLO As medidas da duração de vida ( em horas ) de 5 componentes eletrônicos tomados aleatoriamente de sua produção são : 141 , 136 , 157 , 143 e 138. A média das cinco medidas é : 141 + 136 + 157 + 143 + 138 = 143 horas 5 Em ordem crescente os dados ficam : X = 136 138 141 143 157 Assim, a mediana é Me = 141. Este conjunto de medidas é amodal, isto é, não tem moda porque nenhum valor ocorre com maior freqüência que os demais. 5.5.7 VARIÂNCIA E DESVIO PADRÃO DE UMA AMOSTRA DE MEDIDAS Considere os dois conjuntos de medidas A e B abaixo : A: 3 5 6 5 8 3 B : 0 1 6 9 12 2 Note que ambos os conjuntos de medidas tem a mesma média 6. Entretanto, existe uma diferença entre eles quanto à sua variabilidade ou dispersão que não pode ser identificada através da média. VARIÂNCIA : É uma medida de dispersão dos dados de uma amostra definida por: 1 s = n -1 2 2 n ∑( X i - X) i=1 _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 98 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ DESVIO PADRÃO : É também uma medida de dispersão dos dados de amostra, definida como sendo a raiz quadrada positiva da variância. 5.5.7.1 Propriedades da Variância • Somando-se uma constante qualquer a cada elemento de um conjunto de medidas, a variância não se altera. • Se cada medida de uma amostra for multiplicada por uma constante, a variância fica multiplicada por esta constante ao quadrado. EXEMPLO Considere as mesmas medidas de duração de vida do exemplo anterior. A variância é : (141-143) 2 + (136 -143) 2 + (157 -143) 2 + (143 -143) 2 + (138 -143) 2 = 68,5 s = 5 - 1 O desvio padrão é : 2 s = ( variância )1/2 = ( 68,5 )1/2 = 8,28 5.5.8 AMPLITUDE É a diferença entre o maior e o menor valor numa amostra de medidas. 5.5.9 COEFICIENTE DE VARIAÇÃO É uma medida de dispersão que expressa o desvio padrão como um percentual da média . V = s 100 % X _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 99 Notas de Aula ______________________________________________________________________________________ Como V é uma medida de variação relativa expressa em porcentagem, então ela pode ser utilizada para comparar a variabilidade de dois ou mais conjuntos de medidas mesmo que as observações sejam expressas em diferentes unidades. EXEMPLO Os pesos de 10 caixas de um certo tipo de cereal tem conteúdo médio de 278 g com um desvio padrão de 9,64 g. Se estas caixas são vendidas por um preço médio de 1,29 u.m. com um desvio padrão de 0,09 u.m., podemos concluir que os pesos são relativamente mais homogêneos do que os preços ? Vpeso = 9, 64 100 % = 3,74 % 278 Vpreço = 0,09 100 % = 6,98 % 1,29 Concluímos, então, que os pesos são mais homogêneos do que os preços. 5.5.9.1 Algumas Observações Sobre a Interpretação da Média e do Desvio Padrão de uma Amostra • A média, que é uma medida de posição central, indica o centro da amostra. Note, por exemplo, o diagrama de pontos ( gráfico 1 ) onde aparece a média posicionando o centro da distribuição dos pontos. • A variância pode ser vista como a média dos desvios que cada medida da amostra tem em relação à média X , elevados ao quadrado. Lembre que os desvios, se somados, se compensam e levam a soma a zero. Assim, elevados ao quadrado, temos uma medida que caracteriza, basicamente, o afastamento dos dados em relação ao centro da distribuição. Portanto, quanto maior for a variância ( ou o desvio padrão ), maior será a variabilidade ou dispersão dos dados. Uma variância pequena indica que os dados da amostra se apresentam de forma concentrada em torno da média. • Amostras de medidas em muitas situações práticas apresentam histogramas com simetria bastante acentuada e em forma de sino. Poderíamos pensar na distribuição Normal como sendo o modelo adequado a estas medidas. Neste caso, vale as seguintes afirmações : 1. Em torno de 68 % das medidas caem no intervalo : ( X - s , X + s ). 2. Em torno de 95 % das medidas caem no intervalo : ( X - 2s , X + 2s ). 3. Em torno de 99,9 % das medidas caem no intervalo : ( X - 3s , X + 3s ). 4. Em torno de 50 % das medidas caem no intervalo : ( X - 2/3s , X + 2/3s ). • Quanto maior o tamanho da amostra, mais o histograma se aproxima da distribuição normal. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 100 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ 5.5.10 MÉDIA E VARIÂNCIA DE UMA AMOSTRA DE MEDIDAS APROXIMADAS Suponha que se tenha uma amostra de medidas X1 , X2 , . . ., Xn agrupadas em uma distribuição de freqüências com k classes ( intervalos ), pontos médios de classes m1 , m2 , . . ., mk e freqüências de classes f1 , f2 , . . ., fk . Uma vez que temos f1 dos X’s sendo aproximados por m1 , f2 dos X’s n aproximados por m2 ,etc. , é evidente que a expressão ∑ X i é aproximada por : i=1 n ∑f j mj . i=1 Sendo assim, uma aproximação para X é dada por : 1 k X = ∑ fj mj n j=1 Para o cálculo da variancia, uma aproximação é dada por : s2 = 1 n -1 n ∑f j (m j − X) 2 j=1 EXEMPLO Considere os dados da Tabela 2. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 101 Notas de Aula ______________________________________________________________________________________ Pontos Médios de Classe (mi) Freqüências (fi) fi . mi fi . mi m 1,33 5 6,65 8,8445 1,38 5 6,90 9,5220 1,43 8 11,44 16,3592 1,48 15 22,20 32,8560 1,53 13 19,89 30,4317 1,58 17 26,86 42,4388 1,63 12 19,56 31,8828 1,68 2 3,36 5,6448 1,73 2 3,46 5,9858 1,78 1 1,78 3,1684 80 122,10 187,134 122,10 = 1,52625 80 1 ⎛ 1 ⎞ ⎜187,134 s = 122,102 ⎟ = 0,0098591 ⎠ 80 - 1 ⎝ 80 X = 5.6 DISTRIBUIÇÕES AMOSTRAIS Suponha que se tenha uma população conhecida representada pela v.a. X e que θ seja um parâmetro de interesse nesta população. Imagine que se retire todas as amostras possíveis de tamanho n desta população, segundo um plano amostral previamente definido e que, para cada amostra se obtenha o valor de uma estatística θ$ . Tem-se, assim, um conjunto de todos os possíveis valores de θ$ que dependem do tamanho da amostra, do tamanho da população e do procedimento da amostragem e que variam de uma amostra para outra. Desta forma, a estatística θ$ é uma variável aleatória e tem uma distribuição de probabilidade. Esta distribuição é denominada DISTRIBUIÇÃO AMOSTRAL DE θ$ . Esquematicamente temos : _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 102 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ População Amostra 1 θ$ 1 X Amostra 2 θ$ 2 θ θ Amostra k θ$ k θ Em resumo, a distribuição de probabilidade de uma estatística é chamada de distribuição amostral. Por exemplo, a distribuição de probabilidade de X é chamada de distribuição amostral da média, a distribuição de probabilidade de p$ é chamada de distribuição amostral da proporção. O desvio padrão de uma distribuição amostral é chamado de erro padrão da estatística. EXEMPLO Suponha que se retire amostras de uma população uniforme discreta consistindo dos valores 0, 1, 2 e 3. As quatro observações que compõem a população são valores de uma v.a. X que tem distribuição de probabilidade : 1 p(x) = P(X=x) = , para x = 0, 1, 2, 3. 4 3 3 com média : µ = E(X) = ∑ x.p(x) = 2 x=0 3 5 e variancia : σ 2 = V(x) = E[(X - µ ) 2 ] = ∑ (x - µ ) 2 . p(x) = 4 x=0 O histograma de probabilidade desta v.a. é dado por : p(x) 1/4 0 1 2 3 x _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 103 Notas de Aula ______________________________________________________________________________________ Suponha agora que se retire todas as possíveis amostras de tamanho n = 2, com reposição, e que para cada amostra se calcule a estatística X . As 16 amostras possíveis e suas respectivas médias são : Amostra 0,0 0,1 0,2 0,3 1,0 1,1 1,2 1,3 2,0 2,1 2,2 2,3 3,0 3,1 3,2 3,3 X 0 0,5 1 1,5 0,5 1 1,5 2 1 1,5 2 2,5 1,5 2 2,5 3 À partir daí, vemos que a v.a. X tem a seguinte distribuição de probabilidade: 0 x 0,5 1,0 1 2 3 16 16 16 A média desta distribuição é : p( x) µ X = E(X) = ∑ x .p(x) = 1,5 2,0 2,5 4 16 3 16 2 16 3,0 1 16 3 = µ 2 e a variancia é : σX 2 σ2 5 = V(X) = ∑ (x − µ X ) . p( x) = = . 8 n 2 _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 104 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ p( x ) 4/16 3/16 2/16 1/16 x 0 0 0,5 1,0 1,5 2,0 2,5 3,0 Note que o histograma de probabilidade da distribuição amostral de X surege uma curva normal com uma média e uma variancia apropriadas. 5.6.1 Distribuição Amostral da Média Se uma amostra aleatória de tamanho n é retirada de uma população infinita com média µ e variancia σ2, então a distribuição amostral de X é aproximadamente Normal com média µ X = µ e variancia σ 2X = σ2/n. Assim : Z = X−µ σ/ n tem distribuição Normal com média 0 e variancia 1. (Este é o chamado Teorema Central do Limite) Note que isto é o mesmo que dizer que, para n grande, a distribuição de X é : ⎛ σ2 ⎞ X : N⎜ µ , ⎟. n⎠ ⎝ Observe que a distribuição de X está centrada em µ e que a variancia depende do tamanho n da amostra. Quanto maior a amostra, mais concentrada é X em torno de µ. Quanto à forma da distribuição, o Teorema afirma que no limite para n tendendo ao infinito a distribuição amostral de X tende à distribuição Normal. Essa convergência é mais rápida se a distribuição da v.a. X na população já for próxima da Normal. Como regra prática, aceita-se que para amostras com mais de 30 elementos a aproximação já pode ser considerada muito boa. 2 σx2 = σn µx= µ X _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 105 Notas de Aula ______________________________________________________________________________________ EXEMPLO 1 (Bussab) _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 106 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ EXEMPLO 2 Uma fábrica da material elétrico produz lâmpadas que tem duração de vida com distribuição aproximadamente normal, com média igual a 800 horas e desvio padrão de 40 horas. Encontre a probabilidade de que uma amostra aleatória de 16 lâmpadas tenha vida média X menor do que 775 horas. Solução : X : duração de vida da lâmpada µ = 800 horas e σ = 40 horas. X tem distribuição normal com média : µ X = 800 e desvio padrão : σX = σ 40 = = 10. n 16 Z= X − µ 775 − 800 = = −2, 5 10 σ/ n P( X < 775) = P( Z < −2, 5) = 0, 00062 775 800 X 5.6.2 Distribuição Amostral da Proporção Considere uma população em que a proporção de elementos que possuem uma certa característica é p. Seja p$ a proporção de elementos com a referida característica na amostra. População Amostra 1 p$ 1 Amostra 2 p p$ 2 Amostra k p p p$ k _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 107 Notas de Aula ______________________________________________________________________________________ Para n suficientemente grande, podemos considerar que a distribuição amostral de p$ é : pq ⎞ ⎛ ⎟ p$ : N⎜ p , ⎝ n⎠ onde q = 1- p. Note que, então : z = p$ - p p.q n EXEMPLO Uma máquina está em operação sob controle quando a proporção de defeitos apresentada é de 10 %. A cada dia uma amostra de 30 peças fabricadas por esta máquina é retirada. Se esta máquina está sob controle, qual a probabilidade dessa amostra apresentar proporção de defeitos maior do que 0,18 ? 0,1.0,9 ⎞ ⎛ ⎟ p$ = N⎜ 0,1 ; ⎝ 30 ⎠ ou seja : p$ : N(0,1 ; 0,003) Para p$ = 0,18 : 0,18 - 0,1 p$ - p = = 1,46 z = p.q 0,10 . ,9 n 30 P(p$ > 0,18) = P(z > 1,46) = 1 - 0,9278 = 0,0722 0,10 0,18 p 5.6.3 Distribuição Amostral da Diferença de Duas Médias Admita-se que são dadas duas populações 1 e 2, com médias µ1 e µ2 e variancias σ12 e σ22 , e que se retire, independentemente, amostras de tamanho n1 da população 1 e amostras de tamanho n2 da população 2. De todas as possíveis amostras retiradas pode-se obter a distribuição amostral da diferença de duas médias X 1 - X 2. Se n1 e n2 forem suficientemente grandes : _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 108 ESTATÍSTICA Notas de Aula _____________________________________________________________________________________ ⎛ σ2 σ2 ⎞ X1 − X 2 : N⎜ µ1 - µ2 , 1 + 2 ⎟ n1 n 2 ⎠ ⎝ Z= X1 − X 2 − (µ1 − µ2 ) σ12 σ22 + n1 n 2 EXEMPLO As lâmpadas elétricas do fabricante A tem duração média de 1400 horas, com um desvio padrão de 200 horas, enquanto as do fabricante B tem duração média de 1200 horas, com um desvio padrão de 100 horas. Se forem ensaiadas amostras aleatórias de 125 lâmpadas de cada marca, qual será a probabilidade que as lâmpadas da marca A tenham vida média maior do que as da marca B de pelo menos 160 horas ? X 1 = duração média da amostra A. X 2 = duração média da amostra B. ⎛ σ2 σ2 ⎞ X1 − X 2 : N⎜ µ1 - µ2 , 1 + 2 ⎟ com : n1 n 2 ⎠ ⎝ µ1 - µ2 = 1400 - 1200 = 200 σ12 σ22 2002 1002 = = 400 + + 125 125 n1 n 2 (σ X1 − X 2 ) = 20 Para X1 − X 2 = 160 Z = X1 − X 2 − ( µ 1 − µ 2 ) σ12 σ 22 + n1 n 2 = 160 − 200 = -2 20 160 180 200 220 240 X1 - X 2 P(a média da amostra da marca A ser maior do que a média da amostra da marca B de pelo menos 160 horas) = P( X 1 > X 2 + 160 ) = P( X 1- X 2 > 160 ) = P(Z > -2) = 0,9772. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 109 Notas de Aula ______________________________________________________________________________________ 5.6.4 Distribuição Amostral da Diferença da duas Proporções Suponha que se retire amostras de tamanho n1 de uma população 1 cuja proporção de elementos com uma certa característica seja p1 e que se retire amostras de tamanho n2 de uma população 2 cuja proporção de elementos com a referida característica seja p2. A distribuição amostral da diferença das duas proporções p$ 1 − p$ 2 é dada por : ⎛ p .q p .q ⎞ p$ 1 − p$ 2 : N ⎜ p1 - p 2 , 1 1 + 2 2 ⎟ n1 n2 ⎠ ⎝ p$ − p$ 2 − ( p1 - p 2 ) z= 1 p1.q 1 p 2 .q 2 + n1 n2 EXEMPLO A e B jogam uma partida “cara e coroa” lançando cada um 50 vezes uma moeda. O jogador A vencerá o jogo se conseguir 5 ou mais caras do que o jogador B e, quando isso não ocorrer, B vencerá. Determinar a probabilidade de ganho do jogador A e do jogador B. p$ 1 = proporção de caras obtidas por A. p$ 2 = proporção de caras obtidas por B. Admitindo-se que as moedas sejam honestas com probabilidade de “cara” igual a 0,5, temos : ⎛ p .q p .q ⎞ p$ 1 − p$ 2 : N ⎜ p1 - p 2 , 1 1 + 2 2 ⎟ onde : n1 n2 ⎠ ⎝ p1 - p 2 = 0,5 - 0,5 = 0 p1.q 1 p 2 .q 2 0,5 . 0,5 0,5 . 0,5 = + = 0,01 + n1 n2 50 50 Para p$ 1 − p$ 2 = 0,1 (5 caras em 50 jogadas): z= p$ 1 − p$ 2 − ( p1 - p 2 ) 0,1 − 0 = =1 0,1 p1 .q 1 p 2 .q 2 + n1 n2 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 p1 - p 2 P( A vencer ) = P( p$ 1 > p$ 2 + 0,1 ) = P( p$ 1 − p$ 2 > 0,1 ) = P( z >1 ) = 1- P( z ≤ 1 ) = = 1 - 0,84134 = 0,15866. P ( B vencer ) = 1 - P( A vencer ) = 0,84134. _____________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR