ESTATÍSTICA APLICADA À ADMINISTRAÇÃO AULA 04: AMOSTRAGEM E ESTIMAÇÃO TÓPICO 03: DISTRIBUIÇÕES AMOSTRAIS VERSÃO TEXTUAL Como podemos verificar anteriormente, um problema muito comum em Estatística é a inferência sobre uma característica de uma população (ex: média populacional), tendo como base uma estatística amostral (ex: média amostral). Porém, deve-se observar que a cada amostra retirada, o valor desta estatística varia, o que a caracteriza como uma variável aleatória. CONCEITO A distribuição de probabilidade dos valores que uma estatística assumiria em todas as possíveis amostras de mesmo tamanho de retiradas da população é denominada distribuição amostral. Vejamos abaixo dois tipos de amostras: Amostra com reposição ocorre quando cada elemento da população pode ser escolhido mais de uma vez para uma mesma amostra. Amostra sem reposição ocorre quando cada elemento da população puder ser escolhido uma única vez para participar de uma mesma amostra. Na prática, demonstra-se que o uso de amostras sem reposição origina resultados mais confiáveis do que amostras com reposição. VEJA O EXEMPLO Como exemplo, considere a seguinte população constituída por 5, 7, 9, 11 e 13. Vamos construir a distribuição amostral da média de uma amostra de tamanho 2 retirada sem reposição desta população, cuja média é dada por e o desvio é igual a Agora considere que foram retiradas todas as amostras de tamanho 2, teríamos a seguinte distribuição: Média amostral Combinações Possíveis Probabilidade 6 (5,7) 0,1 7 (5,9) 0,1 8 (5,11); (7,9) 0,2 9 (5,13); (7,11) 0,2 10 (7,13); (9,11) 0,2 11 (9,13) 0,1 12 (11,13) 0,1 Para obtermos maiores informações a respeito desta distribuição, podemos calcular sua média e desvio-padrão, denotados, respectivamente por e . Assim, Observe que, pelo menos para este exemplo, podemos concluir que a média da distribuição amostral de é igual à média populacional, , e o desvio padrão da distribuição amostral de é menor do que o desvio-padrão populacional, . DISTRIBUIÇÃO AMOSTRAL DA MÉDIA A partir de agora, poderemos introduzir o seguinte teorema: Para amostras aleatórias de tamanho retiradas de uma população com média e desvio-padrão , a distribuição amostral de tem média igual a . , ou seja, a média da distribuição amostral é igual à média da população. E seu desvio-padrão é dado por: ou . O primeiro caso aplica-se para populações infinitas e o segundo para populações finitas de tamanho . O fator é chamado de fator de correção para população finita. PARA SABER MAIS SOBRE O FATOR DE CORREÇÃO PARA POPULAÇÕES FINITAS Para uma população finita, ou seja, aquela que possui fração amostral maior do que 5%: (onde tamanho da amostra e tamanho da população), deve-se utilizar o fator de correção para populações finitas (FCPF) para ajuste dos desvios-padrão da média amostral. O desvio-padrão é também conhecido como erro-padrão da média, e tem a finalidade de mensurar a variação esperada das médias das amostras, em função do acaso. Assim, se é pequeno, há uma forte indicação de que a média da amostra esteja próxima da média populacional, do contrário, se é grande, é provável que haja uma grande diferença entre as duas. TEOREMA DO LIMITE CENTRAL Outro teorema largamente utilizado na estatística para inferir acerca da média populacional, partindo da média amostral, é o Teorema do Limite Central (TLC), que pode ser resumido da seguinte forma: A distribuição amostral da média das amostras de uma população com parâmetros ( ) segue uma distribuição normal, independentemente da distribuição da população da qual a amostra for retirada, quando o tamanho da amostra for suficientemente grande . e uma variância , a Portanto, para uma população com média distribuição amostral das médias de todas as possíveis amostras de tamanho n, geradas a partir da população, será aproximadamente normalmente distribuída – com a média da distribuição amostral igual a e variância igual - assumindo que o tamanho amostral é igual ou superior a trinta. Considerando a distribuição amostral de médias, quando se conhece a variância ou a amostra é grande , utilizamos a estatística que segue uma normal padrão (média igual a zero e desvio-padrão igual a 1), independente da distribuição da população. Então, por meio do teorema do limite central, a estatística será dada por: Porém, comumente não se conhece o desvio-padrão populacional e trabalha-se com amostras pequenas . Neste caso utiliza-se o desviopadrão amostral e obtém-se a seguinte variável. Que segue uma distribuição t de student com graus de liberdade. DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA Considerando-se uma amostra de elementos de uma população com distribuição normal de média e variância , então, pode-se demonstrar que a distribuição amostral da variância amostral segue uma distribuição de (qui-quadrado) com graus de liberdade. A variável da estatística de qui-quadrado será dada por: OLHANDO DE PERTO Veja exemplo de uso das distribuições t de Student e Qui-quadrado, consulte a página 88-90 do livro-texto. FONTES DAS IMAGENS Responsável: Profº. Mst. Sérgio César de Paula Cardoso Universidade Federal do Ceará - Instituto UFC Virtual