FACULDADE IDEAL/FGV CURSO DE ADMINISTRAÇÃO – 2008/1º SEM DISCIPLINA: ESTATÍSTICA II PROF: RDO. ELI SIQUEIRA ESTATISTICA II – DOC 1 INTRODUÇÃO A INFERÊNCIA ESTATÍSTICA 1. CONCEITOS BÁSICOS A Inferência estatística é o processo por meio do qual são utilizados os resultados de amostras para tirar conclusões sobre as características de uma população. A inferência estatística ou indução estatística, baseada em distribuições de probabilidades conhecidas, resolve dois tipos de problemas: A estimação de parâmetros e a prova ou teste de hipóteses. A Estimação é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos, podendo ser pontual ou intervalar. As estimativas mais comuns são a media e o desvio-padrão (ou variância) e a proporção populacional. No Teste de Hipóteses iremos admitir um valor hipotético para um parâmetro populacional e com base nas informações da amostra realizaremos um teste estatístico para aceitar ou rejeitar o valor hipotético. Dois conceitos básicos são necessários para o desenvolvimento da Inferência estatística: a população e a amostra. POPULAÇÃO: Conjunto de todos os elementos que constituem a abrangência do estudo. A população pode ser finita ou infinita (quanto ao numero), simples ou composta (quanto ao numero de características), homogênea ou heterogênea ( quanto ao grau de variabilidade). AMOSTRA: É qualquer subconjunto de uma população. As amostras podem ser classificadas em: Probabilísticas ou aleatórias: Ocorre quando cada elemento da população tiver a mesma probabilidade de ser selecionado, podendo ser determinado o erro amostral, elemento essencial na Inferência Estatística. Para a seleção das amostras será utilizado sorteio, tabela de números aleatórios, ou programas geradores de números aleatórios. Podem ser Aleatórias Simples, Estratificadas, Sistemáticas, por Conglomerados. Amostra não probabilística: É a amostragem subjetiva ou por julgamento onde a variabilidade amostral não pode ser estabelecida com precisão. Não se prestam a tratamento estatístico que levem a inferência sobre a população sendo seus resultados validos apenas dentro da própria amostra, devendo ser evitadas por serem tendenciosas. Devem ser evitadas por não estarem baseadas em princípios científicos, mas a vontade e decisões pessoais, apresentando assim viéz, ou tendenciosidade. (Podem ser intencionais, de conveniências, por cotas, etc. As unidades amostrais podem ser selecionadas com e sem reposição. No primeiro caso cada unidade só pode entrar na amostra uma única vez, enquanto que no segundo pode entrar quantas vezes ela vier a ser selecionada ( neste caso a população é considerada infinita). Calculo do numero de amostras: De uma população de tamanho N podemos selecionar: Amostras sem reposição Cn Amostras com reposição Nn 2. ESTATÍSTICAS E PARAMETROS Obtida uma amostra, muitas vezes desejamos usá-la para produzir alguma característica específica. As mais comuns são: X ( media da amostra), S2 (variância da amostra), S (desvio-padrão da amostra), p (a proporção na amostra) e n (tamanho da amostra). Já um parâmetro é uma medida usada para descrever uma característica de uma população. Os principais são: µ = E(X) (media da população), σ2 = V(X) (variância populacional), p (proporção populacional) e N (tamanho da população). 3. ESTIMADORES ( OU ESTATÍSTICAS) São formulas matemáticas aplicadas aos valores obtidos em uma amostra. Os valores dos estimadores são denominados estimativas. Os estimadores (estimativas) são considerados Variáveis Aleatórias possuindo uma DISTRIBUIÇÃO DE PROBABILIDADE conhecida como DISTRIBUIÇÃO DE AMOSTRAGEM 4. DISTRIBUIÇÃO AMOSTRAL OU DE AMOSTRAGEM Ao juntar os modelos de probabilidade e as medidas características de uma amostra obtemos as distribuições amostrais. As distribuições amostrais são distribuições de probabilidade para estatísticas amostrais, ou seja, é uma distribuição de probabilidade que indica ate que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória. As distribuições de probabilidade mais utilizadas são a Binomial e a Normal. Para entender como se podem utilizar estatísticas amostrais para fazer inferências sobre parâmetros populacionais estudaremos populações com parâmetros conhecidos ( como a media) o observaremos as estatísticas amostrais que elas tendem a produzir ( raciocínio dedutivo). Feito isso estaremos em condições de aprender como as características de uma única amostra podem ser usadas para fazer inferências sobre o(s) parâmetro(s) de uma população (raciocínio dedutivo). - DISTRIBUIÇÃO AMOSTRAL DA MEDIA Uma distribuição amostral de medias é uma distribuição de probabilidade que indica quão prováveis são as diversas medias amostrais. A distribuição é função da media e do desvio padrão da população e do tamanho da amostra. São utilizadas as seguintes formulas: Para a media: ou seja a média de uma distribuição amostral é sempre igual a media da população ( para população finita ou infinita). Para o desvio padrão: , quando a população é muito grande( amostragem com reposição) ou infinita. TEOREMA DO LIMITE CENTRAL A capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende do conhecimento da distribuição amostral. Alem da media e do desvio-padrão precisamos de outra informação: a forma da distribuição amostral. Isso será visto através do Teorema Central do Limite que é um dos conceitos mais importantes e úteis da estatística, se constituindo no fundamento para a estimativa de parâmetros populacionais e para o teste de hipóteses. Seja (X1, X2, ..., XN) uma amostra aleatória simples de tamanho n extraída de uma população cuja característica, X, tem media µ e variância σ. Na medida em que n aumenta a distribuição de amostragem da estatística media da amostra se aproxima de uma distribuição normal com media m e variância σ/n, independente da distribuição de X. Regras práticas de uso comum: 1. Para amostras de tamanho n ≥ 30, a distribuição das medias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal mesmo quando a população não tem distribuição normal. A aproximação melhora na medida em que aumente o tamanho da amostra n. 2. Se a própria distribuição original tem distribuição normal, então as medias amostrais terão distribuição normal para qualquer tamanho amostral n. Utilizaremos um exemplo simples para assimilar o conceito de distribuição amostral. Ver CD do curso e resolva o ex. 01 da lista de exercícios 01. Bibliografia Recomendada: − BUSSAB, W. de O.; MORETTIN, P. A. Estatística Básica, 5a. ed. São Paulo: Saraiva, 2004 − LARSON,R. e FARBER,B., Estatística Aplicada, 2ª ed.,São Paulo:Prentice Hall, 2004. − LEVIN Jack, e FOX, James A. Estatística para Ciências Sociais, 9a. Ed., São Paulo Prentice Hall, 2004. − LEVINE, D.M., BERENSON, M.L. s STEPHAN, D. Estatística: Teoria e Aplicações. 3 a. ed. Rio de Janeiro: LTC, 2005. − MARTINS, G.A. Estatística Geral e Aplicada. 2a. Ed. São Paulo: Editora Atlas. 2002. − STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo, Harbra, 1986.