CAPÍTULO II Inferência Estatística Paramétrica Prof. Dr.Miguel Angel Uribe Opazo 1. Introdução O objetivo da Inferência Estatística é produzir afirmações sobre uma determinada característica da população, na qual estamos interessados em estudar, a partir de informações colhidas de uma parte dessa população chamada Amostra. INTRODUÇÃO • Esta característica pode ser representada por uma Variável Aleatória. • Essa Variável Aleatório pode ser discreta ou continua. • No caso de variável discreta se tivéssemos informações completas sobre a função de probabilidade, ou no caso de variável contínua se tivéssemos informações completas sobre a função densidade de probabilidade, não teríamos necessidade de colher uma amostra. INTRODUÇÃO Toda afirmação desejada seria obtida através da distribuição da variável aleatória, usando-se as propriedades estudadas. Mas isso raramente acontece. • Podemos admitir, por exemplo, que a altura dos brasileiros adultos, que ela siga uma distribuição normal. Mas desconhecemos os parâmetros que a caracterizam (média e variância)?. INTRODUÇÃO • Em outros casos, podemos ter uma idéia da média e da variância, mas desconhecemos a forma da curva. • Então, o uso de uma amostra nos ajudaria a formar uma opinião sobre o comportamento da variável na população. População e Amostra • População: é o conjunto total de elementos portadores de, pelo menos, uma característica em comum, sob investigação. • Amostra: é um subconjunto representativo da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. • Elemento Amostral: é um elemento da amostra, na qual será colhidas as informacoes. Como Selecionar uma Amostra • A maneira de se obter uma amostra é tão importante, e existem tantos modos de fazê-lo, que esses procedimentos constituem especialidades dentro da estatística, sendo Amostragem e Planejamento de experimentos as duas mais conhecidas. Como Selecionar uma Amostra • Poderíamos dividir os procedimentos científicos de obtenção de dados amostrais em três grandes grupos: - Levantamento Amostral; - Planejamentos de Experimentos; - Levantamentos observacionais. Planejamento de Experimento • Depende do delineamento de experimentos a utilizar. • Inteiramente Casualizado • Blocos ao acaso. • Quadrado latino. LEVANTAMENTOS OBSERVACIONAIS • Através de banco de dados públicos e privados. • De revistas científicas. • De documentos. Levantamento Amostral Métodos Probabilísticos • Exigem que cada elemento da população possua determinada probabilidade de ser selecionado. • Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Métodos Probabilísticos • Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. • Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra. • É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o acaso na escolha. Tipo de Amostragem Probabilístico • • • • • Amostragem Simples Aleatória Amostragem Sistemático Amostragem Estratificado Amostragem por Conglomerados Amostragem Múltipla Amostragem Simples Aleatória • Também conhecido por amostragem ocasional, acidental, randônico, elementar. • Este tipo de amostragem destaca-se por ser um processo de seleção bastante fácil e muito usado. • Neste processo de seleção, todos os elementos da população têm igual probabilidade de serem escolhidos (1/N), não só antes de ser iniciado, como também até completar-se o processo de coleta. Procedimento da Escolha da Amostra •Devem-se enumerar todos os elementos da população. Se por exemplo nossa população tem 5000 elementos (N), devese numerá-los de 1 a 5000 ou, como acontece geralmente, usa-se um número que já identifica o elemento. •Devem-se efetuar sucessivos sorteios com reposição até completar o tamanho da amostra (n). Procedimento da Escolha da Amostra • O processo termina quando for escolhidos os n elementos da amostra. • Se o número escolhido sai mais de uma vez, só será considerada uma vez e prossegui-se com o processo até terminar. Se o número sorteado não existe na população, simplesmente não se considera e prossegui-se o processo. Procedimento da Escolha da Amostra • Para realizar este sorteio, podemos utilizar “tábuas de números aleatórios”, programas computacionais (Excel, Minitab, SPSS) ou calculadoras. • Existem calculadoras que têm o comando RAN, este comando, escolhe aleatoriamente números entre zero e um. Para a escolha de cada elemento pode-se utilizar o seguinte método: Número escolhido = N * (RAN) + 1, sendo N o número total de elementos da população e RAN um número aleatório entre zero e um. Amostragem Sistemático Trata-se de uma variação da amostragem simples aleatório, muito conveniente quando a população está naturalmente ordenada, e caso as retiradas dos elementos da amostra seja feita periodicamente. Procedimento da escolha da amostra por amostragem sistemático • Seja N o tamanho da população e n o tamanho da amostra. • Então, calcula-se o intervalo de amostragem N/n ou inteiro mais próximo “a”. • Sorteia-se, utilizando a tábua de números aleatórios, um número x entre 1 e “a” formando-se a amostra dos elementos correspondentes aos números: x, x + a, x + 2a , x+ 3a, ..., x + (n-1)a. Amostragem Estratificado • Quando a população é heterogenia, a amostragem simples e sistemática não refletem essa heterogeneidade. • Nesse caso, utiliza-se uma amostragem denominada estratificada, obtida pela separação das unidades da população em grupos distintos (chamados estratos); Amostragem Estratificado • Em seguida seleciona-se uma amostra aleatória simples a partir de cada estrato. • A amostra completa compõe-se de agregação das amostras de cada estrato e, geralmente, a proporcionalidade do tamanho é mantida na amostra. Procedimento da Escolha da Amostra Estratificado • Estratificar uma população é dividir em L subpopulações homogenias denominados estratos; • tais Estratos tem Ni elementos (i=1,2,...,L), tais que: N = N1 + N2 + ...+ NL, em que, os estratos são mutuamente exclusivos. • Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada sub-população proporcional ao tamanho do estrato. Amostragem por Conglomerados • Algumas populações não permitem, tornam extremamente difícil que identifiquem seus elementos. ou se • Não obstante isso, pode ser relativamente fácil identificar alguns subgrupos da população. • Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Amostragem Múltipla A amostra é retirada em diversas etapas sucessivas. Dependendo dos resultados observados, etapas suplementares podem ser dispensadas. • Existem outros tipos de amostragem não probabilísticos, que são amostragens em que há uma escolha deliberada dos elementos da amostra. • Este tipo de amostragem não é possível generalizar os resultados das pesquisas para a população, pois as amostras nãoprobabilísticas não garantem a representatividade da população. Amostragem não Probabilistico • amostragem acidental (os elementos vão aparecendo); • amostragem intencional (a escolha é de acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra); • amostragem por quotas (define características que devem ser levadas em conta). Tamanho da Amostra • o tamanho da amostra n da seguinte forma: z n = ( ) p (1 p ) . 2 Tamanho da Amostra Tamanho da Amostra Como se pode notar, f(p) tem a forma de uma parábola com valor máximo alcançado para p = 1/2, o que corresponde a f(p) = 0,25. Assim, é possível escrever a seguinte desigualdade: z z ( ) 2 p (1 p) ( ) 2 0,5(1 0,5) n . n´ . Isto é, o valor de n, que se esta procurando, é sempre menor ou igual a z 2 n´ = ( ) 0,25 . Resumo da Tabela Normal Padrão Coeficiente de confiança (1- )100% 99,74 99,00 95,44 95,00 92,82 90,00 85,00 80,00 68,26 Nível de significância ( )100% 0,26 1,00 4,56 5,00 7,18 10,00 15,00 20,00 31,74 valor z 3,00 2,58 2,00 1,96 1,80 1,65 1,44 1,28 1,00 Tamanho da Amostra n* n (n* 1) 1 N