Estatística e Pesquisa - UVB Aula 10 Estimação e Intervalo de Confiança Objetivos da Aula Fixação dos conceitos de Estimação; Utilização das tabelas de Distribuição Normal e t de Student Introdução Freqüentemente necessitamos, por meio das amostras, conhecer informações gerais da população. Já sabemos que a estatística indutiva é a ferramenta que vai nos auxiliar neste processo, ou seja, vai nos permitir tirar conclusões probabilísticas sobre aspectos das populações, com base na observação de amostras extraídas dessas populações. Estimação A estimação é o processo que consiste no uso de dados da amostra (dados amostrais) para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções etc. Faculdade On-line UVB 100 Estatística e Pesquisa - UVB Estimativas Pontuais e Intervalares Os dois tipos clássicos de estimação são as estimativas pontuais e as intervalares. Neste momento é importante definirmos dois conceitos: Chamamos de estimador a quantidade calculada em função dos elementos da amostra, que será usada no processo de estimação do parâmetro desejado. O estimador é, como vemos, uma estatística. Será, portanto, uma variável aleatória caracterizada por uma distribuição de probabilidade e seus respectivos parâmetros próprios. Chamaremos de estimativa a cada valor particular assumido por um estimador. Estimativa Pontual É quando fazemos uma única estimativa (um valor) para um determinado parâmetro populacional. Vejamos os exemplos: Faculdade On-line UVB 101 Estatística e Pesquisa - UVB Estimativa Intervalar É quando fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional. Neste tipo de estimativa temos um intervalo de valores em torno do parâmetro amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. A esse intervalo chamamos intervalo de confiança. Estimativa de Médias de uma População Para efetuar a Estimativa de Médias de uma População utiliza-se desvio padrão da distribuição que constitui a amostra (distribuição amostral), deve-se levar em consideração se o desvio padrão da população é ou não conhecido. Para desvio padrão populacional conhecido temos: Estimativa Pontual da Média Estimativa Intervalar da média Faculdade On-line UVB 102 Estatística e Pesquisa - UVB Assim teremos a estimativa intervalar: Salientamos que a estimativa intervalar da média populacional baseia-se na hipótese de que a distribuição das médias amostrais é normal, daí usarmos a nova variável z. Para grandes amostras (quando n é maior que 30) esta premissa é garantida pelo Teorema do Limite Central, que não estudaremos. Para amostras de 30 ou menos elementos, é importante saber que a população submetida à amostragem tem distribuição normal ou aproximadamente normal. Exemplo: Considerando que uma amostra de cem elementos extraída de uma população aproximadamente normal, cujo desvio padrão é igual a 2, forneceu média de 35,6 ( ), construir intervalos de confiança de 90%, 95% e 99% para a média dessa população. Vejamos como determinar z: Ao observarmos a representação da distribuição normal reduzida abaixo, sabemos que toda a área compreendida entre a curva e sua base tem valor 1. Logo, a parte em cor amarela tem valor 0,5. Faculdade On-line UVB 103 Estatística e Pesquisa - UVB Em nossa aula anterior calculávamos z e então encontrávamos a área correspondente e, assim, a probabilidade desejada. Agora a ação será inversa. Desejamos, em nosso exemplo acima, para seu primeiro intervalo 90% de confiança, então fazemos: Conhecendo a área que nos dá 90% de confiança no resultado, vamos até a Tabela para a Distribuição Normal Padronizada e encontramos o valor mais próximo de 0,45, que é 0,4494974. Para este valor temos (considerando a linha e a coluna) z = 1,64 Podemos representar da seguinte forma: Faculdade On-line UVB 104 Estatística e Pesquisa - UVB Erro admitido num intervalo (erro de estimação) É a diferença entre a média da amostra e a verdadeira média da população. Como o intervalo de confiança tem centro na média da amostra, o erro máximo provável que está sendo admitido é igual à metade da amplitude do intervalo. O erro de estimação pode ser descrito pela relação: Percebemos que quando aumentamos este erro potencial aumenta. Podemos concluir também que maiores amostras (aumenta n) possuem um potencial de erro menor. No caso do desvio padrão populacional desconhecido que é habitualmente a situação mais comum, teremos o mesmo raciocínio. Entretanto, em nossa avaliação inicial devemos verificar o tamanho da amostra (n), se: Quando usamos a distribuição normal Quando usamos a distribuição t de Student Assim nos intervalos termos: Faculdade On-line UVB 105 Estatística e Pesquisa - UVB Distribuição t de Student Para pequenas amostras a distribuição normal apresenta valores menos precisos, o que nos leva a utilizar um modelo melhor. Por isso iremos conhecer a distribuição t de Student. A principal diferença entre a distribuição normal e a t de Student é que esta tem mais área nas caudas. Existe um valor de t para cada tamanho de amostra, sendo que à medida que a amostra (n) cresce, a distribuição t de Student se aproxima da distribuição normal. Para calcular o valor de t a ser usado é necessário ter: Um nível de confiança desejado: Qual o número de graus de liberdade a ser utilizado: Por exemplo: Sabendo-se que uma amostra tem 25 elementos, que a sua média 150 e desvio padrão igual a 10. Represente um intervalo de confiança em nível de 90%. Como a amostra é menor que 30 elementos, então iremos usar a distribuição t de Student. Se desejamos um intervalo de confiança de 90%, temos: Faculdade On-line UVB 106 Estatística e Pesquisa - UVB Para trabalharmos com a tabela, encontramos o número de graus de liberdade, que é: (n-1), logo (25-1)=24. O nível de confiança desejado é Conhecendo o número de graus de liberdade e o nível de confiança desejado vamos a tabela e encontramos o valor t, neste caso igual a 1,7109. Faculdade On-line UVB 107 Estatística e Pesquisa - UVB Determinação do Tamanho da Amostra O tamanho da amostra depende de 3 fatores, conforme abaixo: O grau de confiança desejado (z); Quantidade de dispersão entre os valores individuais da população ( ); Erro tolerável ou admitido (e). Sendo a fórmula para encontrarmos o tamanho da amostra: Por exemplo: Qual o tamanho de amostra necessária para se estimar a média de uma população infinita cujo desvio padrão é igual a 4, com 98% de confiança e erro de 0,5? Lembramos que z foi retirado da tabela normal. Logo, precisamos de uma amostra com 348 elementos. Faculdade On-line UVB 108 Estatística e Pesquisa - UVB Bibliografia CRESPO, Antonio Arnot. Estatística Fácil. São Paulo : Editora Saraiva, 1998. COSTA NETO, Pedro Luiz de Oliveira. Estatística. 12. ed. São Paulo: Editora Edgard Blücher Ltda., 1992. MAGALHÃES, Marcos Nascimento e LIMA, Antonio Carlos Pedroso de. Noções de Probabilidade e Estatística. São Paulo: 5a. ed. Editora da Faculdade On-line UVB 109 Estatística e Pesquisa - UVB Universidade de São Paulo, 2002. MANDIM, Daniel. Estatística Descomplicada. 10. ed. Brasília: Vestcon Editora Ltda., 2003. SPIEGEL, Murray R. Estatística. São Paulo: Editora McGraw-Hill, 1952. VIEIRA, Sonia. Princípios de Estatística. 1ª reimpr. da 1ª ed. São Paulo: Editora Pioneira Thomson Learning, 2003. SETEVENSON, Willian J. Estatística Aplicada à Administração. São Paulo: Ed. Harbra, 1981. Faculdade On-line UVB 110