Estatística II Aula 3 Prof.: Patricia Maria Bortolon, D. Sc. Estimação por Intervalo Objetivos Nesta semana, veremos: Como construir e interpretar estimativas por intervalos de confiança para a média e a proporção Como determinar o tamanho da amostra necessário para desenvolver um intervalo de confiança para a média e a proporção Como usar estimativas por intervalo de confiança em auditoria Tópicos Intervalos de confiança para a média populacional, μ Quando o desvio-padrão σ da população é conhecido Quando o desvio-padrão σ é desconhecido 2. Intervalos de confiança para a proporção populacional, π 3. Determinação do tamanho de amostra requerido 1. Estimativa Pontual Uma estimativa pontual é um número único. Para a média populacional (e o desvio-padrão populacional), uma estimativa pontual é a média de uma amostra (e o desvio-padrão de uma amostra). Um intervalo de confiança traz informação adicional sobre a variabilidade da informação Limite Inferior de Confiança Estimativa Pontual Largura do Intervalo de Confiança Limite Superior de Confiança Estimativas por Intervalo de Confiança Um intervalo de confiança dá uma estimativa intervalar para os valores: Leva em consideração a variação nas estatísticas amostrais que ocorrem de amostra para amostra Baseia-se em todas as observações de uma amostra Dá informações sobre quão próxima aquela informação está do parâmetro populacional É estabelecido em termos do nível de confiança Ex. 95% de confiança, 99% de confiança Nunca pode ser 100% de confiança Estimativa por Intervalo de Confiança A fórmula geral para todos os intervalos de confiança é: Estimativa Pontual (Valor Crítico) (Erro Padrão) Nível de Confiança Nível de Confiança Confiança em que o intervalo definido irá conter o parâmetro populacional desconhecido. É um percentual (menor que 100%) Nível de Confiança Suponha nível de confiança = 95% Também escrito (1 - ) = 0,95 Uma interpretação em termos de frequência relativa: No longo prazo, 95% de todos os intervalos de confiança que puderem ser construídos, irão conter o verdadeiro parâmetro populacional desconhecido. Um intervalo específico pode conter ou não o verdadeiro parâmetro populacional. Intervalo de Confiança Por que não levar o nível de confiança o mais próximo de 100% possível? Porque isto implicaria aumentar também o intervalo de confiança diminuindo a precisão; Intervalos maiores são piores para a tomada de decisões; Até aqui, quanto maior o nível de confiança maior o intervalo de confiança! Intervalo de Confiança para a Média (σ conhecido) Premissas: População com desvio-padrão conhecido População com distribuição nos moldes da distribuição normal Se a população não for normal, use amostras grandes Estimativa do Intervalo de Confiança: σ XZ n (onde Z é o valor crítico para uma probabilidade α/2 em cada cauda, de uma distribuição normal padronizada) Encontrando o Valor Crítico, Z Considere um intervalo com um nível de confiança igual a 95%: 1 .95 α .025 2 Z unidades: X unidades: α .025 2 Z= -1,96 Limite Inferior do Intervalo de Confiança 0 Estimativa Pontual Z= 1,96 Limite Superior do Intervalo de Confiança Encontrando o Valor Crítico, Z Os intervalos de confiança mais comuns são 90%, 95%, e 99% Nível de Confiança Coeficiente de confiança Valor-Z 80% 90% 95% 98% 99% 99.8% 99.9% .80 .90 .95 .98 .99 .998 .999 1,28 1,645 1,96 2,33 2,58 3,08 3,27 Intervalos e Níveis de Confiança Distribuição da Média Amostral /2 Intervalos se extendem de σ X Z n 1 x μx μ x1 x2 até σ X Z n /2 Intervalos de Confiança (1-)x100% dos intervalos construídos contém μ; ()x100% não contém. Intervalo de Confiança para μ (σ conhecido) Exemplo Uma amostra de 11 circuitos retirada de uma população que segue a distribuição normal, tem resistência média de 2,20 ohms. Nós sabemos, de testes passados, que o desvio padrão da população é .35 ohms. Determine um intervalo de confiança a 95% de confiança para a verdadeira resistência média da população de circuitos. Intervalo de Confiança para μ (σ conhecido) Exemplo σ X Z n 2,20 1,96 (.35/ 11) 2,20 .2068 (1,9932; 2,4068) Nós estamos 95% confiantes de que o intervalo 1,9932 a 2,4068 ohms contém a verdadeira média da população. Apesar da verdadeira média poder ou não estar dentro deste intervalo, 95% dos intervalos formados desta maneira conterão a verdadeira média. Intervalo de Confiança para μ (σ Desconhecido) Se o desvio-padrão da população é desconhecido, nós podemos usar o desvio-padrão da amostra, S Isso introduz uma incerteza adicional, já que S é varia de amostra para amostra Então, utiliza-se a distribuição t ao invés da distribuição normal Intervalo de Confiança para μ (σ Desconhecido) Premissas: População com desvio-padrão desconhecido População normalmente distribuída Se a população não for normal, use amostras grandes Use a distribuição t de Student Estimativa do Intervalo de Confiança: X t n-1 S n (onde t é o valor crítico de uma distribuição t com n-1 g.l. e áreas α/2 em cada cauda) Distribuição t de Student O valor t depende dos graus de liberdade (g.l.) Número de observações que são livres para variar depois que a média da amostra foi calculada g.l. = n - 1 Graus de Liberdade Idéia: Número de observações que são livres para variar depois que a média da amostra foi calculada Exemplo: Suponha que a média de 3 números seja igual a 8.0 Seja X1 = 7 Seja X2 = 8 Qual deve ser o valor de X3? Se a média dos três valores é 8.0, então X3 tem que ser igual a 9 (i.e., X3 não é livre para variar) Aqui, n = 3, então os graus de liberdade são = n – 1 = 3 – 1 = 2 (2 números podem assumir qualquer valor, mas o terceiro não está livre para variar dada uma certa média) Distribuição t de Student Obs: t Z à medida que n aumenta Normal Padrão (t com gl = ∞) t (gl = 13) Distribuições t são em forma de sino, simétricas, mas com caudas mais “gordas” que a distribuição normal t (gl = 5) 0 t Tabela da Distribuição t de Student Area Cauda Sup. gl .25 .10 .05 1 1,000 3,078 6,314 Seja: n = 3 gl = n - 1 = 2 = .10 /2 =.05 2 0,817 1,886 2,920 /2 = .05 3 0,765 1,638 2,353 O corpo da tabela contém valores t, não probabilidades 0 2,920 t Intervalo de Confiança para μ (σ Desconhecido) Exemplo Uma amostra aleatória com n = 25 elementos tem X = 50 e S = 8. Construa um intervalo de confiança para a média μ a um nível de confiança de 95% g.l. = n – 1 = 24, então O intervalo de confiança é X t/2, n -1 S 8 50 (2,0639) n 25 (46,698 ; 53,302) Intervalo de Confiança para a Proporção Populacional, π Uma estimativa de intervalo para a proporção populacional ( π ) pode ser calculada acrescentando uma incerteza à proporção na amostra ( p ) Intervalo de Confiança para a Proporção Populacional, π Lembre que a distribuição da proporção amostral é aproximadamente normal, se o tamanho da amostra for grande, com desvio-padrão σp (1 ) n que pode ser estimado a partir dos dados da amostra com: p(1 p) n Intervalo de Confiança para a Proporção Populacional, π Os limites superiores e inferiores do intervalo de confiança para a proporção populacional são calculados a partir da fórmula p(1 p) pZ n onde Z é o valor crítico para o intervalo de confiança desejado, obtido na distribuição normal padronizada p é a proporção na amostra n é o tamanho da amostra Intervalo de Confiança para a Proporção Populacional, Exemplo Uma amostra aleatória de 100 pessoas mostrou que 25 delas fizeram saques em seus fundos para aposentadoria no último ano. Construa um intervalo de confiança a 95% para a verdadeira proporção da população que recorreu aos fundos de aposentadoria. p Z p(1 p)/n 25/100 1,96 .25(.75)/100 .25 1,96 (.0433) (0,1651 ; 0,3349) Intervalo de Confiança para a Proporção Populacional, Exemplo Com 95% de confiança podemos afirmar que o intervalo entre 16,51% e 33,49% contém a verdadeira proporção da população que fez saques em seus fundos de aposentadoria. Apesar do intervalo .1651 a .3349 poder ou não conter a verdadeira proporção, 95% dos intervalos formados desta maneira a partir de amostras de tamanho 100, conterão a verdadeira proporção. Determinando o Tamanho da Amostra O tamanho da amostra pode ser definido de tal forma que a margem de erro (e) fique em determinado tamanho com um nível de confiança (1 - ) especificado. A margem de erro é também chamada erro amostral É a imprecisão na estimativa do parâmetro populacional É o tamanho do intervalo que se soma e se subtrai da estimativa pontual para construir o intervalo de confiança Determinando o Tamanho da Amostra Para determinar o tamanho da amostra necessário à estimativa da média, você deve conhecer: O nível de confiança desejado (1 - ), que determina o valor crítico Z O erro amostral aceitável (margem de erro), e O desvio-padrão, σ σ XZ n σ eZ n Resolvendo para n Z σ n 2 e 2 2 Determinando o Tamanho da Amostra Se = 45, qual o tamanho da amostra necessária para estimar a média com erro igual a ± 5 com 90% de confiança? Z 2 σ 2 (1,645)2 (45)2 n 2 219,19 2 e 5 Então o tamanho da amostra necessária é n = 220 Determinando o Tamanho da Amostra Para determinar o tamanho da amostra necessário à estimativa da proporção populacional, você deve conhecer: O nível de confiança desejado (1 - ), que determina o valor crítico Z O erro amostral aceitável (margem de erro), e A verdadeira proporção de “sucessos”, π π pode ser estimado a partir de uma amostra piloto, se necessário (ou para ser conservador use π = .50) eZ (1 ) n Resolvendo para n Z (1 ) n e2 2 Determinando o Tamanho da Amostra Qual o tamanho da amostra necessária a uma estimativa da proporção de defeituosos em uma grande população, com margem de erro menor ou igual a ±3%, com 95% de confiança? (Assuma que uma amostra piloto identificou 12% de defeituosos, ou seja, p = .12) Determinando o Tamanho da Amostra Solução: Para 95% de confiança, use Z = 1.96 e = .03 p = .12, então use este valor para estimar π Z 2 (1 ) (1,96)2 (.12)(1 .12) n 450,74 2 2 e (.03) Então use n = 451 Aplicações em Auditoria Sete vantagens da amostragem em auditoria Consome menos tempo Custa menos Proporciona resultados que são objetivos e defensáveis. Uma vez que o tamanho da amostra é baseado em princípios estatísticos que podem ser demonstrados, a auditoria é defensável perante superiores hierárquicos e perante um tribunal Permite estimar antecipadamente o tamanho da amostra Aplicações em Auditoria Sete vantagens da amostragem em auditoria Proporciona uma estimativa para o erro de amostragem Permite que os auditores combinem e posteriormente avaliem, coletivamente, amostras coletadas por diferentes indivíduos Permite que os auditores generalizem para a população as suas descobertas, com um erro de amostragem conhecido Estimando o Valor Total da População Estimativa Pontual: Total NX Intervalo de Confiança para a Estimativa: S NX N ( t n1 ) n Nn N 1 (Como a amostragem é sem reposição, use o fator de correção para populações finitas na fórmula do intervalo de confiança) Estimando o Valor Total da População Exemplo Uma firma tem uma população de 1000 faturas e deseja estimar o valor total das mesmas. Uma amostra de 80 faturas é selecionada com valor médio de $87,6 e desvio padrão de $22,3. Encontre o intervalo de confiança para o valor total das faturas a um nível de confiança de 95%. Estimando o Valor Total da População Exemplo N 1000, n 80, X 87,6, S 22,3 N X N (t n 1 ) S n Nn N 1 (1000)(87,6) (1000)(1,9905) 22,3 1000 80 80 1000 1 87.600 4.762,48 O intervalo de confiança para o valor total das faturas a 95% de confiança é $82.837,52 to $92.362,48 Estimativa do Intervalo de Confiança Unilateral da Taxa de Não-Conformidade com Controles Internos Intervalo de Confiança Unilateral para uma Proporção Aplicação: encontrar o limite superior para a proporção de itens que não atendem a requisitos de controle p(1 p) Limite Superior p Z n Nn N 1 Onde: Z é o valor crítico da normal padronizada para um determinado nível de confiança desejado p é a proporção de itens na amostra que não atendem aos requisitos n é o tamanho da amostra N é o tamanho da população Intervalo de Confiança Unilateral para uma Proporção Exemplo Uma grande empresa de eletrônicos preenche 1 milhão de cheques por ano. Uma norma interna da empresa estabelece que cada cheque só pode ser assinado depois de um documento ter sido gerado por um supervisor do setor de contas a pagar. A taxa de exceção tolerável da empresa para esse controle é de 4%. Se forem encontrados desvios em relação ao controle em 8 dos 400 pagamentos selecionados para a amostra, o que o auditor deve fazer? Para solucionar este problema, utilize um nível de confiança de 95%. Intervalo de Confiança Unilateral para uma Proporção Exemplo Solução: o auditor constrói um intervalo de confiança unilateral de 95% para a proporção de faturas em desacordo com os padrões de conformidade e compara esse resultado com a taxa de exceção tolerável: 8 0,02 e Z 1,645 para um nível de confiança de 95% 400 p (1 p ) N n Limite Superior p Z n N 1 p 0,02(1 0,02) 1.000.000 400 Limite Superior 0,02 1,645 400 1.000.000 1 Limite Superior 0,02 1,645(0,007)(0,9998) 0,02 0,0115 Limite Superior 0,0315 Com 95% de confiança o auditor conclui que a taxa de não conformidade é inferior a 3,15%. Como ela é inferior à taxa de exceção tolerável, o auditor conclui que os processos estão adequados. Questões Éticas Um intervalo de confiança (refletindo o erro de amostragem) deveria ser sempre reportado juntamente com a estimativa pontual O nível de confiança deve sempre ser informado O tamanho da amostra deve ser informado Uma interpretação do intervalo de confiança também deve ser realçada