65 CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM GESTÃO ESTRATÉGICA ECONÔMICA, FINANCEIRA E CONTÁBIL DISCIPLINA: MÉTODOS QUANTITATIVOS DOCENTE: Emília Satoshi Miyamaru Seo QUARTA AULA: INTERVALOS DE CONFIANÇA PARA MÉDIAS E PROPORÇÃO INTRODUÇÃO A distribuição normal é comumente utilizada quando não conhecemos a média populacional, proporção populacional, etc. Utilizam-se dados da amostra para fazer inferência sobre a população – essa parte da estatística é chamada inferência estatística. Por exemplo: e são medidas como parâmetros populacionais; X e s são medidas como estatísticas amostrais; DISTRIBUIÇÃO AMOSTRAL DA MÉDIA = X Um dos procedimentos estatísticos mais comuns é o uso de uma média de amostra X para fazer inferência sobre a média da população .. População com média ? O valor esperado de X é usado para fazer inferência sobre o valor de Uma amostra aleatória simples de n elementos é selecionada a partir da população Os dados da amostra fornecem um valor para a média da amostra X A distribuição de probabilidades para todos os valores possíveis da média da amostra é chamada de distribuição amostral da média da amostra X . ________________________________________________________________________ A distribuição amostral da média de X é a distribuição de probabilidades de todos os valores possíveis da média da amostra, X . 66 ________________________________________________________________________ 1. Vamos começar considerando a média de todos os possíveis valores de X , que é denominado de valor esperado de X . Valor esperado de X = E( X ), = . (média da população) A média da distribuição amostral das médias é igual à média da população . 2. Vamos definir agora, o desvio padrão da distribuição amostral de X . Usaremos a seguinte notação X . Sendo : n = tamanho da amostra; N = tamanho da população; = média da população; = desvio padrão populacional; X = média da amostra. X = desvio padrão da distribuição amostral de X . Pode-se demonstrar que com a amostragem aleatória simples, o desvio padrão de X depende de a população ser finita ou infinita. As duas expressões para desvio padrão de X são: Para população infinita: X = n O resultado de desvio padrão da distribuição normal ( X ) é muito importante porque, na prática, não conhecemos , mas apenas os resultados de nossa amostra X e s (desvio padrão da amostra). Para população finita: X = n N n , desta expressão: a parcela N 1 N n N 1 é chamada de fator de correção da população finita. REGRA GERAL: 1. U se sempre a expressão: X = n , para calcular o desvio padrão de X para: A população seja infinita; A população seja finita e o tamanho da amostra seja menor que a igual a 5% do tamanho da população, isto é, n/N 0,05. N n 2. Use sempre a expressão X = , para calcular o desvio padrão de X n para n/N > 0,05. N 1 67 OBS.: Quando ( desvio padrão da população) for desconhecido, o erro padrão da média pode ser estimado usando-se o desvio padrão da amostra como um estimador do desvio padrão da população: Ou seja: sX = s n Quando inclui o fator de correção: sX = s n N n N 1 Exemplos: 1. Suponha que a média de uma população bastante grande seja = 50 e o desvio padrão = 12. Determinamos a distribuição de amostragem das médias das amostras de tamanho n = 36, em termos de valor esperado e de erro padrão da distribuição, da seguinte forma: X = n = 12 =2 36 2. Um auditor toma uma amostra aleatória de tamanho n = 16 de um conjunto de N = 100 contas a receber. Não se conhece o desvio padrão dos valores das 100 contas a receber. Contudo, o desvio padrão da amostra é s = $57,00. Determinamos o valor do erro padrão da distribuição de amostragem da média da seguinte forma: sX = s n 57 N n = N 1 16 100 16 = $13,13 100 1 TEOREMA DO LIMITE CENTRAL Um teorema em estatística que conduz ao uso do desvio padrão da média é o TEOREMA DO LIMITE CENTRAL para n 30 à medida que se aumenta o tamanho da amostra, a distribuição de amostragem da média se aproxima da forma da distribuição normal, qualquer que seja a forma da distribuição da população. Onde z, neste caso fica: 68 X z= n Onde z = nível de confiança = desvio padrão. Em geral, nas ciências sociais, usamos um nível de confiança de 95% de confiança como um padrão arbitrariamente aceitável. Os valores de z são tabelados. Para 95%, z = 1,96. Significa 1,96 desvios padrões da média, ou seja, 95% de probabilidade de que a média da população caia dentro de 1,96 desvios padrões da média. O ponto importante nesta discussão é que, à medida que se aumenta o tamanho da amostra, o desvio padrão da média diminui. Como resultado, tamanhos maiores de amostra fornecerão uma maior probabilidade de que a média da amostra esteja dentro de uma distância específica da média da população. 2,2 2,0 1,8 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0 x- -2 -1 - 1,96 x x+ 1 -+1,96 n 2 n Exemplo: 3. Um auditor toma uma amostra de n = 36 de uma população de 1000 contas a receber. O desvio padrão da população é desconhecido, mas o desvio padrão da amostra é s = $43,00. Se o verdadeiro valor da média da população de contas a receber é = $260,00, qual a probabilidade de que a média da amostra seja menor ou igual a 250,00? E(X) = = 260 (dado) sX = s n = 43 = 7,17 36 s é usado como estimador de ; fator de correção finita não é necessário, pois 36 < 0,05(1000) z= X s = 250 260 = -1,39 7,17 n Portanto: P ( X 250 ) = 260; s X = 7,17 = P(z -1,39) = 0,5 – P (-1,39 z 0) = 0,5 – 0,4177 = 0,0823. 69 INTERVALO DE CONFIANÇA PARA A MÉDIA, UTILIZANDO A DISTRIBUIÇÃO NORMAL Intervalo de confiança dá um intervalo de valores, centrado na estatística amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. Nosso intervalo de confiança tem a forma: X z x 1. Para n 30 com Desvio Padrão Populacional Conhecido = X z n 2. Para n 30 com Desvio Padrão Populacional Desconhecido = X s z n 3. Para n < 30 com Desvio Padrão Populacional Conhecido = X z n 4. Para n < 30 com Desvio Padrão Populacional Desconhecido - Distribuição t de Student = X tgl s n Exemplos: 5. Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados horistas selecionados de um grande número de empregados de uma fábrica, qual apresentou um salário médio de X = $180,00 com um desvio padrão de amostra de s = $14,00. Estimamos o salário médio para todos os empregados horistas da fábrica de tal maneira que tenhamos uma confiança de 95% de que o intervalo estimado inclua a média da população da seguinte forma: X 1,96. sX = 180 1,96 (2,56) = 174,98 a 185,02 Onde: X = $180,00 (dado) 70 sX = s n = 14 = 2,56 30 INTERVALOS DE CONFIANÇA PARA A PROPORÇÃO, UTILIZANDO A DISTRIBUIÇÃO NORMAL Distribuição de probabilidade aplicável a proporções é a distribuição de probabilidade binomial (acarreta cálculos extenuantes). A maioria utiliza a distribuição normal como aproximação da binomial para a construção de intervalos de confiança para as proporções. A aproximação é apropriada quando n 30 tanto np 5 como n(1 – p) 5. A variância da distribuição de proporções serve de base para o erro padrão. Dada p , proporção observada na amostra, o erro padrão estimado da proporção é: = sp p. 1 p n Não se considera necessário o uso desta correção se n < 0,05N. A correção finita é: sp = . p. 1 p n N n N 1 O intervalo de confiança para uma proporção populacional é: p z sp Exemplo: 6. Uma empresa de pesquisa de mercado faz contato com uma amostra de 100 homens em uma grande comunidade e verifica que uma proporção de 0,40 na amostra prefere lâminas de barbear fabricadas por seu cliente em vez de qualquer outra marca. O intervalo de confiança de 95% para a proporção de todos os homens na comunidade que preferem a lâmina de barbear do cliente é determinado como se segue: sp = p. 1 p = n 0,40(1 0,40) = 100 0,24 = 0,05 100 71 IC = 95% p z s p = 0,40 1,96(0,05) = 0,40 0,098 = 0,30 a 0,50 Cálculo de média da população a partir da média da amostra = x ±Zx Exemplo: Em uma pesquisa realizada com 1.600 engenheiros, verificou-se que a média de consumo mensal de lápis é de 15 unidades, com uma variação em torno de 4 unidades. Qual a média de consumo do universo considerando 99,7% de segurança? n = 1.600 x = 15 s= 4 sx = 4 s = = 0,1 1600 n Portanto Intervalo de Confiança (IC) para a média populacional fica: = x ±Zx = 15 3. 0,1 = 15 0,3 14,7 X 15,3 Proporção ou porcentagem do universo calculada a partir da proporção ou porcentagem da amostra = Proporção ou porcentagem dos elementos do universo favoráveis ao atributo pesquisado. p = Proporção ou porcentagem dos elementos do universo favoráveis ao atributo pesquisado. q = 1 p = Proporção ou porcentagem dos elementos da amostra desfavoráveis ao atributo pesquisado. sp = Desvio padrão da proporção (quando p é desconhecido). 72 Portanto Intervalo de Confiança (IC) para a proporção populacional fica: = p ± z sp sp = p. 1 p n sp = . p. 1 p n N n N 1 onde p + q = 100% Exemplo: Em uma pesquisa realizada para saber a porcentagem de indivíduos que bebiam vodca em uma cidade do interior, verificou-se que 320 pessoas de uma amostra de 1,6 mil bebiam. Qual deve ser a porcentagem de pessoas que bebem vodca na região, com 68% de segurança? n = 1.600 p = 320 = 20% 1600 z= 1 (68%) sp = pq .Z n sp = 20.80 .1 1600 sp = sp =1 = p ± z sp = 20 ± 1 19% < < 21% 1600 .1 1600 q = 80% 73 EXERCÍCIOS 1. Para estimar o tempo necessário para conserto de 40 máquinas o encarregado da manutenção de uma empresa escolheu ao acaso 5 motores e verificou que o tempo médio de conserto é de 4 horas. Por experiência anterior, o encarregado sabe que o desvio padrão do tempo de conserto corresponde a 15% do tempo médio do conserto. Qual é a previsão mínima e a máxima para o tempo médio de conserto de um motor, ao nível de confiança de 98%? 2. Uma ONG decidiu conhecer as características de recém-nascidos paulistas, do sexo masculino, cujas mães moram em favelas. Uma das medidas levantadas foi o peso médio deles. Uma amostra de 121 recém-nascidos indicou que um peso médio de 2,5Kg. Se o desvio padrão populacional é de 1Kg, determine um intervalo de confiança de 94% para ela. 3. O peso de crianças recém - nascidas do sexo feminino numa comunidade tem média e desvio padrão desconhecido. Uma amostra de 100 recém - nascidos indicou um peso médio de 2,3 kg e variância de 0,64 (kg)2. a)Determine um intervalo de confiança de 90% para . b)Determine um intervalo de confiança de 80% para . 4. Uma população composta por 80 elementos apresenta desvio padrão de 3,2 unidades. Uma amostra de 20 elementos selecionados ao acaso, sem reposição, apresentou uma média de 40 unidades. Determine um intervalo de confiança de 85% para a .. Resp. 39,10 a 40,89. 5. Desejamos estimar a proporção ( p ) de consumidores de um certo produto . Uma amostra de 300 pessoas indicou que 100 delas consumiam o produto. Determine o intervalo de confiança para p, com 95% de confiança. 6. Um administrador de uma universidade coleta dados sobre uma amostra aleatória de âmbito nacional de 230 alunos de curso de Administração de Empresas e encontra que 54 de tais estudantes têm diplomas de Técnico de Contabilidade. Usando um nível de confiança de 90%, estimar o intervalo de confiança para a proporção nacional de estudantes que possuem diplomas de Técnico de Contabilidade. Supõe – se aqui que o número de estudantes no país é o suficientemente grande para que seja dispensado o fator de correção finita BIBLIOGRAFIA CONSULTADA 1. ANDERSON, David R. Estatística aplicada à administração e economia. 2a ed. Trad. PAIVA, Luís Sérgio Castro. São Paulo: Pioneira, 2002. 2. LEVIN, Jack. Estatística aplicada a ciências humanas. 2a.ed. Trad. COSTA, Sérgio Francisco. São Paulo : Harbra, 1987. 3. MARTINS, Gilberto Andrade. Estatística geral e aplicada. 2a ed. São Paulo: Atlas, 2002. 4. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6a.ed. Sao Paulo : Atlas,1996. 5. OVALLE, Izidoro Ivo. Estatística básica. 2a ed. São Paulo: Atlas,1995. 6. MARTINS, GILBERTO DE ANDRADE, DONAIRE, DENIS. Princípios de Estatística. 4a ed. São Paulo: Atlas, 1979. 7. MARTINS, GILBERTO DE ANDRADE Manual para elaboração de monografias e dissertações. 2a ed. São Paulo : atlas, 2000. 8. SAMARA, BEATRIZ & BARROS, JOSÉ CARLOS. Pesquisa de Marketing. São Paulo: Makron Books, 1997. 74