Pós GRADUAÇÃO MÉTODOS QUANTITATIVOS submódulo 2 - ESTATÍSTICA Gestão inovadora da empresa gráfica Programa Aula 1 – 26 de agosto – recordação de probabilidade e estatística básica – conceitos gerais de amostragem Aula 2 – 2 de setembro – amostragem aleatória simples (AAS) e amostragem estratificada (AE) Aula 3 – 16 de setembro – Estimadores do tipo razão e do tipo regressão Aula 4 – interpretação da norma NBR5426 – planos de amostragem e procedimentos na inspeção por atributos Aula 5 – exercícios práticos com aplicação da NBR5426 na empresa gráfica CURSO SUPERIOR DE TECNOLOGIA GRÁFICA – PÓS GRADUAÇÃO – GESTÃO INOVADORA DA EMPRESA GRÁFICA SENAI - SP Exercícios de probabilidade 1. Jogando-se três dados, calcular a probabilidade de que a soma dos pontos obtidos seja superior a 14. Solução • Número de resultados do espaço amostral S: n = 6 3 = 216 • Cada um dos 216 resultados de S tem a mesma probabilidade 1/216. • Resultados favoráveis ao evento E (m): m=20 • P(E) = m/n = 20/216=0,0926 Exercícios de probabilidade 2. Seja um baralho comum de 52 cartas. Qual é a probabilidade de uma carta ser de ouros ou de copas? Solução • E = sair carta de ouros • F = sair carta de copas • P(E υ F) = P(E) + P(F) = ¼ + ¼ =1/2 Exercícios de probabilidade 3. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros e a segunda ser de copas, com reposição? Solução • E = sair primeira carta de ouros • F = sair segunda carta de copas • P(E ∩ F) = P(E) × P(F) = ¼ × ¼ =1/16 Exercícios de probabilidade 4. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros e a segunda ser de copas, sem reposição? Solução • E = sair primeira carta de ouros • F = sair segunda carta de copas • P(E ∩ F) = P(E) × P(F│E) = ¼ × 13/51 =13/204 Exercícios de probabilidade 5. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros ou a segunda ser de copas, com reposição? Solução • E = sair primeira carta de ouros • F = sair segunda carta de copas • P(E υ F) = P(E) + P(F) – P(E ∩ F) = 7/16 • Solução alternativa pelo evento complementar P(E υ F) = 1 – P(~E ∩ ~F) = 1 – 9/16 Exercícios de probabilidade 6. Seja uma urna com 7 bolas com as letras A A A C C R R. Extraindo-se as bolas uma por uma, calcular a probabilidade de obter a palavra CARCARÁ. Solução • Evento desejado: F, intersecção dos 7 eventos: • E1 = primeira bola com C • E2 = segunda bola com A • E3 = terceira bola com R • E4 = quarta bola com C • E5 = quinta bola com A • E6 = sexta bola com R • E7 = sétima bola com A P(F) = P(E1) × P(E2|E1) × P(E3|E1E2) ×... = = 2/7 × 3/6 × 2/5 × ¼ × 2/3 × ½ × 1 = 1/210 Exercícios de probabilidade 7. Seja uma urna com 3 bolas brancas e 4 bolas pretas. Extrái-se simultaneamente 3 bolas. Calcular a probabilidade de a) pelo menos duas sejam brancas. E = saírem 3 bolas brancas F = saírem 2 bolas brancas e uma preta. P(EUF) = P(E) + P(F) P(E) = 3/7 . 2/6 . 1/5 = 1/35 P(F) = 3 (1 – 1/7 . 2/6 . 4/5) = 12/35 P(EUF) = 1/35 + 12/35 = 13/35 Exercícios de probabilidade 7. Seja uma urna com 3 bolas brancas e 4 bolas pretas. Extrái-se simultaneamente 3 bolas. Calcular a probabilidade de b) pelo menos uma seja preta. G = pelo menos uma ser preta. ~G = nenhuma ser preta = saírem 3 bolas brancas = E P(G) = 1 - P(~G) = 1 – 1/35 = 34/35 Exercícios de probabilidade 8. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer uma quadra de mão? Exercícios de probabilidade 9. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer um flush (todas do mesmo naipe) de mão? Exercícios de probabilidade 10. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer um par de mão? Aula 2 - AMOSTRAGEM • Noções Básicas – Procedimentos amostrais – Objetivo: obter informações sobre o todo, baseando-se no resultado de uma amostra – Perigo: viés de interpretação do resultado – Adequações e inadequações de alguns protocolos de obtenção de amostras – Inferência estatística: obter resultados para o todo, baseando-se em resultados da amostra Vocabulário Técnico • Ver apêndice A (Bolfarine) • Amostra – subconjunto de uma população • Amostragem por quotas – processo de amostragem em que a seleção das unidades amostrais é feita em campo, até o número especificado em projeto para ser coletado em cada estrato. • Característica de interesse (variável) – propriedade dos elementos da população que se pretende conhecer. Vocabulário Técnico – Censo – resultado do levantamento estatístico que visa a conhecer a totalidade das características individuais de uma população. – População ou universo – conjunto de elementos, cujas propriedades e investigam por meio de subconjuntos que lhes pertencem. – Viés ou vício (de um estimador de um parâmetro) – é a diferença entre o seu valor esperado e o valor do parâmetro. – Sistema de referência – lista ou descrição das unidades amostrais da população, por meio da qual é possível selecionar a amostra. Tópicos para um levantamento amostral – Apêndice B – Identificação dos objetivos e populações – Coleta das informações – Planejamento e seleção da amostra – Processo de coleta dos dados (em campo) – Processamento dos dados – Análise dos resultados (modelos estatísticos) – Apresentação dos resultados – Disponibilização dos dados O que é uma boa amostra? 1. É aquela que permite a generalização de seus resultados dentro dos limites aceitáveis de dúvidas. 2. É aquela que possui um custo mínimo de planejamento e execução e ainda atenda ao objetivo no. 1 O tamanho da amostra e o erro do estimador O erro padrão do estimador decresce à medida que aumenta o tamanho da amostra. Exemplo: seja um levantamento amostral cujo objetivo é prever qual dentre os dois únicos possíveis partidos terá maior porcentagem de votos válidos. Um dos partidos obteve 56% dos votos. Caso tenha sido usada uma amostra de 100 eleitores: intervalo de 95% de confiança indicaria um número entre 46% e 66% (inconclusivo). O tamanho da amostra e o erro do estimador Um dos partidos obteve 56% dos votos. Caso tenha sido usada uma amostra de 400 eleitores: intervalo de 95% de confiança indicaria um número entre 51% e 61% (conclusivo e suficiente). Caso tenha sido usada uma amostra de 1600 eleitores: intervalo de 95% de confiança indicaria um número entre 53,5% e 58,5% (conclusivo e exagerado). Viés e desvio padrão Seja uma população ou universo: o conjunto u = {1,2,...,N} de todas as unidades elementares de interesse. N é o tamanho fixo da população, às vezes desconhecido. Elemento populacional é qualquer elemento i pertencente a Yi u, do qual se deseja conhecer Parâmetro populacional • É o vetor de todos os valores de uma variável de interesse que se denota por D = ( Y1,...,YN) Função paramétrica populacional • É uma característica numérica qualquer da população, que condensa funcionalmente os Yi. Tal função será denotada por θ(D) Exemplo 2.1 (pag. 38) Variável Unidade Notação 1 2 3 i Ada Beto Ema Ai Sexo 0 1 0 Xi Idade 20 30 40 Yi Fumante 0 1 1 Gi Renda bruta familiar 12 30 18 Fi No. de trabalhadores 1 3 2 Ti Nome do chefe Funções paramétricas populacionais • Idade média θ(Y) = (20+30+40)/3 = 30 • Renda média do trabalhador θ(D) = (12+30+18)/(1+3+2) = 10 Funções paramétricas populacionais mais usadas • Média populacional θ(Y) = μ = (Y1+ Y2+...+YN)/N • Variância populacional θ(Y) = σ2 = Σ(Yi – μ)2/N • Desvio padrão σ Exercício • Determinar a média e o desvio padrão das idades dos habitantes de um determinado bairro. Os valores estão apresentados à direita: 45 54 23 35 46 67 37 19 66 43 22 76 44 19 33 41 60 81 47 39 47 56 20 29 31 40 19 22 24 33 80 76 34 67 70 39 79 21 32 33 55 50 29 40 38 44 22 78 22 Amostras • Uma seqüência qualquer de n unidade de denominada uma amostra ordenada de u. • Exemplo: u = {1,2,3} s1 = (1,2) s2 = (2,1) ué s3 = (1,1,3) Planejamento amostral • Se cada amostra tem associada a si uma probabilidade de ser sorteada e a soma de todas as probabilidades for igual a 1, então tem-se um planejamento amostral ordenado. • Exemplo: u = {1,2,3} Plano A: P(11) = P(12) = P(13) = 1/9 P(21) = P(22) = P(23) = 1/9 P(31) = P(32) = P(33) = 1/9 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S. Planejamento amostral • Plano B: P(12) = P(13) = P(21) = P(23) = P(31) = P(32) = 1/6 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S. • Diferença entre o plano A e o plano B: • Plano A: com reposição • Plano B: sem reposição Planejamento amostral • Plano C: P(2) = 1/3 P(12) = P(32) = 1/9 P(112) = P(132) = P(332) = P(312) = 1/27 P(111) = P(113) = P(131) = P(311) = 1/27 P(133) = P(313) = P(331) = P(333) = 1/27 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S. Descrição textual do Plano C • Plano C: “Sorteie uma unidade após a outra, repondo a unidade sorteada antes de sortear a seguinte, até o surgimento da unidade 2 (i=2) ou até que 3 unidades tenham sido sorteadas”. Planos equiprobabilísticos • São os planos em que todas as amostras têm a mesma probabilidade de ser escolhida. Amostragem Aleatória Simples (AAS) • Seleciona-se seqüencialmente cada unidade amostral com igual probabilidade, de tal forma que cada amostra tenha a mesma chance de ser escolhida. A seleção pode ser feita com ou sem reposição. Estimadores • O objetivo principal da amostragem é produzir estimadores para parâmetros populacionais desconhecidos. • Quando se associa uma estatística com a expressão que irá estimar o parâmetro populacional, ele recebe o nome de estimador. O valor numérico do estimador, para cada amostra, chama-se estimativa. Viés ou vício do estimador • BA[θe] = EA[θe – θ] • B de bias (viés em inglês) Variância de uma estatística H • Var A[H] = Σ {h(ds) – EA[H]}2 PA(s) para todas as amostras do plano A. Distribuição binomial Seja p a probabilidade de um evento acontecer em uma tentativa única (probabilidade de sucesso) q = 1 – p é a probabilidade insucesso A probabilidade do evento ocorrer X vezes, em N tentativas, é p(X) = NCXpXqN-X = N!/[X!(N-X)!] pXqN-X Exemplo: Qual é a probabilidade de obter exatamente 2 caras em 6 lances de uma moeda não-viciada? Distribuição binomial Esta distribuição discreta de probabilidade é denominada distribuição binomial, visto que a X= 0, 1, 2, ..., N correspondem os termos sucessivos da fórmula binomial ou do desenvolvimento binomial (p+q)n = qN + NC1qN-1p1 + NC2qN-2p2 +...+pN em que 1, NC1, NC2,... são os coeficientes binomiais Propriedades da distribuição binomial Média μ=Np Variância σ2 = N p q Desvio padrão σ = raiz (N p q) Distribuição de Poisson X λ -λ e /X! p(X) = em que e = 2,71828... e λ é uma constante dada Média: μ=λ Variância: σ2 = λ Relação entre as distribuições binomial e de Poisson Se N for grande e p for pequeno, o evento é raro. Na prática: N≥50 e Np<5, então o evento é raro. Neste caso, a distribuição binomial é muito aproximada da de Poisson, com λ= Np Exercício Dez por cento das revistas produzidas por um certo processo revelaram-se defeituosos. Determinar a probabilidade de em uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas, mediante o emprego: a) da distribuição binomial b) da aproximação de Poisson para essa distribuição Exercício - resolução Probabilidade de uma revista ser defeituosa: p = 0,1 a) Pr{2 revistas defeituosas em 10} = 2q8 = 10!/(2!8!) (0,1)2 (0,9)8 C p 10 2 = 0,1937 b) λ = Np = 10 (0,1) = 1 Pr{2 revistas defeituosas em 10} = λ2e- λ/2! = 0,1839 Distribuição normal (ou de Gauss) 1 1 / 2 ( X )2 / 2 Y e 2 na qual μ é a média, σé o desvio padrão, π=3,14159..., e= 2,712828... Distribuição normal (ou de Gauss) Usando a unidade reduzida z = (X – μ)/σ: 1 1 / 2 z 2 Y e 2 Distribuição normal (ou de Gauss) 68,27% 95,45% (-2 a +2) 99,73% Relação entre as distribuições binomial e normal Se N for grande e nem p nem q forem próximos de zero, a distribuição binomial é muito aproximada da de uma normal. Quanto maior o N, melhor será a aproximação. Exercício Determinar a probabilidade de, em 120 lances de uma moeda honesta, ocorrerem caras: a) entre 40 e 60%; b) em 5/8 ou mais desses lances. Solução a) caras entre 40% e 60% 40% de 120 = 48 60% de 120 = 72 probabilidade do evento cara p = ½ probabilidade do evento coroa q = 1 –p = ½ Número de caras é uma variável discreta Em uma distribuição normal, verifica-se a probabibilidade do número de caras estar situado entre 47,5 e 72,5 Solução (cont.) a) μ = número esperado de caras = Np = 60 σ2 = 120 (1/2) (1/2) = 30 σ = 5,48 47,5 em unidades reduzidas=(47,5-60)/5,48 z1 = -2,28 72,5 em unidades reduzidas=(72,5-60)/5,48 z2 = +2,28 Probabilidade = área (sob a curva normal entre z1= -2,28 e z2=+2,28) = 0,9774 Solução (cont.) b) 5/8 ou mais dos lances serem caras número de caras > 120 x 5/8 = 75 caras número de caras entre 74,5 e 120 74,5 em unidades reduzidas: z1 = (74,5 – 60)/5,48 = 2,65 120 em unidades reduzidas: z2 = (120 – 60)/5,48 = 10,95 Prob = 0,50 – 0,4960 = 0,004 Exercício Cada pessoa de um grupo de 500, lança uma moeda honesta 120 vezes. Quantas pessoas seria de esperar que relatassem ter obtido caras: a) entre 40 e 60% dos seus lances; b) em 5/8 ou mais desses lances. Resposta a) 489 pessoas b) 2 pessoas. Exercício Verificou-se que 2% das revistas produzidas por uma certa impressora são defeituosas. Qual é a probabilidade de, em uma remessa de 400 dessas revistas, revelarem-se defeituosas: (a) 3% ou mais; (b) 2% ou menos? Solução a) 3% ou mais (3% de 400) = 12 revistas defeituosas. Baseado na continuidade, 12 ou mais revistas significam 11,5 ou mais. X = (2% de 400) = 8 σ2 = N p q = (400) x (0,02) x (0,98) = 7,84 σ = 2,8 11,5 em unidades reduzidas: z = (11,5 – 8)/2,8 z = 1,25 Prob = 0,5 – 0,3944 = 0,1056 = 10,56% Solução (cont.) b) 2% ou menos (2% de 400) = 8 revistas 8 revistas ou menos significa 8,5 ou menos 8,5 em unidades reduzidas: z = (8,5 – 8)/2,8 = 0,18 Prob = (0,5 + 0,0714) = 0,5714 = 57,14% Exercício Uma pesquisa amostral foi conduzida com o objetivo de se estudar o índice de ausência ao trabalho em um determinado tipo de indústria. Uma AAS sem reposição de mil operários de um total de 36 mil é observada com relação ao número de faltas não justificadas em um período de 6 meses. Os resultados obtidos foram: Faltas 0 1 2 3 4 5 6 7 8 Operários 451 162 187 112 49 21 5 11 2 Qual é a estimativa de μ dada por essa amostra? Qual é o erro aceitável dentro de um intervalo de confiança de 95%? Distribuição amostral das médias Todas as amostras possíveis de tamanho N são retiradas, sem reposição, de uma população finita de tamanho Np > N. Se a media e o desvio padrão da distribuição amostral das médias foram designados por X e X e os valores correspondentes da população o forem por μ e σ, então: X X N Np N N p 1 (451 0 162 1 ... 2 8) 1,296 1000 2 (Y ) X i n 1 N Np N 2 2,397 2,397 N p 1 1000 36000 1000 0,048 36000 1 Para ter 95% de certeza: intervalo entre μ -1,96σX e μ+1,96σX isto é, (1,20;1,39) Exercício Em uma população de 60 milhões de eleitores, foi feita uma pesquisa com 2500 eleitores de acordo com um plano de amostragem aleátoria simples, sem reposição. Um determinado candidato obteve 51% dos votos. Qual é a estimativa de número total de votos desse candidato na população total, a partir da estatística amostral? Qual é o erro aceitável dentro de um intervalo de confiança de 95%? Distribuição amostral das proporções P p 0,51 N P 60000000 N 2500 pq 0,51 0,49 0,4999 P N NP N 0,499 NP 1 2500 60000000 2500 0,00998 60000000 1 P 1,96 P 0,51 1,96 0,00998 0,53 P 1,96 P 0,51 1,96 0,00998 0,49 : N 25000 (0,504;0,516) Exercício Em uma tiragem de 3000 livros, foi analisada uma amostra de 100 livros de acordo com um plano de amostragem aleátoria simples, sem reposição. Foram encontrados um certo número de livros defeituosos. Qual é a estimativa de número total de livros defeituosos na tiragem? Qual é o erro aceitável dentro de um intervalo de confiança de 95%? Intervalos de confiança % n, em nσ 68,27 1 95 1,96 95,45 2 99 2,58 99,73 3 NBR 5426 Planos de amostragem e procedimentos na inspeção por atributos