Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 2. Medidas descritivas e gráficos básicos 1 2.2 Média A média , X chamado de x-barra, a soma de uma série de dados . número n de dados na soma. Em termos matemáticos, então, podemos escrever dividida pelo .. n X X i 1 i n 2 EXEMPLO - MÉDIA • • • Na tabela 2.1, são colocadas 50 medidas em milímetros do comprimento de uma peça, por sinal, uma das características essenciais da peça. Uma coluna de números não é nada interessante para o engenheiro. Por outro lado, a média das medidas da primeira coluna da tabela é 100,324 = (102,230 + 99,070 + 99,079 + ... + 98,143)/50, e o engenheiro agora pode saber se o produto está sendo fabricado centrado no alvo desejado. 3 2.3 Mediana • Para resolver a distorção de números discrepantes e assimétricos, utiliza-se da mediana, o número no meio dos números ordenados (ou a média dos dois números no meio dos números), nesse caso, na tabela 2.1, 100,861 ( = (100,827 + 100,894)/2). • Vamos explicar melhor. Numa relação de números ordenados do maior para o menor existe um número que separa todos os números em dois grupos de tamanho igual, os números maiores que a mediana e os números menores. Na lista dos 50 números, há 25 números maiores que 100,861 e 25 números menores. • A diferença numérica entre a mediana e a média no exemplo da tabela 2.1 (100,861 - 100,324 = 0,537) poderia ser considerada razoavelmente grande pelo engenheiro, se for considerada pequena a variabilidade dos números, e significaria que a média é realmente distorcida como medida de tendência central, levando o engenheiro a utilizar a mediana. 4 2.4 Quartil • • • • Os quartís são calculados, partindo da mediana. Com a mediana os dados ordenados foram divididos em dois subgrupos, acima e abaixo da mediana. Para cada subgrupo encontra-se sua própria mediana e essa mediana se chama de quartil. Obviamente tem um quartil inferior, o primeiro quartil, e um quartil superior, o terceiro quartil. Para completar o raciocínio, pode chamar a mediana original de segundo quartil. Os quartís dividem os dados ordenados em quatro grupos distintos, cada grupo tem um quarto dos dados. No exemplo na tabela 2.1, cada um dos quatro subgrupos tem aproximadamente 50/4 elementos. Os quartís são assinalados na tabela 2.1: quartil inferior de 98,572 e quartil superior de 101,810. A diferença numérica entre os quartís superior e inferior, o desvio quartílico, pode ser utilizada também para definir a variabilidade dos dados, assunto detalhado na seção 2.7. 5 2.5 Medida de variabilidade – desvio padrão • O desvio ao redor da média é definido como a diferença entre um número individual e a média de todos os dados. • Por exemplo, a tabela 2.2 mostra 30 dados de tempo gasto pela empresa para solucionar problemas dos clientes do momento do . recebimento da queixa até que a solução seja conferida. A média de tempo gasto é 182,89 minutos, um pouco mais que 3 horas. O primeiro desvio calculado (na terceira coluna) é -82,89 = 100 – 182,89 = desvio = Xi X 6 Desvio padrão (média) • Para resolver o problema do sinal do desvio, é preferível utilizar o quadrado do desvio, também sem sinal, todos somados como antes e a média deles calculada ( X i X )2 n 1 i 1 n SX2 = Variância = = SQT/(n – 1) A expressão SQT é usada na área de regressão, assunto do capítulo 13. desvio padrão = SX = √SX2 7 Tabela 2.2 - Minutos corridos até solucionar a reclamação do cliente, e desvios. Código da reclamação Tempo gasto em minutos Desvio ao redor da média Módulo do desvio (valor absoluto) Desvio quadrado 123 100,00 -82,89 82,89 6871,36 872 216,01 33,11 33,11 1096,46 478 113,42 -69,47 69,47 4826,37 123 287,33 104,43 104,43 10906,22 301 221,47 38,58 38,58 1488,33 261 194,95 12,06 12,06 145,42 222 161,55 -21,35 21,35 455,70 182 325,89 142,99 142,99 20447,30 143 292,62 109,73 109,73 12040,82 104 266,38 83,49 83,49 6970,70 164 106,19 -76,70 76,70 5882,76 158 307,56 124,66 124,66 15541,31 169 255,49 72,59 72,59 5269,52 179 203,39 20,50 20,50 420,24 190 148,71 -34,19 34,19 1168,83 8 Tabela 2.2 - Minutos corridos até solucionar a reclamação do cliente, e desvios. (Continuação) 200 17,00 -165,89 165,89 27520,70 211 66,78 -116,11 116,11 13481,55 222 165,34 -17,55 17,55 308,07 232 95,20 -87,70 87,70 7690,68 243 102,95 -79,94 79,94 6390,97 253 427,43 244,53 244,53 59796,28 264 186,34 3,45 3,45 11,91 275 82,04 -100,85 100,85 10171,11 285 59,00 -123,89 123,89 15349,64 296 36,00 -146,89 146,89 21577,74 306 168,89 -14,00 14,00 195,97 317 207,95 25,05 25,05 627,58 328 217,94 35,05 35,05 1228,18 338 225,79 42,90 42,90 1840,23 349 227,19 44,30 44,30 1962,51 Soma da coluna 5486,8 0,00 2274,84 261684,46 Média 182,89 0,00 75,83 8722,82 Amplitude Total 410,43 Raiz da média 93,40 Desvio padrão 94,99 9 Erro padrão – desvio padrão das médias • Um conceito muito importante para os gráficos de controle estudados na segunda parte do livro é o desvio padrão de uma coleção de médias, e leva o nome erro padrão. É quase igual ao desvio padrão, mas a diferença é que é dividido pela raiz quadrada do tamanho da amostra. • erro padrão = • O desvio padrão das médias é pelo menos igual ao desvio padrão dos dados individuais, quer dizer, quando o tamanho n da amostra é maior que um, o desvio padrão das médias é menor. No final, é para esperar menor variação nas médias que efetivamente eliminam valores muito altos acima da média com os valores muito abaixo da média. a variação das médias diminui quando o tamanho da amostra aumentar. Esta relação é ilustrada na figura 2.1 para o caso da distribuição normal, assunto prioritário do próximo capítulo. • • SX SX n 10 Figure 2.1 - Distribuição normal e erro padrão com tamanhos da amostra diferentes n = 16 n=9 n=4 n=1 11 2.6 O desvio padrão de Shewhart em controle estatístico de qualidade Para simplificar o calculo do desvio padrão, o operador calcula a amplitude (valor máximo menos o valor mínimo) de cada amostra (subgrupo) e disso calcula a média das amplitudes R Shewhart desenvolveu uma tabela de coeficientes d2, mostrados na tabela 2.3, com o poder de transformar a média das amplitudes em desvio padrão. Nota-se que o valor de d2 aumenta com o tamanho da amostra. R d2 = 187,308 / 2,326 = 80,528. 12 Tabela 2.3 - Coeficientes de Shewhart para os gráficos de controle Tamanho da amostra = n n= d2 B3 B4 D3 (R) D4 (R) X A2)( 2 1,128 0 3,267 0 3,267 1,880 3 1,693 0 2,568 0 2,575 1,023 4 2,059 0 2,266 0 2,282 0,729 5 2,326 0 2,089 0 2,115 0,577 6 2,534 0,03 1,97 0 2,004 0,483 7 2,704 0,118 1,882 0,076 1,924 0,419 8 2,847 0,185 1,815 0,136 1,864 0,373 9 2,970 0,239 1,761 0,184 1,816 0,337 10 3,078 0,284 1,716 0,223 1,777 0,308 11 3,173 0,321 1,679 0,256 1,744 0,285 12 3,258 0,354 1,646 0,284 1,716 0,266 13 3,336 0,382 1,618 0,308 1,692 0,249 14 3,407 0,406 1,594 0,329 1,671 0,235 15 3,472 0,428 1,572 0,348 1,652 0,223 20 3,735 0,51 1,49 0,414 1,586 0,180 25 3,931 0,565 1,435 0,459 1,541 0,153 13 Observação Amostral 1 Amostra Subgrupo 1 2 3 4 5 6 2 Média 3 4 5 subgrupo Amplitude subgrupo 168,890 207,950 217,940 225,790 227,190 209,552 58,300 161,550 325,890 292,620 266,380 106,190 230,526 219,700 307,560 255,490 203,390 148,710 17,000 186,430 290,560 66,780 165,340 95,200 102,950 427,430 171,540 360,650 186,340 82,040 59,000 36,000 168,890 106,454 150,340 207,950 217,940 225,790 227,190 182,890 212,352 44,300 Média das médias = 182,89 Amplitude média = 187,308 Desvio padrão Shewhart = 80,528 Tabela 2.4 - Minutos corridos até solucionar a reclamação do cliente, dados arranjados em 6 subgrupos amostrais com 5 observações em cada grupo. 14 2.7 Desvio quartílico • Outra medida de variabilidade é o desvio quartílico, a diferença entre o quartil inferior e o quartil superior já estudado anteriormente na seção sobre a mediana. • Voltando para a tabela 2.1 sobre o comprimento em mm, pode ser visto que o desvio quartílico é igual a 3,238 = 101,810 – 98,572. 15 2.8 Gráficos Básicos – Caixa das Medianas e Histograma • Sem dúvida, a melhor maneira de analisar uma série de dados é graficamente. • A tentativa de ver padrões e tendências em uma relação de dados escritos em uma tabela certamente resultará em confusão especialmente quando o número de dados é grande. 16 Figura 2.2 - Tempo gasto em resolver problemas dos clientes 450,00 400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Dias do mes 17 Figura 2.3 - Caixa de medianas para o tempo gasto nas reclamações na tabela 2.2 Figura 2. Caixa de medianas dos dados de tempo gasto na tabela 2 450,00 400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 Um gráfico que reúne as informações da mediana e dos quartis em uma maneira fácil para entender é a caixa das medianas, figura 2.3. 18 Figura 2.3 - Caixa de medianas para o tempo de máquina funcionando e parado Caixa de medianas - tempo funcionando e tempo parado - 3 meses 20 Horas 15 10 5 0 tempo func 1 tempo parado 1 tempo func 2 tempo parado 2 tempo func 3 tempo parado 3 19 Histograma • Finalmente apresenta-se o histograma, um gráfico que tem todas as boas características da caixa de medianas, mas exibe muito mais informação sobre a distribuição dos dados. • Foram amostrados em um laticínio 150 sacos de leite contendo por lei 1 litro do alimento. O histograma é um retrato dos dados na tabela 2.5, logo em seguida. 20 Figura 2.4 - Histograma de medidas de sacos de leite de um litro. Histograma 30 120,00% 25 100,00% 20 80,00% 15 60,00% 10 40,00% 5 20,00% 0 0,00% 21 Tabela 2.5 - Freqüências de medidas em ml de sacos de leite de um litro. Classes até Freqüência Cumulativa % 856,44 1 0,67% 878,61 1 1,33% 900,77 1 2,00% 922,94 3 4,00% 945,10 19 16,67% 967,27 19 29,33% 989,43 25 46,00% 1011,60 21 60,00% 1033,77 23 75,33% 1055,93 19 88,00% 1078,10 10 94,67% 1100,26 4 97,33% maior 4 100,00% 22