Slide 1 - Estatística Industrial - Controle Estatístico de Qualidade

Propaganda
Controle Estatístico de Qualidade
Robert Wayne Samohyl
Capítulo 2. Medidas descritivas e gráficos básicos
1
2.2 Média
A média ,
X
chamado de x-barra, a soma de uma
série de dados
.
número n de dados na soma.
Em termos matemáticos, então, podemos escrever
dividida pelo
..
n
X
X
i 1
i
n
2
EXEMPLO - MÉDIA
•
•
•
Na tabela 2.1, são colocadas 50 medidas em milímetros do
comprimento de uma peça, por sinal, uma das características
essenciais da peça.
Uma coluna de números não é nada interessante para o
engenheiro.
Por outro lado, a média das medidas da primeira coluna da
tabela é
100,324 = (102,230 + 99,070 + 99,079 + ... + 98,143)/50,
e o engenheiro agora pode saber se o produto está sendo
fabricado centrado no alvo desejado.
3
2.3 Mediana
•
Para resolver a distorção de números discrepantes e assimétricos,
utiliza-se da mediana, o número no meio dos números ordenados (ou a
média dos dois números no meio dos números), nesse caso, na tabela
2.1,
100,861 ( = (100,827 + 100,894)/2).
•
Vamos explicar melhor. Numa relação de números ordenados do maior
para o menor existe um número que separa todos os números em dois
grupos de tamanho igual, os números maiores que a mediana e os
números menores. Na lista dos 50 números, há 25 números maiores
que 100,861 e 25 números menores.
•
A diferença numérica entre a mediana e a média no exemplo da tabela
2.1
(100,861 - 100,324 = 0,537)
poderia ser considerada razoavelmente grande pelo engenheiro, se for
considerada pequena a variabilidade dos números, e significaria que a
média é realmente distorcida como medida de tendência central,
levando o engenheiro a utilizar a mediana.
4
2.4 Quartil
•
•
•
•
Os quartís são calculados, partindo da mediana. Com a
mediana os dados ordenados foram divididos em dois
subgrupos, acima e abaixo da mediana. Para cada subgrupo
encontra-se sua própria mediana e essa mediana se chama de
quartil.
Obviamente tem um quartil inferior, o primeiro quartil, e um
quartil superior, o terceiro quartil. Para completar o raciocínio,
pode chamar a mediana original de segundo quartil.
Os quartís dividem os dados ordenados em quatro grupos
distintos, cada grupo tem um quarto dos dados. No exemplo na
tabela 2.1, cada um dos quatro subgrupos tem
aproximadamente 50/4 elementos.
Os quartís são assinalados na tabela 2.1: quartil inferior de
98,572 e quartil superior de 101,810. A diferença numérica entre
os quartís superior e inferior, o desvio quartílico, pode ser
utilizada também para definir a variabilidade dos dados, assunto
detalhado na seção 2.7.
5
2.5 Medida de variabilidade –
desvio padrão
•
O desvio ao redor da média é definido como a diferença entre
um número individual e a média de todos os dados.
•
Por exemplo, a tabela 2.2 mostra 30 dados de tempo gasto pela
empresa para solucionar problemas dos clientes do momento do
.
recebimento da queixa até que a solução seja conferida. A
média de tempo gasto é 182,89 minutos, um pouco mais que 3
horas. O primeiro desvio calculado (na terceira coluna) é
-82,89 = 100 – 182,89 = desvio =
Xi  X
6
Desvio padrão (média)
•
Para resolver o problema do sinal do desvio, é preferível utilizar o
quadrado do desvio, também sem sinal, todos somados como antes e a
média deles calculada
( X i  X )2

n 1
i 1
n
SX2 = Variância =
= SQT/(n – 1)
A expressão SQT é usada na área de regressão, assunto
do capítulo 13.
desvio padrão = SX = √SX2
7
Tabela 2.2 - Minutos corridos até solucionar a
reclamação do cliente, e desvios.
Código da reclamação
Tempo gasto em minutos
Desvio ao redor da média
Módulo do desvio (valor
absoluto)
Desvio quadrado
123
100,00
-82,89
82,89
6871,36
872
216,01
33,11
33,11
1096,46
478
113,42
-69,47
69,47
4826,37
123
287,33
104,43
104,43
10906,22
301
221,47
38,58
38,58
1488,33
261
194,95
12,06
12,06
145,42
222
161,55
-21,35
21,35
455,70
182
325,89
142,99
142,99
20447,30
143
292,62
109,73
109,73
12040,82
104
266,38
83,49
83,49
6970,70
164
106,19
-76,70
76,70
5882,76
158
307,56
124,66
124,66
15541,31
169
255,49
72,59
72,59
5269,52
179
203,39
20,50
20,50
420,24
190
148,71
-34,19
34,19
1168,83
8
Tabela 2.2 - Minutos corridos até solucionar a
reclamação do cliente, e desvios.
(Continuação)
200
17,00
-165,89
165,89
27520,70
211
66,78
-116,11
116,11
13481,55
222
165,34
-17,55
17,55
308,07
232
95,20
-87,70
87,70
7690,68
243
102,95
-79,94
79,94
6390,97
253
427,43
244,53
244,53
59796,28
264
186,34
3,45
3,45
11,91
275
82,04
-100,85
100,85
10171,11
285
59,00
-123,89
123,89
15349,64
296
36,00
-146,89
146,89
21577,74
306
168,89
-14,00
14,00
195,97
317
207,95
25,05
25,05
627,58
328
217,94
35,05
35,05
1228,18
338
225,79
42,90
42,90
1840,23
349
227,19
44,30
44,30
1962,51
Soma da coluna
5486,8
0,00
2274,84
261684,46
Média
182,89
0,00
75,83
8722,82
Amplitude Total
410,43
Raiz da média
93,40
Desvio padrão
94,99
9
Erro padrão – desvio padrão das
médias
•
Um conceito muito importante para os gráficos de controle estudados na
segunda parte do livro é o desvio padrão de uma coleção de médias, e
leva o nome erro padrão. É quase igual ao desvio padrão, mas a
diferença é que é dividido pela raiz quadrada do tamanho da amostra.
•
erro padrão =
•
O desvio padrão das médias é pelo menos igual ao desvio padrão dos
dados individuais, quer dizer, quando o tamanho n da amostra é maior
que um, o desvio padrão das médias é menor.
No final, é para esperar menor variação nas médias que efetivamente
eliminam valores muito altos acima da média com os valores muito
abaixo da média.
a variação das médias diminui quando o tamanho da amostra aumentar.
Esta relação é ilustrada na figura 2.1 para o caso da distribuição
normal, assunto prioritário do próximo capítulo.
•
•
SX
SX 
n
10
Figure 2.1 - Distribuição normal e
erro padrão com tamanhos da
amostra diferentes
n = 16
n=9
n=4
n=1
11
2.6 O desvio padrão de Shewhart em controle
estatístico de qualidade
Para simplificar o calculo do desvio padrão, o
operador calcula a amplitude (valor máximo menos
o valor mínimo) de cada amostra (subgrupo) e disso
calcula a média das amplitudes
R
Shewhart desenvolveu uma tabela de
coeficientes d2, mostrados na tabela 2.3, com o
poder de transformar a média das amplitudes
em desvio padrão. Nota-se que o valor de d2
aumenta com o tamanho da amostra.
R
d2
= 187,308 / 2,326 = 80,528.
12
Tabela 2.3 - Coeficientes de Shewhart para os
gráficos de controle
Tamanho da amostra = n
n=
d2
B3
B4
D3 (R)
D4 (R) X A2)(
2
1,128
0
3,267
0
3,267
1,880
3
1,693
0
2,568
0
2,575
1,023
4
2,059
0
2,266
0
2,282
0,729
5
2,326
0
2,089
0
2,115
0,577
6
2,534
0,03
1,97
0
2,004
0,483
7
2,704
0,118
1,882
0,076
1,924
0,419
8
2,847
0,185
1,815
0,136
1,864
0,373
9
2,970
0,239
1,761
0,184
1,816
0,337
10
3,078
0,284
1,716
0,223
1,777
0,308
11
3,173
0,321
1,679
0,256
1,744
0,285
12
3,258
0,354
1,646
0,284
1,716
0,266
13
3,336
0,382
1,618
0,308
1,692
0,249
14
3,407
0,406
1,594
0,329
1,671
0,235
15
3,472
0,428
1,572
0,348
1,652
0,223
20
3,735
0,51
1,49
0,414
1,586
0,180
25
3,931
0,565
1,435
0,459
1,541
0,153
13
Observação Amostral
1
Amostra
Subgrupo
1
2
3
4
5
6
2
Média
3
4
5
subgrupo
Amplitude
subgrupo
168,890
207,950
217,940
225,790
227,190
209,552
58,300
161,550
325,890
292,620
266,380
106,190
230,526
219,700
307,560
255,490
203,390
148,710
17,000
186,430
290,560
66,780
165,340
95,200
102,950
427,430
171,540
360,650
186,340
82,040
59,000
36,000
168,890
106,454
150,340
207,950
217,940
225,790
227,190
182,890
212,352
44,300
Média das
médias =
182,89
Amplitude
média =
187,308
Desvio padrão
Shewhart =
80,528
Tabela 2.4 - Minutos corridos até solucionar a reclamação do cliente,
dados arranjados em 6 subgrupos amostrais com 5 observações em cada
grupo.
14
2.7 Desvio quartílico
• Outra medida de variabilidade é o desvio
quartílico, a diferença entre o quartil inferior e o
quartil superior já estudado anteriormente na
seção sobre a mediana.
• Voltando para a tabela 2.1 sobre o comprimento
em mm, pode ser visto que o desvio quartílico é
igual a
3,238 = 101,810 – 98,572.
15
2.8 Gráficos Básicos – Caixa das
Medianas e Histograma
• Sem dúvida, a melhor maneira de analisar uma
série de dados é graficamente.
• A tentativa de ver padrões e tendências em uma
relação de dados escritos em uma tabela
certamente resultará em confusão
especialmente quando o número de dados é
grande.
16
Figura 2.2 - Tempo gasto em resolver problemas
dos clientes
450,00
400,00
350,00
300,00
250,00
200,00
150,00
100,00
50,00
0,00
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
Dias do mes
17
Figura 2.3 - Caixa de medianas para o tempo
gasto nas reclamações na tabela 2.2
Figura 2. Caixa de medianas dos dados de tempo gasto na tabela 2
450,00
400,00
350,00
300,00
250,00
200,00
150,00
100,00
50,00
0,00
Um gráfico que reúne as informações da mediana e dos quartis em uma
maneira fácil para entender é a caixa das medianas, figura 2.3.
18
Figura 2.3 - Caixa de medianas para o tempo de
máquina funcionando e parado
Caixa de medianas - tempo funcionando e tempo parado - 3 meses
20
Horas
15
10
5
0
tempo func 1
tempo parado 1
tempo func 2
tempo parado 2
tempo func 3
tempo parado 3
19
Histograma
• Finalmente apresenta-se o histograma, um
gráfico que tem todas as boas características da
caixa de medianas, mas exibe muito mais
informação sobre a distribuição dos dados.
• Foram amostrados em um laticínio 150 sacos
de leite contendo por lei 1 litro do alimento. O
histograma é um retrato dos dados na tabela
2.5, logo em seguida.
20
Figura 2.4 - Histograma de medidas
de sacos de leite de um litro.
Histograma
30
120,00%
25
100,00%
20
80,00%
15
60,00%
10
40,00%
5
20,00%
0
0,00%
21
Tabela 2.5 - Freqüências de medidas
em ml de sacos de leite de um litro.
Classes até
Freqüência
Cumulativa %
856,44
1
0,67%
878,61
1
1,33%
900,77
1
2,00%
922,94
3
4,00%
945,10
19
16,67%
967,27
19
29,33%
989,43
25
46,00%
1011,60
21
60,00%
1033,77
23
75,33%
1055,93
19
88,00%
1078,10
10
94,67%
1100,26
4
97,33%
maior
4
100,00%
22
Download