Document

Propaganda
XV Encontro Nacional sobre Metodologias e Gestão de
Laboratórios da EMBRAPA – XV MET
Embrapa Clima Temperado – PELOTAS - RS
Desenvolvimento e operação de
programas de ensaio de proficiência
Gilberto Batista de Souza
Embrapa Pecuária Sudeste
[email protected]
OUTUBRO / 2010
ESCOPO DO CURSO
 CONCEITOS DE METROLOGIA QUIMICA
 CONCEITOS DE TERMOS ESTATISTICOS
 ESTATÍSTICA APLICADA NO TRATAMENTO DE DADOS
 TESTES DE SIGNIFICÂNCIA
 TESTES ESTATISTICOS PARA DETECÃO DE OUTLIERS
 PROTOCOLO INTERNACIONAL HARMONIZADO PARA ENSAIO DE
PROFICIÊNCIA EM LABORATÓRIOS ANALÍTICOS (QUÍMICOS)
Conceitos básicos de metrologia
Incerteza das medições: Parâmetro, associado ao resultado de uma
MEDIÇÃO, que caracteriza a dispersão dos valores que podem ser
fundamentadamente atribuídos a um mensurando (VIM, 2007).
 Caracteriza a faixa de valores, dentro da qual o valor real deve se situar,
com um nível de confiança especificado.
Incerteza da medição não implica em dúvida quanto a validade de uma
medição; ao contrário, o conhecimento da incerteza implica numa maior
confiança na validade do resultado de uma medição.
Possíveis fontes de Incerteza
 Má definição do mensurando; Amostragem não-representativa;
 Erro pessoal na leitura de instrumentos analógicos; Resolução do instrumento;
 Valores inexatos dos padrões de medição e materiais de referência;
 Ajuste de curva; interpolação; etc
Valor verdadeiro: valor atribuído a uma grandeza específica e aceito, às
vezes por convenção, como tendo uma incerteza apropriada para uma
dada finalidade (EURACHEM/CITAC, 1998).
O valor verdadeiro convencional pode ser denominado como:
 valor designado,
 melhor estimativa do valor,
 valor convencional ou valor de referência.
Frequentemente um grande número de resultados das medições de uma
grandeza é utilizado para estabelecer um valor verdadeiro convencional.
Precisão: está relacionada com a concordância das medidas entre si, ou
seja, quanto maior a dispersão dos valores menor a precisão (relacionada
com a repetitividade e com a reprodutibilidade).
 Quanto menor a dispersão dos valores maior a precisão
 Quanto menor a amplitude maior a precisão
7
6
5
4
3
1
2
3
4
5
6
7
8
9
10
Repetitividade (r)
É um tipo de precisão referente a medições feitas sob condições de repetitividade,
isto é:
 mesmo método;
 mesmo material;
 mesmo operador;
 mesmo laboratório;
 repetições em curto período de tempo.
É calculada a partir do desvio padrão dos resultados dos ensaios sob condição
de repetitividade - recomenda-se 7 ou mais repetições para o cálculo do desvio
padrão para cada concentração.
É aconselhável calcular o limite de repetitividade “r” que capacita o analista a
decidir se a diferença entre análises duplicatas de uma amostra, determinada sob
condições de repetitividade, é significante.
Repetitividade (r)
O limite de repetitividade (r) para um nível de significância de 95% e 6 graus
de liberdade (N = n-1), é dado por:
r  2,8  sr
sr = desvio padrão de repetitividade.
Reprodutibilidade (R)
É um conceito de precisão referente a medições feitas sob condições de
reprodutibilidade, isto é:
mesmo método;
operadores diferentes;
laboratórios diferentes;
equipamentos diferentes;
longo período de tempo.
Embora a reprodutibilidade não seja um componente de validação de método
executado por um único laboratório, é considerada importante quando um
laboratório busca a verificação do desempenho dos seus métodos em relação aos
dados de validação obtidos por meio de comparação interlaboratorial.
Reprodutibilidade (R)
A partir do desvio padrão obtido sob condições de reprodutibilidade é possível
calcular o limite de reprodutibilidade “R”, o qual permite ao analista decidir se a
diferença entre os valores da duplicata das amostras analisadas sob condições de
reprodutibilidade é significante.
O limite de repetitividade (r) para um nível de significância de 95%, é dado por:
R  2,8 S R2
S R2 = variância de reprodutibilidade associada aos resultados considerados, para
cada laboratório.
O cálculo da reprodutibilidade é efetuado para cada nível, separadamente, após
eliminação dos valores dispersos.
Ex. para calcular r e R
Labs
1
2
3
4
5
6
7
8
9
10
11
12
Somatória
A
0,27
0,301
0,285
0,292
0,276
0,282
0,277
0,246
0,28
0,3
0,301
0,272
B
C
0,28
0,3
0,288
0,279
0,27
0,284
0,279
0,256
0,278
0,307
0,29
0,277
0,28
0,302
0,295
0,287
0,281
0,285
0,28
0,249
0,284
0,311
0,284
0,269
D
0,27
0,304
0,282
0,316
0,27
0,287
0,273
0,241
0,281
0,309
0,308
0,27
E
0,28
0,304
0,29
0,281
0,28
0,286
0,278
0,245
0,275
0,307
0,293
0,278
F
0,28
0,301
0,288
0,291
0,277
0,285
0,28
0,243
0,277
0,306
0,284
0,27
Média
0,2767
0,3020
0,2880
0,2910
0,2757
0,2848
0,2778
0,2467
0,2792
0,3067
0,2933
0,2727
s
0,0052
0,0017
0,0044
0,0133
0,0048
0,0017
0,0026
0,0053
0,0032
0,0037
0,0096
0,0039
s2
0,0000267
0,0000028
0,0000196
0,0001772
0,0000227
0,0000030
0,0000070
0,0000283
0,0000102
0,0000139
0,0000919
0,0000151
0,0004181
Anova: fator único
RESUMO
Lab
1
2
3
5
6
7
8
9
10
12
Contagem
6
6
6
6
6
6
6
6
6
6
ANOVA
Fonte da variação
SQ
Entre grupos
0,014834
Dentro dos grupos 0,000745
Total
0,015579
Soma
1,66
1,812
1,728
1,654
1,709
1,667
1,48
1,675
1,84
1,636
gl
Média
0,2766667
0,302
0,288
0,2756667
0,2848333
0,2778333
0,2466667
0,2791667
0,3066667
0,2726667
Variância
0,0000267
0,0000028
0,0000196
0,0000227
0,0000030
0,0000070
0,0000283
0,0000102
0,0000139
0,0000151
MQ
F
valor-P
F crítico
9 0,0016482 110,59283 7,56E-30 2,073351
50 0,0000149
59
2
sentre

0,001648  0,0000149
 0,00027218
6
r  2,8 0,0000149  0,011
R  2,8 0,0000149  0,00027218  0,047
Q1: Um laboratório obtém 2 replicatas: 0,273 e 0,279%; a diferença de 0,006%
entre as duas replicatas é aceitável, pois r = 0,011, portanto os dois resultados
são válidos.
Q2: Um laboratório obtém e replicatas : 0,269 e 0,299%; a diferença de 0,017%
entre as duas replicatas é inaceitável (r = 0,011); um dos valores deve ser
rejeitado.
Q3: Dois labs.: um obtém 0,269% e o outro 0,299%; a diferença de 0,030% entre
os dois resultados é menor que o valor de R = 0,047; portanto os dois valores
são aceitos.
Exatidão: Grau de concordância entre o resultado de uma medição e um
valor verdadeiro do mensurando (VIM, 2007).
Está relacionada com o seu erro absoluto, isto é, com a proximidade do valor
medido em relação ao valor verdadeiro da grandeza.
 Avaliada por meio da comparação entre o valor medido e o valor certificado
de um CRM.
 Comparando com resultados obtidos por intermédio da utilização de um
método já existente e de exatidão conhecida.
 Comparando os resultados obtidos por intermédio da adição padrão à uma
matriz.
EXATIDÃO E TENDÊNCIA (bias)
Exatidão do método é definida como sendo a concordância entre o resultado de
um ensaio e o valor de referência aceito como convencionalmente verdadeiro.
Os processos normalmente utilizados para avaliar a exatidão de um método são,
entre outros: uso de materiais de referência, participação em comparações
interlaboratoriais e realização de ensaios de recuperação.
A exatidão, quando aplicada a uma série de resultados de ensaio, implica numa
combinação de componentes de erros aleatórios e sistemáticos.
Estudante
Resultado (mL)
Comentário
A
10,08
10,11
10,09
10,10
10,12
9,88
10,14
10,02
9,80
10,21
10,19
9,79
9,69
10,05
9,78
10,04
9,98
10,02
9,97
10,04
Preciso e inexato
B
C
D
Exato e impreciso
Impreciso e inexato
Preciso e exato
EXATIDÃO E TENDÊNCIA (bias)
A tendência é algumas vezes chamada de recuperação de um método analítico,
é o erro sistemático desse sistema de medição.
Além da avaliação da tendência, é importante estimar a incerteza de medida
associada à tendência e incluir este componente na estimativa global da incerteza
de medição.
A tendência de um método analítico é geralmente determinada pelo estudo de
materiais de referência ou por adição padrão (fortificação).
A tendência pode ser expressa como uma recuperação analítica:
 C  C2 
Re cuperação(%)   1
  100
 C3 
C1 = concentração determinada na
amostra fortificada;
C2 = concentração determinada na
amostra não fortificada e
C3 = concentração adicionada.
Recuperação: É a fração do analito adicionado na amostra teste (fortificada)
previamente a análise. Geralmente é realizada com no mínimo 6 repetições do
branco da matriz ou amostra não fortificada e amostra fortificada com o analito a
diferentes concentrações.
EXATIDÃO E TENDÊNCIA (bias)
Na avaliação da exatidão utilizando um material de referência certificado (MRC):
os valores obtidos pelo laboratório, média e o desvio padrão de uma série de
ensaios em replicatas, devem ser comparados com os valores certificados do
material de referência.
Para esta comparação podem ser utilizados diversos critérios de decisão, entre os
quais: erro relativo; teste de hipóteses; índice z, e erro normalizado.
Erro relativo (ER):
 X medido  X verdadeiro 
ER

 Erro relativo (ER):

  100 ; X medido = média do
X verdadeiro


valor medido experimentalmente e X verdadeiro = valor aceito como verdadeiro
(valor certificado do MRC).
Teste de hipóteses

Teste de hipóteses: teste F para verificar se as variâncias das amostras
podem ser consideradas iguais, seguido do teste t de Student (ver INMETRO:
DOQ-CGCRE-008 – Revisão 02 – JUNHO/2007).
EXATIDÃO E TENDÊNCIA (bias)
Índice z: o índice z é também um modo de avaliar o desempenho do laboratório,
X
 X verdadeiro 
utilizando MRC: z   medido
 ; X medido = média do valor medido
s


experimentalmente; X verdadeiro = valor aceito como verdadeiro (valor certificado do
MRC) e s = desvio padrão (incerteza) do MRC.

A avaliação segue o seguinte critério: se z  2 o resultado é satisfatório;
2  z  3 o resultados é questionável e z  3 o resultados é insatisfatório.
Erro normalizado En: Caso o laboratório calcule a incerteza do seu resultado ( U lab ), o
valor verdadeiro ( X Verdadeiro ) deve estar dentro do intervalo X lab ± incerteza
expandida.
En 
 X lab  X verd . 
U
2
lab
U
2
ref
En  1 o resultado pode ser considerado adequado
Linearidade
Para métodos quantitativos é determinada pela medição de amostras com
concentrações de analito abrangendo a faixa reivindicada do método.
Linearidade é a habilidade de um método analítico em produzir resultados que sejam
diretamente proporcionais à concentração do analito em amostras, em uma dada faixa
de concentração.
Os resultados são usados para obter uma reta por regressão com relação ao cálculo
de analito, usando-se o método dos mínimos quadrados.
É conveniente que um método seja linear ao longo de uma faixa específica, mas este
não é um requisito absoluto. Quando a linearidade for inatingível para um
procedimento específico, deve ser determinado um algoritmo adequado para
cálculos.
Linearidade
A equação da reta que relaciona as duas variáveis é:
y = resposta medida ou sinal analítico (absorbância, altura ou área do pico, etc.);
x = concentração;
a = interseção com o eixo y, quando x = 0;
b = inclinação da curva analítica = sensibilidade (S).
O método é mais sensível quando pequenas variações de concentração
resultam em maior variação na resposta, ou seja, maior inclinação (b).
Em geral, serão necessários vários níveis de concentração, no mínimo cinco, para
construir a curva analítica. O número de replicatas em cada nível de concentração
deve ser o mais próximo possível daquele empregado na rotina do laboratório.
Linearidade
PERGUNTAS:
1) É linear o gráfico de calibração? Se for uma curva, qual a forma?
2) Sabendo-se que um dos pontos da reta de calibração está sujeito a erros, qual é a
melhor reta que passa pelos pontos?
3) Supondo que a calibração é realmente linear, quais são os erros estimados e o
limites de confiança para a inclinação e interseção na origem da reta?
4) Quando o gráfico de calibração é utilizado para análises de amostras, quais são
os erros e os limites de confiança para a concentração determinada?
5) Qual o limite de detecção do método? Isto é, qual a menor concentração do
analito que se pode detectar com um nível de confiança predeterminado?
Linearidade
A linearidade de um método pode ser observada pelo gráfico dos resultados dos
ensaios em função da concentração do analito e verificada a partir da equação da
regressão linear, determinada pelo método dos mínimos quadrados. Para tal, deve
ser verificada a ausência de valores discrepantes para cada nível de concentração e
a homocedasticidade dos dados, antes de fazer a regressão linear.
 A verificação da ausência de valores discrepantes pode ser feita pelo teste de
Grubbs
 A homocedasticidade, isto é, homogeneidade da variância dos resíduos pelo
teste de Cochran.

xi  x 
G
s
Grubbs
C
2
s máx
p
2
s
i
i 1
Cochran
TABELA TESTE DE GRUBBS
N
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Critical Z
1.15
1.48
1.71
1.89
2.02
2.13
2.21
2.29
2.34
2.41
2.46
2.51
2.55
2.59
2.62
2.65
2.68
2.71
2.73
2.76
2.78
2.80
2.82
2.84
N
27
28
29
30
31
32
33
34
35
36
37
38
39
40
50
60
70
80
90
100
110
120
130
140
Critical Z
2.86
2.88
2.89
2.91
2.92
2.94
2.95
2.97
2.98
2.99
3.00
3.01
3.03
3.04
3.13
3.20
3.26
3.31
3.35
3.38
3.42
3.44
3.47
3.49
TABELA TESTE DE COCHRAN
TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)
p
n=2
n=3
n=4
n=5
2
0,975
0,939
0,906
3
0,967
0,871
0,798
0,746
4
0,906
0,768
0,684
0,626
5
0,841
0,684
0,598
0,544
6
0,781
0,616
0,532
0,48
7
0,727
0,561
0,48
0,431
8
0,68
0,516
0,438
0,391
9
0,638
0,478
0,403
0,358
10
0,602
0,445
0,373
0,331
11
0,57
0,417
0,348
0,308
12
0,541
0,392
0,326
0,288
13
0,515
0,371
0,307
0,271
14
0,492
0,352
0,291
0,255
15
0,471
0,335
0,276
0,242
16
0,452
0,319
0,262
0,23
17
0,434
0,305
0,25
0,219
18
0,418
0,293
0,24
0,209
19
0,403
0,281
0,23
0,2
20
0,389
0,27
0,22
0,192
Linearidade
Calcular o modelo através da regressão linear, os resíduos e o coeficiente de
correlação linear (r).
O coeficiente de correlação linear (r) é freqüentemente usado para indicar o quanto
pode ser considerada adequada a reta como modelo matemático.
Um valor maior que 0,90 é, usualmente, requerido (coeficientes de correlação r e
determinação R2).
Coeficiente de correlação (r):
Coeficiente que indica a força da associação entre quaisquer duas variáveis
métricas. O sinal (+ ou -) indica a direção da relação.
O valor pode variar de -1 a +1, em que +1 indica uma perfeita relação positiva, 0
(zero) indica relação nenhuma e -1 uma perfeita relação negativa ou reversa
(quando uma variável se torna maior a outra fica menor).
Linearidade
Coeficiente de determinação (R2):
Medida da proporção da variância da variável dependente em torno de sua media
que é explicada pelas variáveis independentes.
O coeficiente pode variar entre 0 e 1. Se o modelo de regressão é propriamente
aplicado e estimado, pode-se assumir que quanto maior o valor de R2, maior o poder
de explicação da equação de regressão e, portanto, melhor a previsão da variável
dependente.
Erros
Qualquer resultado de uma medida experimental está associada a um erro, ou
seja, a uma incerteza.
Esta incerteza é considerada a diferença entre o valor medido e o valor verdadeiro.
Os erros podem ser classificados em três categorias:
grosseiros, aleatórios (randômicos) ou indeterminados e sistemáticos ou
determinados.
Erros grosseiros são facilmente reconhecidos. Eles são erros tão sérios que
não deixam alternativas a não ser refazer todo o experimento.
Exemplos incluem a quebra do equipamento, contaminação de reagentes,
erros na adição de alíquotas, etc.
Enganos na leitura de uma escala
Erro de cálculos nas operações
Erros na adição de alíquotas
Ocorrem em geral pela falta de cuidado ou
inabilidade de fazer uma determinada análise
Erros Aleatórios:
Não possuem valor definido, é resultante de uma medição menos a média de um
número infinito de medições sob condições de repetitividade e flutuam de maneira
aleatória (são bidirecionais).
ErroAleató rio  xi  X
• São irregulares e resultam em variabilidade afetando o desvio padrão.
• Não tem causas assimiláveis,
• Podem ser submetidos a tratamento estatístico para permitir saber qual o valor
mais provável e também a precisão de uma série de medidas.
ERROS ALEATÓRIOS
Submetidos a tratamento estatístico
PERMITIR
 Estimativa do valor mais provável
 Precisão de uma série de medidas.
7
6
ERRO ALEATÓRIO
5
4
PRECISÃO
3
1
2
3
4
5
6
7
8
9
10
Erros Sistemáticos
São inúmeros e foram agregados em quatro grupos:
CLASSIFICAÇÃO
 Erros de métodos
 Erros operacionais
 Erros pessoais
 Erros instrumentais
São unilaterais resultando um desvio constante nos resultados, tem causas
assimiláveis e estão relacionados com a exatidão, sendo geralmente
caracterizados por conservarem o mesmo valor em medições sucessivas.
 Afetam a grandeza do resultado
 Afetam a média de um conjunto de resultados
 Afetam a exatidão
São erros que resultam de causas constantes que alteram de
modo uniforme os resultados das medidas
EXATIDÃO
ERRO SISTEMÁTICO
7
6
5
4
3
1
2
3
4
5
6
7
8
9
10
São erros que resultam de causas constantes que alteram de
modo uniforme os resultados das medidas
Cálculos dos erros:
Os erros podem ser analisados de forma rápida, através das seguintes equações:
Erro    xi
   xi 
% Erro  
 100

  
 = valor verdadeiro, p.e. resultado de um material de referência;
xi = resultado de uma medida experimental.
CONCEITO DE TERMOS ESTATÍSTICOS
Elemento: a unidade considerada para um estudo estatístico é
denominada de elemento. Exemplo: um objeto; um individuo, uma peça.
População: conjunto de elementos que tem pelo menos uma característica
em comum. Esta característica deve delimitar corretamente quais são os
elementos da população que podem ser animados ou inanimados.
Exemplos: um lote de peças; um lote de um polímero; população do estado
de São Paulo.
Amostra: subconjunto de elementos de uma população. Este subconjunto
deve ter dimensão menor que o da população e seus elementos devem ser
representativos da população.
Graus de liberdade (N):
é um conceito ligado ao número de dados disponíveis (livres) para o
cálculo da estatística. Por exemplo, ao estimarmos a média populacional
() com a média amostral ( x ) perdemos um grau de liberdade, assim a
estatística t-student terá n-1 graus de liberdade.
Distribuição normal:
Uma variável quantitativa segue uma distribuição normal, se sua distribuição
de freqüências tem o formato similar ao de um sino (curva de Gauss), ou
seja, a maioria dos valores se concentra em torno da média e, a medida que
se afasta do centro as observações são cada vez mais raras. Essa
distribuição é considerada simétrica. Muitas variáveis têm essa distribuição,
tais como altura das pessoas adultas do sexo masculino, coeficiente de
inteligência, etc.
Distribuição normal
Histograma:
É um gráfico de colunas justapostas que representa uma distribuição de freqüência
para dados contínuos ou uma variável discreta quando esta apresentar muitos
valores distintos. No eixo horizontal são dispostos os limites das classes segundo
as quais os dados foram agrupados enquanto que o eixo vertical corresponde às
freqüências absolutas ou relativas das mesmas.
Frequencia (%)
40
M
Med
Mo
92,20
92,24
92,20
30
20
10
0
87
88
89
90
91
92
MS (%)
93
94
95
96
Medidas de assimetria:
A medida de assimetria é um indicador da forma da distribuição dos dados.
Ao construir uma distribuição de freqüências e/ou um histograma, está-se
buscando, também, identificar visualmente, a forma da distribuição dos dados
que é ou não confirmada pelo coeficiente de assimetria de Pearson (As) definido
como:
para dados populacionais
  Mo
AS 

para dados amostrais
X  Mo
AS 
s
Simétrica: média = mediana = moda ou As = 0
assimétrica negativa: média ≤ mediana ≤ moda ou As < 0
O lado mais longo do polígono de freqüência (cauda da
distribuição) está à esquerda do centro.
assimétrica positiva : moda ≤ mediana ≤ média ou As > 0
O lado mais longo do polígono de freqüência está à direita do centro.
Etapas para construção de tabelas de freqüências e histogramas:
- Coletar n amostras entre 30 < n < 200.
- Encontrar o valor máximo (Vmax) e mínimo (Vmin) dos dados em estudo.
- Calcular a amplitude:
R  Vmax  Vmin
- Determinar o numero de classes de freqüência:
- Calcular a amplitude dos intervalos das classes:
k n
R
h
k
outra forma de calcular é dividir por 1, 2 ou 5 de forma a obter-se de 5 a
20 intervalos de classes, de igual amplitude.
- Definir o limite superior e inferior de cada classe e seu ponto médio.
- Construir uma tabela de freqüência.
- Traçar o diagrama.
Exemplo: Foi realizado um levantamento de três meses dos resultados das
análises de proteína (%) em amostra de farelo de trigo. Com os dados,
construir um histograma para as análises.
16,4
16,4
15,8
17,7
17,6
17,7
17,3
16,7
17,4
16,8
16,9
17,0
16,9
16,9
16,5
16,7
16,6
16,6
16,6
16,4
16,7
16,6
16,8
16,0
16,9
16,8
17,4
17,0
16,9
16,4
16,5
16,9
16,6
16,6
16,7
16,8
16,6
16,5
17,0
17,0
16,8
16,8
16,8
16,6
17,0
16,9
17,1
16,4
16,8
16,7
17,1
16,7
17,0
16,7
16,2
16,8
17,2
17,5
16,7
16,9
17,0
16,6
16,8
17,2
17,0
17,0
16,8
16,9
16,4
16,6
16,6
16,9
16,8
17,1
16,6
16,9
16,8
17,0
16,0
16,6
- Tamanho da amostra:
- Amplitude:
n  80
R  17,7  15,8  1,9
R  Vmax  Vmin
- Classes de freqüência:
k n
- Amplitude das classes: h 
R
k
k  80
h
k  8,94
1,9
 0,212  0,2
8,94
- Tabela de freqüência:
Limites das classes
Código da
classe
Freqüência
(contagem)
Freqüência
(%)
15,8 ≤ x < 16,0
A
1
1,25
16,0 ≤ x < 16,2
B
2
2,5
16,2 ≤ x < 16,4
C
1
1,25
16,4 ≤ x < 16,6
D
9
11,25
16,6 ≤ x < 16,8
E
21
26,25
16,8 ≤ x < 17,0
F
24
30
17,0 ≤ x < 17,2
G
13
16,25
17,2 ≤ x < 17,4
H
5
6,25
17,4 ≤ x < 17,6
I
2
2,5
17,6 ≤ x < 17,7
J
2
2,5
- Histograma:
80
35
30
25
Frequência (%)
Total (n)
20
15
10
5
0
A
B
C
D
E
F
Código da Classe
G
H
I
J
Estatística Aplicada no Tratamento e Avaliação de Dados:
Uma vez que as medidas reais contêm erros experimentais, é praticamente
impossível estar completamente certo de um resultado.
O erro aleatório pode ser determinado e desta forma, todos os resultados
analíticos devem estar associados a uma incerteza, ou intervalo de confiança.
A estimativa da incerteza pode se basear no nível de qualidade da leitura de
uma medida num dado equipamento, ou na experiência do analista com um
determinado método.
Sempre que possível, a incerteza deve ser expressa como um desvio padrão
de uma série de medidas em replicatas.
Sempre que possível a qualidade, das medidas experimentais, deve ser
verificada para avaliar a confiabilidade dos resultados analíticos.
Media ( x ; ): a média aritmética, que é normalmente abreviada para média,
é a soma de todos os valores obtidos dividida pelo número de medidas (n):
N
x
i
Média populacional:

i 1
N
n
x
Média amostral:
i
x
i 1
n
Mediana (Med): a mediana é o valor central de um conjunto de dados
arranjados em ordem crescente ou decrescente, ou seja, é o valor de tal
magnitude que, o número de dados menores do que ele é igual ao número
de dados maiores do que ele.
• Quando a quantidade de dados (n) é impar, a mediana é o valor que ocupa
a posição central;
• Quando a quantidade de dados (n) é par, há duas posições centrais na lista
ordenada; assim, a mediana da amostra é a média aritmética dos dois
valores que ocupam as posições ventrais.
Replicatas
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
Média
Mediana
Valor
5,2
4,8
5,1
4,9
5,2
4,7
5,2
4,8
5,3
4,7
4,99
Replicatas
x10
x6
x2
x8
x4
x3
x1
x5
x7
x9
Valor
4,7
4,7
4,8
4,8
4,9
5,1
5,2
5,2
5,2
5,3
5,00
Replicatas
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
Média
Mediana
Valor
5,2
4,8
5,1
4,9
5,2
4,7
5,2
4,8
20,0
1,0
6,09
Replicatas
x10
x6
x2
x8
x4
x3
x1
x5
x7
x9
Valor
1,0
4,7
4,8
4,8
4,9
5,1
5,2
5,2
5,2
20,0
5,00
Moda (Mo): é o valor amostral que tem a maior freqüência, ou seja, é o
encontrado em maior número de vezes, portanto, é a observação mais
"provável" da distribuição dos dados.
Portanto, numa amostra a moda pode não existir. Uma distribuição em que não
há elementos repetidos é dita amodal.
Também se considera que a moda pode não ser única. Se dois valores
aparecem em igual quantidade de vezes a distribuição é dita bimodal. Para três
valores, trimodal, e assim, sucessivamente.
Importante é notar que se existe apenas uma moda em uma amostra, há apenas
um grupo de indivíduos com suas variações, ou seja, a amostra é homogênea.
Mas, se houver duas ou mais modas, há grupos diferentes dentro daquela
amostra. Diz-se, então, que a amostra é heterogênea.
Exemplo: Os valores de medidas de uma amostra foram os seguintes: 3, 3, 4,
5, 5, 6, 6, 6, 7, 8, 9, 9; calcular a Moda dos resultados obtidos:
Resposta: a moda é o valor 6, porque corresponde ao valor com maior
freqüência, é o valor que mais ocorre.
Desvio: a diferença entre qualquer resultado de uma análise ( xi) e a média da
série de resultados é denominado de desvio da média (d). O desvio é positivo se
o valor é maior do que a média, ou negativo se for menor do que a média:
d  xi  x
Variância: é definida como sendo a soma dos quadrados dos desvios em
relação à média, dividida pelo número de observações da amostra menos um.
n  1
Para não trabalhar com valores negativos obtidos na diferença, trabalha-se com
valores absolutos ou eleva-se ao quadrado. Sendo mais fácil, elevar ao
quadrado e tirar a média, o valor resultante é simbolizado por s 2 e chama-se
variância amostral:
n
 x
i
s2 
 X
i 1
n 1
2
Desvio Padrão Experimental ( s ): a definição mais útil para a dispersão dos
dados experimentais é o desvio padrão, é utilizado freqüentemente para avaliar
a precisão dos resultados em um conjunto de dados realizados em replicatas. A
estimativa do desvio padrão é calculado extraindo-se a raiz quadrada do
quociente obtido dividindo a soma dos quadrados dos desvios ( d ) individuais
pelo número de determinações menos uma unidade:
n
2


x

x
 i
s
i 1
n  1
Coeficiente de variação: é frequentemente utilizado o conceito de coeficiente
de variação (cv%), também conhecido como desvio padrão relativo (DPR). As
unidades são, expressas em porcentagem e são exemplos de erros relativos,
isto é, um erro estimado dividido por uma estimativa do valor absoluto da
quantidade medida. Erros relativos são frequentemente usados na comparação
da precisão de resultados que têm diferentes unidades ou magnitudes, e são
também importantes no estudo da propagação de erros.
100  s
cv% 
x
Coeficiente de variação (CV):
 São exemplos de erros relativos
 Erros relativos são frequentemente usados na comparação da
precisão de resultados que têm diferentes unidades ou magnitudes
 São também importantes no estudo da propagação de erros.
s
CV
DISPERSÃO
PRECISÃO
cv(%) X Concentração
Taverniers, I. ; De Loose, M.; van Bockstaele, E. Trends in quality in the analytical laboratory. II. Analytical
method validation and quality assurance. Trends in Analytical Chemistry, Vol. 23, No. 8, 2004
Exemplo: considere os valores da porcentagem de proteína em uma ração,
obtido por um analista:
% PB
31,62
31,76
31,60
31,47
31,71
31,60
31,64
31,53
31,71
Podemos observar através da tabela que: o valor de 31,62 é a mediana uma
vez que há quatro valores menores e quatro valores maiores do que o valor
31,62.
E ao aplicarmos as fórmulas para a média e para o desvio padrão, obtêm-se
os seguintes valores, sendo que os resultados podem ser expressos
associados ao erro: 31,63 ± 0,09.
Mediana
x
Desvio Padrão
(s)
31,62
31,63
0,09
Coeficiente de
variação
(cv%)
0,28
Intervalo de confiança: Geralmente somente é realizado um pequeno número
de determinações em duplicatas, triplicatas, etc., tornando-se necessário
examinar como estes dados podem ser interpretados de uma maneira lógica.
Uma análise mais detalhada mostra que, sejam quais forem os valores de  e
de  , aproximadamente 68% da população situa-se entre ±1  da média,
aproximadamente 95% está entre ±2  e que aproximadamente 99,7% situa-se
entre ±3  da média.
O Intervalo de Confiança e os valores extremos deste limite são
conhecidos como Limites de Confiança.
O termo “confiança” implica que podemos assegurar com certo grau de
confiança, e com certa probabilidade, que o Intervalo de Confiança inclui
o valor real.
O tamanho do intervalo de confiança depende de quanto nós queremos
que ele inclua o valor real.
Quanto maior a certeza, maior o intervalo requerido.
O desvio padrão pode ser utilizado para
calcular os limites dentro do qual o valor
verdadeiro se situa a um dado nível de
probabilidade.
Para verificar a probabilidade de o valor
experimental estar próximo do valor real,
utiliza-se o teste estatístico denominado de
“t “ de Student.
Mesmo a partir de um número limitado de
medidas é possível encontrar a média
verdadeira.
É preciso calcular a média experimental, x ,
e o desvio padrão, s .
O Intervalo de Confiança é uma expressão que estabelece que a média
verdadeira,  , se situa dentro de certa distância da média experimental,
sendo expresso pela fórmula:
ts
x
N
EXEMPLO: Utilizando os dados do exemplo anterior, onde (n=9), podemos
determinar o Intervalo de Confiança para um nível de probabilidade de 95%
empregando a equação para o teste “t “:
x  31,63
s  0,09
  31,63 
2,306  0,09
 31,63  0,07 0 0
9
A porcentagem de proteína encontrada pode ser expressa por: 31,63 ± 0,07%.
Isto significa que a probabilidade do valor real se situar no intervalo de 31,56% a
31,70% é de 95%.
É evidente que se aumentarmos o nível de confiança para 99% o intervalo de
confiança se estenderá.
Exemplo: O conteúdo de íons sódio de uma espécie de urina foi determinado
usando um fotômetro de chama. Os seguintes valores foram obtidos: 102, 97, 99,
98, 101, 106 mg L-1. Quais são os limites de confiança para 95% e 99% de
confiança para a concentração dos íons sódio.
x
Limite de Confiança

  x t s
n6 N 5
S = 3,27 mg L-1
= 100,5 mg L-1
n
95% (P = 0,05)
tCRÍTICO = 2,57
99% (P = 0,01)
tCRÍTICO = 4,03

- o limite de confiança para 95% é dado por:

  100,5  2,57 3,27
6

 = 100,5 ± 5,4 mg L-1
- Similarmente, para 99% de limite de confiança:

= 100,5 ± 5,4 mg L-1

  100,5  4,03 3,27
6

Exemplo: Dez amostras são retiradas de um lote de calcário e analisadas.
O teor de Cálcio apresentou uma x = 4,30% (m/m) e um desvio-padrão
estimado, s = 0,30% (m/m). Qual é o intervalo de confiança, no nível de 95%,
da média do lote?
n = 10; t95 = 2,262;
  x  t s
x
= 4,30%;
n
  4,30%  0,21%
s = 0,30%
2,262  0,30
  4,30 
10
Exemplo: Um químico para avaliar o método de quantificação para cobre,
preparou uma solução conhecida de Cu de 50 mg L-1. Esta solução foi
analisada seis vezes por absorção atômica, tomando para cada determinação
alíquotas de 10 mL. Foram encontrados os seguintes resultados: 48,2; 51,0;
46,6; 51,5; 43,8; 46,9 mg L-1.
Calcular a média, mediana, desvio das medidas, desvio padrão, coeficiente
de variação e o intervalo de confiança?
Média:
Valores
(mg L-1)
43,8
46,6
46,9
48,2
51,0
51,5
Freqüência
1
1
1
1
1
1
x

x
n
Mediana
i
288

 48mg / L
6
Neste caso a mediana corresponde ao valor do meio entre:
46,9 e 48,2 = 47,5
Desvios das medidas
Determinação
Desvio em relação à média
Desvio ao quadrado
xx
xx
x  x 2
43,8 - 48
-4,2
17,64
46,6 - 48
-1,4
1,96
46,9 - 48
-1,1
1,21
48,2 - 48
0,2
0,04
51,0 - 48
3,0
9,00
51,5 - 48
3,5
12,25
Total
 x
i
 x  0
2

x

x

 42,10
 i
Desvio Padrão
s
2

x

x

 i
n 1
 8,42  2,902mg / L
S 100 2,902 100
CV 

 6,04%
x
48
Coeficiente de Variação:
Intervalo de Confiança no nível de 95%:
  x  t s
n
2,571 2,902
  48 
6
  48  3,05
TESTES DE SIGNIFICÂNCIA
Umas das propriedades mais importantes de um método analítico é que ele
deve ser isento de erros sistemáticos, isto é, o valor calculado pelo método
deve ser o valor real.
Entretanto, erros aleatórios fazem com que o valor medido raramente seja
exatamente igual ao valor real.
Para decidir se a diferença entre o valor medido e o valor padrão pode ser
atribuído a estes erros aleatórios, um teste estatístico, conhecido como teste de
significância, pode ser empregado.
 Testes estatístico para decidir se existe diferença significativa
entre o valor medido e o valor padrão.
Ferramentas importantes para
validação de resultados
 Verificar se um resultado individual, no conjunto de resultados, pode
ser considerado discrepante (Outlier)
 Verificar se existe diferença estatisticamente significativa entre a Média
de valores experimentais com um valor considerado verdadeiro
 Se há ou não diferenças estatisticamente significativas, na precisão
dos resultados de dois conjuntos de valores
 Se um valor médio de um conjunto de resultados é significativamente
diferente de um outro valor médio obtido
Valor probabilistico do limite de rejeição da Hipótese nula (H0), do erro
Tipo I. Em geral adota-se o valor alfa de 0,05 ou 0,01, admitindo-se, ao
rejeitar a H0, a probabilidade de ocorrência de 1 erro em 20 (5%) ou 1 em
100 (1%), respectivamente.
Hipótese nula (H0): é a hipótese que se testa considerando-se não haver
diferenças entre grupos específicos objetos de estudo.
Hipótese alternativa (H1): é a hipótese que contraria a de nulidade, no sentido
de afirmar que há diferença entre grupos específicos objetos da pesquisa
TIPO 1: consiste em aceitar, como diferentes, médias de tratamentos
que na verdade são iguais
ERRO
TIPO 2: consiste em aceitar, como iguais, médias de tratamentos que
na verdade são diferentes
Teste mono-caudal (unilateral)
Teste estatístico no qual a H1 especifica a direção da diferença as ser
detectada, assim representado: 1  0 ou 1  0
Teste bi-caudal (bi-lateral)
Teste estatístico no qual a H1 (hipótese alternativa) não especifica a
direção da diferença as ser detectada, como está representado: 1  0
podendo 1 ser maior ou menor a 0.
Critério estatístico empregando o Teste “t” : este é um teste de
significância para verificar se a média de um conjunto de dados se difere
do valor verdadeiro (valor referência).
Teste t (Student)
Comparação entre uma média experimental e um valor conhecido:
Exemplo: Em um método para determinar ferro por absorção atômica os
seguintes valores foram encontrados para um material de referência contendo
38,9% de ferro: 38,9; 37,4 e 37,1%. Há alguma evidência de erro sistemático?
x  37,8%
s  0,964%
  38,9%
n  3 N  2) 
t.s
X
n
n
t  x   
s
t  37,8  38,9 
3
0,964
t  1,98
Para 2 graus de liberdade, o valor crítico de t é 4,3 (p=0,05).
No exemplo o valor t é menor, a hipótese nula é mantida, não há
evidência de erro sistemático.
NÚMERO DE
DETERMINAÇÕES
N
GRAUS DE
LIBERDADE
N-1
NÍVEL DE CONFIANÇA
Comparação das médias de duas amostras.
Verificar se existe diferença significativa entre a média experimental de uma
nova metodologia e a média experimental de uma metodologia referência
Exemplo: Numa comparação entre dois métodos para a determinação de boro
em amostras de plantas, os seguintes resultados foram obtidos em µg/mL:
Método espectrofotométrico: média 28,0; desvio padrão = 0,3; n = 10
Método fluorimétrico: média = 26,25; desvio padrão = 0,23 ; n = 10
s
2
n


1
 1s  n 2  1s
n1  n2  2
2
1
2
2

t
x1  x2 
1
1 
s    
 n1 n 2 


10  10,3  10  10,23 

 0,0715
2
s2
2
10  10  2
s  0,267
t
28,0  26,25
1 1
0,267    
 10 10 
t  14,7
Existem 18 graus de liberdade, assim, da
Tabela de t (P=0,05), o valor crítico é 2,1.
Como o valor experimental de t é maior do
que este valor, a diferença entre os dois
resultados é significante no nível de 5% e a
hipótese nula é rejeitada.
Teste F para comparar conjuntos de dados.
Utilizado:
 Para determinar se uma população apresenta maior variabilidade
que a outra.
 Para determinar se dois métodos diferem em precisão,
 Se qual entre dois analistas ou instrumentos de laboratório é
mais preciso dentro de um nível de confiança desejado.
s
Fc 
s
2
A
2
B
s
2
= Variância do conjunto de dados A
A
s
2
= Variância do conjunto de dados B
B
Valor de F tabelado levando em consideração o número de
graus de liberdade e o de significância (mono-caudal).
Valores críticos de F para teste mono caudal (ao nível de 5 % = p =0,05)
GL  1/ 2
1
2
3
4
5
6
7
8
9
10
12
15
20
1
161,4
199,5
215,7
224,6
230,2
234,0
236,8
238,9
240,5
241,9
243,9
245,9
248,0
2
18,51
19,00
19,16
19,25
19,30
19,33
19,35
19,37
19,38
19,40
19,41
19,43
19,45
3
10,13
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,74
8,70
8,66
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,91
5,86
5,80
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,68
4,62
4,56
6
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
4,00
3,94
3,87
7
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,64
3,57
3,51
3,44
8
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,35
3,28
3,22
3,15
9
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,14
3,07
3,01
2,94
10
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,98
2,91
2,85
2,77
11
4,84
3,98
2,59
3,36
3,20
3,09
3,01
2,95
2,90
2,85
2,79
2,72
2,65
12
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
2,75
2,69
2,62
2,54
13
4,67
3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,71
2,67
2,60
2,53
2,46
14
4,60
3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,65
2,60
2,53
2,46
2,39
15
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
2,54
2,48
2,40
2,23
16
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
2,49
2,42
2,35
2,28
17
4,45
3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,49
2,45
2,38
2,31
2,23
18
4,41
3,55
3,16
2,93
2,77
2,66
2,58
2,51
2,46
2,41
2,34
2,27
2,19
19
4,38
3,52
3,13
2,90
2,74
2,63
2,54
2,48
2,42
2,38
2,31
2,23
2,16
20
4,35
3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,39
2,35
2,28
2,20
2,12
1: nº de graus de liberdade no numerador; 2: nº de graus de liberdade no denominador.
Valor de F tabelado levando em consideração o número de
graus de liberdade e o de significância (bi-caudal).
Exemplo: um analista realizou analises de potássio em solução de concentração
conhecida durante vários dias. No primeiro dia para um conjunto de sete
determinações encontrou um desvio de 2,5 mg L-1, e no sétimo dia encontrou um
desvio de 3,3 mg L-1 (para dez replicatas). Existe alguma diferença nas determinações
do analista ao nível de confiança de 95%?
Nnumerador = 9 (10-1); Ndenominador = 6 (7-1); Ftabelado = 5,523 (95%, p=0,05)
2
7º
2
1
2
s
3,3
F9, 6 

 1,74
2
s
2,5
O valor de F calculado (1,74) é menor do que F tabelado (4,10), dessa
forma não houve diferença significativa no nível de 95% de confiança
entre os dois conjunto de dados, assim é aceita a igualdade das
variâncias.
Exemplo: O valor aceito para o teor de zinco de uma amostra padrão obtida de uma
análise prévia é de 54,20 mg kg-1 (m/m) com desvio-padrão de 0,15 mg kg-1 (N = 5).
Cinco análise da mesma amostra foram realizadas por um novo procedimento
instrumental, obtendo-se os seguintes valores: 54,01; 54,24; 54,05; 54,27; 54,11 mg kg-1.
O novo método produziu resultados consistentes com o valor aceito?
s
F4, 4
2


x

x
 i
N 1
0,054

 0,116
4
0,152 0,0225


 1,56
2
0,0144
0,12
O valor de Ftabelado para 4 Graus de Liberdade (N) no numerador e
para 4 no denominador é igual a 9,6.
Assim, os desvios-padrão não são significativamente diferentes,
pois Fcalculado  Ftabelado e o novo método instrumental proporcionam
os mesmos resultados do que o método de referência.
Teste-t pareado
Dois métodos de análises diferentes podem ter que ser comparados pelo estudo
de amostras contendo quantidades diferentes da espécie-teste (analito)
t  xd 
n
sd
A Tabela mostra concentrações de manganês (mg kg-1) determinadas por dois
métodos diferentes para cada uma das quatro amostras:
Amostra
A
Via Seca
71
Via Húmida
76
B
C
61
50
68
48
D
60
57
Os dois métodos dão valores médios de manganês que variam significantemente?
O teste de comparação das duas médias não pode ser aplicado neste caso,
porque qualquer variação devida ao método seria disfarçada pelo efeito da
diferença entre as porções-teste.
A melhor maneira de concluir se existe diferença estatística significativa entre as
duas amostra é analisando a diferença entre cada par de resultados, um de cada
método.
Adotando a hipótese nula de que não há diferença entre as médias de
concentrações pelos dois métodos, podemos testar se as diferenças são
significativamente diferentes de zero.
Para os pares de valores acima, as diferenças são -5, -7, 2 e 3. A diferença
média , d é -1,75 e o desvio padrão para a diferença, s d , é 4,99. Como  d  0
a equação para calcular t se torna:
t  xd 
n
sd
4
t  1,75 
 0,70
4,99
• O valor crítico de é 3,18 (P = 0,05) e como o valor calculado de é
menor que isto, a hipótese nula é mantida.
• O método não deu diferença significativa para os valores médios da
concentração de manganês.
Alguns exemplos para aplicação do teste t pareado:
 a quantidade de qualquer uma das espécies-teste é
suficiente para uma única determinação por método.
 os métodos serão comparados usando uma grande
variedade de amostras de diferentes fontes com
diferentes concentrações.
 as espécies-testes podem ser de um longo intervalo
de tempo e é necessário remover os efeitos sazonais
(temperatura, pressão, etc.)
6
Y = 0,17508 + 0,89466 * X
r = 0,9504 (N = 803)
-1
ICPOES- S-SO4 (g.kg )
5
-2
4
3
2
1
0
0
1
2
3
4
-2
5
6
-1
Turbidimetria - S-SO4 (g.kg )
Paired t-Test on Data1 col(Turbidimetr) and col(ICPOES):
Data
Mean
Variance N
-----------------------------------------------------------Turbidimetr 1,56715 0,87316
803
ICPOES
1,57714 0,77368
803
-----------------------------------------------------------t = -0,97371
p = 0,33049
At the 0,05 level, the two means are NOT significantly different.
TESTE ESTATÍSTICO PAR REJEIÇÃO DE RESULTADOS
DISCREPANTES (OULTLIER)
Para saber se um resultado discrepante ou suspeito deve ou não ser
rejeitado para o cálculo do valor médio de um conjunto de dados
experimentais, deve-se aplicar um teste estatístico. Existem vários
procedimentos, sendo os mais utilizados:
teste de Dixon (teste Q); teste de Grubbs, teste Hampel e teste Cochran.
Teste de Dixon ou teste de confiança Q
O teste Q verifica:
Se um resultado pertence à mesma distribuição dos outros resultados
comparando com os valores tabelados a 5% e 1% de significância.
Aplicação do teste Q:
Os resultados são ordenados em ordem crescente, indicando o número de
Z que corresponde a cada determinação; 1, 2, 3, ... até o valor maior que
corresponde à determinação chamada de H, o valor anterior ao H é o H-1.
TESTE Q
H = 3 até 7 determinações:
Extremo inferior
Q
Z (2)  Z (1)
Z ( H )  Z (1)
Extremo superior
Z ( H )  Z ( H  1)
Z ( H )  Z (1)
Q
H = 8 até 12 determinações
Q
Z (2)  Z (1)
Z ( H  1)  Z (1)
Q
Z ( H )  Z ( H  1)
Z ( H )  Z (2)
H = 13 ou mais determinações
Z (3)  Z (1)
Q
Z ( H  2)  Z (1)
Q
Z ( H )  Z ( H  2)
Z ( H )  Z (3)
Tabela com os valores críticos para o teste de Dixon – teste Q
H
Valores críticos
95% (p = 0,05)
99% (p = 0,01)
3
0,970
0,994
4
0,829
0,926
5
0,710
0,821
6
0,628
0,740
7
0,569
0,608
8
0,608
0,717
9
0,564
0,672
10
0,530
0,635
11
0,502
0,605
12
0,479
0,579
13
0,611
0,697
14
0,586
0,670
15
0,565
0,647
16
0,546
0,627
17
0,529
0,610
18
0,514
0,594
19
0,501
0,580
20
0,489
0,567
Exemplos: Um analista obteve os seguintes resultados na
determinação de amônia numa solução de concentração conhecida:
29,4– 29,8– 30,8- 29,3– 31,3– 30,8 – 31,8.
As oito determinações são provenientes da mesma distribuição normal?
Z=
29,3
29,4
29,8
30,0
30,8
30,8
31,3
31,8
1
2
3
4
5
6
7
8 ou
H
Z(H) = 31,8; Z(H-1) = 31,3; Z(2) = 29,4
Cálculo para os valores superiores:
QS 
Z ( H )  Z ( H  1) 31,8  31,3 0,5


 0,208
Z ( H )  Z (2)
31,8  29,4 2,4
Cálculo para os valores inferiores:
Z (2)  Z (1)
29,4  29,3 0,1
QI 


 0,05
Z ( H  1)  Z (1) 31,3  29,3 2,0
O valor critico (Qc) para 95% (p = 0,05) de significância é 0,608 (tabelado)
QS = 0,208 < Qc = 0,608
O valor 31,8 pertence à mesma distribuição normal,
não devendo ser rejeitado.
QI = 0,05 < Qc = 0,608
O valor 29,3 pertence à mesma distribuição
normal, não devendo ser rejeitado.
Exemplos: Foi analisado Cu em uma amostra de ração. Foram realizadas
dez replicas (N=10) sendo os resultados expressos em mg L-1 conforme a
tabela abaixo. Determinar quais resultados requerem rejeição.
Cobre (mg/L)
Z
15,42
15,51
15,52
15,53
15,68
15,52
15,56
15,53
15,54
15,56
15,42
15,51
15,52
15,52
15,53
15,53
15,54
15,56
15,56
15,68
1
2
3
4
5
6
7
8
9
H=10
Z(H) = 15,68; Z(H-1) =15,56; Z(1) = 15,42; Z(2) = 15,51
QI

15,51  15,42 0,09


 0,643
15,56  15,42 0,14
QI = 0,643  QC = 0,530 (p = 0,05)
QS = 0,706  QC = 0,530 (p = 0,05)
QS

15,68  15,56 0,12


 0,706
15,68  15,51 0,17
O valor 15,42 não pertence à mesma
distribuição normal, devendo ser rejeitado.
O valor 15,68 não pertence à mesma
distribuição normal, devendo ser rejeitado.
Cobre (mg/L)
15,42
15,51
15,52
15,53
15,68
15,52
15,56
15,53
15,54
15,56
15,42
X
15,51
15,52
15,52
15,53
15,53
15,54
15,56
15,56
15,68
Z
1
2
3
4
5
6
7
8
9
H=10
Z
*
1
2
3
4
5
6
7
H=8
*
X
Z(H) = 15,56; Z(H-1) =15,56; Z(1) = 15,51; Z(2) = 15,52
QI
15,52  15,51  0,01  0,00

15,56  15,56 0,0
QS

15,56  15,56 0,0


 0,00
15,56  15,52 0,04
QI = 0,00  QC = 0,608 (p = 0,05)
QS = 0,00 < QC = 0,608 (p = 0,05)
Nenhum dos valores
devem ser rejeitados
Teste de Grubbs (http://www.graphpad.com/quickcalcs/Grubbs1.cfm)
O teste de Grubbs (G) é realizado por meio da razão entre a diferença de cada
resultados ( xi ) com a média de todos os resultados ( x ) em relação ao desvio
padrão ( s ). Um valor é considerado como “outlier” quando o valor de “G” é maior
que o valor crítico (GCRITICO) correspondente valores tabelado (GRUBBS, 1969). O
teste é realizado no nível de significância de 95 % e repetido até não serem
detectados outros “outliers

xi  x 
G
s
TABELA TESTE DE GRUBBS
N
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Critical Z
1.15
1.48
1.71
1.89
2.02
2.13
2.21
2.29
2.34
2.41
2.46
2.51
2.55
2.59
2.62
2.65
2.68
2.71
2.73
2.76
2.78
2.80
2.82
2.84
N
27
28
29
30
31
32
33
34
35
36
37
38
39
40
50
60
70
80
90
100
110
120
130
140
Critical Z
2.86
2.88
2.89
2.91
2.92
2.94
2.95
2.97
2.98
2.99
3.00
3.01
3.03
3.04
3.13
3.20
3.26
3.31
3.35
3.38
3.42
3.44
3.47
3.49
Exemplo: Para o mesmo conjunto de dados do exemplo anterior, calcular o
valor de G.
xi
29,3
29,4
29,8
30,0
30,8
30,8
31,3
31,8
 xi  x 
xi  x 2
Gcalculado
-1,1
1,21
-1,206
-1
1
-1,096
-0,6
0,36
-0,658
-0,4
0,16
-0,439
0,4
0,16
0,439
0,4
0,16
0,439
0,9
0,81
0,987
1,4
1,96
1,536
 x  x 
2
 x  243,2
i
 5,82
x  30,4
s
2

x

x

 i
n 1

5,82
 0,912
7
G1

xi  x   29,3  30,4 


 1,206
s


0,912


n = 8; Nível de significância: 95%
 31,8  30,4 
G8  
 1,536

 0,912 
Gcalculado= 1,536  Gtabelado= 2,13
Teste de Hampel
O teste de Hampel é considerado método robusto para detectar resultados
considerados “outliers”. Inicialmente, é calculado o residual individual ( ri ) por meio
da diferença do resultado do laboratório ( xi ) em relação à mediana ( Med ) de todos
os resultados.
A seguir os valores obtidos dos ri , são ordenados em ordem crescente (sem
considerar o sinal), sendo então encontrado o valor residual mediano ( rmed ).
O valor é considerado um “outlier” quando o ri for maior do que rmed  5,06 ,
considerando nível de significância de 95 % (LINSINGER, et al, 1998).
ri
ri  xi  X
se
OUTLIER
X
Residual
absoluto
Mediana
ri ≥ rm x 5,06
rm = residual mediano
Exemplo Teste de Hampel: Para o mesmo conjunto de dados do exemplo
anterior.
xi
ri
ri*
29,3
29,4
29,8
30
30,8
30,8
31,3
31,8
-1,1
-1,0
-0,6
-0,4
0,4
0,4
0,9
1,4
0,4
0,4
0,4
0,6
0,9
1,0
1,1
1,4
rmed = 0,75
Med =30,4
rmed  5,06 = 3,795
ri* = residual individual ordenado em ordem crescente e sem
considerar o sinal.
Exercício: Verificar Outlier pelos testes de Hampel e Grubbs
Cobre (mg/L)
15,42
HAMPEL
Med
15,51
15,52
15,52
15,53
15,53
GRUBBS
xi
15,42
15,51
15,52
15,52
15,53
15,53
15,54
15,56
15,56
15,68
15,53
ri
-0,11
-0,02
-0,01
-0,01
0,00
0,00
0,010
0,03
0,03
0,15
rmed
rmed  5 , 06
ri*
0,11
0,02
0,01
0,01
0,00
0,00
0,01
0,03
0,03
0,15
0,015
0,08
Media
s
n
G tabelado
15,54
15,56
xi
15,42
15,51
15,52
15,52
15,53
15,53
15,54
15,56
15,56
15,68
15,537
0,064
10
2,29
15,56
G
-1,834
-0,423
-0,267
-0,267
-0,110
-0,110
0,047
0,361
0,361
2,242
15,68
G
1,83
0,42
0,27
0,27
0,11
0,11
0,05
0,36
0,36
2,24
Teste de Cochran
O teste de Cochran é usado para comparar a maior variância com as outras
variâncias de um grupo. Pode ser usado para comparar a precisão de vários
analistas ou vários métodos de análises ou vários laboratórios.
C
2
s máx
p
2
s
i
i 1
s
2
máx
p
= maior variância
s
2
i
= a soma de todas as variâncias
i 1
p = número de laboratórios, analista ou métodos
n = número de determinações realizadas por cada analista
TABELA TESTE DE COCHRAN
TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)
p
n=2
n=3
n=4
n=5
2
0,975
0,939
0,906
3
0,967
0,871
0,798
0,746
4
0,906
0,768
0,684
0,626
5
0,841
0,684
0,598
0,544
6
0,781
0,616
0,532
0,48
7
0,727
0,561
0,48
0,431
8
0,68
0,516
0,438
0,391
9
0,638
0,478
0,403
0,358
10
0,602
0,445
0,373
0,331
11
0,57
0,417
0,348
0,308
12
0,541
0,392
0,326
0,288
13
0,515
0,371
0,307
0,271
14
0,492
0,352
0,291
0,255
15
0,471
0,335
0,276
0,242
16
0,452
0,319
0,262
0,23
17
0,434
0,305
0,25
0,219
18
0,418
0,293
0,24
0,209
19
0,403
0,281
0,23
0,2
20
0,389
0,27
0,22
0,192
Exemplo Teste de Cochran
Quatro analistas analisaram uma solução de hidróxido de sódio de
concentração conhecida e encontraram os seguintes resultados:
Analista
Determinações (%)
1
6
10,20
0,190
2
6
10,00
0,486
3
6
10,70
0,179
4
6
10,20
0,121
O analista 2 apresenta uma variabilidade excessiva, diferente dos demais?
2

0,486 
0,236
C

 0,74
2
2
2
2
0,190  0,486  0,179  0,121  0,3189
O valor critico para p = 4 e n = 6 (para 5% de significância) é igual a 0,590 (tabelado) e para
1% de significância é igual a 0,676.
O valor calculado (0,74) é maior que o valor tabelado, assim conclui-se que os resultados
do analista 2 são menos precisos do que os resultados dos outros analistas.
Numa mesma amostra de ração foi analisado o teor de fósforo, com a
participação de 5 laboratórios diferentes; os resultados obtidos estão na tabela
abaixo. Através do teste de Cochran verificar a homogeneidade das variâncias
dos laboratórios:
Laboratório
C
Média
s2
1
32,6
31,9
33,0
32,5
0,3100
2
23,7
22,0
22,7
22,8
0,7300
3
24,6
24,6
23,6
24,3
0,3333
4
30,5
30,3
31,5
30,8
0,4133
5
23,0
24,0
24,8
23,9
0,8133
2
s máx
p
2
s
i
i 1
P-PO4 (g/kg)
0,8133
C
 0,3168
[0,3100  0,7300  0,3333  0,4133  0,8133]
p=5en=3
Valor critico para 5% de significância: 0,684
Valor critico para 1% de significância: 0,788
O valor calculado (0,3168) é menor que o valor tabelado, assim conclui-se que o valor
calculado é menos variável, isto é, mais preciso. Não deve ser rejeitada a variância do
LAB. 5.
Controle de Qualidade
CIQ
CEQ
CIQ
Objetivo: manter as condições de validação no laboratório
por longo tempo
 Repetições de análises
 Uso de materiais de referência
 Uso de cartas controle
CEQ
Objetivo: assegurar a comparabilidade dos resultados
entre laboratórios
 Participação em Ensaios de Proficiência
(programas interlaboratoriais)
Download