XV Encontro Nacional sobre Metodologias e Gestão de Laboratórios da EMBRAPA – XV MET Embrapa Clima Temperado – PELOTAS - RS Desenvolvimento e operação de programas de ensaio de proficiência Gilberto Batista de Souza Embrapa Pecuária Sudeste [email protected] OUTUBRO / 2010 ESCOPO DO CURSO CONCEITOS DE METROLOGIA QUIMICA CONCEITOS DE TERMOS ESTATISTICOS ESTATÍSTICA APLICADA NO TRATAMENTO DE DADOS TESTES DE SIGNIFICÂNCIA TESTES ESTATISTICOS PARA DETECÃO DE OUTLIERS PROTOCOLO INTERNACIONAL HARMONIZADO PARA ENSAIO DE PROFICIÊNCIA EM LABORATÓRIOS ANALÍTICOS (QUÍMICOS) Conceitos básicos de metrologia Incerteza das medições: Parâmetro, associado ao resultado de uma MEDIÇÃO, que caracteriza a dispersão dos valores que podem ser fundamentadamente atribuídos a um mensurando (VIM, 2007). Caracteriza a faixa de valores, dentro da qual o valor real deve se situar, com um nível de confiança especificado. Incerteza da medição não implica em dúvida quanto a validade de uma medição; ao contrário, o conhecimento da incerteza implica numa maior confiança na validade do resultado de uma medição. Possíveis fontes de Incerteza Má definição do mensurando; Amostragem não-representativa; Erro pessoal na leitura de instrumentos analógicos; Resolução do instrumento; Valores inexatos dos padrões de medição e materiais de referência; Ajuste de curva; interpolação; etc Valor verdadeiro: valor atribuído a uma grandeza específica e aceito, às vezes por convenção, como tendo uma incerteza apropriada para uma dada finalidade (EURACHEM/CITAC, 1998). O valor verdadeiro convencional pode ser denominado como: valor designado, melhor estimativa do valor, valor convencional ou valor de referência. Frequentemente um grande número de resultados das medições de uma grandeza é utilizado para estabelecer um valor verdadeiro convencional. Precisão: está relacionada com a concordância das medidas entre si, ou seja, quanto maior a dispersão dos valores menor a precisão (relacionada com a repetitividade e com a reprodutibilidade). Quanto menor a dispersão dos valores maior a precisão Quanto menor a amplitude maior a precisão 7 6 5 4 3 1 2 3 4 5 6 7 8 9 10 Repetitividade (r) É um tipo de precisão referente a medições feitas sob condições de repetitividade, isto é: mesmo método; mesmo material; mesmo operador; mesmo laboratório; repetições em curto período de tempo. É calculada a partir do desvio padrão dos resultados dos ensaios sob condição de repetitividade - recomenda-se 7 ou mais repetições para o cálculo do desvio padrão para cada concentração. É aconselhável calcular o limite de repetitividade “r” que capacita o analista a decidir se a diferença entre análises duplicatas de uma amostra, determinada sob condições de repetitividade, é significante. Repetitividade (r) O limite de repetitividade (r) para um nível de significância de 95% e 6 graus de liberdade (N = n-1), é dado por: r 2,8 sr sr = desvio padrão de repetitividade. Reprodutibilidade (R) É um conceito de precisão referente a medições feitas sob condições de reprodutibilidade, isto é: mesmo método; operadores diferentes; laboratórios diferentes; equipamentos diferentes; longo período de tempo. Embora a reprodutibilidade não seja um componente de validação de método executado por um único laboratório, é considerada importante quando um laboratório busca a verificação do desempenho dos seus métodos em relação aos dados de validação obtidos por meio de comparação interlaboratorial. Reprodutibilidade (R) A partir do desvio padrão obtido sob condições de reprodutibilidade é possível calcular o limite de reprodutibilidade “R”, o qual permite ao analista decidir se a diferença entre os valores da duplicata das amostras analisadas sob condições de reprodutibilidade é significante. O limite de repetitividade (r) para um nível de significância de 95%, é dado por: R 2,8 S R2 S R2 = variância de reprodutibilidade associada aos resultados considerados, para cada laboratório. O cálculo da reprodutibilidade é efetuado para cada nível, separadamente, após eliminação dos valores dispersos. Ex. para calcular r e R Labs 1 2 3 4 5 6 7 8 9 10 11 12 Somatória A 0,27 0,301 0,285 0,292 0,276 0,282 0,277 0,246 0,28 0,3 0,301 0,272 B C 0,28 0,3 0,288 0,279 0,27 0,284 0,279 0,256 0,278 0,307 0,29 0,277 0,28 0,302 0,295 0,287 0,281 0,285 0,28 0,249 0,284 0,311 0,284 0,269 D 0,27 0,304 0,282 0,316 0,27 0,287 0,273 0,241 0,281 0,309 0,308 0,27 E 0,28 0,304 0,29 0,281 0,28 0,286 0,278 0,245 0,275 0,307 0,293 0,278 F 0,28 0,301 0,288 0,291 0,277 0,285 0,28 0,243 0,277 0,306 0,284 0,27 Média 0,2767 0,3020 0,2880 0,2910 0,2757 0,2848 0,2778 0,2467 0,2792 0,3067 0,2933 0,2727 s 0,0052 0,0017 0,0044 0,0133 0,0048 0,0017 0,0026 0,0053 0,0032 0,0037 0,0096 0,0039 s2 0,0000267 0,0000028 0,0000196 0,0001772 0,0000227 0,0000030 0,0000070 0,0000283 0,0000102 0,0000139 0,0000919 0,0000151 0,0004181 Anova: fator único RESUMO Lab 1 2 3 5 6 7 8 9 10 12 Contagem 6 6 6 6 6 6 6 6 6 6 ANOVA Fonte da variação SQ Entre grupos 0,014834 Dentro dos grupos 0,000745 Total 0,015579 Soma 1,66 1,812 1,728 1,654 1,709 1,667 1,48 1,675 1,84 1,636 gl Média 0,2766667 0,302 0,288 0,2756667 0,2848333 0,2778333 0,2466667 0,2791667 0,3066667 0,2726667 Variância 0,0000267 0,0000028 0,0000196 0,0000227 0,0000030 0,0000070 0,0000283 0,0000102 0,0000139 0,0000151 MQ F valor-P F crítico 9 0,0016482 110,59283 7,56E-30 2,073351 50 0,0000149 59 2 sentre 0,001648 0,0000149 0,00027218 6 r 2,8 0,0000149 0,011 R 2,8 0,0000149 0,00027218 0,047 Q1: Um laboratório obtém 2 replicatas: 0,273 e 0,279%; a diferença de 0,006% entre as duas replicatas é aceitável, pois r = 0,011, portanto os dois resultados são válidos. Q2: Um laboratório obtém e replicatas : 0,269 e 0,299%; a diferença de 0,017% entre as duas replicatas é inaceitável (r = 0,011); um dos valores deve ser rejeitado. Q3: Dois labs.: um obtém 0,269% e o outro 0,299%; a diferença de 0,030% entre os dois resultados é menor que o valor de R = 0,047; portanto os dois valores são aceitos. Exatidão: Grau de concordância entre o resultado de uma medição e um valor verdadeiro do mensurando (VIM, 2007). Está relacionada com o seu erro absoluto, isto é, com a proximidade do valor medido em relação ao valor verdadeiro da grandeza. Avaliada por meio da comparação entre o valor medido e o valor certificado de um CRM. Comparando com resultados obtidos por intermédio da utilização de um método já existente e de exatidão conhecida. Comparando os resultados obtidos por intermédio da adição padrão à uma matriz. EXATIDÃO E TENDÊNCIA (bias) Exatidão do método é definida como sendo a concordância entre o resultado de um ensaio e o valor de referência aceito como convencionalmente verdadeiro. Os processos normalmente utilizados para avaliar a exatidão de um método são, entre outros: uso de materiais de referência, participação em comparações interlaboratoriais e realização de ensaios de recuperação. A exatidão, quando aplicada a uma série de resultados de ensaio, implica numa combinação de componentes de erros aleatórios e sistemáticos. Estudante Resultado (mL) Comentário A 10,08 10,11 10,09 10,10 10,12 9,88 10,14 10,02 9,80 10,21 10,19 9,79 9,69 10,05 9,78 10,04 9,98 10,02 9,97 10,04 Preciso e inexato B C D Exato e impreciso Impreciso e inexato Preciso e exato EXATIDÃO E TENDÊNCIA (bias) A tendência é algumas vezes chamada de recuperação de um método analítico, é o erro sistemático desse sistema de medição. Além da avaliação da tendência, é importante estimar a incerteza de medida associada à tendência e incluir este componente na estimativa global da incerteza de medição. A tendência de um método analítico é geralmente determinada pelo estudo de materiais de referência ou por adição padrão (fortificação). A tendência pode ser expressa como uma recuperação analítica: C C2 Re cuperação(%) 1 100 C3 C1 = concentração determinada na amostra fortificada; C2 = concentração determinada na amostra não fortificada e C3 = concentração adicionada. Recuperação: É a fração do analito adicionado na amostra teste (fortificada) previamente a análise. Geralmente é realizada com no mínimo 6 repetições do branco da matriz ou amostra não fortificada e amostra fortificada com o analito a diferentes concentrações. EXATIDÃO E TENDÊNCIA (bias) Na avaliação da exatidão utilizando um material de referência certificado (MRC): os valores obtidos pelo laboratório, média e o desvio padrão de uma série de ensaios em replicatas, devem ser comparados com os valores certificados do material de referência. Para esta comparação podem ser utilizados diversos critérios de decisão, entre os quais: erro relativo; teste de hipóteses; índice z, e erro normalizado. Erro relativo (ER): X medido X verdadeiro ER Erro relativo (ER): 100 ; X medido = média do X verdadeiro valor medido experimentalmente e X verdadeiro = valor aceito como verdadeiro (valor certificado do MRC). Teste de hipóteses Teste de hipóteses: teste F para verificar se as variâncias das amostras podem ser consideradas iguais, seguido do teste t de Student (ver INMETRO: DOQ-CGCRE-008 – Revisão 02 – JUNHO/2007). EXATIDÃO E TENDÊNCIA (bias) Índice z: o índice z é também um modo de avaliar o desempenho do laboratório, X X verdadeiro utilizando MRC: z medido ; X medido = média do valor medido s experimentalmente; X verdadeiro = valor aceito como verdadeiro (valor certificado do MRC) e s = desvio padrão (incerteza) do MRC. A avaliação segue o seguinte critério: se z 2 o resultado é satisfatório; 2 z 3 o resultados é questionável e z 3 o resultados é insatisfatório. Erro normalizado En: Caso o laboratório calcule a incerteza do seu resultado ( U lab ), o valor verdadeiro ( X Verdadeiro ) deve estar dentro do intervalo X lab ± incerteza expandida. En X lab X verd . U 2 lab U 2 ref En 1 o resultado pode ser considerado adequado Linearidade Para métodos quantitativos é determinada pela medição de amostras com concentrações de analito abrangendo a faixa reivindicada do método. Linearidade é a habilidade de um método analítico em produzir resultados que sejam diretamente proporcionais à concentração do analito em amostras, em uma dada faixa de concentração. Os resultados são usados para obter uma reta por regressão com relação ao cálculo de analito, usando-se o método dos mínimos quadrados. É conveniente que um método seja linear ao longo de uma faixa específica, mas este não é um requisito absoluto. Quando a linearidade for inatingível para um procedimento específico, deve ser determinado um algoritmo adequado para cálculos. Linearidade A equação da reta que relaciona as duas variáveis é: y = resposta medida ou sinal analítico (absorbância, altura ou área do pico, etc.); x = concentração; a = interseção com o eixo y, quando x = 0; b = inclinação da curva analítica = sensibilidade (S). O método é mais sensível quando pequenas variações de concentração resultam em maior variação na resposta, ou seja, maior inclinação (b). Em geral, serão necessários vários níveis de concentração, no mínimo cinco, para construir a curva analítica. O número de replicatas em cada nível de concentração deve ser o mais próximo possível daquele empregado na rotina do laboratório. Linearidade PERGUNTAS: 1) É linear o gráfico de calibração? Se for uma curva, qual a forma? 2) Sabendo-se que um dos pontos da reta de calibração está sujeito a erros, qual é a melhor reta que passa pelos pontos? 3) Supondo que a calibração é realmente linear, quais são os erros estimados e o limites de confiança para a inclinação e interseção na origem da reta? 4) Quando o gráfico de calibração é utilizado para análises de amostras, quais são os erros e os limites de confiança para a concentração determinada? 5) Qual o limite de detecção do método? Isto é, qual a menor concentração do analito que se pode detectar com um nível de confiança predeterminado? Linearidade A linearidade de um método pode ser observada pelo gráfico dos resultados dos ensaios em função da concentração do analito e verificada a partir da equação da regressão linear, determinada pelo método dos mínimos quadrados. Para tal, deve ser verificada a ausência de valores discrepantes para cada nível de concentração e a homocedasticidade dos dados, antes de fazer a regressão linear. A verificação da ausência de valores discrepantes pode ser feita pelo teste de Grubbs A homocedasticidade, isto é, homogeneidade da variância dos resíduos pelo teste de Cochran. xi x G s Grubbs C 2 s máx p 2 s i i 1 Cochran TABELA TESTE DE GRUBBS N 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Critical Z 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.29 2.34 2.41 2.46 2.51 2.55 2.59 2.62 2.65 2.68 2.71 2.73 2.76 2.78 2.80 2.82 2.84 N 27 28 29 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100 110 120 130 140 Critical Z 2.86 2.88 2.89 2.91 2.92 2.94 2.95 2.97 2.98 2.99 3.00 3.01 3.03 3.04 3.13 3.20 3.26 3.31 3.35 3.38 3.42 3.44 3.47 3.49 TABELA TESTE DE COCHRAN TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%) p n=2 n=3 n=4 n=5 2 0,975 0,939 0,906 3 0,967 0,871 0,798 0,746 4 0,906 0,768 0,684 0,626 5 0,841 0,684 0,598 0,544 6 0,781 0,616 0,532 0,48 7 0,727 0,561 0,48 0,431 8 0,68 0,516 0,438 0,391 9 0,638 0,478 0,403 0,358 10 0,602 0,445 0,373 0,331 11 0,57 0,417 0,348 0,308 12 0,541 0,392 0,326 0,288 13 0,515 0,371 0,307 0,271 14 0,492 0,352 0,291 0,255 15 0,471 0,335 0,276 0,242 16 0,452 0,319 0,262 0,23 17 0,434 0,305 0,25 0,219 18 0,418 0,293 0,24 0,209 19 0,403 0,281 0,23 0,2 20 0,389 0,27 0,22 0,192 Linearidade Calcular o modelo através da regressão linear, os resíduos e o coeficiente de correlação linear (r). O coeficiente de correlação linear (r) é freqüentemente usado para indicar o quanto pode ser considerada adequada a reta como modelo matemático. Um valor maior que 0,90 é, usualmente, requerido (coeficientes de correlação r e determinação R2). Coeficiente de correlação (r): Coeficiente que indica a força da associação entre quaisquer duas variáveis métricas. O sinal (+ ou -) indica a direção da relação. O valor pode variar de -1 a +1, em que +1 indica uma perfeita relação positiva, 0 (zero) indica relação nenhuma e -1 uma perfeita relação negativa ou reversa (quando uma variável se torna maior a outra fica menor). Linearidade Coeficiente de determinação (R2): Medida da proporção da variância da variável dependente em torno de sua media que é explicada pelas variáveis independentes. O coeficiente pode variar entre 0 e 1. Se o modelo de regressão é propriamente aplicado e estimado, pode-se assumir que quanto maior o valor de R2, maior o poder de explicação da equação de regressão e, portanto, melhor a previsão da variável dependente. Erros Qualquer resultado de uma medida experimental está associada a um erro, ou seja, a uma incerteza. Esta incerteza é considerada a diferença entre o valor medido e o valor verdadeiro. Os erros podem ser classificados em três categorias: grosseiros, aleatórios (randômicos) ou indeterminados e sistemáticos ou determinados. Erros grosseiros são facilmente reconhecidos. Eles são erros tão sérios que não deixam alternativas a não ser refazer todo o experimento. Exemplos incluem a quebra do equipamento, contaminação de reagentes, erros na adição de alíquotas, etc. Enganos na leitura de uma escala Erro de cálculos nas operações Erros na adição de alíquotas Ocorrem em geral pela falta de cuidado ou inabilidade de fazer uma determinada análise Erros Aleatórios: Não possuem valor definido, é resultante de uma medição menos a média de um número infinito de medições sob condições de repetitividade e flutuam de maneira aleatória (são bidirecionais). ErroAleató rio xi X • São irregulares e resultam em variabilidade afetando o desvio padrão. • Não tem causas assimiláveis, • Podem ser submetidos a tratamento estatístico para permitir saber qual o valor mais provável e também a precisão de uma série de medidas. ERROS ALEATÓRIOS Submetidos a tratamento estatístico PERMITIR Estimativa do valor mais provável Precisão de uma série de medidas. 7 6 ERRO ALEATÓRIO 5 4 PRECISÃO 3 1 2 3 4 5 6 7 8 9 10 Erros Sistemáticos São inúmeros e foram agregados em quatro grupos: CLASSIFICAÇÃO Erros de métodos Erros operacionais Erros pessoais Erros instrumentais São unilaterais resultando um desvio constante nos resultados, tem causas assimiláveis e estão relacionados com a exatidão, sendo geralmente caracterizados por conservarem o mesmo valor em medições sucessivas. Afetam a grandeza do resultado Afetam a média de um conjunto de resultados Afetam a exatidão São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas EXATIDÃO ERRO SISTEMÁTICO 7 6 5 4 3 1 2 3 4 5 6 7 8 9 10 São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas Cálculos dos erros: Os erros podem ser analisados de forma rápida, através das seguintes equações: Erro xi xi % Erro 100 = valor verdadeiro, p.e. resultado de um material de referência; xi = resultado de uma medida experimental. CONCEITO DE TERMOS ESTATÍSTICOS Elemento: a unidade considerada para um estudo estatístico é denominada de elemento. Exemplo: um objeto; um individuo, uma peça. População: conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados. Exemplos: um lote de peças; um lote de um polímero; população do estado de São Paulo. Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. Graus de liberdade (N): é um conceito ligado ao número de dados disponíveis (livres) para o cálculo da estatística. Por exemplo, ao estimarmos a média populacional () com a média amostral ( x ) perdemos um grau de liberdade, assim a estatística t-student terá n-1 graus de liberdade. Distribuição normal: Uma variável quantitativa segue uma distribuição normal, se sua distribuição de freqüências tem o formato similar ao de um sino (curva de Gauss), ou seja, a maioria dos valores se concentra em torno da média e, a medida que se afasta do centro as observações são cada vez mais raras. Essa distribuição é considerada simétrica. Muitas variáveis têm essa distribuição, tais como altura das pessoas adultas do sexo masculino, coeficiente de inteligência, etc. Distribuição normal Histograma: É um gráfico de colunas justapostas que representa uma distribuição de freqüência para dados contínuos ou uma variável discreta quando esta apresentar muitos valores distintos. No eixo horizontal são dispostos os limites das classes segundo as quais os dados foram agrupados enquanto que o eixo vertical corresponde às freqüências absolutas ou relativas das mesmas. Frequencia (%) 40 M Med Mo 92,20 92,24 92,20 30 20 10 0 87 88 89 90 91 92 MS (%) 93 94 95 96 Medidas de assimetria: A medida de assimetria é um indicador da forma da distribuição dos dados. Ao construir uma distribuição de freqüências e/ou um histograma, está-se buscando, também, identificar visualmente, a forma da distribuição dos dados que é ou não confirmada pelo coeficiente de assimetria de Pearson (As) definido como: para dados populacionais Mo AS para dados amostrais X Mo AS s Simétrica: média = mediana = moda ou As = 0 assimétrica negativa: média ≤ mediana ≤ moda ou As < 0 O lado mais longo do polígono de freqüência (cauda da distribuição) está à esquerda do centro. assimétrica positiva : moda ≤ mediana ≤ média ou As > 0 O lado mais longo do polígono de freqüência está à direita do centro. Etapas para construção de tabelas de freqüências e histogramas: - Coletar n amostras entre 30 < n < 200. - Encontrar o valor máximo (Vmax) e mínimo (Vmin) dos dados em estudo. - Calcular a amplitude: R Vmax Vmin - Determinar o numero de classes de freqüência: - Calcular a amplitude dos intervalos das classes: k n R h k outra forma de calcular é dividir por 1, 2 ou 5 de forma a obter-se de 5 a 20 intervalos de classes, de igual amplitude. - Definir o limite superior e inferior de cada classe e seu ponto médio. - Construir uma tabela de freqüência. - Traçar o diagrama. Exemplo: Foi realizado um levantamento de três meses dos resultados das análises de proteína (%) em amostra de farelo de trigo. Com os dados, construir um histograma para as análises. 16,4 16,4 15,8 17,7 17,6 17,7 17,3 16,7 17,4 16,8 16,9 17,0 16,9 16,9 16,5 16,7 16,6 16,6 16,6 16,4 16,7 16,6 16,8 16,0 16,9 16,8 17,4 17,0 16,9 16,4 16,5 16,9 16,6 16,6 16,7 16,8 16,6 16,5 17,0 17,0 16,8 16,8 16,8 16,6 17,0 16,9 17,1 16,4 16,8 16,7 17,1 16,7 17,0 16,7 16,2 16,8 17,2 17,5 16,7 16,9 17,0 16,6 16,8 17,2 17,0 17,0 16,8 16,9 16,4 16,6 16,6 16,9 16,8 17,1 16,6 16,9 16,8 17,0 16,0 16,6 - Tamanho da amostra: - Amplitude: n 80 R 17,7 15,8 1,9 R Vmax Vmin - Classes de freqüência: k n - Amplitude das classes: h R k k 80 h k 8,94 1,9 0,212 0,2 8,94 - Tabela de freqüência: Limites das classes Código da classe Freqüência (contagem) Freqüência (%) 15,8 ≤ x < 16,0 A 1 1,25 16,0 ≤ x < 16,2 B 2 2,5 16,2 ≤ x < 16,4 C 1 1,25 16,4 ≤ x < 16,6 D 9 11,25 16,6 ≤ x < 16,8 E 21 26,25 16,8 ≤ x < 17,0 F 24 30 17,0 ≤ x < 17,2 G 13 16,25 17,2 ≤ x < 17,4 H 5 6,25 17,4 ≤ x < 17,6 I 2 2,5 17,6 ≤ x < 17,7 J 2 2,5 - Histograma: 80 35 30 25 Frequência (%) Total (n) 20 15 10 5 0 A B C D E F Código da Classe G H I J Estatística Aplicada no Tratamento e Avaliação de Dados: Uma vez que as medidas reais contêm erros experimentais, é praticamente impossível estar completamente certo de um resultado. O erro aleatório pode ser determinado e desta forma, todos os resultados analíticos devem estar associados a uma incerteza, ou intervalo de confiança. A estimativa da incerteza pode se basear no nível de qualidade da leitura de uma medida num dado equipamento, ou na experiência do analista com um determinado método. Sempre que possível, a incerteza deve ser expressa como um desvio padrão de uma série de medidas em replicatas. Sempre que possível a qualidade, das medidas experimentais, deve ser verificada para avaliar a confiabilidade dos resultados analíticos. Media ( x ; ): a média aritmética, que é normalmente abreviada para média, é a soma de todos os valores obtidos dividida pelo número de medidas (n): N x i Média populacional: i 1 N n x Média amostral: i x i 1 n Mediana (Med): a mediana é o valor central de um conjunto de dados arranjados em ordem crescente ou decrescente, ou seja, é o valor de tal magnitude que, o número de dados menores do que ele é igual ao número de dados maiores do que ele. • Quando a quantidade de dados (n) é impar, a mediana é o valor que ocupa a posição central; • Quando a quantidade de dados (n) é par, há duas posições centrais na lista ordenada; assim, a mediana da amostra é a média aritmética dos dois valores que ocupam as posições ventrais. Replicatas x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 Média Mediana Valor 5,2 4,8 5,1 4,9 5,2 4,7 5,2 4,8 5,3 4,7 4,99 Replicatas x10 x6 x2 x8 x4 x3 x1 x5 x7 x9 Valor 4,7 4,7 4,8 4,8 4,9 5,1 5,2 5,2 5,2 5,3 5,00 Replicatas x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 Média Mediana Valor 5,2 4,8 5,1 4,9 5,2 4,7 5,2 4,8 20,0 1,0 6,09 Replicatas x10 x6 x2 x8 x4 x3 x1 x5 x7 x9 Valor 1,0 4,7 4,8 4,8 4,9 5,1 5,2 5,2 5,2 20,0 5,00 Moda (Mo): é o valor amostral que tem a maior freqüência, ou seja, é o encontrado em maior número de vezes, portanto, é a observação mais "provável" da distribuição dos dados. Portanto, numa amostra a moda pode não existir. Uma distribuição em que não há elementos repetidos é dita amodal. Também se considera que a moda pode não ser única. Se dois valores aparecem em igual quantidade de vezes a distribuição é dita bimodal. Para três valores, trimodal, e assim, sucessivamente. Importante é notar que se existe apenas uma moda em uma amostra, há apenas um grupo de indivíduos com suas variações, ou seja, a amostra é homogênea. Mas, se houver duas ou mais modas, há grupos diferentes dentro daquela amostra. Diz-se, então, que a amostra é heterogênea. Exemplo: Os valores de medidas de uma amostra foram os seguintes: 3, 3, 4, 5, 5, 6, 6, 6, 7, 8, 9, 9; calcular a Moda dos resultados obtidos: Resposta: a moda é o valor 6, porque corresponde ao valor com maior freqüência, é o valor que mais ocorre. Desvio: a diferença entre qualquer resultado de uma análise ( xi) e a média da série de resultados é denominado de desvio da média (d). O desvio é positivo se o valor é maior do que a média, ou negativo se for menor do que a média: d xi x Variância: é definida como sendo a soma dos quadrados dos desvios em relação à média, dividida pelo número de observações da amostra menos um. n 1 Para não trabalhar com valores negativos obtidos na diferença, trabalha-se com valores absolutos ou eleva-se ao quadrado. Sendo mais fácil, elevar ao quadrado e tirar a média, o valor resultante é simbolizado por s 2 e chama-se variância amostral: n x i s2 X i 1 n 1 2 Desvio Padrão Experimental ( s ): a definição mais útil para a dispersão dos dados experimentais é o desvio padrão, é utilizado freqüentemente para avaliar a precisão dos resultados em um conjunto de dados realizados em replicatas. A estimativa do desvio padrão é calculado extraindo-se a raiz quadrada do quociente obtido dividindo a soma dos quadrados dos desvios ( d ) individuais pelo número de determinações menos uma unidade: n 2 x x i s i 1 n 1 Coeficiente de variação: é frequentemente utilizado o conceito de coeficiente de variação (cv%), também conhecido como desvio padrão relativo (DPR). As unidades são, expressas em porcentagem e são exemplos de erros relativos, isto é, um erro estimado dividido por uma estimativa do valor absoluto da quantidade medida. Erros relativos são frequentemente usados na comparação da precisão de resultados que têm diferentes unidades ou magnitudes, e são também importantes no estudo da propagação de erros. 100 s cv% x Coeficiente de variação (CV): São exemplos de erros relativos Erros relativos são frequentemente usados na comparação da precisão de resultados que têm diferentes unidades ou magnitudes São também importantes no estudo da propagação de erros. s CV DISPERSÃO PRECISÃO cv(%) X Concentração Taverniers, I. ; De Loose, M.; van Bockstaele, E. Trends in quality in the analytical laboratory. II. Analytical method validation and quality assurance. Trends in Analytical Chemistry, Vol. 23, No. 8, 2004 Exemplo: considere os valores da porcentagem de proteína em uma ração, obtido por um analista: % PB 31,62 31,76 31,60 31,47 31,71 31,60 31,64 31,53 31,71 Podemos observar através da tabela que: o valor de 31,62 é a mediana uma vez que há quatro valores menores e quatro valores maiores do que o valor 31,62. E ao aplicarmos as fórmulas para a média e para o desvio padrão, obtêm-se os seguintes valores, sendo que os resultados podem ser expressos associados ao erro: 31,63 ± 0,09. Mediana x Desvio Padrão (s) 31,62 31,63 0,09 Coeficiente de variação (cv%) 0,28 Intervalo de confiança: Geralmente somente é realizado um pequeno número de determinações em duplicatas, triplicatas, etc., tornando-se necessário examinar como estes dados podem ser interpretados de uma maneira lógica. Uma análise mais detalhada mostra que, sejam quais forem os valores de e de , aproximadamente 68% da população situa-se entre ±1 da média, aproximadamente 95% está entre ±2 e que aproximadamente 99,7% situa-se entre ±3 da média. O Intervalo de Confiança e os valores extremos deste limite são conhecidos como Limites de Confiança. O termo “confiança” implica que podemos assegurar com certo grau de confiança, e com certa probabilidade, que o Intervalo de Confiança inclui o valor real. O tamanho do intervalo de confiança depende de quanto nós queremos que ele inclua o valor real. Quanto maior a certeza, maior o intervalo requerido. O desvio padrão pode ser utilizado para calcular os limites dentro do qual o valor verdadeiro se situa a um dado nível de probabilidade. Para verificar a probabilidade de o valor experimental estar próximo do valor real, utiliza-se o teste estatístico denominado de “t “ de Student. Mesmo a partir de um número limitado de medidas é possível encontrar a média verdadeira. É preciso calcular a média experimental, x , e o desvio padrão, s . O Intervalo de Confiança é uma expressão que estabelece que a média verdadeira, , se situa dentro de certa distância da média experimental, sendo expresso pela fórmula: ts x N EXEMPLO: Utilizando os dados do exemplo anterior, onde (n=9), podemos determinar o Intervalo de Confiança para um nível de probabilidade de 95% empregando a equação para o teste “t “: x 31,63 s 0,09 31,63 2,306 0,09 31,63 0,07 0 0 9 A porcentagem de proteína encontrada pode ser expressa por: 31,63 ± 0,07%. Isto significa que a probabilidade do valor real se situar no intervalo de 31,56% a 31,70% é de 95%. É evidente que se aumentarmos o nível de confiança para 99% o intervalo de confiança se estenderá. Exemplo: O conteúdo de íons sódio de uma espécie de urina foi determinado usando um fotômetro de chama. Os seguintes valores foram obtidos: 102, 97, 99, 98, 101, 106 mg L-1. Quais são os limites de confiança para 95% e 99% de confiança para a concentração dos íons sódio. x Limite de Confiança x t s n6 N 5 S = 3,27 mg L-1 = 100,5 mg L-1 n 95% (P = 0,05) tCRÍTICO = 2,57 99% (P = 0,01) tCRÍTICO = 4,03 - o limite de confiança para 95% é dado por: 100,5 2,57 3,27 6 = 100,5 ± 5,4 mg L-1 - Similarmente, para 99% de limite de confiança: = 100,5 ± 5,4 mg L-1 100,5 4,03 3,27 6 Exemplo: Dez amostras são retiradas de um lote de calcário e analisadas. O teor de Cálcio apresentou uma x = 4,30% (m/m) e um desvio-padrão estimado, s = 0,30% (m/m). Qual é o intervalo de confiança, no nível de 95%, da média do lote? n = 10; t95 = 2,262; x t s x = 4,30%; n 4,30% 0,21% s = 0,30% 2,262 0,30 4,30 10 Exemplo: Um químico para avaliar o método de quantificação para cobre, preparou uma solução conhecida de Cu de 50 mg L-1. Esta solução foi analisada seis vezes por absorção atômica, tomando para cada determinação alíquotas de 10 mL. Foram encontrados os seguintes resultados: 48,2; 51,0; 46,6; 51,5; 43,8; 46,9 mg L-1. Calcular a média, mediana, desvio das medidas, desvio padrão, coeficiente de variação e o intervalo de confiança? Média: Valores (mg L-1) 43,8 46,6 46,9 48,2 51,0 51,5 Freqüência 1 1 1 1 1 1 x x n Mediana i 288 48mg / L 6 Neste caso a mediana corresponde ao valor do meio entre: 46,9 e 48,2 = 47,5 Desvios das medidas Determinação Desvio em relação à média Desvio ao quadrado xx xx x x 2 43,8 - 48 -4,2 17,64 46,6 - 48 -1,4 1,96 46,9 - 48 -1,1 1,21 48,2 - 48 0,2 0,04 51,0 - 48 3,0 9,00 51,5 - 48 3,5 12,25 Total x i x 0 2 x x 42,10 i Desvio Padrão s 2 x x i n 1 8,42 2,902mg / L S 100 2,902 100 CV 6,04% x 48 Coeficiente de Variação: Intervalo de Confiança no nível de 95%: x t s n 2,571 2,902 48 6 48 3,05 TESTES DE SIGNIFICÂNCIA Umas das propriedades mais importantes de um método analítico é que ele deve ser isento de erros sistemáticos, isto é, o valor calculado pelo método deve ser o valor real. Entretanto, erros aleatórios fazem com que o valor medido raramente seja exatamente igual ao valor real. Para decidir se a diferença entre o valor medido e o valor padrão pode ser atribuído a estes erros aleatórios, um teste estatístico, conhecido como teste de significância, pode ser empregado. Testes estatístico para decidir se existe diferença significativa entre o valor medido e o valor padrão. Ferramentas importantes para validação de resultados Verificar se um resultado individual, no conjunto de resultados, pode ser considerado discrepante (Outlier) Verificar se existe diferença estatisticamente significativa entre a Média de valores experimentais com um valor considerado verdadeiro Se há ou não diferenças estatisticamente significativas, na precisão dos resultados de dois conjuntos de valores Se um valor médio de um conjunto de resultados é significativamente diferente de um outro valor médio obtido Valor probabilistico do limite de rejeição da Hipótese nula (H0), do erro Tipo I. Em geral adota-se o valor alfa de 0,05 ou 0,01, admitindo-se, ao rejeitar a H0, a probabilidade de ocorrência de 1 erro em 20 (5%) ou 1 em 100 (1%), respectivamente. Hipótese nula (H0): é a hipótese que se testa considerando-se não haver diferenças entre grupos específicos objetos de estudo. Hipótese alternativa (H1): é a hipótese que contraria a de nulidade, no sentido de afirmar que há diferença entre grupos específicos objetos da pesquisa TIPO 1: consiste em aceitar, como diferentes, médias de tratamentos que na verdade são iguais ERRO TIPO 2: consiste em aceitar, como iguais, médias de tratamentos que na verdade são diferentes Teste mono-caudal (unilateral) Teste estatístico no qual a H1 especifica a direção da diferença as ser detectada, assim representado: 1 0 ou 1 0 Teste bi-caudal (bi-lateral) Teste estatístico no qual a H1 (hipótese alternativa) não especifica a direção da diferença as ser detectada, como está representado: 1 0 podendo 1 ser maior ou menor a 0. Critério estatístico empregando o Teste “t” : este é um teste de significância para verificar se a média de um conjunto de dados se difere do valor verdadeiro (valor referência). Teste t (Student) Comparação entre uma média experimental e um valor conhecido: Exemplo: Em um método para determinar ferro por absorção atômica os seguintes valores foram encontrados para um material de referência contendo 38,9% de ferro: 38,9; 37,4 e 37,1%. Há alguma evidência de erro sistemático? x 37,8% s 0,964% 38,9% n 3 N 2) t.s X n n t x s t 37,8 38,9 3 0,964 t 1,98 Para 2 graus de liberdade, o valor crítico de t é 4,3 (p=0,05). No exemplo o valor t é menor, a hipótese nula é mantida, não há evidência de erro sistemático. NÚMERO DE DETERMINAÇÕES N GRAUS DE LIBERDADE N-1 NÍVEL DE CONFIANÇA Comparação das médias de duas amostras. Verificar se existe diferença significativa entre a média experimental de uma nova metodologia e a média experimental de uma metodologia referência Exemplo: Numa comparação entre dois métodos para a determinação de boro em amostras de plantas, os seguintes resultados foram obtidos em µg/mL: Método espectrofotométrico: média 28,0; desvio padrão = 0,3; n = 10 Método fluorimétrico: média = 26,25; desvio padrão = 0,23 ; n = 10 s 2 n 1 1s n 2 1s n1 n2 2 2 1 2 2 t x1 x2 1 1 s n1 n 2 10 10,3 10 10,23 0,0715 2 s2 2 10 10 2 s 0,267 t 28,0 26,25 1 1 0,267 10 10 t 14,7 Existem 18 graus de liberdade, assim, da Tabela de t (P=0,05), o valor crítico é 2,1. Como o valor experimental de t é maior do que este valor, a diferença entre os dois resultados é significante no nível de 5% e a hipótese nula é rejeitada. Teste F para comparar conjuntos de dados. Utilizado: Para determinar se uma população apresenta maior variabilidade que a outra. Para determinar se dois métodos diferem em precisão, Se qual entre dois analistas ou instrumentos de laboratório é mais preciso dentro de um nível de confiança desejado. s Fc s 2 A 2 B s 2 = Variância do conjunto de dados A A s 2 = Variância do conjunto de dados B B Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (mono-caudal). Valores críticos de F para teste mono caudal (ao nível de 5 % = p =0,05) GL 1/ 2 1 2 3 4 5 6 7 8 9 10 12 15 20 1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 1: nº de graus de liberdade no numerador; 2: nº de graus de liberdade no denominador. Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (bi-caudal). Exemplo: um analista realizou analises de potássio em solução de concentração conhecida durante vários dias. No primeiro dia para um conjunto de sete determinações encontrou um desvio de 2,5 mg L-1, e no sétimo dia encontrou um desvio de 3,3 mg L-1 (para dez replicatas). Existe alguma diferença nas determinações do analista ao nível de confiança de 95%? Nnumerador = 9 (10-1); Ndenominador = 6 (7-1); Ftabelado = 5,523 (95%, p=0,05) 2 7º 2 1 2 s 3,3 F9, 6 1,74 2 s 2,5 O valor de F calculado (1,74) é menor do que F tabelado (4,10), dessa forma não houve diferença significativa no nível de 95% de confiança entre os dois conjunto de dados, assim é aceita a igualdade das variâncias. Exemplo: O valor aceito para o teor de zinco de uma amostra padrão obtida de uma análise prévia é de 54,20 mg kg-1 (m/m) com desvio-padrão de 0,15 mg kg-1 (N = 5). Cinco análise da mesma amostra foram realizadas por um novo procedimento instrumental, obtendo-se os seguintes valores: 54,01; 54,24; 54,05; 54,27; 54,11 mg kg-1. O novo método produziu resultados consistentes com o valor aceito? s F4, 4 2 x x i N 1 0,054 0,116 4 0,152 0,0225 1,56 2 0,0144 0,12 O valor de Ftabelado para 4 Graus de Liberdade (N) no numerador e para 4 no denominador é igual a 9,6. Assim, os desvios-padrão não são significativamente diferentes, pois Fcalculado Ftabelado e o novo método instrumental proporcionam os mesmos resultados do que o método de referência. Teste-t pareado Dois métodos de análises diferentes podem ter que ser comparados pelo estudo de amostras contendo quantidades diferentes da espécie-teste (analito) t xd n sd A Tabela mostra concentrações de manganês (mg kg-1) determinadas por dois métodos diferentes para cada uma das quatro amostras: Amostra A Via Seca 71 Via Húmida 76 B C 61 50 68 48 D 60 57 Os dois métodos dão valores médios de manganês que variam significantemente? O teste de comparação das duas médias não pode ser aplicado neste caso, porque qualquer variação devida ao método seria disfarçada pelo efeito da diferença entre as porções-teste. A melhor maneira de concluir se existe diferença estatística significativa entre as duas amostra é analisando a diferença entre cada par de resultados, um de cada método. Adotando a hipótese nula de que não há diferença entre as médias de concentrações pelos dois métodos, podemos testar se as diferenças são significativamente diferentes de zero. Para os pares de valores acima, as diferenças são -5, -7, 2 e 3. A diferença média , d é -1,75 e o desvio padrão para a diferença, s d , é 4,99. Como d 0 a equação para calcular t se torna: t xd n sd 4 t 1,75 0,70 4,99 • O valor crítico de é 3,18 (P = 0,05) e como o valor calculado de é menor que isto, a hipótese nula é mantida. • O método não deu diferença significativa para os valores médios da concentração de manganês. Alguns exemplos para aplicação do teste t pareado: a quantidade de qualquer uma das espécies-teste é suficiente para uma única determinação por método. os métodos serão comparados usando uma grande variedade de amostras de diferentes fontes com diferentes concentrações. as espécies-testes podem ser de um longo intervalo de tempo e é necessário remover os efeitos sazonais (temperatura, pressão, etc.) 6 Y = 0,17508 + 0,89466 * X r = 0,9504 (N = 803) -1 ICPOES- S-SO4 (g.kg ) 5 -2 4 3 2 1 0 0 1 2 3 4 -2 5 6 -1 Turbidimetria - S-SO4 (g.kg ) Paired t-Test on Data1 col(Turbidimetr) and col(ICPOES): Data Mean Variance N -----------------------------------------------------------Turbidimetr 1,56715 0,87316 803 ICPOES 1,57714 0,77368 803 -----------------------------------------------------------t = -0,97371 p = 0,33049 At the 0,05 level, the two means are NOT significantly different. TESTE ESTATÍSTICO PAR REJEIÇÃO DE RESULTADOS DISCREPANTES (OULTLIER) Para saber se um resultado discrepante ou suspeito deve ou não ser rejeitado para o cálculo do valor médio de um conjunto de dados experimentais, deve-se aplicar um teste estatístico. Existem vários procedimentos, sendo os mais utilizados: teste de Dixon (teste Q); teste de Grubbs, teste Hampel e teste Cochran. Teste de Dixon ou teste de confiança Q O teste Q verifica: Se um resultado pertence à mesma distribuição dos outros resultados comparando com os valores tabelados a 5% e 1% de significância. Aplicação do teste Q: Os resultados são ordenados em ordem crescente, indicando o número de Z que corresponde a cada determinação; 1, 2, 3, ... até o valor maior que corresponde à determinação chamada de H, o valor anterior ao H é o H-1. TESTE Q H = 3 até 7 determinações: Extremo inferior Q Z (2) Z (1) Z ( H ) Z (1) Extremo superior Z ( H ) Z ( H 1) Z ( H ) Z (1) Q H = 8 até 12 determinações Q Z (2) Z (1) Z ( H 1) Z (1) Q Z ( H ) Z ( H 1) Z ( H ) Z (2) H = 13 ou mais determinações Z (3) Z (1) Q Z ( H 2) Z (1) Q Z ( H ) Z ( H 2) Z ( H ) Z (3) Tabela com os valores críticos para o teste de Dixon – teste Q H Valores críticos 95% (p = 0,05) 99% (p = 0,01) 3 0,970 0,994 4 0,829 0,926 5 0,710 0,821 6 0,628 0,740 7 0,569 0,608 8 0,608 0,717 9 0,564 0,672 10 0,530 0,635 11 0,502 0,605 12 0,479 0,579 13 0,611 0,697 14 0,586 0,670 15 0,565 0,647 16 0,546 0,627 17 0,529 0,610 18 0,514 0,594 19 0,501 0,580 20 0,489 0,567 Exemplos: Um analista obteve os seguintes resultados na determinação de amônia numa solução de concentração conhecida: 29,4– 29,8– 30,8- 29,3– 31,3– 30,8 – 31,8. As oito determinações são provenientes da mesma distribuição normal? Z= 29,3 29,4 29,8 30,0 30,8 30,8 31,3 31,8 1 2 3 4 5 6 7 8 ou H Z(H) = 31,8; Z(H-1) = 31,3; Z(2) = 29,4 Cálculo para os valores superiores: QS Z ( H ) Z ( H 1) 31,8 31,3 0,5 0,208 Z ( H ) Z (2) 31,8 29,4 2,4 Cálculo para os valores inferiores: Z (2) Z (1) 29,4 29,3 0,1 QI 0,05 Z ( H 1) Z (1) 31,3 29,3 2,0 O valor critico (Qc) para 95% (p = 0,05) de significância é 0,608 (tabelado) QS = 0,208 < Qc = 0,608 O valor 31,8 pertence à mesma distribuição normal, não devendo ser rejeitado. QI = 0,05 < Qc = 0,608 O valor 29,3 pertence à mesma distribuição normal, não devendo ser rejeitado. Exemplos: Foi analisado Cu em uma amostra de ração. Foram realizadas dez replicas (N=10) sendo os resultados expressos em mg L-1 conforme a tabela abaixo. Determinar quais resultados requerem rejeição. Cobre (mg/L) Z 15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,56 15,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68 1 2 3 4 5 6 7 8 9 H=10 Z(H) = 15,68; Z(H-1) =15,56; Z(1) = 15,42; Z(2) = 15,51 QI 15,51 15,42 0,09 0,643 15,56 15,42 0,14 QI = 0,643 QC = 0,530 (p = 0,05) QS = 0,706 QC = 0,530 (p = 0,05) QS 15,68 15,56 0,12 0,706 15,68 15,51 0,17 O valor 15,42 não pertence à mesma distribuição normal, devendo ser rejeitado. O valor 15,68 não pertence à mesma distribuição normal, devendo ser rejeitado. Cobre (mg/L) 15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,56 15,42 X 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68 Z 1 2 3 4 5 6 7 8 9 H=10 Z * 1 2 3 4 5 6 7 H=8 * X Z(H) = 15,56; Z(H-1) =15,56; Z(1) = 15,51; Z(2) = 15,52 QI 15,52 15,51 0,01 0,00 15,56 15,56 0,0 QS 15,56 15,56 0,0 0,00 15,56 15,52 0,04 QI = 0,00 QC = 0,608 (p = 0,05) QS = 0,00 < QC = 0,608 (p = 0,05) Nenhum dos valores devem ser rejeitados Teste de Grubbs (http://www.graphpad.com/quickcalcs/Grubbs1.cfm) O teste de Grubbs (G) é realizado por meio da razão entre a diferença de cada resultados ( xi ) com a média de todos os resultados ( x ) em relação ao desvio padrão ( s ). Um valor é considerado como “outlier” quando o valor de “G” é maior que o valor crítico (GCRITICO) correspondente valores tabelado (GRUBBS, 1969). O teste é realizado no nível de significância de 95 % e repetido até não serem detectados outros “outliers xi x G s TABELA TESTE DE GRUBBS N 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Critical Z 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.29 2.34 2.41 2.46 2.51 2.55 2.59 2.62 2.65 2.68 2.71 2.73 2.76 2.78 2.80 2.82 2.84 N 27 28 29 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100 110 120 130 140 Critical Z 2.86 2.88 2.89 2.91 2.92 2.94 2.95 2.97 2.98 2.99 3.00 3.01 3.03 3.04 3.13 3.20 3.26 3.31 3.35 3.38 3.42 3.44 3.47 3.49 Exemplo: Para o mesmo conjunto de dados do exemplo anterior, calcular o valor de G. xi 29,3 29,4 29,8 30,0 30,8 30,8 31,3 31,8 xi x xi x 2 Gcalculado -1,1 1,21 -1,206 -1 1 -1,096 -0,6 0,36 -0,658 -0,4 0,16 -0,439 0,4 0,16 0,439 0,4 0,16 0,439 0,9 0,81 0,987 1,4 1,96 1,536 x x 2 x 243,2 i 5,82 x 30,4 s 2 x x i n 1 5,82 0,912 7 G1 xi x 29,3 30,4 1,206 s 0,912 n = 8; Nível de significância: 95% 31,8 30,4 G8 1,536 0,912 Gcalculado= 1,536 Gtabelado= 2,13 Teste de Hampel O teste de Hampel é considerado método robusto para detectar resultados considerados “outliers”. Inicialmente, é calculado o residual individual ( ri ) por meio da diferença do resultado do laboratório ( xi ) em relação à mediana ( Med ) de todos os resultados. A seguir os valores obtidos dos ri , são ordenados em ordem crescente (sem considerar o sinal), sendo então encontrado o valor residual mediano ( rmed ). O valor é considerado um “outlier” quando o ri for maior do que rmed 5,06 , considerando nível de significância de 95 % (LINSINGER, et al, 1998). ri ri xi X se OUTLIER X Residual absoluto Mediana ri ≥ rm x 5,06 rm = residual mediano Exemplo Teste de Hampel: Para o mesmo conjunto de dados do exemplo anterior. xi ri ri* 29,3 29,4 29,8 30 30,8 30,8 31,3 31,8 -1,1 -1,0 -0,6 -0,4 0,4 0,4 0,9 1,4 0,4 0,4 0,4 0,6 0,9 1,0 1,1 1,4 rmed = 0,75 Med =30,4 rmed 5,06 = 3,795 ri* = residual individual ordenado em ordem crescente e sem considerar o sinal. Exercício: Verificar Outlier pelos testes de Hampel e Grubbs Cobre (mg/L) 15,42 HAMPEL Med 15,51 15,52 15,52 15,53 15,53 GRUBBS xi 15,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68 15,53 ri -0,11 -0,02 -0,01 -0,01 0,00 0,00 0,010 0,03 0,03 0,15 rmed rmed 5 , 06 ri* 0,11 0,02 0,01 0,01 0,00 0,00 0,01 0,03 0,03 0,15 0,015 0,08 Media s n G tabelado 15,54 15,56 xi 15,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68 15,537 0,064 10 2,29 15,56 G -1,834 -0,423 -0,267 -0,267 -0,110 -0,110 0,047 0,361 0,361 2,242 15,68 G 1,83 0,42 0,27 0,27 0,11 0,11 0,05 0,36 0,36 2,24 Teste de Cochran O teste de Cochran é usado para comparar a maior variância com as outras variâncias de um grupo. Pode ser usado para comparar a precisão de vários analistas ou vários métodos de análises ou vários laboratórios. C 2 s máx p 2 s i i 1 s 2 máx p = maior variância s 2 i = a soma de todas as variâncias i 1 p = número de laboratórios, analista ou métodos n = número de determinações realizadas por cada analista TABELA TESTE DE COCHRAN TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%) p n=2 n=3 n=4 n=5 2 0,975 0,939 0,906 3 0,967 0,871 0,798 0,746 4 0,906 0,768 0,684 0,626 5 0,841 0,684 0,598 0,544 6 0,781 0,616 0,532 0,48 7 0,727 0,561 0,48 0,431 8 0,68 0,516 0,438 0,391 9 0,638 0,478 0,403 0,358 10 0,602 0,445 0,373 0,331 11 0,57 0,417 0,348 0,308 12 0,541 0,392 0,326 0,288 13 0,515 0,371 0,307 0,271 14 0,492 0,352 0,291 0,255 15 0,471 0,335 0,276 0,242 16 0,452 0,319 0,262 0,23 17 0,434 0,305 0,25 0,219 18 0,418 0,293 0,24 0,209 19 0,403 0,281 0,23 0,2 20 0,389 0,27 0,22 0,192 Exemplo Teste de Cochran Quatro analistas analisaram uma solução de hidróxido de sódio de concentração conhecida e encontraram os seguintes resultados: Analista Determinações (%) 1 6 10,20 0,190 2 6 10,00 0,486 3 6 10,70 0,179 4 6 10,20 0,121 O analista 2 apresenta uma variabilidade excessiva, diferente dos demais? 2 0,486 0,236 C 0,74 2 2 2 2 0,190 0,486 0,179 0,121 0,3189 O valor critico para p = 4 e n = 6 (para 5% de significância) é igual a 0,590 (tabelado) e para 1% de significância é igual a 0,676. O valor calculado (0,74) é maior que o valor tabelado, assim conclui-se que os resultados do analista 2 são menos precisos do que os resultados dos outros analistas. Numa mesma amostra de ração foi analisado o teor de fósforo, com a participação de 5 laboratórios diferentes; os resultados obtidos estão na tabela abaixo. Através do teste de Cochran verificar a homogeneidade das variâncias dos laboratórios: Laboratório C Média s2 1 32,6 31,9 33,0 32,5 0,3100 2 23,7 22,0 22,7 22,8 0,7300 3 24,6 24,6 23,6 24,3 0,3333 4 30,5 30,3 31,5 30,8 0,4133 5 23,0 24,0 24,8 23,9 0,8133 2 s máx p 2 s i i 1 P-PO4 (g/kg) 0,8133 C 0,3168 [0,3100 0,7300 0,3333 0,4133 0,8133] p=5en=3 Valor critico para 5% de significância: 0,684 Valor critico para 1% de significância: 0,788 O valor calculado (0,3168) é menor que o valor tabelado, assim conclui-se que o valor calculado é menos variável, isto é, mais preciso. Não deve ser rejeitada a variância do LAB. 5. Controle de Qualidade CIQ CEQ CIQ Objetivo: manter as condições de validação no laboratório por longo tempo Repetições de análises Uso de materiais de referência Uso de cartas controle CEQ Objetivo: assegurar a comparabilidade dos resultados entre laboratórios Participação em Ensaios de Proficiência (programas interlaboratoriais)