Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 1 ESTUDO DE CASO 3 COMENTÁRIOS E SOLUÇÕES PROPOSTAS Para realizar este estudo de caso, transfira inicialmente o arquivo "Miastenia.xls" para um diretório de trabalho do computador que você está usando. Este arquivo contém uma planilha com dados parciais da evolução clínica e terapêutica de 228 pacientes com miastenia, atendidos no Ambulatório de Neurologia do Hospital das Clínicas da Faculdade de Medicina da USP (HCFMUSP). São casos reais, acompanhados pelo Prof.Dr. Paulo Marchiori, Prof.Dr. Antonio Zambon e equipe de assistentes do HC-FMUSP, modificados pelo Prof.Dr. Raymundo S. de Azevedo, para exercício dos alunos da Disciplina de Métodos Quantitativos em Medicina. A planilha é composta pelos seguintes campos (colunas): CAMPO (coluna) registro_serial idade_últimaconsulta sexo cor profissão idade_diagnóstico timectomia idade_timectomia Osserman_inicial anticolinesterásico_inicial corticóide_inicial patologia_timo tempo_corticóide Osserman_final anticolinesterásico_final corticóide_final Significado número de série para identificar o paciente idade do paciente quando estes dados foram anotados (em anos) sexo do paciente (M = masculino ; F = feminino) cor da pele do paciente (AMARELA; BRANCA; MULATA; NEGRA) profissão exercida pelo paciente no início da doença idade em que foi feito o diagnóstico de miastenia (em anos) indicação de realização da timectomia (SIM ou NÃO) idade em que foi realizada a timectomia (em anos) Classificação de Osserman* na primeira consulta ( A = remissão dos sintomas; I = apenas ocular; IIa = leve e generalizado; IIb = moderado e generalizado; IV = grave ). dose de anticolinesterásico prescrita no início do tratamento (em mg) dose de corticóide prescrita no início do tratamento (em mg) diagnóstico anátomo-patológico do timo retirado (TNL = timo normal; AT = timo atrófico; HFT = hiperplasia de timo; TB = timoma benigno; TM = timoma maligno; 0 = não realizada timectomia) tempo de administração de corticóide (em anos) Classificação de Osserman na última consulta, quando estes dados foram anotados dose de anticolinesterásico atual (em mg) dose de corticóide atual (em mg) 1) Para realizar este item do estudo de caso, serão utilizadas as variáveis idade_últimaconsulta, sexo, cor, idade_diagnóstico, idade_timectomia, Osserman_inicial e Osserman_final. timectomia, a) Repare que há variáveis quantitativas contínuas (idades), e qualitativas discretas (sexo, cor, timectomia e escala de Osserman). Portanto, usaremos 2 maneiras diferentes para apreciar estes dados. b) Para verificar como as variáveis relacionadas a idade se distribuem, vamos lançar mão da descrição básica que o programa Minitab oferece, acionando a partir do menu principal a opção Stat, Basic Statistics e Display Descriptive Statistics . b.1. Aparece uma janela que mostra todas as variáveis quantitativas da planilha. Escolha uma de cada vez para poder analisar os resultados. b.2. Acione o botão Graphs... e opte por Graphical Summary. Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 2 b.3. Analise os resultados que tem um relatório semelhante ao que se segue: Descriptive Statistics: idade_últimaconsulta Variable idade_úl N 228 Variable idade_úl Mean 38.46 Minimum 12.00 Median 35.00 Maximum 86.00 Q1 27.25 TrMean 37.82 StDev 15.10 SE Mean 1.00 Q3 47.00 Descriptive Statistics Variable: idade_última Anderson-Darling Normality Test A-Squared: P-Value: 15 30 45 60 75 95% Confidence Interval for Mu 2.813 0.000 Mean StDev Variance Skewness Kurtosis N 38.4649 15.0998 228.003 0.680472 -7.1E-02 228 Minimum 1st Quartile Median 3rd Quartile Maximum 12.0000 27.2500 35.0000 47.0000 86.0000 95% Confidence Interval for Mu 36.4944 33 34 35 36 37 38 39 40 41 40.4354 95% Confidence Interval for Sigma 13.8293 16.6292 95% Confidence Interval for Median 95% Confidence Interval for Median 33.0000 39.0000 b.4. Repita esta operação para cada variável quantitativa de interesse. c) Para as variáveis discretas, é possível contar quantos pacientes há em cada categoria, montando tabelas para cada variável de interresse. Não é apropriado descrever estas variáveis calculando-se médias e variância, porque estas variáveis são nominais (cor, sexo, timectomia) ou ordinais (escala de Osserman, com gradação de gravidade da miastenia). c.1. Para tanto vamos acionar Stat, Tables, Tally, abrindo uma janela para preenchimento. c.2.Observe que são apresentadas todas as 17 variáveis que compõe esta planilha. Localize as variáveis discretas de interesse. c.3.Selecione as 5 variáveis pedidas para este estudo e opte para que sejam apresentadas as contagens e porcentagens de cada categoria, “clicando” em Display os quadrinhos Count e Percent seguidos de um clique no botão Ok. c.4.Observe o relatório que se apresenta semelhante ao transcrito abaixo: Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 3 Tally for Discrete Variables: sexo; cor; timectomia; Osserman_ini; Osserman_fin sexo F M N= Count 171 57 228 Percent 75.00 25.00 Osserman_inicial I IIa IIb IV N= cor AMARELA BRANCA MULATA NEGRA N= Count 3 63 66 96 228 Percent 1.32 27.63 28.95 42.11 Count 9 178 34 7 228 Percent 3.95 78.07 14.91 3.07 timectomia NÃO SIM N= Osserman_final A I IIa IIb IV N= Count 89 102 34 2 1 228 Count 59 169 228 Percent 25.88 74.12 Percent 39.04 44.74 14.91 0.88 0.44 c.5.Ao observar os dados organizados nestas tabelas, constatamos que a miastenia apresenta maior frequência entre mulheres (75% dos pacientes atendidos neste ambulatório) e pessoas de cor branca (78,07% desta casuística). Repare que acabamos de levantar uma hipótese sobre a ocorrência de miastenia, que deverá ser devidamente testada com métodos estatísticos. Outros fatos que podemos constatar analisando estas tabelas é ser a timectomia um procedimento frequentemente indicado em pacientes com miastenia, neste grupo estudado. Finalmente, após a introdução de anticolinesterásicos associados ou não a corticóides, combinado ou não com a timectomia, oservamos que 39,04% dos pacientes ficam assintomáticos (A na escala de Osserman) e 44,7% apresentam apenas sintomas oculares (I na escala de Osserman). c.6.Esta primeira abordagem descritiva tem grande valor, pois abre a possibilidade de formularmos as primeiras hipóteses a respeito da história natural de uma doença. 2) A gravidade da miastenia é avaliada pela escala de Osserman, que classifica a doença em 6 estágios (leia mais a respeito no capítulo 53 do livro “Adams and Victor’s Principles of Neurology”, a partir do site da FMUSP, na página da Biblioteca Central http://www.fm.usp.br/sobre/biblioteca/index.htm , no item OVID, clicando em Books@ovid , ou diretamente em http://pco.ovid.com/lrppco/index.html de qualquer computador dentro da FMUSP). a) Repare que a escala de Osserman é uma variável discreta, ordenável, ou seja, podemos colocar em ordem crescente da menor gravidade (A , pacientes assintomáticos) para a maior gravidade (IV , pacientes com necessidade de ventilação assistida). Portanto, não há cabimento em pressupor uma distribuição normal para esta variável. Consequentemente, para testar se há diferença entre homens e mulheres quanto a gravidade da miastenia no momento do diagnóstico, será necessário aplicar um Teste Não-Paramétrico. b) Considerando que são 2 amostras independentes (grupo de mulheres e grupo de homens), o teste não-paramétrico indicado é o Teste de MannWhitney. c) O teste de hipóteses tem a seguinte formulação: Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 H0: OssermanMulheres = OssermanHomens 4 HA: OssermanMulheres OssermanHomens d) Para operar o teste de Mann-Whitney no programa MINITAB, será necessário recodificar a variável Osserman_inicial de texto para número. Para tanto, clique em Manip, Code, Text to Numeric . Abriu-se uma janela, onde deverá ser preenchido o campo Code data from column: clicando-se na variável que se deseja recodificar, no nosso caso Osserman_inicial; no campo Into column: indica-se a coluna previamente identidicada por você em local vazio, por exemplo na coluna C19 coloque um nome para a nova variável (sugestão Osserman_inicial_numeric). Finalmente, nos campos Original values: coloque a escala A e em New: o novo valor 0. E assim por diante, para a escala I atribua o novo valor 1, para IIa o valor 2, para IIb o valor 2.5 e para IV o valor 4. Clique em OK e observe a coluna criada. e) Agora será preciso criar uma coluna com os valores dos pacientes homens e uma coluna para as pacientes mulheres. Isso pode ser conseguido acionando Manip, Split worksheet, indicando no campo By variable a variável sexo, gerando assim duas planilhas. f) Copie as duas colunas com os dados de Osserman_Inicial_numeric dos homens ao lado dos dados das mulheres. Renomeie cada coluna (por exemplo H_Oss_Ini e F_Oss_Ini), clique em Stat, Nonparametrics, MannWhitney e preencha os campos da janela que se abre. Como nosso teste de hipótese é verificar se a escala de Osserman é igual ou diferente entre homens e mulheres, escolha em Alternative a opção not equal (que já está selecionada em geral, como opção automática do MINITAB). g) Clique em OK e obtem-se um relatório similar ao transcrito abaixo: Mann-Whitney Test and CI: H_Oss_Ini; F_Oss_Ini Osserman N = 57 Median = 2.5000 Osserman N = 171 Median = 2.5000 Point estimate for ETA1-ETA2 is -0.0000 95.0 Percent CI for ETA1-ETA2 is (-0.5001;-0.0002) W = 5790.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at The test is significant at 0.0689 (adjusted for ties) 0.0879 Cannot reject at alpha = 0.05 h) Observe que o valor obtido de P (0.0879) é maior que o nível de significância estabelecido ( = 0.05). Portanto aceitamos H0 e conclui-se que não há diferença entre homens e mulheres quanto a escala de Osserman no momento inicial de diagnóstico. Em outras palavras, não há diferença entre homens e mulheres quanto a gravidade da miastenia no momento em que se fez o diagnóstico dos pacientes do ambulatório de Neurologia do HCFMUSP. 3) A dose inicial de anticolinesterásico é uma variável quantitativa contínua. Observe a variação da dose clicando em STAT, Basic Statistics, Display Descriptive Statistics..., e selecione a variável anticolinesterásico_inicial . Repare que podemos utilizar a média e desvio padrão para descrever esta variável. Pelo Teorema Central do Limite, sabemos que a distribuição das Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 5 médias de uma variável contínua tem distribuição de Gauss (ou normal). Assim sendo deveremos aplicar um teste t para determinar se a dose inicial de anticolinesterásico é maior nas mulheres do que nos homens com miastenia. a) Depois de criar as colunas de dose de anticolinesterásicos para homens e mulheres, e antes de realizar o teste t para duas amostras independentes, devemos determinar se as variância da dose de anticolinesterásicos é igual ou diferente no grupo de homens e de mulheres. Para tanto, aplicaremos o teste F, clicando em STAT, Basic Statistics, 2 variances, preenchendo os campos da janela que se abre. Clique em OK e procure no relatório que é produzido o teste F, como o que segue abaixo: F-Test (normal distribution) Test Statistic: 1.165 P-Value : 0.456 b) Repare que o valor de P obtido (= 0.456) é maior que o nível de significância determinado ( = 0.01). Portanto, aceitamos a hipótese nula e concluimos que as variâncias são estatisticamente iguais. Esta conclusão será utilizada no teste t, mostrado a seguir. c) O teste de hipóteses tem a seguinte formulação: H0: DoseMulheres DoseHomens HA: DoseMulheres DoseHomens d) Para realizar o teste t para duas amostras independentes, clique em STAT, Basic Statistics, 2-sample t... e indique em Samples in different columns os nomes das variáveis a serem testadas. Indique que as variâncias são iguais em Assume equal variances. Clique em Options... e indique em Alternative a opção Greater than . Clique em OK e novamente em OK. Observe o relatório que aparece na área de trabalho, similar ao transcrito abaixo: Two-Sample T-Test and CI: F_anticolinester; M_anticolinester Two-sample T for F_anticolinesterásico_inicial vs M_anticolinesterásico_inicial F_antico M_antico N 171 57 Mean 242.5 236.8 StDev 37.0 40.0 SE Mean 2.8 5.3 Difference = mu F_anticolinesterásico_inicial - mu M_anticolinesterásico_inicial Estimate for difference: 5.61 95% lower bound for difference: -3.93 T-Test of difference = 0 (vs >): T-Value = 0.97 P-Value = 0.166 DF = 226 Both use Pooled StDev = 37.8 e) O valor de P obtido (0.166) é maior que o nível de significância ( = 0.01), levando-nos a concluir que a dose de anticolinesterásicos não é maior em mulheres quando comparada com a dose usada em homens. 4) Temos 2 grupos para serem comparados: pacientes timectomizados e pacientes tratados só clinicamente. O efeito que se pretende verificar é a melhora da miastenia utilizando-se a escala de Osserman, que é uma variável qualitativa Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 6 categórica ordinal. Portanto o teste a ser utilizado é não-paramétrico, no caso o Teste de Mann-Whitney por se tratar de 2 grupos independentes (timectomizados x tratamento clínico). a) Antes de realizar o teste de Mann-Whitney, devemos preparar os dados de modo apropriado, transformando a escala de Osserman de texto para número (veja o item 2d). b) Repare que há 2 anotações para a Escala de Osserman, a saber: em um momento inicial e num momento final. Considerando que desejamos verificar o efeito relativo da timectomia associada aos medicamentos, em comparação com os medicamentos sem a cirurgia, é mais apropriado calcular uma nova variável que expresse a diferença do Osserman inicial para o Osserman final. Basta para isto, depois de codificar as variáveis Osserman_Inicial e Osserman_Final de texto para número (exemplo Oss_Ini e Oss_Fim), criar uma nova coluna, por exemplo Osserman_Diferença, clicar em Calc, Calculator e realizar a operação Oss-Ini menos Oss_Fim . c) Resta então separar os dois grupos (timectomia e clínico) em duas colunas diferentes para poder realizar o teste de Mann-Whitney. O teste de hipóteses é formulado da seguinte maneira: H0: Oss_DIFtimectomia = Oss_DifClínico HA: Oss_DIFtimectomia Oss_DifClínico d) Copie as duas colunas com os dados de Oss_DIF de pacientes submetidos a timectomia ao lado dos pacientes sob tratamento clínico. Renomeie cada coluna (por exemplo Oss_DIF_Timectomia e Oss_DIF_Clínico), clique em Stat, Nonparametrics, Mann-Whitney e preencha os campos da janela que se abre. Como nosso teste de hipótese é para verificar se a diferença produzida na escala de Osserman é igual ou diferente entre pacientes timectomizados e pacientes não operados, escolha em Alternative a opção not equal . e) Clique em OK e observe o relatório semelhante ao copiado a seguir: Mann-Whitney Test and CI: Oss_DIF_Timectomia; Oss_DIF_Clínico TmcDIF_O N = 169 Median = 2.5000 ÑTmcDIF_ N = 59 Median = 1.0000 Point estimate for ETA1-ETA2 is 1.0000 90.0 Percent CI for ETA1-ETA2 is (1.0001;1.5001) W = 22258.5 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at The test is significant at 0.0000 (adjusted for ties) f) 0.0000 O valor de P obtido ( < 0.0001 ) é bastante menor que o valor do critério estabelecido para significância ( = 0.01). Portanto rejeitamos a hipótese nula e podemos concluir que a timectomia produz uma mudança na escala de Osserman em pacientes com miastenia que é diferente do tratamento com medicamentos apenas. g) Se quisermos saber se a timectomia produz uma diferença maior na escala de Osserman, temos um outro teste de hipótese: H0: Oss_DIFtimectomia Oss_DifClínico HA: Oss_DIFtimectomia Oss_DifClínico Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 7 h) Rodando o teste de Mann-Whitney com a opção Greater than em Alternative, temos o seguinte relatório: Mann-Whitney Test and CI: Oss_DIF_Timectomia; Oss_DIF_Clínico TmcDIF_O N = 169 Median = 2.5000 ÑTmcDIF_ N = 59 Median = 1.0000 Point estimate for ETA1-ETA2 is 1.0000 90.0 Percent CI for ETA1-ETA2 is (1.0001;1.5001) W = 22258.5 Test of ETA1 = ETA2 vs ETA1 > ETA2 is significant at The test is significant at 0.0000 (adjusted for ties) i) 0.0000 O valor de P é menor que o de , e portanto podemos dizer que a timectomia associada às drogas tem um efeito maior na redução dos sintomas da miastenia quando comparada ao tratamento medicamentoso isolado. 5) A dose de corticóide é uma variável quantitativa contínua, portando aplica-se o mesmo raciocínio da solução apresentada no item 3 (ver acima). a) Depois de criar as colunas de dose de corticóide depois da timectomia e para o grupo de tratamento clínico, e antes de realizar o teste t para duas amostras independentes, devemos determinar se a variância da dose de corticóide é igual ou diferente no grupo de timectomizados e de pacientes tratados clinicamente apenas. Para tanto, aplicaremos o teste F, clicando em STAT, Basic Statistics, 2 variances, preenchendo os campos da janela que se abre. Clique em OK e procure no relatório que é produzido o teste F, como o que segue abaixo: F-Test (normal distribution) Test Statistic: 1.051 P-Value : 0.847 b) Repare que o valor de P obtido (= 0.847) é maior que o nível de significância determinado ( = 0.01). Portanto, aceitamos a hipótese nula e concluimos que as variâncias são estatisticamente iguais. Esta conclusão será utilizada no teste t, mostrado a seguir. c) Neste caso, a formulação do teste de hipóteses é a seguinte: H0: Dosetimectomia DoseClínico HA: Dosetimectomia DoseClínico d) Para realizar o teste t para duas amostras independentes, clique em STAT, Basic Statistics, 2-sample t... e indique em Samples in different columns os nomes das variáveis a serem testadas. Indique que as variâncias são iguais em Assume equal variances. Clique em Options... e indique em Alternative a opção Less than . Clique em OK e novamente em OK. Observe o relatório que aparece na área de trabalho, similar ao transcrito abaixo: Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 8 Two-Sample T-Test and CI: Timect_corticóide_final; Clínico_corticóide_final Two-sample T for Timect_corticóide_final vs Clínico_corticóide_final Timect_c Clínico_ N 169 59 Mean 2.56 3.86 StDev 7.56 7.37 SE Mean 0.58 0.96 Difference = mu Timect_corticóide_final - mu Clínico_corticóide_final Estimate for difference: -1.30 95% upper bound for difference: 0.58 T-Test of difference = 0 (vs <): T-Value = -1.14 P-Value = 0.127 DF = 226 Both use Pooled StDev = 7.51 f) O valor de P obtido (0.127) é maior que o nível de significância ( = 0.01), levando-nos a concluir que a dose de corticóide não é menor em timectomizados quando comparada com a dose usada em pacientes sob terapêutica clínica. 6) Como visto anteriormente, a dose de anticolinesterásico é uma variável quantitativa contínua, portanto podemos considerar a distribuição das médias como sendo gaussiana (normal). Observe que se deseja comparar a dose média de 4 grupos etários distintos ao mesmo tempo. Em outras palavras, pretende-se determinar se há diferença na dose de anticolinesterásico necessária para controlar a miastenia para diferentes grupos de idade (mais de 2 grupos, simultaneamente). Temos então um caso para ser resolvido por ANOVA (Análise de Variância). Note que o nível de significância não foi pré-definido no enunciado. Portanto, cabe a você escolher o critério a ser usado. Para este exercício, sugere-se de 5%. a) Para realizar a ANOVA (análise de variância), devemos antes constituir uma nova variável que identifique os 4 grupos etários. Assim, ative a planilha miastenia.xls e numa coluna vazia coloque o título Grupo_Etário. b) Em seguida, clique em Manip, Code, Numeric to Numeric e preencha os campos na janela que se abre da seguinte maneira: no campo Code data from column: indique a variável idade_diagnóstico, que vai ser recodificada no campo Into column: Grupo_Etário. Finalmente, nos campos Original values: coloque as faixas etárias de 6:21 e em New: o novo valor 1. E assim por diante, para idades de 22:29 atribua o novo valor 2, para 30:39 o valor 3, para 40:100 o valor 4. Clique em OK e observe a coluna criada. c) Agora para realizar a análise de variância, clique em Stat, ANOVA, Oneway... e preencha os campos na janela aberta da seguinte forma: no campo Response: coloque a variável de estudo anticolinesterásico_inicial e no campo Factor: indique a nova variável Grupo_Etário. Clique OK e observe o relatório gerado pelo MINITAB como segue abaixo: One-way ANOVA: anticolinesterásico_inicial versus Grupo_Etário Analysis of Variance for anticoli Source DF SS MS Grupo_Et 3 6330 2110 Error 224 317417 1417 Total 227 323747 F 1.49 P 0.218 Disciplina de Métodos Quantitativos (MPT-164) Setembro de 2002 Level 1 2 3 4 N 81 53 50 44 Pooled StDev = Mean 237.04 250.19 237.60 241.36 37.64 StDev 37.83 40.31 34.20 37.70 9 Individual 95% CIs For Mean Based on Pooled StDev ---+---------+---------+---------+--(-------*-------) (---------*---------) (----------*---------) (----------*-----------) ---+---------+---------+---------+--230 240 250 260 d) Repare que o valor de P obtido (= 0.218) é maior que o nível de significância escolhido ( = 0.05). Portanto, aceitamos H0 e concluimos que a dose de anticolinesterásico no início do tratamento é semelhante para os 4 diferentes grupos etários. 7. Aproveite a planilha fornecida e construa novos testes de hipótese com as variáveis disponíveis. Faça perguntas aos dados coletados e tente respondê-las com os métodos até aqui apresentados.