INSTITUTO DE SAÚDE DA COMUNIDADE DEPARTAMENTO DE EPIDEMIOLOGIA E BIOESTATÍSTICA Lista de Exercícios de Epidemiologia I Alunos: ______________________________________________________ Múltipla-escolha 1) Relacione cada uma das variáveis abaixo com uma classificação na coluna da direita: Variável 1. Marca de antitérmico preferida 2. Temperatura corpórea (°C) 3. Grau de satisfação com o atendimento médico 4. Pressão arterial (mmHg) a) 1A; 2D; 3A; 4E; d) 1B; 2E; 3C; 4E; Tipo de Variável A. Categórica nominal dicotômica B. Multicategórica nominal C. Multicategórica ordinal D. Quantitativa discreta E. Quantitativa contínua b) 1B; 2C; 3C; 4D; e) 1D; 2D; 3A; 4D. c) 1D; 2E; 3D; 4E; 2) Observe a tabela abaixo: Tabela 1 – Sororreatividade para infecção chagásica de habitantes de Taquarituba, SP, Brasil, 1974 a 1976. Localidade Amostras Examinadas Amostras Positivas N % Amostras Negativas N % Campos 731 123 16,8 608 83,2 Neves 473 55 11,6 418 88,4 Nunes 597 73 12,2 524 87,8 Pico 576 72 12,5 504 87,5 Leites 407 57 14,0 350 86,0 Total 2.784 380 13,6 2.404 86,4 As variáveis “Localidade” e “Amostras examinadas” são, respectivamente: a) Categórica nominal e Categórica ordinal dicotômica; c) Categórica ordinal e Categórica ordinal dicotômica; e) Categórica nominal e Quantitativa contínua. b) Categórica nominal e Quantitativa discreta; d) Categórica ordinal e Quantitativa discreta; 3) Para descrever adequadamente uma distribuição de freqüências, não basta conhecer o centro da distribuição, sendo necessária alguma idéia da variabilidade dos dados. A medida de variabilidade mais usada, e bastante representativa em dados com distribuição simétrica, é: a) Amplitude; d) Desvio padrão; b) Média; e) Coeficiente de variação. c) Desvio absoluto médio; 4) O número de resfriados adquiridos por oito estudantes num determinado período foi respectivamente: 1, 2, 2, 3, 4, 4, 6 e 8. A média, a mediana e a moda foram, nesta ordem: a) 3,75; 3,5; 2; d) 3,75; 3,5; 4; b) 3,5; 3,75; 2 e 4; e) 3,5; 3,75; 4. c) 3,75; 3,5; 2 e 4; 5) Um nono estudante, com deficiência imunológica, foi incluído na amostra e apresentou 26 resfriados no mesmo período. Assinale a alternativa correta: a) A mediana foi mais alterada do que a média; c) A moda foi mais alterada do que a média; e) A moda e a mediana foram igualmente alteradas. b) A moda foi mais alterada do que a mediana; d) A média foi mais alterada do que a mediana; 6) Numa distribuição de freqüência com classes e com limites perfeitamente definidos e na qual uma moda é reconhecível, a média aritmética, a mediana e a moda coincidem quando: a) As freqüências forem iguais; b) As classes tiverem a mesma amplitude; c) Houver pequena variabilidade; d) A distribuição for perfeitamente simétrica; e) Houver grande variabilidade. 7) O desvio padrão de uma distribuição: a) É sempre nulo; d) Pode ser positivo ou negativo; b) É sempre negativo; e) É sempre par. c) É sempre positivo; 8) Em uma distribuição de freqüências assimétrica ou quando não temos muita segurança quanto à confiabilidade de todos os dados, quais as medidas de tendência central e de dispersão mais indicadas? a) Moda e desvio absoluto; d) Média e quartis; b) Média e desvio padrão; e) Moda e desvio padrão. c) Mediana e quartis; 9) Com base na tabela abaixo, assinale a alternativa correta: Tabela 2 – Níveis das variáveis bioquímicas dos 970 empregados do CENPES, Rio de Janeiro, 2000. Estatísticas Descritivas Glicemia (mg/dl) Colesterol (mg/dl) HDL (mg/dl) LDL (mg/dl) Triglicerídeos (mg/dl) Média 91,9 208,4 48,1 132,3 143,3 Desvio-padrão 16,1 41,3 11,5 36,5 127,1 Mínimo 65 107 22 20,8 32 1o quartil 85 179 40 107,2 76 Mediana 90 205 46 130,6 109 3o quartil 95 231 55 151,8 165 Máximo 299 376 110 297,5 1.725 N = 967 I. 25% dos indivíduos do estudo apresentam glicemia menor que 85 mg/dl. II. O valor de colesterol igual a 376 mg/dl corresponde ao percentil de 100%. III. 95% dos indivíduos do estudo apresentam valores de triglicerídeos entre 76 e 165 mg/dl. a) Somente a alternativa I está correta; d) Há duas alternativas corretas; b) Somente a alternativa II está correta; e) Todas as alternativas estão incorretas. c) Somente a alternativa III está correta; Com relação às questões 10 a 12, os únicos testes possivelmente utilizados são o t de Student ou o qui-quadrado. 10) Os usuários de um posto de saúde foram avaliados para testar a associação entre idade e satisfação com o atendimento. Entre os 52 usuários insatisfeitos com o atendimento, 33 apresentavam idade igual ou maior que 40 anos. Entre os usuários satisfeitos com o atendimento, 25 apresentavam idade igual ou maior que 40 anos. O teste de hipóteses apresentou um valor-p = 0,007. Para uma significância estatística de 99%, assinale a resposta correta: I – O teste de hipóteses utilizado foi o teste qui-quadrado, que testa diferenças entre proporções. II – Há uma associação estatisticamente significativa entre a idade e a satisfação com o atendimento. III – Os usuários com idade maior ou igual a 40 anos apresentavam, estatisticamente, igual freqüência de satisfação com o atendimento do que os usuários com idade menor de 40 anos. a) Somente a afirmativa I está correta; d) Somente a afirmativa III está errada; b) Somente a afirmativa II está correta; e) Nenhuma das afirmativas está correta. c) Somente a afirmativa III está correta; 11) Foi realizado um estudo sobre a associação entre escore de Apgar no quinto minuto de vida (Apgar 5) e desfecho da internação em recém-nascidos (RNs) internados em uma CTI neonatal. Entre os 773 RNs que tiveram alta da CTI neonatal, o Apgar 5 médio foi de 6,5 (desvio-padrão = 1,34). Nos 202 RNs que foram a óbito, o Apgar 5 médio foi de 5,9 (desvio-padrão = 1,08). O teste estatístico utilizado apresentou um valor-p << 0,01. Para uma significância estatística de 95%, assinale a resposta correta: I – O teste de hipóteses utilizado foi o t de Student, que testa diferenças entre médias. II – O Apgar 5 dos dois grupos de RNs foi estatisticamente igual. III – Os RNs que tiveram alta da CTI neonatal apresentaram, estatisticamente, maior Apgar 5 do que os RNs que foram a óbito. a) Somente a afirmativa I está correta; d) Somente a afirmativa II está errada; b) Somente a afirmativa II está correta; e) Nenhuma das afirmativas está correta. c) Somente a afirmativa III está correta; 12) Foi realizado um estudo sobre o número de dentes perdidos em adultos de dois municípios: Baixo Guandu e Ibatiba. Em Baixo Guandu, foram avaliados 141 indivíduos, com um número médio de 2,32 dentes perdidos (desvio-padrão = 3,00 dentes). Em Ibatiba, foram avaliados 35 indivíduos, com um número médio de 2,46 dentes perdidos (desvio-padrão = 3,08 dentes). O teste estatístico utilizado apresentou um valor-p = 0,849. Para uma significância estatística de 95%, assinale a resposta correta: I – O teste de hipóteses utilizado foi o teste t de Student, que testa diferenças entre proporções. II – Os adultos de Ibatiba apresentam, estatisticamente, mais dentes perdidos do que os de Baixo Guandu. III – O número de dentes perdidos em adultos nos dois municípios foi estatisticamente igual. a) Somente a afirmativa I está correta; d) Há duas afirmativas corretas; b) Somente a afirmativa II está correta; e) Nenhuma das afirmativas está correta. c) Somente a afirmativa III está correta; 13) Assinale a afirmação FALSA sobre o teste t de Student para amostras independentes: a) Só pode ser aplicado a dados com distribuição gaussiana; b) Pressupõe que os dois grupos são originados de uma mesma população; c) Apresenta hipótese nula de igualdade entre as médias dos dois grupos; d) Pressupõe que os dois grupos apresentam mesmo desvio padrão; e) Pode ser aplicado a dados com qualquer distribuição de probabilidade. 14) Se for desejado comparar duas variáveis que não seguem distribuição gaussiana, ou que não atendam aos requisitos dos testes paramétricos disponíveis, uma opção é usar um teste não-paramétrico. Assinale a afirmação FALSA sobre testes não-paramétricos: a) Transformam os dados de modo a poder utilizar uma distribuição específica para qualquer conjunto de dados; b) Normalmente, apresentam um poder de teste menor que o teste paramétrico correspondente; c) São mais indicados quando se deseja ter uma abordagem estatística a pequenos grupos de dados “mal-comportados”; d) Usualmente, analisam não os dados originais mas os “rankings” ou alguma forma de ordenação dos dados; e) Já que independem das características dos dados, devem sempre ser preferidos em qualquer comparação entre grupos. 15) Qual a distribuição de probabilidade comumente associada à ocorrência de k indivíduos portadores de uma determinada característica dentro de uma amostra de n indivíduos selecionada aleatoriamente de uma população onde a Prevalência (ou a probabilidade de ocorrência individual) da tal característica é P? a) Gaussiana; d) Binomial; b) Poisson; e) t de Student. c) F de Fischer; Discursivas 16) Uma amostra de 20 indivíduos teve sua glicemia aleatória (feita a qualquer hora - mg/dl) medida e esses valores foram organizados no quadro abaixo: 210 228 206 238 225 219 223 202 216 205 233 214 231 227 227 222 209 215 240 210 a) Calcule a média e a variância não-tendenciosa (i.e., dividindo por N-1); b) Calcule a mediana e os quartis inferior e superior; c) Desenhe o histograma dos valores de glicemia utilizando “bins” (classes) com largura de 8 mg/dl, ou seja, as classes abrangem os seguintes intervalos de glicemia: [202-210), [210-218), [218-226), [226-234), [234-242); d) Desenhe, na horizontal, o Box-plot dos valores de glicemia. e) Obtenha o intervalo de confiança de 95% para a estimativa de média populacional de glicemia. ( t19* ; 95% = 2,093 ) 17) Em uma universidade, com número de alunos “infinitamente” maior que 4, a proporção de alunos moradores fora da cidade é de 10%. Se for selecionado aleatoriamente um grupo de 4 alunos, qual a probabilidade de haver neste grupo: a) exatamente 3 alunos que morem fora da cidade? b) pelo menos 2 alunos que morem fora da cidade? 18) Foi realizado um estudo sobre a associação entre renda média familiar e peso ao nascer em recém-nascidos (RNs). Foram avaliados 355 RNs de famílias com renda mensal menor que 3 salários mínimos (SM), que apresentaram peso médio ao nascer de 2.452,37 g (desvio-padrão = 802,86 g). Nos 87 RNs de famílias com renda mensal igual ou superior a 3 SMs, o peso médio ao nascer foi de 3.361,18 g (desvio-padrão = 792,91 g). Pressupondo-se que os dois grupos de dados apresentam distribuição gaussiana: (i) defina se o teste usado para comparar as médias é do tipo para amostras pareadas ou independentes; (ii) defina se deve ser empregado teste unilateral ou bilateral e, enfim, (iii) aplique o teste-t e interprete o resultado.