BIOESTATÍSTICA ESTATÍSTICA.... Num sentido mais lato, Estatística é a ciência que se ocupa da coleta e tratamento de informação. Tem como objetivo analisar os dados coletados, descrevendo-os e organizando-os para posterior interpretação e eventual utilização na previsão de acontecimentos futuros. O QUE É “BIOESTATÍSTICA”? Aplicação dos métodos estatísticos para a solução de problemas biológicos e de saúde OBJETIVOS Redução dos Dados poucas variáveis Verificação da importância dessas variáveis O estudo da estatística explora: o planejamento e a coleta; a organização; a análise e a interpretação dos dados. No planejamento, ela auxilia: na escolha das situações experimentais; na determinação da quantidade indivíduos a serem examinados. Na análise dos dados indica técnicas para resumir apresentar as informações comparar as situações experimentais. de CLASSIFICAÇÃO Estatística Descritiva: Técnicas para organizar e resumir os dados: (i) tabelas (ii) Gráficos Inferência estatística: Técnicas para se tirar conclusões a partir dos dados amostrados “generalizando” para a população, e tomando assim certas decisões. FONTES DA VARIAÇÃO Biológicas Condições de medição Método de aferição Erros de aferição Etapas de uma pesquisa • Planejamento da pesquisa • Coleta dos dados • Descrição dos dados • Resumo e apresentação dos dados • Análise dos dados • Interpretação dos resultados tomada de decisões ou descobertas de novos conhecimentos CONCEITOS BÁSICOS Dados : conjunto de valores de uma ou mais variáveis registrada em um ou mais unidade observacional Fontes dos dados 1. Registros rotineiramente coletados 2. Censo, entrevistas 3. Experimentos 4. Publicações 5. Bancos de dados (internet) População: um conjunto de indivíduos, objetos ou eventos o qual se tem um interesse num tempo particular. Amostra: um sub-conjunto da população, selecionada de tal modo que seja representativa da população Parâmetro: uma constante verdadeira que caracteriza a natureza da população na variável em estudo. Estimativa: um valor calculado a partir de uma amostra, logo está sujeita a erros. O que é variável ? • condição ou característica estudada em cada unidade da pesquisa; • assume valores diferentes em cada unidade; • deve ser registrada; TIPOS DE VARIÁVEL 1. Qualitativa Expressam qualidade, são divididas em categorias. Não são mensuráveis, são apenas contáveis. São expressas em percentual. São classificadas em: • Nominal (Classificatória) - gênero, Estado civil, raça • Ordinal (Escala natural) - Gravidade de uma doença . TIPOS DE VARIÁVEL 2. Quantitativa Expressam quantidade, são mensuráveis São classificadas em: • Discreta - valores inteiros - nº de filhos, nº de hemácias • Contínua – medidos em escala contínua - pressão sangüínea, peso, altura, idade 14 Tipos de variáveis: Categorizada ou nominal Ordinal Numérica Variável categorizada (qualitativa): expressa por palavras. O A B AB Nenhum Variável ordinal: expressa por números (ou Leve palavras) que indicam ordem. Moderado Severo Variável numérica (quantitativa): é expressa por números. Tabela 1- Distribuição do trabalhador rural segundo a ocupação. MG, 1991 a 2000. Ocupação Frequência Técnico Aplicador Serviço Geral Total Fonte: DADOS hipotéticos. % GRÁFICOS TIPOS DE GRÁFICOS Linhas ou série histórica Barras GRÁFICOS Dispersão Setorial GRÁFICOS Histograma Medidas de posição (tendência central) • Média • Mediana • Moda Medidas de variabilidade (dispersão) • Amplitude (máximo, mínimo) • Variância • Desvio padrão • Erro padrão Média é a soma de todos os dados, dividida pelo número deles. x x n Exemplo São dados os pesos de cinco pessoas: 50, 65, 76, 70, 70. Como se calcula a média ? x 50 x x n 65 76 70 n=5 70 x =331 A média é 66,2kg. Mediana também é medida de tendência central. Para obter a mediana: 1. organize os dados em ordem crescente; 2. tome o valor central. Em fila! Se o número de dados é ímpar, mediana é o valor que ocupa o centro da série ordenada. 7, 9, 0, 2, 2, 5, 0 0, 0, 2, 2, 5, 7, 9 Mediana Se o número de dados é par, mediana é a média dos dois valores que ocupam o centro da série ordenada. 7, 9, 0, 2, 2, 5 0, 2, 2, 5, 7, 9 Mediana = 3,5 Moda também é medida de tendência central. Moda é o valor que mais se repete. A moda é azul... Medidas de variabilidade Mínimo e máximo Variância Desvio padrão Erro padrão Coeficiente de variação Mínimo e máximo são medidas de variabilidade. Ache mínimo e máximo de 1 2 3 4 5 A diferença (5 – 1 = 4) é a amplitude. Conjuntos de dados podem ter a mesma média, mas variabilidades diferentes. Três conjuntos de dados Conjunto A B C Valores 1 3 2 2 3 4 3 3 3 Média 4 3 2 5 3 4 3 3 3 Três conjuntos de dados Conjunto Valores Mínimo Máximo Amplitude A B 1 2 3 4 5 3 3 3 3 3 1 5 4 3 3 0 C 2 4 3 2 4 2 4 2 Variabilidade em torno da média Como se mede a variabilidade? Desvio em relação à média Desvio positivo Média Desvio negativo Desvio em relação à média É a diferença entre cada valor e a média da amostra. Indica-se por xx Desvio em relação à média Exemplo Dados: 3, 7, 5, 9, 1. Qual é o desvio de 7 em relação à média? Desvios em relação à média x 3 7 5 9 1 x 5 xx -2 2 0 4 -4 0 A soma dos desvios em relação à média é sempre zero. Como a soma dos desvios em relação à média é sempre zero, não se pode calcular a média dos desvios. Variância da amostra é a soma dos desvios elevados ao quadrado, dividida por n -1. (x x) s n 1 2 2 n –1 graus de liberdade Variância da amostra Dados 3, 7, 5, 9, 1, qual é a variância ? Variância da amostra x x - x (x – x )2 3 7 5 9 1 -2 2 0 4 -4 0 4 4 0 16 16 40 40 s 10 4 2 Uma dificuldade da variância A unidade de medida da variância é igual ao quadrado da unidade de medida dos dados. Desvio padrão é a raiz quadrada da variância, com sinal positivo. Dados 3, 7, 5, 9, 1, qual é o desvio padrão? Desvio padrão é a raiz quadrada da variância, com sinal positivo. 40 s 10 4 2 s 10 3,16 Desvio padrão Para que serve o desvio padrão? Mede variabilidade em torno da média, com a mesma unidade de medida dos dados. MARTINEZ, Maria Carmen; PARAGUAY, Ana Isabel Bruzzi Bezerra; LATORRE, Maria do Rosário Dias de Oliveira. Relação entre satisfação com aspectos psicossociais e saúde dos trabalhadores. Rev. Saúde Pública, São Paulo, v. 38, n. 1, Feb. 2004 Intervalo xs Não é a melhor maneira de construir um intervalo, mas é a maneira mais conhecida. Erro padrão s EP s x n Mede a precisão da estimativa da média ( x ) em relação média populacional (μ) IC 95% x 1,96 EP CORRELAÇÃO DE PEARSON Testa a correlação de variáveis quantitativas. n de ordem dias de exposição 1 20 2 21 3 13 4 14 5 15 6 15 7 15 8 20 9 4 10 3 11 2 12 2 13 10 14 10 15 15 16 15 Idade 25 32 42 32 42 35 21 25 32 25 42 28 42 35 45 26 50 45 40 35 Idade 30 25 20 15 10 5 0 0 5 10 15 20 Dias de Exposição CORRELAÇÃO DE PEARSON r = -0,13578 25 -1<r<0 0<r<1 r<=0 r de Pearson – variáveis quantitativas r de Spearman – variáveis qualitativas