média

Propaganda
BIOESTATÍSTICA
ESTATÍSTICA....

Num sentido mais lato, Estatística é a ciência
que se ocupa da coleta e tratamento de
informação. Tem como objetivo analisar os dados
coletados, descrevendo-os e organizando-os para
posterior interpretação e eventual utilização na
previsão de acontecimentos futuros.
O QUE É “BIOESTATÍSTICA”?
Aplicação
dos
métodos
estatísticos para a solução de
problemas biológicos e de saúde
OBJETIVOS

Redução dos Dados  poucas variáveis

Verificação da importância dessas variáveis
O estudo da estatística explora:

o planejamento e a coleta;

a organização;

a análise e a interpretação dos dados.
No planejamento, ela auxilia:

na escolha das situações experimentais;

na determinação da quantidade
indivíduos a serem examinados.
Na análise dos dados indica técnicas para
resumir
apresentar as informações
comparar as situações experimentais.
de
CLASSIFICAÇÃO
Estatística Descritiva:
Técnicas para organizar e resumir os dados:
(i) tabelas (ii) Gráficos
Inferência estatística:
Técnicas para se tirar conclusões a partir dos
dados amostrados “generalizando” para a
população, e tomando assim certas decisões.
FONTES DA VARIAÇÃO
Biológicas
 Condições de medição
 Método de aferição
 Erros de aferição

Etapas de uma pesquisa
• Planejamento da pesquisa
• Coleta dos dados
• Descrição dos dados
• Resumo e apresentação dos dados
• Análise dos dados
• Interpretação dos resultados
tomada de decisões ou descobertas de
novos conhecimentos
CONCEITOS BÁSICOS
Dados : conjunto de valores de uma ou mais variáveis
registrada em um ou mais unidade observacional
Fontes dos dados
1. Registros rotineiramente coletados
2. Censo, entrevistas
3. Experimentos
4. Publicações
5. Bancos de dados (internet)
População: um conjunto de indivíduos, objetos ou
eventos o qual se tem um interesse num tempo
particular.
Amostra: um sub-conjunto da população, selecionada de
tal modo que seja representativa da população
Parâmetro: uma constante verdadeira que caracteriza a
natureza da população na variável em estudo.
Estimativa: um valor calculado a partir de uma amostra,
logo está sujeita a erros.
O que é variável ?
• condição ou característica estudada em cada
unidade da pesquisa;
•
assume valores diferentes em cada unidade;
• deve ser registrada;
TIPOS DE VARIÁVEL
1. Qualitativa
Expressam qualidade, são divididas em
categorias. Não são mensuráveis, são apenas
contáveis. São expressas em percentual.
São classificadas em:
• Nominal (Classificatória)
- gênero, Estado civil, raça
• Ordinal (Escala natural)
- Gravidade de uma doença
.
TIPOS DE VARIÁVEL
2. Quantitativa
Expressam quantidade, são mensuráveis
São classificadas em:
• Discreta - valores inteiros
- nº de filhos, nº de hemácias
• Contínua – medidos em escala contínua
- pressão sangüínea, peso, altura, idade
14
Tipos de variáveis:
 Categorizada ou nominal
 Ordinal
 Numérica
Variável categorizada (qualitativa):
expressa por palavras.
O
A
B
AB
Nenhum
Variável ordinal:
expressa por números (ou
Leve
palavras)
que indicam ordem.
Moderado
Severo
Variável numérica (quantitativa):
é expressa por números.
Tabela 1- Distribuição do trabalhador rural segundo a
ocupação. MG, 1991 a 2000.
Ocupação
Frequência
Técnico
Aplicador
Serviço Geral
Total
Fonte: DADOS hipotéticos.
%
GRÁFICOS
TIPOS DE GRÁFICOS
Linhas ou série histórica
Barras
GRÁFICOS
Dispersão
Setorial
GRÁFICOS
Histograma
Medidas de posição (tendência central)
• Média
• Mediana
• Moda
Medidas de variabilidade (dispersão)
• Amplitude (máximo, mínimo)
• Variância
• Desvio padrão
• Erro padrão
Média é
a soma de todos os dados,
dividida pelo número deles.
x
x
n
Exemplo
São dados os pesos de cinco pessoas:
50, 65, 76, 70, 70.
Como se calcula a média ?
x
50
x
x
n
65
76
70
n=5
70
x =331
A média é 66,2kg.
Mediana
também é
medida de tendência central.
Para obter a mediana:
1. organize os dados em ordem crescente;
2. tome o valor central.
Em fila!
Se o número de dados é ímpar,
mediana é o valor
que ocupa o centro
da série ordenada.
7, 9, 0, 2, 2, 5, 0
0, 0, 2, 2, 5, 7, 9
Mediana
Se o número de dados é par,
mediana é a média
dos dois valores
que ocupam o centro
da série ordenada.
7, 9, 0, 2, 2, 5
0, 2, 2, 5, 7, 9
Mediana = 3,5
Moda
também é
medida de tendência central.
Moda é o valor que mais se repete.
A moda é azul...
Medidas de variabilidade
Mínimo e máximo
Variância
Desvio padrão
Erro padrão
Coeficiente de variação
Mínimo e máximo
são medidas de variabilidade.
Ache mínimo e máximo de
1
2
3
4
5
A diferença (5 – 1 = 4) é a amplitude.
Conjuntos de dados podem
ter a mesma média,
mas variabilidades
diferentes.
Três conjuntos de dados
Conjunto
A
B
C
Valores
1
3
2
2
3
4
3
3
3
Média
4
3
2
5
3
4
3
3
3
Três conjuntos de dados
Conjunto
Valores
Mínimo Máximo Amplitude
A
B
1 2 3 4 5
3 3 3 3 3
1
5
4
3
3
0
C
2 4 3 2 4
2
4
2
Variabilidade em torno da média
Como se mede a variabilidade?
Desvio em relação à média
Desvio positivo
Média
Desvio negativo
Desvio em relação à média
É a diferença entre cada valor e a média
da amostra.
Indica-se por
xx
Desvio em relação à média
Exemplo
Dados:
3, 7, 5, 9, 1.
Qual é o desvio de 7 em relação à média?
Desvios em relação à média
x
3
7
5
9
1
x 5
xx
-2
2
0
4
-4
0
A soma dos desvios
em relação à média
é sempre zero.
Como a soma dos desvios
em relação à média
é sempre zero,
não se pode calcular
a média dos desvios.
Variância da amostra
é a soma dos desvios elevados ao quadrado,
dividida por n -1.
 (x  x)
s 
n 1
2
2
n –1 graus de liberdade
Variância da amostra
Dados 3, 7, 5, 9, 1,
qual é a variância ?
Variância da amostra
x
x - x (x – x )2
3
7
5
9
1
-2
2
0
4
-4
0
4
4
0
16
16
40
40
s 
 10
4
2
Uma dificuldade da variância
A unidade de medida da variância
é igual ao quadrado da unidade
de medida dos dados.
Desvio padrão
é a raiz quadrada da variância, com sinal positivo.
Dados 3, 7, 5, 9, 1,
qual é o desvio padrão?
Desvio padrão
é a raiz quadrada da variância, com sinal positivo.
40
s 
 10
4
2
s  10  3,16
Desvio padrão
Para que serve o desvio padrão?
Mede variabilidade em torno da média,
com a mesma unidade de medida dos dados.
MARTINEZ, Maria Carmen; PARAGUAY, Ana
Isabel Bruzzi Bezerra; LATORRE, Maria do Rosário
Dias de Oliveira. Relação entre satisfação com
aspectos psicossociais e saúde dos trabalhadores.
Rev. Saúde Pública, São Paulo, v. 38, n.
1, Feb. 2004
Intervalo
xs
Não é a melhor maneira de
construir um intervalo, mas é
a maneira mais conhecida.
Erro padrão
s
EP  s x 
n
Mede a precisão da estimativa da média ( x ) em
relação média populacional (μ)
IC 95%  x  1,96  EP
CORRELAÇÃO DE PEARSON
Testa a correlação de variáveis quantitativas.
n de ordem dias de exposição
1
20
2
21
3
13
4
14
5
15
6
15
7
15
8
20
9
4
10
3
11
2
12
2
13
10
14
10
15
15
16
15
Idade
25
32
42
32
42
35
21
25
32
25
42
28
42
35
45
26
50
45
40
35
Idade
30
25
20
15
10
5
0
0
5
10
15
20
Dias de Exposição
CORRELAÇÃO DE PEARSON r = -0,13578
25
-1<r<0
0<r<1
r<=0
r de Pearson – variáveis quantitativas
r de Spearman – variáveis qualitativas
Download