Bioestatística - Professor Hubert Chamone Gesser, Dr.

Propaganda
Cursos de Graduação em Farmácia/Nutrição/Enfermagem/Psicologia
Prof. Hubert Chamone Gesser, Dr.
Graduação em Odontologia - UFSC
Graduação em Administração - ESAG/UDESC
Especialização em Odontologia em Saúde Coletiva - ABO/SC
Doutorado e Mestrado em Engenharia de Produção - UFSC
- SUMÁRIO -
Conceitos Básicos em Bioestatística
Medidas de Dispersão
Conhecendo os Dados
Amostragem
Medidas de Tendência Central
Tabelas e Gráficos
Medidas de Ordenamento
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
ESTATÍSTICA
O primeiro uso da palavra ESTATÍSTICA parece datar de 1589 e
apareceu em um trabalho do historiador Girolomo Ghilini, quando se
referiu a uma “ciência civil, política, estatística e militar”.
(Berquó, 1981)
Origem no latim
status (estado) + isticum (contar)
Informações referentes ao estado
Coleta, Organização, Descrição, Análise e Interpretação de Dados
BIOESTATÍSTICA
O Que é Estatística?
Para Sir Ronald A. Fisher
(1890-1962):
Estatística é o estudo das
populações, das variações e dos
métodos de redução de dados.
BIOESTATÍSTICA
O Que é Estatística?
“Eu gosto de pensar na
Estatística como a
ciência de
aprendizagem a partir
dos dados...”
Jon Kettenring
Presidente da
American Statistical Association, 1997
BIOESTATÍSTICA
O Que é Estatística (definição)?
“Estatística é um conjunto de
técnicas e métodos que nos auxiliam
no processo de tomada de decisão na
presença de incerteza.”
BIOESTATÍSTICA
LIVROS DE ESTATÍSTICA
BIOESTATÍSTICA
POR QUE A ESTATÍSTICA É IMPORTANTE?

As diferenças são atribuídas a causas erradas;

As coincidências ocorrem frequentemente;

As pessoas tem dificuldades com probabilidades;

Acrescentam polimento às publicações;

Faz conhecer o “grau de confiança” das conclusões.
BIOESTATÍSTICA
As variabilidades mostram que existem diferenças
1o Mundo
Alta Expectativa de Vida
Boas Condições Sanitárias
Hábitos de Consumo
Assistência em Saúde
3o Mundo
Doenças Infecciosas
Alta Mortalidade Infantil
Baixa Escolaridade
Iniquidades em Saúde
Indicadores Sociais Diferentes
BIOESTATÍSTICA
EXPECTATIVA DE VIDA – Diferenças entre os países
BIOESTATÍSTICA
RENDA PER CAPITA NO BRASIL (PNUD, 2000)
BIOESTATÍSTICA
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
BIOESTATÍSTICA
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
BIOESTATÍSTICA
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)
BIOESTATÍSTICA
GRÁFICO DE DISPERSÃO – RENDA x EDUCAÇÃO (PNUD, 2000)
BIOESTATÍSTICA
FONTES DEMOGRÁFICAS
Bancos de Dados (OMS, OPAS, MS, IBGE, etc)
Indicadores Sociais (IDH, GINI, QV)
Pesquisas de Mercado (Hábitos de Consumo)
Censos Demográficos
Pesquisa Nacional por Amostra de Domicílios (PNAD)
Programa das Nações Unidas para o Desenvolvimento (PNUD)
BIOESTATÍSTICA
POPULAÇÃO E AMOSTRA
POPULAÇÃO: Conjunto de elementos que se deseja estudar
AMOSTRA: Subconjunto da população
Nem sempre o Censo é viável (questões econômicas)
É mais barato coletar dados de amostras
BIOESTATÍSTICA
POPULAÇÃO: Também chamada de Universo
AMOSTRA: Parte da população
População
Amostra
BIOESTATÍSTICA
POPULAÇÃO E AMOSTRA
POPULAÇÃO (N): Todos os estudantes da UFSC
Plano de Amostragem
AMOSTRA (n): Parte dos estudantes da UFSC
BIOESTATÍSTICA
REQUISITOS DE UMA AMOSTRA:
1) Ter um tamanho adequado (previamente calculado)
Existem fórmulas para o cálculo do adequado tamanho da amostra
2) Constituintes selecionados ao acaso (sorteio)
BIOESTATÍSTICA
CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA:
Amostras Grandes:
n > 100
Amostras Médias:
n > 30
(30 < n < 100)
Amostras Pequenas:
n < 30
(12 < n < 30)
Amostras Muito Pequenas: n < 12
Observação: As amostras com n > 30 geram melhores resultados.
O tamanho adequado deve ser pré-calculado.
BIOESTATÍSTICA
Áreas da Estatística
Amostragem e Planejamento de Experimentos
(coleta dos dados)
Estatística Descritiva
(organização, apresentação e sintetização dos dados)
Estatística Inferencial
(testes de hipóteses, estimativas, probabilidades)
BIOESTATÍSTICA
Amostragem e Planejamento de Experimentos
(coleta dos dados)
- É o processo de escolha da amostra
- É o início de qualquer estudo estatístico
- Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo
Exemplos:
Pesquisa sobre tendência de votação
Cuidado: Perfil da Amostra = Perfil da População
BIOESTATÍSTICA
Estatística Descritiva
(organização, apresentação e sintetização dos dados)
- É a parte mais conhecida
- Diariamente veiculada na mídia (jornais, televisão, rádio)
- Distribuições de frequência, médias, tabelas, gráficos
Exemplos: % de Analfabetos em uma comunidade
Índice de Mortalidade Infantil (por mil nascimentos)
Índice de Desenvolvimento Humano
BIOESTATÍSTICA
Estatística Descritiva – Distribuição Populacional de uma Região
BIOESTATÍSTICA
Estatística Inferencial, Indutiva ou Analítica
(testes de hipóteses, estimativas)
- Auxilia o processo de tomada de decisões
- Responde uma dúvida, compara grupos
- Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que
uma delas será aceita mediante a aplicação de um teste estatístico baseado
na teoria das probabilidades.
Exemplo: O tabagismo está associado à doença pulmonar?
Hipóteses: Nula (não há associação), Alternativa (há associação)
BIOESTATÍSTICA
EXERCÍCIO No 1
Em uma cidade de 500.000 habitantes onde 45% das
pessoas tem título de eleitor, realizou-se uma pesquisa
eleitoral com 2000 pessoas. Qual o tamanho da população de
estudo e da amostra?
BIOESTATÍSTICA
EXERCÍCIO No 2
Uma amostra de apenas 3000 eleitores pode fornecer
um perfil confiável sobre a preferência de todo o eleitorado,
na véspera de uma eleição presidencial? Por que?
BIOESTATÍSTICA
EXERCÍCIO No 3
Você considera a pesquisa proposta no exercício
anterior como experimental ou de levantamento? Por quê?
BIOESTATÍSTICA
EXERCÍCIO No 4
Elabore uma situação em que a estatística possa ser
empregada em benefício de uma organização.
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
TIPOS DE DADOS

Dados Nominais (Sexo, Raça, Cor dos Olhos)

Dados Ordinais (Grau de Satisfação)

Dados Numéricos Contínuos (Altura, Peso)

Dados Numéricos Discretos (Número de Filiais)
“Estatísticas aplicadas em alguns tipos de dados
não podem ser aplicadas a outros .”
BIOESTATÍSTICA
TIPOS DE DADOS

Dados Intervalares (Temperatura oC)
Quando se referem a valores obtidos mediante a
aplicação de uma unidade de medida arbitrária, porém
constante e onde o zero é relativo. Este tipo de dado
tem restrições a cálculos.
30oC não é três vezes mais quente que 10oC
Para cálculos se utiliza a escala Kelvin
BIOESTATÍSTICA
ARREDONDAMENTO DE DADOS CONTÍNUOS
1ª Regra: Arredondar para o número mais próximo
2ª Regra: Arredondar para o par mais próximo
5,0
5,5
6,0
6,0
6,5
7,0
BIOESTATÍSTICA
EXERCÍCIO No 1
Faça os seguintes arredondamentos:
38,648
para o centésimo mais próximo
38,65
54,76
para o décimo mais próximo
54,8
27,465
para o centésimo mais próximo
27,46
42,455
para o centésimo mais próximo
42,46
4,5
para o inteiro mais próximo
4
BIOESTATÍSTICA
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
8
5
3
5
5
3
2
2
6
7
4
4
6
5
5
5
5
7
6
5
3
6
4
6
2
5
4
6
x
2
3
4
5
6
7
8
Total
f (frequência)
3
3
4
9
6
2
1
28
BIOESTATÍSTICA
AGRUPAMENTO DE DADOS POR CLASSES
Classes
f (frequência)
Ponto Médio
39
50
4
44,5
50
61
72
83
61
72
83
94
5
5
6
5
55,5
66,5
77,5
88,5
BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
f
10
8
6
4
2
2
3
4
5
6 7
8
x
BIOESTATÍSTICA
EXERCÍCIO No 2
Em uma amostra de estudantes foram coletadas as seguintes
alturas em metros: 1,70 1,58 1,67 1,72 1,70 1,71 1,75
1,58 1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77 1,76 1,75
1,73 1,65 1,64 1,63 1,62 1,66 1,71 1,68 1,69 1,70 1,59
1,61 1,64 1,76 1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70 1,67
1,71 1,72 1,63 1,70
a) Qual foi o tamanho da amostra (n)?
b) Qual é a altura do sujeito mais alto e a do mais baixo?
c) Faça o agrupamento de dados por valores distintos.
d) Faça o agrupamento por 6 classes.
e) Faça o polígono de frequência p/ o agrupamento por classes.
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Análise Vertical:
Assimétrica Positiva (esquerda)
Leptocúrtica (alta)
Simétrica
Mesocúrtica
Assimétrica Negativa (direita)
Platicúrtica (baixa)
Análise Conjunta:
Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Positiva (esquerda)
f
x
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Simétrica
f
x
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Negativa (direita)
f
x
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Leptocúrtica (alta)
f
x
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Mesocúrtica
f
x
BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Platicúrtica (baixa)
f
x
BIOESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
Apresentam-se os valores absolutos e as porcentagens
Podem ser usadas tabelas ou gráficos
20,4
40
35
30
25
45,9
20
15
10
5
0
1° Trim.
30,6
2° Trim.
Gráfico de Barras
Gráfico Circular
BIOESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
45
40
35
30
25
20
15
10
5
0
45,9
30,6
20,4
1° Trim.
2° Trim.
Gráfico de Linhas
(não é usado; restrito a dados contínuos)
0
10
20
30
40
50
Gráfico de Barras Horizontal
BIOESTATÍSTICA
DESCRIÇÃO DOS DADOS CONTÍNUOS
Trazem informações que expressam a tendência central e a
dispersão dos dados.
Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo )
Medidas de Dispersão: Desvio Padrão, Variância, Amplitude,
Coeficiente de Variação,
Valor Máximo, Valor Mínimo
BIOESTATÍSTICA
EXERCÍCIO No 3
Em uma pesquisa com jogadoras de basquete foram
coletados os seguintes pesos corporais em quilogramas:
65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63
64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68
69 70
a) Qual foi o tamanho da amostra (n)?
b) Qual é o maior peso e o menor?
c) Faça o agrupamento de dados por valores distintos.
d) Faça o agrupamento em 3 classes.
e) Faça o polígono de frequência p/ o agrupamento por classes.
f) A curva de frequência encontrada se assemelha a normal?
BIOESTATÍSTICA
EXERCÍCIO No 4
Na pesquisa do exercício anterior faça a representação
gráfica em barras e a circular para as 3 classes de
jogadoras geradas.
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma idéia de onde se localiza o centro, o
ponto médio de um determinado conjunto de dados.
Medidas: Média, Moda e Mediana.
f
x
BIOESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto de dados.
Fisicamente representa o ponto de equilíbrio da distribuição.
Modos de calcular
1) para dados simples
x=Sx/n
2) para valores distintos
x = S fx / n
3) para agrupamentos em classes
x = S fx / n
BIOESTATÍSTICA
MÉDIA
1) Cálculo para dados simples
x=Sx/n
16 18 23 21
17 16 19 20
S x = Soma dos valores
n = tamanho da amostra
x = (16+18+23+21+17+16+19+20)
8
x = 18,75
BIOESTATÍSTICA
MÉDIA
2) Cálculo para valores distintos
x
2
3
4
5
6
7
8
f
fx
3
6
3
9
4 16
9 45
6 36
2 14
1
8
Total 28 134
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 134
28
x = 4,7857
BIOESTATÍSTICA
MÉDIA
3) Cálculo para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
x
fx
4
5
5
6
5
44,5
55,5
66,5
77,5
88,5
178
277,5
332,5
465
442,5
25
-
1695,5
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 1695,5
25
x = 67,82
BIOESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um conjunto de
dados ordenados.
Para um número par de termos a mediana é obtida através
da média aritmética dos dois valores intermediários.
Interpretação:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
BIOESTATÍSTICA
MEDIANA
1) Cálculo da posição da mediana para dados simples
2 3 4 5 6
7 8 9 10
PMd =(n+1) / 2
PMd = (9+1) / 2
PMd = 5o Termo
Mediana (Md) = 6
BIOESTATÍSTICA
MEDIANA
2) Cálculo da posição da mediana para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
fa
3o
6o
10o
19o
25o
27o
28o
-
PMd =(n+1) / 2
PMd = (28+1) / 2
PMd = 14,5
x entre 14o e 15o Termo
Mediana (Md) = 5
BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
PMd =(n+1) / 2
PMd = (25+1) / 2
PMd = 13o Termo
Classe Mediana
61
72
Mediana (Md) = 66,5 (estimativa)
BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Pode-se fazer a interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Li = limite inferior da classe mediana
PMd = posição da mediana
faa = frequência acumulada da classe anterior
f = frequência da classe mediana
A = amplitude da classe mediana
BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Md = 61 + ((13 - 9) / 5) . 11
Mediana (Md) = 69,8
BIOESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um conjunto
de dados. Símbolo = Mo
1) Moda para dados simples
Exemplos:
2, 3, 4, 5, 6, 7, 8
AMODAL
2, 3, 3, 4, 5, 6 ,7
MODA = 3
2, 3, 3, 4, 5, 5, 6
BIMODAL (Mo = 3 e Mo = 5)
BIOESTATÍSTICA
MODA
2) Moda para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
O valor 5 tem o maior
número de ocorrências (9)
Mo = 5
BIOESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
Moda Bruta
Ponto médio da classe de
maior frequência
Mo = 77,5
É uma estimativa
BIOESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Moda de King
Mo = Li + (A . f2 / (f1 + f2))
Li = limite inferior da classe modal
A = amplitude do intervalo da classe modal
f1 = frequência da classe anterior a modal
f2 = frequência da classe posterior a modal
Mo = 72 + (11 . 5)
5+5
Mo = 77,5
BIOESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA:
Dados Numéricos e Intervalares
É a medida mais utilizada.
MODA:
Dados Nominais
MEDIANA: Dados Ordinais
BIOESTATÍSTICA
EXERCÍCIO No 1
Determine a média, a mediana e a moda para o seguinte
conjunto de dados
6 5 8 4 7 6 9 7 3
BIOESTATÍSTICA
EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana
e a moda para o seguinte conjunto de dados
12 32 54 17 82 99 51 11 44 22
22 33 44 52 76 41 37 10 5 87
BIOESTATÍSTICA
EXERCÍCIO No 3
Dado o seguinte agrupamento em classes determine:
Classes
1,60
1,65
1,65
1,70
1,70
1,75
1,75
1,80
1,80
1,85
f
10
15
22
18
3
Total
68
a) os pontos médios de cada classe
b) a classe modal
c) a moda bruta
d) a moda de King
e) a classe mediana
f) a mediana por agrupamento de classes
g) a média por agrupamento de classes
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em rol
Medidas: QUARTIS, DECIS E PERCENTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Os Percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
BIOESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Entre cada quartil há 25% dos dados da disposição
Posição do Primeiro Quartil (Q1) = (n + 1) / 4
Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4
Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4
O segundo quartil coincide com a Mediana (Q2 = Md)
BIOESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
n = 27
Q1
Q2
Q3
7o termo
14o termo
21o termo
BIOESTATÍSTICA
DECIS
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Entre cada decil há 10% dos dados da disposição
Posição do Primeiro Decil (D1) = (n + 1) / 10
Posição do Segundo Decil (D2) = 2.(n + 1) / 10
Posição do Nono Decil (D9) = 9.(n + 1) / 10
O Quinto Decil coincide com a Mediana (D5 = Md)
BIOESTATÍSTICA
PERCENTIS
Os percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
Entre cada percentil há 1% dos dados da disposição
Posição do Primeiro Percentil (P1) = (n + 1) / 100
Posição do Segundo Percentil (P2) = 2.(n + 1) / 100
Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100
P50 = Md
P25 = Q1
P75 = Q3
BIOESTATÍSTICA
EXERCíCIOS
1) Dado o conjunto de dados:
a) apresente a disposição em rol;
b) o Percentil 50,
c) o Primeiro Quartil,
d) a Média,
e) a Moda e
f) a Mediana
10 13 24
45 66 77 11
14 26 33 65
21 57
BIOESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a posição do
oitavo decil, da mediana, do segundo decil, do terceiro
quartil e do segundo quartil?
BIOESTATÍSTICA
3) Determine a média, a moda, a mediana, o 1o quartil, o 5o
decil, o percentil 75 e o percentil 50 para a seguinte
distribuição por valores distintos?
Pesos (kg)
64
65
66
67
68
69
70
71
72
f
4
10
12
12
15
14
9
5
2
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade.
Medidas mais comuns: Variância, Desvio Padrão, Amplitude
f
Dispersão dos dados
na amostra
Dispersão dos dados
na população
x
BIOESTATÍSTICA
Dispersão na População
É uma forma de se ver o quanto os dados se afastam da média.
Exemplo: Vilarejo com apenas 11 pessoas
135cm 152cm
136cm 152cm
138cm 157cm
141cm 163cm
143cm 170cm
152cm
Alturas de 11 pessoas
Média = 149cm
Mediana e Moda = 152cm
Valor Máximo = 170cm
Valor Mínimo = 135cm
Amplitude = 35cm
BIOESTATÍSTICA
Dispersão na População
Alturas
x-x
(N=11)
135cm
136cm
138cm
141cm
143cm
152cm
152cm
152cm
157cm
163cm
170cm
Total
135-149
136-149
138-149
141-149
143-149
152-149
152-149
152-149
157-149
163-149
170-149
-14
-13
-11
-8
-6
3
3
3
8
14
21
(x - x)2
196
169
121
64
36
9
9
9
64
196
441
1314
2 Variância
= 1314 / 11
= 119,454 cm2
 Desvio Padrão
=
119,454
= 10,92 cm
Soma dos desvios
quadráticos
BIOESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
2 = S ( x - x )2 / N
Desvio Padrão da população = Raiz quadrada da variância
 = 2
Como a dispersão nas amostras é menor do que na
população, se faz um ajuste matemático.
BIOESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s = s2
A dispersão nas amostras é menor do que na população,
por isso é que se faz este ajuste matemático
BIOESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.
f
Média
x
BIOESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados maior do que a curva B,
logo o desvio padrão de A é maior do que o de B.
f
f
Curva A
Média
Curva B
x
Média
x
BIOESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada,
assim um desvio medido em dias será maior do que um medido
em meses.
O coeficiente de variação expressa o desvio-padrão como
porcentagem do valor da média.
COEF. VARIAÇÃO = 100 . DESVIO PADRÃO
MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
BIOESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média
- GRAU DE HOMOGENEIDADE DOS DADOS -
até 10%  ÓTIMO
de 10% a 20%  BOM
de 20% a 30%  REGULAR
acima de 30%  RUIM
BIOESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
4 5 5 6
6 7 7 8
BIOESTATÍSTICA
2) Determine o valor de n, a amplitude, a média, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
22
76
21
28
22
53
32
24
58
33
47
36
45
21
92
73
28
88
22
78
11
11
24
99
46
43
16
29
21
18
BIOESTATÍSTICA
3) Com base nos coeficientes de variação calculados nos dois
exercícios anteriores classifique a dispersão encontrada:
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
APLICAÇÕES DE AMOSTRAGEM
Pesquisa Mercadológica (Índice de satisfação na população)
Pesquisa Eleitoral (Percentagem de votos para cada candidato)
Perfil Socioeconômico da População (Grau de escolaridade, Renda)
Na População
Na Amostra
População
Parâmetros
Estatísticas
Amostra
Inferência Estatística
BIOESTATÍSTICA
POR QUE USAR A AMOSTRAGEM?
Economia (É mais barato levantar dados de uma parcela da população)
Tempo (É mais rápido)
QUANDO NÃO USAR A AMOSTRAGEM?
Quando a população for pequena (n > 0,8.N)
Quando a característica for de fácil mensuração (Sim ou Não)
Quando houver a necessidade de alta precisão (Censo IBGE)
BIOESTATÍSTICA
TIPOS DE AMOSTRAGEM
AMOSTRAGEM ALEATÓRIA SIMPLES
(Tem que obedecer a propriedade de qualquer elemento da população
ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela
de números aleatórios ou sorteios)
AMOSTRAGEM ALEATÓRIA SISTEMÁTICA
(Após obter-se a lista dos elementos da população, sorteia-se a entrada e
segue-se a relação N/n.)
AMOSTRAGEM ALEATÓRIA ESTRATIFICADA
(Elabora-se a amostra através do perfil conhecido da população.
Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é
confeccionada obedecendo-se estes parâmetros.)
BIOESTATÍSTICA
OUTROS TIPOS DE AMOSTRAGEM
AMOSTRAGEM NÃO ALEATÓRIA
(De fácil obtenção.)
AMOSTRAGEM PARA ESTUDOS COMPARATIVOS
(Não visa a descrição de uma população, mas a comparação entre
grupos diferentes. Exemplos: Comparar as taxas de tabagismo em
indivíduos com câncer de pulmão e sadios.)
Procure respeitar o Plano de Amostragem para que seja
alcançada uma amostra representativa da população.
BIOESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Sejam: n0 = Primeira aproximação para o tamanho da amostra
E0 = Erro Amostral Tolerável
n = Tamanho da Amostra
N = Tamanho da População
n0 = 1 / (Eo)2
n = (N . n0) / (N + no)
BIOESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Populações Finitas com Parâmetros de Prevalência Conhecidos
n=
(N . z2 . p . (1-p))
(E02 . (N-1) + z2 . p . (1-p))
Onde: N = Tamanho da População
z = Nível de confiança expresso em desvio padrão (95%) = 1,96
E0 = Erro Amostral Tolerável
p = Prevalência do evento na População
BIOESTATÍSTICA
RELAÇÃO ENTRE (n) E (N)
Relação entre o tamanho da população e o tamanho da amostra
n
600
500
400
300
200
100
0
0
500
1000
1500
2000
2500
3000
3500
N
BIOESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma pesquisa eleitoral
em uma cidade com 200.000 eleitores, adotando uma margem de
erro de 2 pontos percentuais.
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
BIOESTATÍSTICA
TABELAS
Tabela é a forma não discursiva de apresentar informações, das
quais o dado numérico se destaca como informação central.
Uma tabela estatística conterá necessariamente uma série ou
uma distribuição de frequência.
Vantagens:
- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
BIOESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos arábicos;
Os números são precedidos da palavra “Tabela”;
No topo deve estar o título que indica a natureza e as abrangências
geográficas e temporal dos dados numéricos;
O centro da tabela é representado por uma série de colunas e
subcolunas onde são alocados os dados;
No rodapé deve-se colocar a fonte (o responsável pelos dados) e
opcionalmente uma nota geral ou uma nota específica;
A moldura deve conter no mínimo 3 traços horizontais;
Não se deve fechar uma tabela com traços verticais em suas
extremidades.
BIOESTATÍSTICA
CLASSIFICAÇÃO DAS TABELAS
Séries Cronológicas (temporais ou históricas);
Variável: Tempo Constantes: Lugar e Espécie
Séries Geográficas (territoriais);
Variável: Lugar
Constantes: Tempo e Espécie
Séries Especificativas;
Variável: Espécie
Constantes: Tempo e Lugar
Séries Mistas;
Quando há mais de uma variável.
Distribuição de Frequência
BIOESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Tabela 1: Proporções de doentes X na Cidade Y
Anos
Percentual
2005
25,74
2006
26,85
2007
27,94
2008
32,45
Fonte: Hipotética
BIOESTATÍSTICA
Séries Geográficas (Territoriais)
Tabela 2: Proporção de doentes X no Ano de 2008
Cidades
Percentual
Itajaí
10,44
Lages
29,45
Florianópolis
8,66
Blumenau
9,82
Fonte: Hipotética
BIOESTATÍSTICA
Séries Especificativas
Tabela 3: Proporção de doentes X no Ano de 2008
em Florianópolis
Segmento populacional
Percentual
Infantil
60,25
Juvenil
20,72
Adulto
2,75
3a Idade
5,82
Fonte: Hipotética
BIOESTATÍSTICA
Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)
Tabela 4: Volume de internações hospitalares por ano e cidade
(valores em milhares)
Doenças
2007
2008
Fpolis
Lages
Pulmonares
24,24
9,34
25,95
9.98
Infecciosas
112,72
27,45
111,75
29,48
Cardíacas
86,75
18,45
79,37
19,57
1,95
0,85
2,01
0,84
Outras
Fonte: Hipotética
Fpolis Lages
BIOESTATÍSTICA
Distribuições de Frequência
Tabela 5: Distribuição de frequência dos pesos corporais de
uma amostra (valores em quilogramas)
Pesos
Frequência
Frequência Acumulada
64
51
51
65
100
151
66
22
173
67
14
187
Total
187
-
Fonte: Hipotética
BIOESTATÍSTICA
GRÁFICOS
Gráfico é a forma geométrica de apresentação dos dados e
respectivos resultados de sua análise.
A escolha do modelo ideal de representação gráfica depende das
preferências e do senso estético do elaborador.
Vantagens:
- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
BIOESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um leigo;
Não há a necessidade de se colocar título se estiver na mesma página
da tabela correspondente;
Há a necessidade de se colocar o título se a tabela correspondente
não estiver na mesma página.
O senso estético individual determina o espaço do gráfico (L x A);
As colunas, barras, linhas e áreas gráficas devem ser ordenadas de
modo crescente ou decrescente, mas a ordem cronológica prevalece;
BIOESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica que deu origem à
técnica de construção de gráficos estatísticos.
Utiliza-se o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais.
Ordenadas (eixo y)
1o Quadrante
Abscissas (eixo x)
Eixo y
Eixo x
Frequências
Valores da Variável
BIOESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
Tabela 1: Quantidade de exames realizados
em um determinado laboratório em 2003.
25000
20000
Exames
Quantidade
Hematologia
9824
15000
Bioquímica
21534
10000
Imunologia
15432
5000
Parasitologia
4310
0
Hemat
Bioq
Imunol
Parasit
Fonte: Hipotética
Figura 1: Gráfico em colunas do número de
exames em um determinado laboratório em 2003.
BIOESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
Tabela 2: Quantidade de exames realizados
em um determinado laboratório em 2003.
Parasit
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
Imunol
Bioq
Hemat
4310
0
5000
10000
15000
20000
25000
Fonte: Hipotética
Figura 2: Gráfico em barras horizontais do
número de exames realizados em um determinado
laboratório no ano de 2003.
BIOESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Tabela 3: Quantidade de exames realizados
em um determinado laboratório em 2003.
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
4310
Parasit
Hemat
Imunol
Bioq
Fonte: Hipotética
Figura 3: Gráfico circular do número de exames
realizados em um determinado laboratório no ano
de 2003.
BIOESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
Tabela 4: Notas dos alunos na disciplina de
Estatística no curso de Administração (ano x)
12
10
8
Notas
Frequência
6
0
2
2
2
4
7
2
4
6
11
0
4
0a2
6
8
10
8
10
5
Fonte: Dados Fictícios
2a4
4a6
6a8
8 a 10
Figura 4: Histograma das notas dos alunos
BIOESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
• A área do histograma é
proporcional à soma das
frequências;
35
31,4
28,6
30
25
20
• Para
comparar
duas
distribuições, o ideal é utilizar
números percentuais;
20
14,3
15
10
5,7
5
0
0a2
2a4
4a6
6a8
8 a 10
Figura 5: Histograma dos percentuais das notas
dos alunos
BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
• É um Gráfico em Linha de
uma
distribuição
de
frequência;
35
31,4
30
28,6
25
20
• Para se obter um polígono
(linha
fechada),
deve-se
completar a figura, ligando os
extremos da linha obtida aos
pontos médios da classe
anterior à primeira e posterior
à última, da distribuição.
20
15
14,3
10
5,7
5
0
0
0a2
2a4
4a6
6a8
8 a 10
11
Figura 6: Polígono de Frequência percentual de
das notas dos alunos
BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo: Ogiva)
Tabela 5: Notas dos alunos na disciplina de
estatística no ano x
120
100
100
85,7
80
Notas
Frequência F. Acumulada %
57,1
60
0
2
2
5,7
40
2
4
7
25,7
20
4
6
11
57,1
0
6
8
10
85,7
8
10
5
100,0
Fonte: Dados Fictícios
25,7
5,7
0
0a2
2a4
4a6
6a8
8 a 10
Figura 7: Polígono de frequências acumuladas
das notas dos alunos
BIOESTATÍSTICA
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
13
22
33
45
53
62
71
14
23
35
47
57
63
72
15 15
28 29
36 37 39 39
58 58 59
65
Conjunto de Dados
Tronco (Stem)
1
2
3
4
5
6
7
Folha (Leaf)
3455
2389
356799
57
37889
235
12
Figura 8: Gráfico Stem-Leaf onde o primeiro
dígito é o tronco e o segundo é a folha
BIOESTATÍSTICA
GRÁFICO DE BARRAS COM DESVIO PADRÃO
1,95
1,9
1,85
1,8
1,75
1,7
1,65
1,6
1,55
Medicina
Odontologia
Farmacia
Nutrição
Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de
estudantes da faculdade x (valores fictícios).
BIOESTATÍSTICA
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
1,95m
1,90m
1,85m
1,80m
1,75m
1,70m
1,65m
1,60m
1,55m
Valor Máximo
Percentil 75
Percentil 50
Percentil 25
Valor Mínimo
Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).
BIOESTATÍSTICA
EXERCÍCIOS
1) Construa uma série cronológica com os dados da mortalidade
infantil de uma determinada região.
BIOESTATÍSTICA
2) Construa o Gráfico de Barras com os dados do exercício
anterior.
BIOESTATÍSTICA
3) Construa o Gráfico em Setores do seguinte agrupamento em
classes:
Pesos (Kg)
f
40
60
15
60
80
26
80
100
38
100
120
9
Total
88
Fonte Bibliográfica
 BARBETA, P. A. Estatística Aplicada às Ciências Sociais.
5.ed. Florianópolis: UFSC, 2006.
 DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical.
3.ed. New York: Lange Medical Books/McGraw-Hill, 2006.
 LEVIN, J. Estatística Aplicada às Ciências Humanas.
7.ed. São Paulo: Harbra, 2007.
 SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron
Books, 2006.
 STEVENSON, W. J. Estatística Aplicada à Administração.
São Paulo: Harbra, 2007.
Retornar
Download