Slides Estatística - Professor Hubert Chamone Gesser, Dr.

Propaganda
Curso de Capacitação Docente
Prof. Hubert Chamone Gesser, Dr.
Graduação em Odontologia - UFSC
Graduação em Administração - ESAG/UDESC
Especialização em Odontologia em Saúde Coletiva - ABO/SC
Doutorado e Mestrado em Engenharia de Produção - UFSC
Agradecimentos:
Prof. Rafael Villari, Dr.
Reitor do Centro Universitário Estácio de Sá de Santa Catarina
Profa. Priscila Monteiro Pereira, M.Sc.
Pró-reitora Acadêmica do Centro Universitário Estácio de Sá de Santa Catarina
Prof. Jorge Dolzan, M.Sc.
Pró-reitor de Pós graduação do Centro Universitário Estácio de Sá de Santa Catarina
Profa. Patrícia Soberajski Barreto, Dra.
Focal de Pesquisa e Extensão do Centro Universitário Estácio de Sá de Santa Catarina
- SUMÁRIO -
Conceitos Básicos
Correlação Linear
Conhecendo os Dados
Regressão Linear
Medidas de Tendência Central
Teste de Diferença entre Médias
Medidas de Dispersão
Bibliografia
Conceitos Básicos
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
ESTATÍSTICA
Origem no latim
status (estado) + isticum (contar)
Informações referentes ao estado
Coleta, Organização, Descrição, Análise e Interpretação de Dados
ESTATÍSTICA
Elaborando a Definição de Estatística
ESTATÍSTICA
O Que é Estatística (definição)?
“Estatística é um conjunto de
técnicas e métodos que nos auxiliam
no processo de tomada de decisão na
presença de incerteza.”
ESTATÍSTICA
POR QUE A ESTATÍSTICA É IMPORTANTE?

As diferenças são atribuídas a causas erradas;

As coincidências ocorrem frequentemente;

As pessoas têm dificuldades com probabilidades;

Acrescentam polimento às publicações;

Faz conhecer o “grau de confiança” das conclusões.
BIOESTATÍSTICA
POPULAÇÃO E AMOSTRA
POPULAÇÃO (N): Todos os estudantes da Estácio
Plano de Amostragem
AMOSTRA (n): Parte dos estudantes da Estácio
ESTATÍSTICA
REQUISITOS DE UMA AMOSTRA
1) Ter um tamanho adequado (previamente calculado)
Existem fórmulas para o cálculo do adequado tamanho da amostra
2) Constituintes selecionados ao acaso (sorteio)
ESTATÍSTICA
ESTATÍSTICA
Ferramentas para Análise de Dados
•
•
•
•
•
•
•
SPSS
Epidata
Bioestat
Excel
STATA
SAS
Epi Info
Conhecendo os Dados
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
TIPOS DE DADOS

Dados Nominais (Sexo, Raça, Cor dos Olhos)

Dados Ordinais (Grau de Satisfação)

Dados Numéricos Contínuos (Altura, Peso)

Dados Numéricos Discretos (Número de Filiais)
“Estatísticas aplicadas em alguns tipos de dados
não podem ser aplicadas a outros.”
ESTATÍSTICA
TIPOS DE DADOS

Dados Intervalares (Temperatura oC)
Quando se referem a valores obtidos mediante a
aplicação de uma unidade de medida arbitrária,
porém constante e onde o zero é relativo. Este tipo de
dado tem restrições a cálculos.
30oC não é três vezes mais quente que 10oC
Para cálculos se utiliza a escala Kelvin
ESTATÍSTICA
Medidas de
Tendência Central
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma ideia de onde se localiza o centro, o
ponto médio de um determinado conjunto de dados.
f
Medidas:
Média, Moda e Mediana.
x
ESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto de dados.
Fisicamente representa o ponto de equilíbrio da distribuição.
Modos de calcular
1) para dados simples
x=Sx/n
2) para valores distintos
x = S fx / n
3) para agrupamentos em classes
x = S fx / n
ESTATÍSTICA
Fonte: renovadoresudf.wordpress.com
ESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um conjunto de
dados ordenados.
Para um número par de termos a mediana é obtida através
da média aritmética dos dois valores intermediários.
Interpretação:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
ESTATÍSTICA
MEDIANA
Fonte: http://guiacemtiradentes.blogspot.com.br/2013/03/moda-mediana-media-matematica.html
ESTATÍSTICA
Interpretação da Mediana:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
Na Empresa ABC o
salário mediano é de
R$ 2.800,00
ESTATÍSTICA
MEDIANA
1) Cálculo da posição da mediana para dados simples
2 3 4 5 6
7 8 9 10
PMd =(n+1) / 2
PMd = (9+1) / 2
PMd = 5o Termo
Mediana (Md) = 6
ESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um conjunto
de dados. Símbolo = Mo
1) Moda para dados simples
Exemplos:
2, 3, 4, 5, 6, 7, 8
AMODAL
2, 3, 3, 4, 5, 6 ,7
MODA = 3
2, 3, 3, 4, 5, 5, 6
BIMODAL (Mo = 3 e Mo = 5)
ESTATÍSTICA
Média, Mediana e Moda.
Fonte: http://revistaescola.abril.com.br/fundamental-2/moda-media-mediana-quando-usar-como-interpretar-resultados-732318.shtml#ad-image-2
ESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA:
Dados Numéricos e Intervalares
É a medida mais utilizada.
MODA:
Dados Nominais
MEDIANA: Dados Ordinais
Medidas de Dispersão
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade.
Medidas mais comuns:
- Variância,
- Desvio Padrão,
- Amplitude,
- Coeficiente de Variação
ESTATÍSTICA
Fonte: http://jesseantenado.blogspot.com.br/2012_01_01_archive.html
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s = s2
A dispersão nas amostras é menor do que na população,
por isso é que se faz este ajuste matemático
ESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.
f
Média
x
ESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados maior do que a curva B,
logo o desvio padrão de A é maior do que o de B.
f
f
Curva A
Média
Curva B
x
Média
x
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada,
assim um desvio medido em dias será maior do que um medido
em meses.
O coeficiente de variação expressa o desvio-padrão como
porcentagem do valor da média.
COEF. VARIAÇÃO =
100 . DESVIO PADRÃO
MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média
- GRAU DE HOMOGENEIDADE DOS DADOS -
até 10%

ÓTIMO
de 10% a 20%

BOM
de 20% a 30%

REGULAR
acima de 30%

RUIM
ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
4 5 5 6
6 7 7 8
Correlação Linear
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis quantitativas
(com dados numéricos).
a
a
b
a
b
b
ESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores pequenos de b, enquanto que valores grandes de a
tendem a estar relacionados com valores grandes de b.
a
Exemplos:
Peso x Altura
Nível socioeconômico x Volume de vendas
Consumo de Álcool x Preval. Cirrose Hepática
b
ESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores grandes de b, enquanto que valores grandes de a
tendem a estar relacionados com valores pequenos de b.
a
Exemplos:
Renda Familiar x Número de Filhos
Escolaridade x Absenteísmo
Volume de vendas x Passivo circulante
b
ESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de pontos
aproximando-se mais de uma parábola do que de uma reta.
a
Exemplos:
Coef. de Letalidade (a) x Dose do Medicamento (b)
Custo (a) x Lote Econômico de Compra (b)
b
ESTATÍSTICA
COEFICIENTE DE CORRELAÇÃO DE PEARSON
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
S(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma
SX = Somatório dos valores da variável X
SY = Somatório dos valores da variável Y
SX2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma
SY2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma
ESTATÍSTICA
EXEMPLO
Cálculo do coeficiente de correlação para os dados das variáveis
X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos.
X
Y
101
193
3,2
4,6
.
.
.
42
1452
.
.
.
2,8
39,3
X2
Y2
X.Y
10201 10,24
37249 21,16
.
.
.
.
.
.
323,2
887,8
.
.
.
1764
7,84 117,6
251538 153,55 5706,2
ESTATÍSTICA
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
r =
12 . 5706,2 - 1452 . 39,3
12 . 251538 - (1452)2 .
12 . 153,55 - (39,3)2
r = 0,69 (Correlação Linear Positiva
r > 0)
ESTATÍSTICA
COEFICIENTES DE CORRELAÇÃO
Positiva Perfeita
Positiva
r>0
Negativa
r<0
r=1
Negativa perfeita
r = -1
ESTATÍSTICA
COEFICIENTES DE CORRELAÇÃO
Ausência de Correlação
r=0
ESTATÍSTICA
INTERPRETAÇÃO
• O Valor de r (Correlação Linear de Pearson) varia de -1 a +1.
• O sinal indica o sentido (correlação positiva ou negativa).
• O valor indica a força da correlação (Fraca ou Forte)
valor de r
Forte
-1
Relativa
Fraca
- 0,6
Muito
Muito
Ausência
Fraca
Fraca
- 0,3
0
+ 0,3
Relativa
Fraca
+ 0,6
Forte
+1
ESTATÍSTICA
CORRELAÇÃO DE SPEARMAN (Rho)
• Estatística não paramétrica
• Usada em dados que não têm Distribuição Normal
• Usadas com dados Ordinais (Conceitos: A, B, C, D, E)
CORRELAÇÃO TAU DE KENDALL
• Estatística não paramétrica
• Usada em um conjunto pequeno de dados com muitos
postos empatados
ESTATÍSTICA
EXERCÍCIO:
1) Coloque V (Verdadeiro) ou F (Falso):
(
) Quando o valor de r for maior que 0,7 ou menor que -0,7 a
correlação entre as duas variáveis em estudo é forte
(
) O sinal negativo de r indica que as variáveis em estudo são
inversamente proporcionais
( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que
as variáveis sejam diretamente proporcionais.
( ) O coeficiente de correlação de Pearson pode ser aplicado em
dados nominais
Regressão Linear
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
REGRESSÃO
A análise de regressão tem por objetivo descrever,
através de um modelo matemático, a relação entre
duas variáveis, partindo de n observações das
mesmas.
A variável a qual desejamos fazer uma estimativa recebe
o nome de variável dependente e a outra recebe o
nome de variável independente.
ESTATÍSTICA
REGRESSÃO
Supondo X a variável independente e Y a dependente, vamos
procurar determinar o ajustamento de uma reta à relação
entre essas variáveis, ou seja, vamos obter uma função
definida por:
Y = a.X + b
onde a e b são coeficientes.
a = Inclinação ou Gradiente (Coef. Angular)
b = Intercepto (Coef. Linear)
ESTATÍSTICA
REGRESSÃO
Sejam duas variáveis X (Notas de Matemática) e Y (Notas de
Estatística), entre as quais exista uma correlação acentuada,
embora não perfeita, como as que formam a tabela a seguir:
ESTATÍSTICA
REGRESSÃO
Podemos concluir, pela forma do
diagrama, que se trata de uma
correlação retilínea, de modo a
permitir o ajustamento de uma
reta, imagem da função definida
por:
Y = a.X + b
ESTATÍSTICA
REGRESSÃO
Legendre, Adrien-Marie (1752-1833)
- Matemático francês, discípulo de
Euler e Lagrange.
- É autor de um clássico trabalho de
geometria, Élements de géométrie.
- Também fez importantes
contribuições em equações
diferenciais, cálculo, teoria das
funções e teoria dos números.
Eu obtive a equação
da reta ... dos mínimos
quadrados ordinários
ESTATÍSTICA
REGRESSÃO
Y = a.X + b
ESTATÍSTICA
REGRESSÃO
ESTATÍSTICA
CÁLCULO DA REGRESSÃO
ESTATÍSTICA
RETA IMAGEM DA REGRESSÃO
ESTATÍSTICA
RETA IMAGEM DA REGRESSÃO (Microsoft Excel)
ESTATÍSTICA
COEFICIENTE DE DETERMINAÇÃO ( R2 )
n
Variação exp licada
r =
Variação total
2
Basta elevar o coeficiente
de correlação ao quadrado
R2
r =
2
  yˆ
i =1
n
 y
i =1
i
 y
2
i
 y
2
É quanto a variável X pode explicar da variação em Y
ESTATÍSTICA
INTERPOLAÇÃO E EXTRAPOLAÇÃO
Voltando à tabela das notas, vemos que 4,0 não figura entre as
notas de Matemática. Entretanto, podemos estimar a nota
correspondente em Estatística fazendo X=4,0 na equação:

Y = 0,86 X  0,89
Assim,

X = 4,0  Y = 0,86  4,0  0,89 = 4,33
O mesmo acontece com a nota 1,0:

X = 1,0  Y = 0,86 1,0  0,89 = 1,75
Como 4 pertence ao
intervalo [2,10], foi feita
uma
interpolação;
e
como 1 não pertence ao
intervalo [2,10], foi feita
uma extrapolação.
Teste de Diferença
entre as Médias
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
TEST T
Serve para comparar as médias de dois grupos amostrais
Duas hipóteses possíveis:
H0: ma - mb = zero
As médias são iguais
H1: ma - mb ≠ zero
As médias são diferentes
ESTATÍSTICA
Testes de duas
amostras
As médias das duas
amostras são iguais?
ESTATÍSTICA
Analisando duas amostras
m
x
≠
≠
x
m ?
ESTATÍSTICA
Teste da diferença!
H0: ma-mb=zero
H1: ma-mb≠zero
diferença = 0
Médias iguais
ESTATÍSTICA
Teste da diferença!
H0: ma-mb=zero
H1: ma-mb≠zero
diferença = 0
Médias iguais
Cuidado!!!
Antes do emprego do Teste T deve ser
testada a homogeneidade das variâncias.
ESTATÍSTICA
Roteiro do Teste da diferença entre médias
1) Testar a homogeneidade das variâncias:
Quando p>0,05  temos variâncias homogêneas
Quando p<0,05  temos variâncias diferentes
2) Se as variâncias forem homogêneas
realizar o Teste T para homogeneidade das variâncias.
3) Se as variâncias forem diferentes
realizar o Teste T para variâncias diferentes.
4) Quando o Teste T apresentar:
p>0,05  As médias são iguais
p<0,05  As médias são diferentes
ESTATÍSTICA
Comparando as médias no Microsoft Excel
ESTATÍSTICA
Comparando as médias no SPSS
ESTATÍSTICA
Output do SPSS
Como p>0,05 as variâncias
são semelhantes
Como p<0,05 as
médias são diferentes
p<0,05: Diferentes!
Fonte Bibliográfica
 BARBETA, P. A. Estatística Aplicada às Ciências Sociais.
5.ed. Florianópolis: UFSC, 2006.
 DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical.
3.ed. New York: Lange Medical Books/McGraw-Hill, 2006.
 LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed.
São Paulo: Harbra, 2007.
 SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron
Books, 2006.
 STEVENSON, W. J. Estatística Aplicada à Administração.
São Paulo: Harbra, 2007.
Retornar
Download