1. correlação e regressão

Propaganda
Estatística e Probabilidade
CORRELAÇÃO
LINEAR 1.
•
•
Exercícios.
E
REGRESSÃO
•1. CORRELAÇÃO E REGRESSÃO LINEAR
• Quando considera-se as observações de duas variáveis que
podem estar relacionadas como causa e efeito, ou variável
independente e variável independente, os procedimentos
conformam as teorias da correlação e da regressão linear.
• Duas ou mais variáveis relacionadas podem ser analisadas por
um procedimento similar, a regressão múltipla
• Nesta disciplina, estudaremos a correlação e a regressão linear
entre duas variáveis.
• Esta pode ser simples, de um par de variáveis, uma
condicionadora ou independente e outra dependente, ou ainda
múltipla, onde há duas ou mais variáveis condicionadoras.
•1. CORRELAÇÃO E REGRESSÃO
• Quaisquer hipóteses de correlação podem ser observadas
inicialmente nos diagramas de dispersão, a representação gráfica
das variáveis no eixo “x” (independente) e eixo “y” (dependente).
Por exemplo, uma amostra aleatória, de dez dos 98 alunos de
uma classe da Universidade A: notas obtidas Matemática e
Estatística:
•
•1. CORRELAÇÃO E REGRESSÃO
•
Representando os pares ordenados (x,y), obtemos uma
nuvem de pontos que denominamos diagrama de dispersão.
•
Esse diagrama nos fornece uma idéia grosseira, porém útil da
correlação existente.
•
Quais as análises estatísticas que se pode desenvolver sobre
a significância desta correlação?
•
Por definição, correlação é a relação entre duas variáveis que
expressam a relação de causa e efeito ou que variam
concomitantemente.
São
variáveis
consideradas
correlacionadas.
•
O grau de relacionamento para dados amostrais é dado pelo
coeficiente de correlação linear, r .
•1. CORRELAÇÃO E REGRESSÃO
•
Posteriormente à análise da significância da correlação,
procede-se na análise matemática e gráfica desta correlação,
construindo-se a equação da reta entre x e y, na etapa da
regressão linear.
•
A análise da regressão linear permite a projeção de valores de
y a partir dos valores reais de x. Permite portanto a previsão de
resultados.
•
•
Como se calcula r e como se analisa a sua significância?
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
• O grau de relacionamento para dados amostrais é dado
pela seguinte expressão:
•
•
•
•
•
•
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
• Onde: n é o número de observações e r é o coeficiente de
correlação linear para uma amostra. Esta equação pode ser
simplificada em duas etapas como (VER LIVRO TEXTO):
•
• r = Σ (x- ) (y- )
•
-----------------•
√ Σ (x- )2 Σ (y- )2
•
• e finalmente,
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
(X)
5
8
7
10
6
7
9
3
8
2
65
•
(Y)
6
9
8
10
5
7
8
4
6
2
65
XY
30
72
56
100
30
49
72
12
48
4
473
X2
25
64
49
100
36
49
81
9
64
4
481
Y2
36
81
64
100
25
49
64
16
36
4
475
•EXEMPLOS:
• Desenvolva o primeiro exercício do livro ;
• A seguir encontre o coeficiente de correlação r para os dados
da tabela anterior (acima) usando a equação simplificada.
•3. Propriedades do coeficiente r .
• Propriedades do coeficiente r:
• O valor de r está sempre entre –1 e 1.
• O valor de r não varia se todos os valores de qualquer uma das
variáveis são convertidos para uma escala diferente.
• O valor de r não é afetado pela escolha de x ou y.
• O r mede a intensidade, ou grau, de um relacionamento linear.
Não serve para medir a intensidade de um relacionamento nãolinear.
•
•4. Coeficiente de determinação r2:
• O coeficiente de determinação r2 indica aproximadamente o
percentual de variação na série atribuído à variável independente;
• Da mesma forma 1- r2 indica o percentual de variação atribuído
a outros fatores.
• Todos os programas estatísticos calculam o r, r2 e a
significância de r.
• Como avaliar-se a significância de r ?
•5. Significância do coeficiente de correlação linear.
• A significância de r está baseada no seu afastamento de zero.
• Uma aplicação do teste t é geralmente utilizada para a
avaliação da significância de r.
• Justifica-se como a observação da diferença do r calculado de
zero, que indica a inexistência de qualquer correlação. A equação
e os graus de liberdade (pares na série) usados são:
•
•6. CORRELAÇÃO POSITIVA E NEGATIVA.
• CORRELAÇÃO POSITIVA:
• Caso as variáveis x e y cresçam no mesmo sentido, isto é,
quando x cresce, y também cresce, diz-se que as duas variáveis
têm correlação positiva.
• As notas de matemática e notas de estatística dos alunos tem
correlação positiva, porque quando uma das variáveis cresce, a
outra , em média, também cresce.
• CORRELAÇÃO NEGATIVA: caso as variáveis x e y variem em
sentido contrário, isto é, quando x cresce, em média y decresce,
diz-se que as duas variáveis têm correlação negativa.
•7. INTENSIDADE DA CORRELAÇÃO.
•
•8. Exemplo final.
• Observe os dados da tabela a seguir e discuta:
• Qual é o coeficiente de correlação da série?
• O que significa?:
•8. Exemplo final
•
Download