Estatística e Probabilidade CORRELAÇÃO LINEAR 1. • • Exercícios. E REGRESSÃO •1. CORRELAÇÃO E REGRESSÃO LINEAR • Quando considera-se as observações de duas variáveis que podem estar relacionadas como causa e efeito, ou variável independente e variável independente, os procedimentos conformam as teorias da correlação e da regressão linear. • Duas ou mais variáveis relacionadas podem ser analisadas por um procedimento similar, a regressão múltipla • Nesta disciplina, estudaremos a correlação e a regressão linear entre duas variáveis. • Esta pode ser simples, de um par de variáveis, uma condicionadora ou independente e outra dependente, ou ainda múltipla, onde há duas ou mais variáveis condicionadoras. •1. CORRELAÇÃO E REGRESSÃO • Quaisquer hipóteses de correlação podem ser observadas inicialmente nos diagramas de dispersão, a representação gráfica das variáveis no eixo “x” (independente) e eixo “y” (dependente). Por exemplo, uma amostra aleatória, de dez dos 98 alunos de uma classe da Universidade A: notas obtidas Matemática e Estatística: • •1. CORRELAÇÃO E REGRESSÃO • Representando os pares ordenados (x,y), obtemos uma nuvem de pontos que denominamos diagrama de dispersão. • Esse diagrama nos fornece uma idéia grosseira, porém útil da correlação existente. • Quais as análises estatísticas que se pode desenvolver sobre a significância desta correlação? • Por definição, correlação é a relação entre duas variáveis que expressam a relação de causa e efeito ou que variam concomitantemente. São variáveis consideradas correlacionadas. • O grau de relacionamento para dados amostrais é dado pelo coeficiente de correlação linear, r . •1. CORRELAÇÃO E REGRESSÃO • Posteriormente à análise da significância da correlação, procede-se na análise matemática e gráfica desta correlação, construindo-se a equação da reta entre x e y, na etapa da regressão linear. • A análise da regressão linear permite a projeção de valores de y a partir dos valores reais de x. Permite portanto a previsão de resultados. • • Como se calcula r e como se analisa a sua significância? •2. COEFICIENTE DE CORRELAÇÃO LINEAR • O grau de relacionamento para dados amostrais é dado pela seguinte expressão: • • • • • • •2. COEFICIENTE DE CORRELAÇÃO LINEAR • Onde: n é o número de observações e r é o coeficiente de correlação linear para uma amostra. Esta equação pode ser simplificada em duas etapas como (VER LIVRO TEXTO): • • r = Σ (x- ) (y- ) • -----------------• √ Σ (x- )2 Σ (y- )2 • • e finalmente, •2. COEFICIENTE DE CORRELAÇÃO LINEAR (X) 5 8 7 10 6 7 9 3 8 2 65 • (Y) 6 9 8 10 5 7 8 4 6 2 65 XY 30 72 56 100 30 49 72 12 48 4 473 X2 25 64 49 100 36 49 81 9 64 4 481 Y2 36 81 64 100 25 49 64 16 36 4 475 •EXEMPLOS: • Desenvolva o primeiro exercício do livro ; • A seguir encontre o coeficiente de correlação r para os dados da tabela anterior (acima) usando a equação simplificada. •3. Propriedades do coeficiente r . • Propriedades do coeficiente r: • O valor de r está sempre entre –1 e 1. • O valor de r não varia se todos os valores de qualquer uma das variáveis são convertidos para uma escala diferente. • O valor de r não é afetado pela escolha de x ou y. • O r mede a intensidade, ou grau, de um relacionamento linear. Não serve para medir a intensidade de um relacionamento nãolinear. • •4. Coeficiente de determinação r2: • O coeficiente de determinação r2 indica aproximadamente o percentual de variação na série atribuído à variável independente; • Da mesma forma 1- r2 indica o percentual de variação atribuído a outros fatores. • Todos os programas estatísticos calculam o r, r2 e a significância de r. • Como avaliar-se a significância de r ? •5. Significância do coeficiente de correlação linear. • A significância de r está baseada no seu afastamento de zero. • Uma aplicação do teste t é geralmente utilizada para a avaliação da significância de r. • Justifica-se como a observação da diferença do r calculado de zero, que indica a inexistência de qualquer correlação. A equação e os graus de liberdade (pares na série) usados são: • •6. CORRELAÇÃO POSITIVA E NEGATIVA. • CORRELAÇÃO POSITIVA: • Caso as variáveis x e y cresçam no mesmo sentido, isto é, quando x cresce, y também cresce, diz-se que as duas variáveis têm correlação positiva. • As notas de matemática e notas de estatística dos alunos tem correlação positiva, porque quando uma das variáveis cresce, a outra , em média, também cresce. • CORRELAÇÃO NEGATIVA: caso as variáveis x e y variem em sentido contrário, isto é, quando x cresce, em média y decresce, diz-se que as duas variáveis têm correlação negativa. •7. INTENSIDADE DA CORRELAÇÃO. • •8. Exemplo final. • Observe os dados da tabela a seguir e discuta: • Qual é o coeficiente de correlação da série? • O que significa?: •8. Exemplo final •