análise dos estimadores resumo significado erro padrão estimação de intervalo teste de hipótese teste t teste F (ANOVA) 2 Regressão Linear Simples - Exemplo Coleta de Dados: obs. banco pccrédito 1 1 0,26 2 2 0,15 3 3 0,28 4 4 0,15 5 5 0,30 6 7 0,20 7 15 0,13 8 22 0,20 9 23 0,24 10 24 0,24 11 38 0,26 12 51 0,12 13 65 0,27 14 87 0,12 pctvm 0,10 0,22 0,09 0,24 0,15 0,31 0,62 0,18 0,22 0,11 0,13 0,31 0,29 0,38 3 Análise da Regressão REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X) Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0% Interseção 0,2825 0,0260 10,862 0,0000 0,2258 0,3391 0,2361 0,3288 pctvm -0,3109 0,0949 -3,278 0,0066 (0,5176) (0,1043) (0,4800) (0,1419) 4 Regressão Linear Simples crédito/ativo x tvm/ativos 0,70 0,60 tvm/ativo 0,50 0,40 0,30 0,20 0,10 0,00 0,10 0,12 0,14 0,16 0,18 0,20 crédito/ativo 0,22 0,24 0,26 0,28 0,30 5 Modelo de Regressão Linear tvm/ativos x crédito/ativos 0,30 0,28 0,26 0,24 pccrédito 0,22 0,20 0,18 0,16 0,14 0,12 0,10 0,00 0,10 0,20 0,30 0,40 pctvm 0,50 0,60 0,70 6 Resultado do Modelo de Regressão REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X) Quais os valores dos estimadores? Interseção pctvm Coeficientes 0,2825 -0,3109 7 Análise dos Estimadores . REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X) Os estimadores a e b da equação: são estatisticamente significativos? são estatisticamente diferentes de zero? yc = a + b.xi yc = 0,2825 – 0,3109xi 8 Análise da Regressão Erro padrão do coeficiente angular Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0% Interseção 0,2825 0,0260 10,862 0,0000 0,2258 0,3391 0,2361 0,3288 pctvm -0,3109 0,0949 -3,278 0,0066 (0,5176) (0,1043) (0,4800) (0,1419) 9 Analisando os estimadores . Erro Padrão do Coeficiente a – Sa Sa Se 2 1 X n Sxx 10 Analisando os estimadores Erro Padrão do Coeficiente b – Sb Sb Se Sxx 11 Estimando Intervalos onde: B = Parâmetro angular esperado da população b = Coeficiente angular estimado pela regressão Sb = Erro padrão da estimativa do coeficiente angular t = distribuição de student α = nível de confiança desejado 12 Testando a significância do estimador Teste de hipótese O parâmetro populacional está contido no intervalo amostral? 3 formas de testar – sempre utilizando a distribuição t 1) Através do Intervalo de Confiança 2) Através do Nível de Significância 3) Através da probabilidade estimada (p-value) 13 Testando o coeficiente b Será que o modelo de regressão linear obtido é útil para projetar valores de y? A hipótese nula estabelece que as variáveis x e y da população não são relacionadas, isto é, Inclinação de FRP = 0. H0: B = 0 H 1: B 0 14 Análise da Regressão Teste t para o coeficiente angular B Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0% Interseção 0,2825 0,0260 10,862 0,0000 0,2258 0,3391 0,2361 0,3288 pctvm -0,3109 0,0949 -3,278 0,0066 (0,5176) (0,1043) (0,4800) (0,1419) Teste de hipóteses: H0 : B = 0 variáveis PCTVM e PCCRÉDITO não são relacionadas. H1 : B ≠ 0 variáveis PCTVM E PCCRÉDITO são relacionadas. 15 Testando o coeficiente b . Teste pelo nível de significância O teste consiste em comparar o t calculado com o t crítico a um dado nível de significância cálculo de t = b-B Sb Como não se conhece o parâmetro, faz-se B = 0 = então, t calculado = b Sb Se t calculado > t crítico: rejeita H0 e b é válido ≠ 0 Se t calculado < t crítico: aceita H0 e b não é válido = 016 Testando o coeficiente b Com o Intervalo de Confiança: Se o Intervalo estimado contiver o valor hipotético de B, aceita H0, que será, estatisticamente igual a zero. Com o P-VALUE: Se a probabilidade estimada for maior que α, aceita H0. 17 Testando o coeficiente b Intervalo de Confiança 4,5% 4,0% 3,5% 3,0% 2,5% 2,0% 1,5% Limite crítico Intervalo de confiança Zona de Rejeição 1,0% 0,5% 0,0% 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 18 Análise da Regressão Valor p (p-value) Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0% Interseção 0,2825 0,0260 10,862 0,0000 0,2258 0,3391 0,2361 0,3288 pctvm -0,3109 0,0949 -3,278 0,0066 (0,5176) (0,1043) (0,4800) (0,1419) Consiste em comparar valor p calculado (p-value) com o nível de significância requerido pelo pesquisador/consultor Caso o p-value seja menor que o nível de significância previamente estabelecido: Rejeita-se H0: B é válido, ou seja, diferente de zero 19 Estimando Intervalos Intervalo de Confiança do coeficiente b Estima-se o intervalo de variação de b em torno do parâmetro populacional B Utiliza-se a distribuição t , que é a distribuição z ajustada para (n – k) graus de liberdade b t Sb B b t Sb 2 2 20 Análise da Regressão Intervalo de confiança Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0% Interseção 0,2825 0,0260 10,862 0,0000 0,2258 0,3391 0,2361 0,3288 pctvm -0,3109 0,0949 -3,278 0,0066 (0,5176) (0,1043) (0,4800) (0,1419) Consiste em identificar se o valor 0 (zero) pertence ao intervalo de confiança. Caso pertença, não se rejeita H0, ou seja, B não é diferente de zero. 21 Testando a equação da reta Testa a hipótese de que nenhum dos estimadores tenha significado É utilizada a distribuição F O teste consiste em comparar o F calculado com o F crítico Se F calculado > F crítico: rejeita H0 e a regressão é válida Se F calculado < F crítico: aceita H0 e rejeita a regressão 22 Testando a equação da reta A distribuição F representa uma análise de variância (ANOVA) Quanto maior, mais adequada a reta Em regressão simples, F = t2 Variação Explicada F Variação não Explicada 23 Testando a equação da reta . n 2 (y – y) c i=1 F= K-1 (k – 1) graus de liberdade n 2 (y – y ) i c i=1 n-k (n – k) graus de liberdade Onde: n = nº de observações da amostra k = nº de amostras /nº de variáveis 24 Estatísticas ANOVA gl: graus de liberdade para a distribuição F SQ: soma dos quadrados dos desvios MQ: média dos quadrados dos desvios (SQ/gl) da regressão e dos resíduos MQ da regressão = variância explicada MQ dos resíduos = variância não explicada F: MQ da regressão / MQ dos resíduos F de significação: p-value da estatística F 25 Análise de Regressão Análise da Variância Notar que F = t2 ANOVA gl Regressão Resíduo Total SQ MQ F F de significação 1 4.029053 4.029053 7.5247854 0.017827567 12 6.425251 0.535438 13 10.4543 26 Análise de Dados - Regressão (Excel) Ferramentas Análise de dados Regressão Caixa de diálogo: Intervalo Y de entrada: selecionar Intervalo X de entrada: selecionar Constante é zero: selecionar quando se quiser que a reta passe pela origem (a=0) Rótulos: marcar quando a seleção dos dados anteriores contiver o título da coluna Nível de confiança: informar o nível de significância (0,05; 0,025; etc.) Opções de saída: indicar a célula onde se deseja a resposta 27