Estatística Inferencial Estatística Inferencial É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação de uma estatística amostral podem tirar-se conclusões sobre um valor de um parâmetro populacional; - Testes de hipóteses – usando a informação da amostra é possível decidir se uma hipótese (pressuposto) sobre um parâmetro populacional, por exemplo, a média ou proporção, deve ou não ser rejeitada. (Denisa Mendonça – ICBAS-UP, 2004) Testes de Hipóteses ... usando a informação da amostra é possível decidir se uma hipótese (pressuposto) sobre um parâmetro populacional, por exemplo, a média ou proporção, deve ou não ser rejeitada. ... Definição da hipótese nula H0 e alternativa H1 ... Construção de uma estatística teste ... Cálculo do valor de prova (p) de um teste estatístico ... Contraste do valor de prova (p) e nível de significância (α) (Denisa Mendonça – ICBAS-UP, 2004) Definição da Hipótese nula (H0) e alternativa (H1) Hipótese nula, H0, é uma afirmação que indica não haver diferença entre a média da população, u, e o valor hipotético assumido; isto é, nula significa que não há diferença. Hipótese alternativa, H1, é uma afirmação que discorda da hipótese nula. ... se a hipótese nula é rejeitada em resultado da evidência, a hipótese alternativa é a conclusão. ... se não tivermos evidência suficiente para rejeitar a hipótese nula, ela mantém-se mas não a aceitamos, dizemos apenas que não a podemos rejeitar. (Denisa Mendonça – ICBAS-UP, 2004) Testes unilaterais e bilaterais Bilaterais (não direccionais) - na hipótese de investigação não há conhecimento apriori da direcção da associação (μ1 ≠ μ2). Zona não rejeição H0: μ1 = μ2 H1: μ1 ≠ μ2 Zona rejeição Zona rejeição Unilaterais (direccionais) - a hipótese de investigação não só refere que há uma associação como indica a direcção (positiva ou negativa) dessa associação (μ1 > μ2). Zona não rejeição H0: μ1 ≤ μ2 H1: μ1 > μ2 Zona rejeição Analogia com o sistema judicial (Denisa Mendonça – ICBAS-UP, 2004) Sistema judicial e a estatística têm pontos comuns Hipótese alternativa - razão pela qual um réu é preso. Obviamente a polícia não pensa prender ninguém que seja inocente. Na estatística a H1 é a hipótese que o investigador deseja avaliar. Hipótese nula - no sistema judicial esta é a de inocência. Em ambos os sistemas, estatística, a H0 indica que o suspeito e o não fazem nada. O nulo é logicamente o alternativo. presunção judicial e tratamento oposto do SUSPEITA Hipótese: Indivíduo é inocente A acusação tem de encontrar provas suficientes para considerar que o índivíduo não é inocente e rejeitar a hipótese de inocência Construção da estatística teste Um determinado teste estatístico segue uma determinada distribuição, segundo a hipótese nula (i.e. se H0 fosse verdadeira) Por exemplo, a estatística ... para testar médias segue uma distribuição t de student, ... para testar proporções segue uma distribuição qui-quadrado, ... para testar variâncias segue uma distribuição F, ... etc. Valores elevados de um teste estatístico indicam que os dados estão longe do esperado, mostrando evidência contra a hipótese nula e favorecendo a hipótese alternativa (Denisa Mendonça – ICBAS-UP, 2004) Cálculo do valor de prova (p) de um teste de significância estatística ... o teste estatístico é então convertido numa probabilidade condicional chamada valor de prova. ... o valor de prova responde à seguinte questão “Se a hipótese nula for verdadeira, qual é a probabilidade de se encontrarem os dados observados, ou outros mais extremos?” Valor de prova (p-value) - a probabilidade (p) de obter por acaso o resultado observado no teste estatístico realizado, ou outro ainda mais extremo, admitindo que a hipótese nula é verdadeira. Contraste do valor de prova (p) com o nível de significância (α) ... se o valor de prova (p) é menor que uma certa quantidade (α) consideramos H0 improvável e portanto rejeitamos H0. ... esta quantidade é chamada nível de significância (α). Indica a probabilidade de rejeitar a hipótese nula quando ela é verdadeira . ... esta quantidade deve ser pequena, porque não queremos rejeitar H0, quando ela é verdadeira (cometer o erro tipo I) ... os valores tradicionais para α são 0.05, 0.01 e 0.001. Se utilizarmos um nível de significância (α) de 0.05 ... quando o valor de prova é >0.05 → a diferença observada não é “significativa” ... quando o valor de prova é ≤0.05 → a diferença é “significativa” ... neste contexto, entende-se por “significativa” que a “diferença observada não é provável por acaso. Não significa, necessariamente, “importância” ou “relevância” substantiva. Um exemplo.... Foi aplicado um programa de musculação a 20 homens, durante 6 semanas, com o objectivo de verificar o seu efeito no peso corporal. No final da aplicação do programa verificou-se uma diminuição média, no peso corporal, de 1.1 Kg. A amostra foi retirada de uma população cuja variável segue uma distribuição normal onde é conhecido = 2.8 Kg, e onde é sabido que programas desta natureza não produzem qualquer efeito 1º Passo - Formulação das hipóteses estatísticas H0: = 0 Kg (a média na população é 0 Kg) H1: 0 Kg (a média na população é 0 Kg). Nesta hipótese não se conhece o sentido (logo é bilateral). 2º passo - escolher o nível de significância para o teste estatístico = 0.05 3º passo - decidir qual o teste apropriado para a hipótese admitida (com conhecido ou não) Tendo em conta que se conhece o desvio padrão da população, a estatística a utilizar baseia-se na distribuição N(0,1) z X n 4º passo - Fazer os cálculos z X n Média da amostra = -1.1 Média da população = 0 Desvio padrão população = 2.8 N = 20 sujeitos z 1.1 0 2.8 20 z 1.76 5º passo - Cálculo do valor de prova z 1.76 p = 0.0392 Z=- 1.76 0.05 Valor-1.76 de prova (p) = 7.84 p = 0.0392 p = 0.0392 Z=- 1.76 Z= 1.76 Como esta probabilidade 0.0784 é superior a 0.05 ou 5.0 % (nível de significância), não se rejeita H0 ALTERNATIVA Definição da área de rejeição e não rejeição na distribuição normal, usando um = 0.05 (bilateral) Zona rejeição Zona não rejeição Z=? 2.5% Z=- 1.96 Zona rejeição 2.5% Z= 1.96 Z=- 1.96 -1.76 Z= 1.96 Como - 1.76 > - 1.96 cai na região de não rejeição de H0