Zanoto, A. - 2009 PROVAS ESTATÍSTICAS NA PESQUISA Na pesquisa científica a metodologia adotada deve ser objetiva, pública e possível de ser repetida por outros pesquisadores competentes. A inferência estatística está apoiada em probabilidades e portanto deve ser previamente definida e metodizada. O procedimento comum envolve vários passos ou estágios de execução: 1- Escolha do modelo estatístico mais adequado para o tipo de variável. 2- Definição da hipótese de nulidade ( Ho ). 3- Determinação do nível de significância ( a ) e a consequente região de rejeição. 4- Determinação do tamanho da amostra ( N ). 5- Cálculo estatístico, de acordo com o modelo adequado escolhido. O valor calculado determina uma de duas decisões possíveis: a) O valor está na região de rejeição: a decisão é rejeitar Ho. b) O valor está fora da região de rejeição: a decisão é aceitar Ho. 6- Verificação do poder da prova aplicada. Zanoto, A. - 2009 Zanoto, A. - 2009 TESTE DE HIPÓTESES O primeiro passo ou estágio, no processo de decisão, é definir a hipótese de nulidade. Hipótese de nulidade ( Ho ) - É a hipótese de que não haja diferenças; nada acontece de diferente e de forma significativa; tudo permanece igual ou semelhante. Formula-se usualmente com o expresso propósito de ser rejeitada. Se é rejeitada, aceita-se a hipótese alternativa. Hipótese alternativa ( H1 ) - É a definição operacional da pesquisa. Chamada tambem de hipótese de pesquisa, é a predição deduzida da teoria que está sendo comprovada. Zanoto, A. - 2009 Ao se tomar uma decisão, baseada na hipótese de nulidade ( Ho ), existem dois tipos de erros que podem ser cometidos: Erro tipo I ou erro a - Consiste em rejeitar a hipótese de nulidade quando ela é verdadeira. Erro tipo II ou erro b - Consiste em aceitar a hipótese de nulidade quando ela é falsa. HIPÓTESES DEFINIDAS H0 H1 H0 Não há erro Erro tipo II Erro b H1 Erro tipo I Erro a Não há erro Poder = ( 1 – b) DECISÃO Zanoto, A. - 2009 Nível de Significância ou Nível de Confiança – É o valor escolhido para a . Marca o início da região de rejeição da hipótese de nulidade. Em estudos médicos e biológicos é estabelecido geralmente em 5% , isto é, 5/100 = 0,05 ( a = 0,05 ). Eventualmente, outros valores podem ser adotados: 1%, 1/100 = 0,01 , ou 10%, 10/100 = 0,10 , etc. Poder de uma prova - É a probabilidade de rejeitar Ho , quando Ho é falsa. Poder = ( 1 - probabilidade de um erro tipo II ) = ( 1 - b ) A probabilidade de se cometer um erro tipo II ( b ) diminui quando o tamanho N da amostra cresce. Portanto o poder da prova aumenta com o N . Probabilidade de erro P - É a probabilidade de erro tipo I ou a , correspondente ao resultado do cálculo da prova estatística aplicada. Quando menor ou igual ao valor adotado de a , cai na região de rejeição e portanto é significante ( * ). Quando maior que a , é não significante ( ns ), pois Ho torna-se válida. Na região de rejeição, quanto menor o valor de P , maior é a significância do resultado da prova. Zanoto, A. - 2009 Independent Sample t-Test: Sample Size Calculation (Alpha = 0,05) 40 Required Sample Size (N) 35 30 25 20 15 10 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 Power Goal Zanoto, A. - 2009 Independent Sample t-Test: Sample Size Calculation (Alpha = 0,01) 50 Required Sample Size (N) 45 40 35 30 25 20 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 Pow er Goal Zanoto, A. - 2009 INTERVALO DE CONFIANÇA DA MÉDIA DA POPULAÇÃO ( m ) O intervalo de confiança da média aritmética da população ( m ) pode ser calculado a partir de: X = média aritmética da amostra s = desvio padrão da amostra N = frequência total ou número de casos da amostra a = nível de significância adotado GL = graus de liberdade = ( N - 1 ) ou “degrees of freedom” = ( df ) t = valor de t na Tabela, de acordo com os graus de liberdade (GL) ou (df) 1 ( IC OU CI ) = X t a 2 s 1 m X t a 2 N s N Zanoto, A. - 2009 Zanoto, A. - 2009 Exemplo: X = 68,2 consequentemente: s = 2,9 N = 10 a = 0,05 GL = df = (N-1) = (10-1) = 9 t = 2,262 na Tabela (para GL = df = 9) 2.9 2.9 68.2 2.262 m 68.2 2.262 10 10 68.2 - 2.07 < m < 68.2 + 2.07 IC(95%) ou CI(95%) = 66.13 < m < 70.27 Zanoto, A. - 2009 Exemplo: X = 1,5646 consequentemente: s = 0,295 N = 65 a = 0,05 GL = df = (N-1) = (65-1) = 64 t = 2,000 (para GL = df = 60) 0.295 0.295 15646 . 2.000 m 15646 . 2.000 65 65 1.5646 - 2.000 ( 0.295 / 8.06226) < m < 1.5646 + 2.000 (0.295 / 8.06226) IC(95%) ou CI(95%) = 1.4915 < m < 1.6377 Zanoto, A. - 2009 Zanoto, A. - 2009 ESCOLHA DO MODELO ESTATÍSTICO A escolha do modelo estatístico adequado vai depender principalmente de: a- Nível de mensuração das variáveis: CATEGÓRICA OU NOMINAL QUALITATIVAS (NÃO-PARAMÉTRICO) ORDINAL INTERVALAR OU NUMÉRICA QUANTITATIVAS (PARAMÉTRICO) b- Número de variáveis: 1, 2, k (3 ou mais variáveis) c- Tipos de variáveis: dependentes ou relacionadas e independentes d- N (Frequência total de casos ou observações de cada variável) Zanoto, A. - 2009 PROVAS PARAMÉTRICAS abcde- Mensuração Quantitativa Nível de mensuração – Escala numérica, intervalar ou de razão Desvio Padrão e Coeficiente de Variação Distribuição normal da amostra N > 35 PROVAS NÃO PARAMÉTRICAS OU PROVAS DE ORDENAÇÃO OU PROVAS DE DISTRIBUIÇÃO LIVRE abcdeef- Mensuração Qualitativa Nível de mensuração - Escalas categórica, nominal ou de classe e ordinal Ordenação Número pequeno de casos ou observações ( N < 20 ) Distribuição livre Modelos mais específicos e mais recentes Tabelas próprias Zanoto, A. - 2009