Distribuicoes de Probabilidade Como representar a freqüência dos dados? Histograma Um histograma ‘suavizado’ é chamado de função de densidade de probabilidade (fdp). função de densidade de probabilidade (fdp) Normal (ou Gausiana) Caso Discreto Só são possíveis alguns valores Se a variável é discreta então não temos uma fdp e sim uma função de probabilidade, que é definida como: a função f(xi) = P(X=xi), i=1,2.... Toda função de probabilidade tem de satisfazer a: f (x ) 1 i 1 i Centro espalhamento Outra medida de tendência central é a mediana Outra, é a moda (medida que ocorre com mais freqüência no conjunto de dados) Uma Normal pode ser caracterizada com apenas 2 parâmetros: Média e variância Distribuição Normal ou Gaussiana 68.2% do total da área 95.4% da área 99.6% da área Qual é a média desta Normal? Qual é a mediana desta Normal? Qual é o Desvio padrão desta Normal? Meus dados são ´uma Normal´ ? Q Q PLOT Distribuições Bimodais Voltamos a Função de Densidade de Probabilidade Vimos que é um histograma suavisado, mas será que todo histograma suavisado é uma fdp? NÃO Toda f.d.p. tem de satisfazer à: para todo x, Integral = área sob a curva Como medir probabilidade a partir da f.d.p. : b A P(a X b) f ( x) a Área sob a curva (integral)