Licenciatura 1304 -Análise de Dados e Probabilidade 1e2 1º Semestre 2006/2007 Clara Costa Duarte 1304- Análise de Dados e Probabilidade 1.1 – Introdução Estatística:é um conjunto de instrumentos que servem para: Recolher Descrever e explorar Interpretar Dados numéricos Estatística Descritiva: Procura sintetizar e representar de forma compreensível a informação contida num conjunto de dados Inferência Estatística: Pretende a partir de um conjunto restrito de dados caracterizar um conjunto mais amplo 1304- Análise de Dados e Probabilidade 1.2 – Conceitos Básicos População: Conjunto de elementos com característica(s) comum (s) que pretendemos estudar. (ou o conjunto dos dados que medem essa (s) característica (s)). Amostra: Subconjunto representativo da população. Unidade estatística : Elemento pertencente à população Atributo ou Característica (Variável Estatística): Factor que permite classificar a unidade estatística: . Qualitativa (várias modalidades) . Quantitativa (diferentes valores) : pode ser Discreta ou Contínua Dado Estatístico ou Observação: o registo da característica de uma unidade estatística 1304- Análise de Dados e Probabilidade 1.2 – Conceitos Básicos Terminologia : • Variável Estatística X • Colecção de dados com N elementos : Os dados estatísticos resultantes são n valores designados por: x1, x2, ...xi,.... xn, • Frequência Absoluta (ni) : nº de vezes que a modalidade ou a classe i é observada na base de dados. • Frequência Relativa (fi) : o mesmo em % • Frequência Absoluta Acumulada (Si) : nº de vezes que a Variável tem valores ≤ à modalidade ou classe i • Frequência Relativa Acumulada (Fi) : o mesmo em % 1304- Análise de Dados e Probabilidade 2 – Classificação e Representação dos Dados . Variáveis Discretas (Exemplo) Quadro de Frequências Representação Gráfica . Distribuição de Frequências (Diagrama de Barras) . Distribuição de Frequências Acumuladas Representação Matemática . Função Cumulativa da Frequência F(x) = F(li-1) = Fi-1 , li-1≤ x< li 1304- Análise de Dados e Probabilidade 2 – Classificação e Representação dos Dados . Variáveis Contínuas (Exemplo) Quadro de Frequências . l0 ≤ Min {xi} e lj ≥ Max {xi} . Escolha do número de Classes- várias formulas . Estimar a amplitude e decidir . Determinar os limites das classes 1304- Análise de Dados e Probabilidade 2 – Classificação e Representação dos Dados . Variáveis Contínuas (Exemplo) Representação Gráfica . Distribuição de Frequências (Histograma; Polígono de Frequências) . Distribuição de Frequências Acum. (Polígono Integral) Representação Matemática . Função Cumulativa da Frequência F(x) x − li −1 fi, F ( x) = Fi −1 + li − li −1 Em que F(li)=Fi li-1≤ x ≤ li 1304- Análise de Dados e Probabilidade 2 – Classificação e Representação dos Dados . Variáveis Contínuas (Exemplo) Histograma (Diagrama de áreas)- Sucessão de rectângulos tendo por base o intervalo da classe e por altura a respectiva frequência dividida pela amplitude da classe. . Área de cada rectângulo = ni ou fi . Área total do Histograma = N ou 1 Caso particular: Todas as classes de igual amplitude é usual tomar-se para altura dos rectângulos - ni ou fi Polígono de Frequências- Obtêm-se unido os pontos médios dos lados superiores dos rectângulos do Histograma. (+ 2 classes nos extremos com frequência 0) Área total do Histograma = Área total do Polígono de Frequências 1304- Análise de Dados e Probabilidade Variável Contínua e População infinita Se N ∞ e h 0 Histograma de área 1 Curva de Frequência A área compreendida entre dois pontos x=a e x=b Frequência relativa Se N ∞ e h Polígono Integral Probabilidade 0 Função de distribuição Licenciatura 1304 -Análise de Dados e Probabilidade 3 1º Semestre 2006/2007 Clara Costa Duarte 1304- Análise de Dados e Probabilidade 3 – Variáveis Estatísticas Unidimensionais Principais aspectos a considerar no estudo de uma uma colecção de dados são: . Localização . Dispersão . Assimetria . Achatamento das correspondentes distribuições de frequência. Como medir estes aspectos? 1304- Análise de Dados e Probabilidade 3.1– Medidas de Localização Central (Média) Definição: N ∑ xi x1 + x2 + ... + xN i =1 = x= N N Ou para dados classificados n1 x1′ + ... + n j x′j = x= N j ∑ ni xi′ i =1 N j = ∑ f i xi′ i =1 Vantagens: Usa a totalidade das observações, fácil interpretação e cálculo, definição rigorosa Desvantagens: Muito sensível a valores extremos; pode não ser um valor observado 1304- Análise de Dados e Probabilidade Propriedades da Média: 1. A soma dos valores observados é o produto da média pelo número de observações 2. A soma dos desvios dos valores observados relativamente à média é zero. 3. A soma n ∑ ( xi − c)2 é mínima quando c = x i =1 4. Se adicionarmos c a todos os valores observados então a média fica adicionada de c 5. Se multiplicarmos por c todos os valores observados então a média fica multiplicada por c 6. Se adicionarmos todos os valores observados de duas colecções de dados então a média da variável soma é igual à soma das médias 7. Quando um conjunto de observações é dividido em j subcolecções, a média principal é igual à media ponderada das médias dos subconjuntos. 1304- Análise de Dados e Probabilidade Média Geométrica Definição: 1 N N xg = ( x1 x2 ...xN ) = (∏ xi ) 1 N i =1 Ou para dados classificados: 1 N j xg = ( x1′ ...x′j ) = (∏ xi′ ) n1 nj ni i =1 1 N _________________________________________________________ Média Harmónica Definição: N xh = N 1 ∑x i =1 i Ou para dados classificados: xh = N j ni ∑ x′ i =1 i 1304- Análise de Dados e Probabilidade 3.1– Medidas de Localização Central (Mediana) Valores ordenados : x(1) ≤ x(2) ≤ ...≤ x(N) Definição: ~ x = x N +1 ( ~ x= 2 para N impar ) x N + x N+1 ( ) 2 ( 2 ) 2 para N par Ou para dados classificados: 0.5 − Fe −1 ~ x = le −1 + (le − le −1 ) fe em que e é a classe da mediana 1304- Análise de Dados e Probabilidade Propriedade da Mediana: n A soma ∑ xi − c é mínima quando c=~ x i =1 Vantagens: Pouco sensível a valores extremos. Desvantagens:Cálculo mais complexo; pouco significativo em amostras pequenas; maior variabilidade 1304- Análise de Dados e Probabilidade 3.1– Medidas de Localização Central (Moda) Definição: Valor que ocorre com maior frequência no conjunto das observações. Para dados classificados, quantitativos contínuos, define-se a classe modal, como a classe com maior frequência (apenas se todas as classes forem de igual amplitude). f m+1 Moda = lm−1 + (lm − lm−1 ) f m−1 + f m+1 em que m é a classe modal Vantagens: Pouco sensível a valores extremos. Desvantagens: Pouco significativo em amostras pequenas; para variáveis contínuas cálculo mais complexo e de difícil interpretação . 1304- Análise de Dados e Probabilidade 3.1– Medidas de Localização Não Central (Quantil) Para dados discretos ou contínuos não classificados: Definição: Quantil de ordem α (0< α <1) é Zα = x(k ) em que k é o maior inteiro menor que (Nα)+1 Para dados classificados, quantitativos e contínuos: Definição: Quantil de ordem α (0< α <1) é x tal que F (x) = α 1304- Análise de Dados e Probabilidade 3.1– Medidas de Localização Não Central (Quantil) Casos Particulares: Quartil (qk) : Dividir os dados em 4 partes iguais, definem-se 3 quartis. Quartil de ordem k (k =1,2,3) = Quantil de ordem α=k/4 Decil (dk) : Dividir os dados em 10 partes iguais, definem-se 9 decis. Decil de ordem k (k =1,2,...,9) = Quantil de ordem α=k/10 Percentil (pk) : Dividir os dados em 100 partes iguais, definem-se 99 percentis. Percentil de ordem k (k =1,2,...,99) = Quantil de ordem α=k/100 ~ x = p50 = d5 = q2 p10 =d1, p20 =d2 ,...... p25 =q1 , p50 =q2 , p75 =q3 1304- Análise de Dados e Probabilidade 3.2– Medidas de Dispersão Existem 2 tipos de medidas de dispersão: i) Definidas a partir da relação com um ponto fixo da amostra (Média) Variância (s2) e desvio padrão (s) ; Desvio absoluto médio (δx) Coeficiente de dispersão ou de variação (cv) ii) Definidas a partir das estatísticas ordinais Amplitude total ( r) ; Amplitude Inter quartil ( rq) Desvio quartil reduzido 1304- Análise de Dados e Probabilidade 3.2– Medidas de dispersão (Variância e Desvio Padrão) Definição: Média Aritmética do quadrado dos desvios para a média N 2 ( x1 − x ) + ( x2 − x ) + ... + ( x N − x ) = s = N 2 2 2 2 ∑ ( xi − x ) i =1 N Para dados classificados: j s2 = ∑ ni ( xi′ − x ) 2 i =1 N Para amostras pequenas é mais correcto dividir por N-1 O Desvio Padrão é a raiz quadrada positiva da Variância Tem a vantagem de se exprimir nas mesmas unidades que a amostra. 1304- Análise de Dados e Probabilidade Propriedades da Variância e do Desvio Padrão: 1. A variância e o desvio padrão são sempre valores não negativos. 2. Decomposição da Variância: A variância é igual à média dos quadrados das observações menos o quadrado da média. 3. Seja yi = ( xi − x ) / s x para todo i, A variável Y tem média de 0 e variância de 1 4. Se adicionarmos c a todos os valores observados a variância e o desvio padrão não se alteram. 5. Se multiplicarmos por c todos os valores observados então a variância fica multiplicada por c2 e o desvio padrão por |c |. 6. Quando um conjunto de observações é dividido em j sub-colecções, a variância principal relaciona-se com as variâncias das sub-colecções pela expressão: j s2 = 2 N s ∑ kk k =1 N j + 2 N ( x − x ) ∑ k k k =1 N 1304- Análise de Dados e Probabilidade 3.2– Medidas de dispersão (Desvio Médio) Definição: Média dos módulos dos desvios para a média N xi − x x1 − x + x2 − x + .. + x N − x ∑ = i=1 δx = N N Para dados classificados: j ∑ ni xi′ − x δ x = i=1 N Esta medida pode ser definida em relação a outro valor central Propriedades 1. O desvio médio é mínimo quando tomado em relação à mediana 2. O desvio padrão é maior que o desvio médio Desvantagem: O cálculo do módulo é mais difícil de tratar em termos informáticos 1304- Análise de Dados e Probabilidade 3.2– Medidas de dispersão (Coeficiente de variação) Definição: s cv = x Esta é uma medida de dispersão relativa, como não depende das unidades da amostra permite comparar distribuições de variáveis com unidades ou médias diferentes. Não é definido quando a média é 0, pelo que só deve ser utilizado quando as observações tem todos o mesmo sinal. 1304- Análise de Dados e Probabilidade 3.2– Medidas de dispersão Medidas de dispersão absoluta Amplitude Total: Diferença entre o maior e o menor valor da amostra r = x(N) - x(1) Amplitude Interquartil: Medida de dispersão relativa Desvio quartil reduzido: rq = q3 – q1 q3 − q1 ~ x 1304- Análise de Dados e Probabilidade 3.3– Medidas de Assimetria Grau de Assimetria de Pearson Parte da noção de que nas distribuições simétricas a Média a Moda e a Mediana são iguais, e que quanto maior a assimetria da distribuição maior a distância entre elas. Fórmula de Pearson : Média – Moda = 3 (Média – Mediana) Grau de assimetria de Pearson : (-3<g<3) x − Moda g= s Grau de Assimetria de Bowley ~ ~ Parte da noção de que nas distribuições simétricas q3 − x = x − q1 e que quanto maior a assimetria da distribuição maior a diferença. Grau de Assimetria de Bowley : (-1<g’<1) x ) − (~ x − q1 ) (q3 − ~ x ) − (~ x − q1 ) (q3 − ~ g'= = ~ ~ rq (q3 − x ) + ( x − q1 ) 1304- Análise de Dados e Probabilidade 3.3– Medidas de Assimetria Definição de Momento: Momento de ordem r em relação a um valor fixo V é N mr ,V = ∑ ( xi − V ) r N i =1 Se V=0 , Momento simples de ordem r é N m'r = ∑ xi i =1 N Se V= Média, Momento centrado de ordem r é r N mr = ∑ ( xi − x ) r N i =1 1304- Análise de Dados e Probabilidade 3.3– Medidas de Assimetria Partindo da noção de que nas distribuições simétricas todos os momentos de ordem impar em relação á media são nulos. 2 Coeficiente de Pearson: (m3 ) b1 = (m2 ) 3 Coeficiente Assimetria de Fisher: m3 g1 = 3 s b1>0 sempre, não informa sobre o sinal g1 já informa sobre o sinal 1304- Análise de Dados e Probabilidade 3.4– Medidas de Achatamento ou Curtose Procura medir o peso das caudas da distribuição. No 4º Momento, os grandes desvios em relação á média tem mais peso que os pequenos, e divide-se pelo desvio padrão para anular o efeito da dispersão. Coeficiente de Achatamento: m4 m4 b2 = = 4 2 (m2 ) s Sabendo que para a distribuição normal, b2=3, define-se Excesso ou Kurtosis: g2 = b2 – 3 O sinal de g2 compara o achatamento da distribuição com a distribuição normal. g2 > 0 diz-se que a distribuição é “leptocúrtica” lepto = estreito, delgado g2 < 0 diz-se que a distribuição é “platicúrtica” plati exprime a ideia de plano 1304- Análise de Dados e Probabilidade 3.5– Medidas de Concentração As medidas de concentração destinam-se a medir a forma como determinado atributo se distribui pelos elementos de uma dada população. Só faz sentido para atributos quantitativos com carácter aditivo. Dada a distribuição de frequências de X, agrupadas em i classes seja t i = ∑ xk k∈i ou ti = ni x'i o valor do atributo acumulado na classe i i Defina-se pi = Fi e qi = ∑ tk k =1 j ∑ tk k =1 Demonstra-se que pi ≥ qi i = ∑ tk k =1 N ∑ xi i =1 1304- Análise de Dados e Probabilidade 3.5– Medidas de Concentração j −1 j −1 Índice de Gini : G= 0≤G≤1 G = 0 a concentração é mínima ∑ ( pi − qi ) i =1 j −1 ∑ pi i =1 = 1− ∑ qi i =1 j −1 ∑ pi i =1 G = 1 a concentração é máxima Curva de Lorenz : Representação gráfica dos pontos (pi , qi ) e da recta de igual distribuição (pi = qi ) Licenciatura 1304 -Análise de Dados e Probabilidade 4 1º Semestre 2006/2007 Clara Costa Duarte 1304- Análise de Dados e Probabilidade 4. 1- Números Índices Definição: Um índice é uma relação entre dois estados ou situações de uma grandeza. Representa o nível em relação ao nível tomado para base. Permitem uma rápida avaliação da variação relativa do fenómeno em análise. Índice Simples: Quando traduz a evolução de um só fenómeno (x) it / 0 xt = .100 x0 Índice Sintético: Quando traduz a evolução de um conjunto de k fenómenos. (x x’ x’’..) 1304- Análise de Dados e Probabilidade 4.2- Números Índices Formas alternativas de construir índices sintéticos 1- Média dos índices simples It / 0 it / 0 + it′/ 0 + it′′/ 0 + ... ∑ it / 0 = = k k 2- Índice das médias (agregativo) It / 0 xt + xt′ + xt′′ + ... ∑ xt = = x0 + x0′ + x0′′ + ... ∑ x0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices ( Índices Ponderados) 1- Índice Sintético Ponderado ωit / 0 + ω ′it′/ 0 + ω ′′it′′/ 0 + ... ∑ ωit / 0 It / 0 = = ω + ω ′ + ω ′′ + .. ∑ω 2- Índice Agregativo Ponderado ω t xt + ω t′xt′ + ω t′′xt′′ + ... ∑ ω t xt = It / 0 = ω 0 x0 + ω 0′ x0′ + ω 0′′x0′′ + ... ∑ ω 0 x0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Índice de Laspeyres Consideram-se como ponderadores preços ou quantidades do ano base. Índice de Preços: P t/0 L Índice de Quantidades: Q Lt / 0 pt q0 ∑ = ∑ p0 q0 p0 qt ∑ = ∑ p0 q0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Índice de Paasche Consideram-se como ponderadores preços ou quantidades do ano t. Índice de Preços: Ρ P t/0 Índice de Quantidades: Ρt / 0 Q pt qt ∑ = ∑ p0 qt pt qt ∑ = ∑ pt q0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Índices de Laspeyres e de Paasche 1- O Índice de Preços de Laspeyres pode ser escrito como uma média ponderada de índices de preços simples. 2- O Índice de Preços de Paasche pode ser escrito como uma média ponderada de índices de preços simples, ou alternativamente como a média harmónica de índices de preços simples. 3- O Índice de Quantidades de Laspeyres pode ser escrito como uma média ponderada de índices de quantidades simples. 4- O Índice de Quantidades de Paasche pode ser escrito como uma média ponderada de índices de quantidades simples, ou alternativamente como a média harmónica de índices de quantidades simples. 5- Demonstra-se que, em certas condições, o índice de Laspeyres é superior ao de Paasche tanto para preços como para quantidades. 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Índice de Fisher Média geométrica dos índices de Laspeyres e Paasche Índice de Preços: F = p t/0 Índice de Quantidades: F = q t/0 ∑ pt q0 ∑ pt qt ∑ p0 q0 ∑ p0 qt ∑ p0 qt ∑ pt qt ∑ p0 q0 ∑ pt q0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Índices de valor Índice Simples: pt qt p q i = = it/0it/0 p0 q0 v t/0 Índice Sintético: I v t/0 pt qt ∑ p q q p = = Lt/0 .Pt/0 = Lt/0 .Pt/0 ∑ p0 q0 1304- Análise de Dados e Probabilidade 4.2 - Números Índices –Propriedades de um “bom”indíce 1- Boa determinação 2- Identidade 3- Homogeneidade 4- Proporcionalidade 5-Reversão dos factores 6- Reversão no tempo 7- Circularidade 1304- Análise de Dados e Probabilidade 4.3 – Índices de Base Móvel. Índices em cadeia. De entre os índices de base móvel tem particular importância: 1) Índices elos, em que a base é sempre constituída pelo período anterior 2) Índices homólogos (mensais ou trimestrais), tomam para base o valor do mês (ou trimestre) homólogo do ano anterior. “Encadeando” os índices de elos obtêm-se um novo tipo de índice de base fixa chamados índices em cadeia: I c t /0 = I1 / 0 .I 2 / 1.I 3 / 2 ....I t / t −1 1304- Análise de Dados e Probabilidade 4.3 – Mudança de base. Conciliação de Índices Se o índice em causa satisfizer a propriedade da circularidade a mudança de base é simples: it / b xt x0 it / 0 = = xb x0 ib / 0 Na prática, usa-se esta regra para todo o tipo de índices. Licenciatura 1304 -Análise de Dados e Probabilidade 5 1º Semestre 2006/2007 Clara Costa Duarte 1304- Análise de Dados e Probabilidade 5.1 – Noções Preliminares • Tipos de fenómenos: Determinísticos e Probabilísticos •Conceitos de Base: •Experiência Aleatória; Observação; Espaço Amostral (S); Evento Simples; Evento Composto; Conjunto finito; Conjunto Infinito; Conjunto Contável. •Definições: A ={x∈S : x∉A} •Complemento de um evento A (em S) •Intersecção de dois eventos A A∩B={x∈S: x∈A e x∈B} A∩B=∅ eB •Eventos mutuamente exclusivos •Diferença entre dois eventos A−B={x∈S: x∈Ae x∉B} •Reunião de dois eventos A A∪B={x∈S: x∈A ou x∈B} eB •Cardinal de um conjunto Finito - #A •Partição do Espaço Amostral B1, B2, ,Br r Bi ∩Bj =∅,i ≠ j e UBi =S i=1 1304- Análise de Dados e Probabilidade 5.1 – Noções Preliminares ( cont.) • Diagramas de Venn •Propriedades das Operações no Espaço Amostral A∩ A = ∅ A∪ A = S Leis Associativas Elemento Neutro Leis Distributivas Leis de Morgan Leis Comutativas A∩ B = B ∩ A A∪ B = B ∪ A A ∩ B ∩ C = ( A ∩ B) ∩ C = A ∩ ( B ∩ C ) A ∪ B ∪ C = ( A ∪ B) ∪ C = A ∪ ( B ∪ C ) A∪∅ = A A∩ S = A Elemento Absorvente ( A ∪ B) ∩ C = ( A ∩ C ) ∪ ( B ∩ C ) ( A ∩ B) ∪ C = ( A ∪ C ) ∩ ( B ∪ C ) A∩ B = A ∪ B A∪ B = A ∩ B A∪ S = S A∩∅ = ∅ 1304- Análise de Dados e Probabilidade 5.1 – Noções Preliminares • Métodos de Contagem •Definições: •Permutação; Factorial; Combinação •Teoremas •Princípio Fundamental da Contagem •O número de Permutações de n objectos diferentes é:h Pn = n! •O número de Permutações de n objectos diferentes escolhendo r objectos de cada vez é: n! n Pr = (n − r )! •O número de Permutações de n objectos diferentes arranjados em círculo é: P = ( n − 1)! n 1304- Análise de Dados e Probabilidade 5.1 – Noções Preliminares •Teoremas •O número de Permutações de n objectos de r tipos diferentes em que, n1+ n2 +...+ nr = n , é: •O número de maneiras diferentes de dividir n objectos em r grupos com ni elementos em cada grupo é: ⎛ n ⎞ n! ⎟⎟ = ⎜⎜ ⎝ n1 , n2 ,.., nr ⎠ n1!n2 !..nr ! Caso particular: Combinação •O número de Combinações de r objectos escolhidos de n objectos é: ⎛ n ⎞ ⎛n⎞ n! C = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎝ r , n − r ⎠ ⎝ r ⎠ r!(n − r )! n r 1304- Análise de Dados e Probabilidade 5.2 – Conceito de Probabilidade •Axiomas da Probabilidade •Seja A um evento do espaço amostral S. Chama-se Probabilidade de A P(A) o número real que mede a verosimilhança com que A ocorre e que satisfaz os seguintes axiomas: i) 0 ≤ P ( A) ≤ 1 ii) P ( S ) = 1 iii) Seja Ai um evento de S, se Ai ∩ A j = 0 para i ≠ j, então P( Ai ∪ A j ) = P ( Ai ) + P( A j ) •Frequência relativa Probabilidade 1304- Análise de Dados e Probabilidade 5.3 – Teoremas Elementares do Cálculo das Probabilidades •Teoremas •Sejam A e B dois eventos de S em que B ⊆ A Então: P ( A − B ) = P ( A) − P ( B ) •Sejam A e B dois eventos quaisquer de S Então: P ( A ∪ B) = P( A) + P( B ) − P ( A ∩ B) •Sejam A , B e C eventos quaisquer de S Então: P ( A ∪ B ∪ C ) = P ( A) + P ( B ) + P (C ) − P( A ∩ B) − P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C ) 1304- Análise de Dados e Probabilidade 5.3 – Teoremas Elementares do Cálculo das Probabilidades •Teoremas •Seja A um evento de S P ( A) + P ( A ) = 1 Então: •Se B ⊆ A Então: P ( B ) ≤ P ( A) •Sejam A1 , A2 , ...., An eventos mutuamente exclusivos Então: n n i =1 i =1 P ( U Ai ) = ∑ P ( Ai ) 1304- Análise de Dados e Probabilidade 5.4 – Probabilidade Condicional. Independência de Eventos •Definição: Probabilidade de A dado B: P( A ∩ B) P( A | B) = , se P( B) ≠ 0 P( B) •Definição: A e B são eventos independentes se e só se: P( A ∩ B) = P( A) P( B ) Teorema: Se A e B são eventos independentes, com probabilidades positivas, então: P ( A | B ) = P( A) e P( B | A) = P( B ) 1304- Análise de Dados e Probabilidade 5.4 – Probabilidade Condicional. Teoremas •Teorema: A Probabilidade Conjunta dos eventos A e B é: P( A ∩ B) = P ( B) P( A | B ) = P( A) P( B | A) A Probabilidade Conjunta dos eventos A1, A2 ,... Ar é: P( A1 ∩ A2 ∩ ... ∩ Ar ) = P( A1 ) P ( A2 | A1 )... .P( Ar | A1 ∩ A2 ∩ ... ∩ Ar −1 ) •Teorema da Probabilidade Total: Se B1, B2 ,... Br forem uma partição de S, então para qualquer evento A : r P ( A) = ∑ P( A | Bi ) P( Bi ) i =1 1304- Análise de Dados e Probabilidade 5.4 – Probabilidade Condicional. Teorema de Bayes •Teorema de Bayes: Se B1, B2 ,... Br forem uma partição de S, então para qualquer evento A então : P ( Bk | A) = P( Bk ∩ A) P ( A | Bk ) P( Bk ) = r P ( A) ∑ P( A | B ) P( B ) i =1 i i para k=1,2,...,r Permite calcular a probabilidade de Bk (uma causa) ocorrer dado que ocorreu o evento A. Licenciatura 1304 -Análise de Dados e Probabilidade 6 1º Semestre 2006/2007 Clara Costa Duarte 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias : Def: Variável Aleatória X(s): é uma função que associa um número real x a cada resultado s do espaço amostral S •Variável Aleatória Discreta X(s): o conjunto de valores possíveis de X é finito (ou infinito numerável) •Função de Probabilidade : Propriedades: f ( x) = P( X = x) i) f ( x) ≥ 0 ii) ∑ f ( x) = 1 x •Função de Distribuição Acumulada: F ( x) = P( X ≤ x) = ∑ f (u ) u ≤x Propriedades: i) É uma função com descontinuidades e em escada ii) Se x ≤ y, então F ( x) ≤ F ( y ) iii) F (−∞) = lim F ( x) = 0 x→−∞ iv) F (+∞) = lim F ( x) = 1 x→+∞ 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias •Variável Aleatória Continua X(s): toma valores de um intervalo ou de um conjunto de intervalos •Função de Densidade de Probabilidade (f.d.p.) : f(x) tal que b a P(a < X < b) = ∫ f ( x)dx, ∀a, b ∈ IR : a ≤ b Propriedades: i) f ( x) ≥ 0, ∀ x ∈ IR +∞ -∞ ii) ∫ f ( x)dx = 1 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias •Variável Aleatória Continua X(s): •Função de Distribuição Acumulada : x −∞ F ( x) = ( X ≤ x) = ∫ f (u )du Propriedades: i) É uma função contínua ii) Se x ≤ y, então F ( x) ≤ F ( y ) iii) F (−∞) = lim F ( x) = 0 x→−∞ iv) F (+∞) = lim F ( x) = 1 x→+∞ dF ( x) v) f ( x) = , se F for derivável dx vi)P(a ≤ x ≤ b) = F (b) − F (a) 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias - Duas ( ou n) dimensões; x =X(s) e y=Y(s)) •Seja (X,Y) um vector Aleatório Discreto •Função de Probabilidade Conjunta: fXY (x,y)= •Propriedades i) f XY ( x, y ) ≥ 0 P(X = x,Y=y) ii) ∑ ∑ f XY ( x, y ) = 1 x y •Função de Distribuição Acumulada Conjunta: FXY = P ( X ≤ x, Y ≤ y ) = ∑ ∑ f XY (u , v) u ≤ x v≤ y 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias- Duas ( ou n) dimensões; x =X(s) e y=Y(s)) •Seja (X,Y) um vector Aleatório Contínuo •Função de Densidade de Probabilidade Conjunta: f XY tal que P ( X , Y ) ∈ A = ∫ ∫ f XY ( x, y )dxdy A Propriedades: i) f XY ( x, y ) ≥ 0, ∀ x ∈ IR +∞ +∞ -∞ -∞ ii) ∫ ∫ f XY ( x, y )dxdy = 1 •Função de Distribuição Acumulada Conjunta: x y FXY = P ( X ≤ x, Y ≤ y ) = ∫−∞ ∫−∞ f XY (u , v) dvdu e ∂ 2 FXY ( x, y ) f XY ( x, y ) = ∂x∂y 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias •Distribuições Marginais de V.A. Discretas •Funções de Probabilidade Marginal de X e Y: f X ( x) = ∑ f XY ( x, y ) y e fY ( y ) = ∑ f XY ( x, y ) x •Função de Distribuição Acumulada Marginal: FX ( x) = ∑ ∑ f XY (u , y ) u ≤x y E FY ( y ) = ∑ ∑ f XY ( x, v) v≤ y x 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias (cont) Distribuições Marginais de V.A. Continuas •Funções de Probabilidade Marginal de X e Y: +∞ +∞ f X ( x) = ∫−∞ f XY ( x, y )dy e fY ( y ) = ∫−∞ f XY ( x, y )dx •Função de Distribuição Acumulada Marginal de X e Y: x +∞ FX ( x) = ∫−∞ ∫−∞ f XY (u , y )dydu y +∞ FY ( y ) = ∫−∞ ∫−∞ f XY ( x, v)dxdv 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias (cont) •Distribuições Condicionais •Funções de Probabilidade Condicional de X dado Y: P ( X = x, Y = y ) f XY ( x, y ) f X Y = y ( x) = P( X = x Y = y ) = fY ( y ) P (Y = y ) •e de Y dado X: P ( X = x, Y = y ) f XY ( x, y ) fY X = x ( y ) = P (Y = y X = x) = f X ( x) P( X = x) 1304- Análise de Dados e Probabilidade 6.1 – Variáveis Aleatórias (cont) •Definição de independência de variáveis aleatórias f XY ( x, y ) = f X ( x) fY ( y ) ∀x, y ∈ IR •Funções de Variáveis Aleatórias Y=g(X) •Como determinar fY a partir de fX? fY ( y ) = P (Y = y ) = P[g ( X ) = y ] = •e FY a partir de FX? FY ( y ) = P (Y ≤ y ) = P[g ( X ) ≤ y ] = ∑ f X ( x) x: g ( x ) = y ∑ f X ( x) x: g ( x ) ≤ y 1304- Análise de Dados e Probabilidade 6.2 –Valor Esperado de uma V.A.(Média) •Definição •V.A.Discreta •V.A. Continua μ = μ x = E(X) = ∑ xf ( x) μ = μ x = E(X) = ∫-∞ x +∞ xf ( x)dx •Teoremas para cálculo de Valores Esperados •E[g(X)] •E[g(X,Y)] •E[ ∑ ai gi (X)] •Se X e Y são V.A. Independentes E(X,Y)=E(X)*E(Y) 1304- Análise de Dados e Probabilidade 6.2 –Variância, Desvio Padrão,Coeficiente de Variação de uma V.A. •Definições •Variância : σ = σ = Var(X) = E ( X − μ ) •V.A.Discreta 2 2 x σ 2 = ∑ ( x − μ ) 2 f ( x) x +∞ σ = ∫−∞ ( x − μ ) f ( x)dx 2 •V.A. Continua 2 2 •Var(X) = E(X2)- μ2 σ = σ = Var(X = E ( X − μ ) σ •Coeficiente de Variação: ω = μ •Desvio Padrão: 2 1304- Análise de Dados e Probabilidade 6.2 –Co-variância e Coeficiente de Correlação •Relação entre 2 V.A. Cov( X , Y ) = σ XY = E [( X − μ X )(Y − μY )] •Co-variância : •V.A.Discreta •V.A. Continua ∑ ∑ ( X − μ X )(Y − μY ) f XY ( x, y ) x y +∞ +∞ −∞ −∞ ∫ ∫ ( X − μ X )(Y − μY ) f XY ( x, y )dxdy •Cov(X,Y) = E(XY)- μX μY •Coeficiente de Correlação: Corr ( X , Y ) = ρ XY = Cov( X , Y ) E[( X − μ X )(Y − μY )] = Var ( X )Var (Y ) Var ( X )Var (Y ) 1304- Análise de Dados e Probabilidade 6.2 –Variância e Co-variância •Teoremas •Var(X) = E(X2)- μ2 •Cov(X,Y) = E(XY)- μX μY n n n ⎡ ⎤ • Var ∑ ai X i = ∑ ∑ ai a j Cov( X i , X j ) ⎢⎣i =1 ⎥⎦ i =1 j =1 1304- Análise de Dados e Probabilidade 6.2 – Momentos de uma V.A. •Definições •Momento simples de ordem r: •V.A.Discreta μ r′ = E( X r ) = ∑ x r f ( x) x •V.A. Continua +∞ r r ′ μ r = E( X ) = ∫−∞ x f ( x)dx •Momento centrado de ordem r: •V.A.Discreta μ r = E( X − μ ) r = ∑ ( x − μ ) r f ( x) x •V.A. Continua μ r = E( X − μ ) r = ∫−+∞∞( x − μ ) r f ( x)dx 1304- Análise de Dados e Probabilidade 6.2 – Momentos de uma V.A. •Definições •Função geradora de momentos da V.A. X: •V.A.Discreta m X (t ) = E(e tX ) = ∑ e tx f ( x) •V.A. Continua m X (t ) = E(e ) = ∫ e f ( x)dx x tX +∞ tx −∞ •A derivada de ordem r da f.g.m. é o momento de ordem r da V.A. •Função geradora de momentos conjunta das V.A. X e Y: m XY (t X , tY ) = E( Exp(t X X + tY Y) 1304- Análise de Dados e Probabilidade 6.2 – V.A. Estandardizadas •Definições X − μX Forma estandardizada de X σX • Uma variável estandardizada tem Valor esperado 0 e Variância 1 •Desigualdade de Chebyshev : Seja X uma V.A.. com média e variância finita e k >0 P(−k < X −μ σ 1 < k) ≥ 1− 2 k 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas Embora exista uma diversidade infinita de possíveis distribuições estatísticas algumas tem um âmbito de aplicação mais generalizado: •Distribuição Uniforme : X ~ DU(i,j) Aplica-se à ocorrência aleatória de resultados igualmente prováveis ⎧ 1 , x ∈ {i, i + 1,... j − 1, j} ⎪ •Função de Probabilidade; f ( x) = ⎨ j − i + 1 ⎪0 x ∉ {i, i + 1,... j − 1, j} ⎩ •Definições: •Função de Distribuição Acumulada ⎧0 ⎪ ⎪ ⎣x ⎦ − i + 1 F ( x) = ⎨ ⎪ j − i +1 ⎪⎩1 x<i i≤x≤ j x> j 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição Uniforme : X ~ DU(i,j) •Parâmetros: Parâmetro de localização i; Parâmetro de escala i-j; •Gama de valores: {i, i + 1,..., j − 1, j} •Propriedades: E(X) = (i+j)/2 VAR(X) =[ (j-i+1)2 –1]/12 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Bernoulli : X ~ Bernoulli (p) •Aplica-se a sequências de n tentativas repetidas independentes com 2 resultados possíveis: sucesso com probabilidade p; insucesso com probabilidade (1-p). •Definições: •Função de Probabilidade: ⎧q = 1 − p x = 0 ⎪ f ( x) = ⎨ p x =1 ⎪0 outros casos, ⎩ • Função de Distribuição Acumulada: ⎧0 ⎪ F ( x ) = ⎨q = 1 − p ⎪1 ⎩ x<0 0 ≤ x <1 x ≥1 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Bernoulli : X ~ Bernoulli (p) •Parâmetros: Parâmetro de localização p •Gama de valores: {0,1} •Propriedades: E(X) = p VAR(X) = p (1-p) 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Binomial: X ~ Bin (n,p) •X corresponde ao número de sucessos em n tentativas de Bernoulli •Definições: ⎧⎛ n ⎞ x n− x x ∈ {0,1,2,..., n} • Função de Probabilidade: ⎪⎜⎜ ⎟⎟ p (1 − p ) f ( x) = ⎨⎝ x ⎠ ⎪0 x ∉ {0,1,2,..., n} ⎩ •Função de Distribuição Acumulada: ⎧0 ⎪⎪⎣ x ⎦ F ( x) = ⎨ ∑ p i (1 − p ) n−i ⎪i =0 ⎪⎩1 x<0 0≤ x≤n x>n 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Binomial: X ~ Bin (n,p) •Parâmetros: n, p •Gama de valores: {0,1,2,....,n} •Propriedades: E(X) =n p VAR(X) = np (1-p) Se (n+1) p não é inteiro Se (n+1) p é inteiro Moda = Int [(n+1) p] Bi-Modal em (n+1) p e (n+1)p -1 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Poisson: X ~ Poisson (λ) Um processo de Poisson refere-se ao nº de eventos que ocorrem num intervalo temporal ou numa região espacial, em que λ representa o nº médio de eventos no referido intervalo. •Definições: • Função de Probabilidade: ⎧ e − λ λx x ∈ {0,1,2,...} ⎪ f ( x) = ⎨ x! ⎪⎩0 x ∉ {0,1,2,...} •Função de Distribuição Acumulada: ⎧0 ⎪ F ( x) = ⎨ −λ ⎣ x ⎦ λi ⎪⎩e i∑ =0 i! x<0 x≥0 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Discretas •Distribuição de Poisson: X ~ Poisson (λ) •Parâmetros: λ •Gama de valores: {0,1,2,....} •Propriedades: E(X) = λ VAR(X) = λ Se λ não é inteiro Moda = Int [λ] Se λ é inteiro Bi-Modal em λ -1 e λ 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição de Uniforme: X ~ U(a,b) Aplica-se à ocorrência aleatória no intervalo [a,b] cuja probabilidade é proporcional ao comprimento do intervalo •Definições: • Função de Densidade de Probabilidade: ⎧ 1 x ∈ [a, b] ⎪ f ( x) = ⎨ b − a ⎪⎩0 x ∉ [a, b] •Função de Distribuição Acumulada: ⎧0 ⎪⎪ x − a F ( x) = ⎨ ⎪b − a ⎪⎩1 x<a x ∈ [a, b] x>b 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição de Uniforme: X ~ U(a,b) •Gama de Valores: [a,b] •Propriedades: E(X) = (a+b)/2 VAR(X) = (b-a)2/12 Função Geradora de Momentos 1 e bt − e at , t≠0 mx (t ) = t b−a 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Normal: X ~ N(µ, σ2) •Definições: 2 ⎡ 1⎛ x − µ ⎞ ⎤ 1 exp ⎢− ⎜ • Função de Probabilidade: f ( x) = ⎟ ⎥ 2 2πσ ⎣ 2⎝ σ ⎠ ⎦ •Função de Distribuição Acumulada: 2 ⎡ 1 1⎛t − µ ⎞ ⎤ x F ( x) = P( X ≤ x) = ⎟ ⎥dt ∫ exp ⎢− ⎜ 2 −∞ 2πσ ⎣ 2⎝ σ ⎠ ⎦ 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Normal: X ~ N(µ, σ2) •Parâmetros: µ,σ2 •Gama de Valores: [-∞, +∞,] •Propriedades: E(X) = µ VAR(X) = σ2 Moda = µ Função Geradora de Momentos ⎛ σ 2t 2 ⎞ ⎟⎟ mx (t ) = exp⎜⎜ µt + 2 ⎠ ⎝ 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Normal: X ~ N(µ, σ2) P(µ −σ < X < µ + σ ) ≈ 0.68 1- P(µ − 2σ < X < µ + 2σ ) ≈ 0.95 P(µ − 3σ < X < µ + 3σ ) ≈ 0.997 2- Se as variáveis Xi ~ N(µi , σi 2) são independentes então: 2 2 a X ~ N ( a µ , a ∑ i i ∑ i i ∑ i σi ) i i i 3- Se as variáveis Xi ~ N(0 , 1) são independentes então: n 2 2 X ~ ℵ ∑ i (n) i =1 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Normal: X ~ N(µ, σ2) •1- Se X ~ N ( µ , σ ) e Z = 2 P (a ≤ X ≤ b) = P ( a−µ σ X −µ σ ≤Z≤ ~ N ( 0,1) b−µ σ ) •2- Se X ~ Bin ( n , p ) e n grande X − np converge para ~ N ( 0 ,1) Z = np (1 − p ) •3- Se X ~ Poisson ( λ ) e λ grande X −λ Z = converge para ~ N ( 0 ,1) λ Correcção de continuidade ( x-0.5<X<x+0.5) 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Exponencial –Exp(β): X ~ Exp(β) Aplica-se à ocorrência de eventos a uma taxa constante, num intervalo de tempo ou numa região. X representa o intervalo de tempo entre eventos independentes Definições: • Função de Probabilidade: ⎧0 ⎪ f ( x) = ⎨ 1 − x / β ⎪β e ⎩ •Função de Distribuição Acumulada: ⎧0 F ( x) = ⎨ −x / β ⎩1 − e x<0 x≥0 x<0 x≥0 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Exponencial –Exp(β): X ~ Exp(β) •Parâmetros: β •Gama de Valores: [0, +∞,] •Propriedades: E(X) = β VAR(X) = β2 Moda = 0 Função Geradora de Momentos ⎛ 1 ⎞ mx (t ) = ⎜ ⎟ ⎝ 1 − βt ⎠ 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Gama –Gama(α,β): X ~ Gama(α,β) X representa a soma de α V.A. exponenciais independentes. ⎧0 ⎪ x = f x ( ) ⎨ 1 α −1 − β • Função de Probabilidade: ⎪ β α Γ(α ) x e ⎩ Definições: +∞ •Em que Γ(α ) = ∫0 xα −1e − x dx α > 0 •Função de Distribuição Acumulada: x≤0 ⎧0 ⎪ i α − 1 F ( x) = ⎨ − xβ 1⎛ x ⎞ ⎪1 − e ∑ i!⎜ β ⎟ x > 0 i =0 ⎝ ⎠ ⎩ x≤0 x>0 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Gama –Gama(α,β): X ~ Gama(α,β) •Parâmetros: α,β •Gama de Valores: [0, +∞,] •Propriedades: E(X) = α β VAR(X) = α β2 Moda = (α –1) β Função Geradora de Momentos α ⎛ 1 ⎞ mx (t ) = ⎜ ⎟ ⎝ 1 − βt ⎠ 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Qui –Quadrado -X2: X ~ X2(v) Representa V.A.s que sejam o quadrado de V.A.s com distribuição Normal Estandardizada. Permite fazer inferências sobre a variância de uma população. x≤0 ⎧0 ⎪ (ν 2 )−1 − x 2 f ( x) = ⎨ 1 x e ν • Função de Probabilidade: ⎪ 2 2 Γ(ν ) ⎩ 2 Definições: x>0 •Função de Distribuição Acumulada:* x≤0 ⎧0 ⎪ ν −1 i 2 1 x F ( x) = ⎨ x − 2 ⎛ ⎞ ⎪1 − e ∑ i!⎜ 2 ⎟ x > 0 i =0 ⎝ ⎠ ⎩ *apenas se v for um nº par , se v for impar a função não é definida 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição Qui –Quadrado -X2 : X ~ X2(v) •Parâmetros: v ( graus de liberdade) •Gama de Valores: [0, +∞,] •Propriedades: E(X) = v VAR(X) = 2 v Moda = v-2, se v≥2 Função Geradora de Momentos ν ⎛ 1 ⎞ mx (t ) = ⎜ ⎟ ⎝ 1 − 2t ⎠ 2 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição t-Student - T(v) : X ~ T(v) Seja : X = Z Y em que Z ~N(0,1) e Y~ X2(v) ν Permite fazer inferências sobre a média de uma população a partir de uma amostra. Definições: • Função de Probabilidade: Γ(ν 2+1 ) ⎛ 1 + x 2 ⎞ ⎜⎜ ⎟⎟ f ( x) = πν Γ(ν2 ) ⎝ ν ⎠ •Função de Distribuição Acumulada: a função não é definida ν +1 − 2 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição t-Student - T(v) : X ~ T(v) •Parâmetros: v •Gama de Valores: [- ∞, + ∞,] •Propriedades: E(X) =0 se v>1 VAR(X) = v/(v-2), se v>2 Moda = 0 Função Geradora de Momentos: não existe 1304- Análise de Dados e Probabilidade 6.3 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição F : X ~ F(v1, v2) •Parâmetros: v1 e v2 •Gama de Valores: [0, + ∞,] •Propriedades: E(X) = v2 / v2 -2 se v2 >2 VAR(X) = 2ν 22 (ν 1 +ν 2 − 2) , se v2 >4 ν 1 (ν 2 − 2 )2 (ν 2 − 4 ) Moda = Função Geradora de Momentos: não existe 1304- Análise de Dados e Probabilidade 6.4 – Distribuições de Probabilidades de Variáveis Contínuas •Distribuição F : X ~ F(v1, v2) X1 ν1 Seja : em que X1~ X= X2 X2(v1) X2 Y~ X2(v2) ν2 Permite comparar variâncias amostrais e fazer inferências sobre as variâncias das populações. Definições: • Função de Probabilidade: ( ) ⎛⎜ ν ( ) ( ) ⎜⎝ν Γ ν 1 +2ν 2 f ( x) = ν 1 ν 2 Γ 2 Γ 2 ν1 2 ν 1 −1 ⎛ ⎞ ν 1 ⎟⎟ x 2 ⎜⎜1 + 1 2 ⎠ ⎝ ν2 ⎞ x ⎟⎟ ⎠ ν 1 +ν 2 − 2 •Função de Distribuição Acumulada: a função não é definida