Profa. Dra. Maria Ivanilde Silva Araújo Biostatística/UFAM - Profª Maria Ivanilde 1 Probabilidade Experimento Aleatório Espaço Amostral Eventos Biostatística/UFAM - Profª Maria Ivanilde 2 Experimento Aleatório Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos varias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Biostatística/UFAM - Profª Maria Ivanilde 3 Espaço Amostral A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6. Biostatística/UFAM - Profª Maria Ivanilde 4 Espaço Amostral Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto universo, representados por S ou . Biostatística/UFAM - Profª Maria Ivanilde 5 Eventos Chamamos de eventos qualquer subconjunto do espaço amostral de um experimento aleatório. Biostatística/UFAM - Profª Maria Ivanilde 6 Probabilidade Procura quantificar as determinada situação. incertezas existentes em Não é possível fazer inferências estatísticas sem utilizar alguns resultados da teoria das probabilidades. Biostatística/UFAM - Profª Maria Ivanilde 7 Objetiva: Clássica Def.: Se um evento pode ocorrer em N maneiras mutuamente excludentes e igualmente prováveis, e se m dessas ocorrências tem uma característica E, então a probabilidade de ocorrência de E é: P(E) = m/N Biostatística/UFAM - Profª Maria Ivanilde 8 Freqüência relativa Def.: Se algum processo é repetido um grande número de vezes, n, e se algum evento com característica E ocorre m vezes, a freqüência relativa m/n é aproximadamente igual à probabilidade de E: P(E) Obs.: m/n é apenas uma estimativa de P(E). Biostatística/UFAM - Profª Maria Ivanilde 9 Propriedades Gerais Seja um experimento aleatório e espaço amostral associado a . A cada evento A associa-se um número real representado por P(A) que é denominado probabilidade de A que satisfaça às seguintes propriedades: 0 ≤ P(A) ≤ 1 P() = 1 Se A e B são eventos mutuamente exclusivos então: P(A U B) = P(A) + P(B) Biostatística/UFAM - Profª Maria Ivanilde 10 Probabilidade com Eventos Várias conseqüências relacionadas a P(A) decorrem das condições citadas anteriormente. Se A for o evento vazio (), então: P(A) = P() = 0 Se A e B são dois eventos quaisquer, então: P(A U B) = P(A) + P(B) – P(A ∩ B) Se for o evento complementar de A então: P(A) = 1 – P(A) Biostatística/UFAM - Profª Maria Ivanilde 11 Probabilidade Condicional Sejam A e B dois eventos associados ao experimento . Denotaremos por P(B|A) a probabilidade condicionada do evento B, quando A tiver ocorrido. P( A B) P( B | A) , desde que P( A) 0. P( A) Biostatística/UFAM - Profª Maria Ivanilde 12 Exemplo: Resultado do desempenho de um novo teste de diagnóstico para câncer de mama em 200 pacientes com nódulo mamário único. Biópsia Novo Positivo Teste Negativo Positivo Negativo 65 70 135 35 30 65 100 100 200 Sensibilidade = P(Novo Teste+| Biópsia +) = 65/100 Especificidade = P(Novo Test -| Biópsia -) = 30/100 VPP (do teste) = P(Biopsia +|NovoTest +) = 65/135 VPN (do teste) = P(Biópsia -|NovoTest -) = 30/65 Biostatística/UFAM - Profª Maria Ivanilde 13 Independência de Eventos Dado dois eventos A e B de um espaço amostral , diremos que A independe de B se: P(A | B) = P(A) Isto é, independe de B se a ocorrência de B não afeta a probabilidade de A. Dois eventos A e B são chamados independentes se P(A B) = P(A) x P(B). Biostatística/UFAM - Profª Maria Ivanilde 14 Variável Aleatória Quando os valores assumidos por uma variável são o produto de fatores casuais e estes não podem ser preditos com exatidão, esta variável é chamada de aleatória. Exemplo: número de alunos aprovados no primeiro período 2014 da UFAM no curso de Odontologia. Biostatística/UFAM - Profª Maria Ivanilde 15 Variável Aleatória Se a variável aleatória pode assumir somente um particular conjunto de valores (finito ou infinito enumerável), diz-se que é uma variável aleatória discreta. Uma variável aleatória é dita contínua se pode assumir qualquer valor em um certo intervalo. Biostatística/UFAM - Profª Maria Ivanilde 16 Função de Probabilidade É a probabilidade de que uma variável aleatória “X” assuma o valor “x”. É representada por P(X = x) ou P(x) e pode ser: Discreta Contínua Biostatística/UFAM - Profª Maria Ivanilde 17 Função de Probabilidade de uma Variável Aleatória Discreta É a função de probabilidade no ponto, ou seja, é o conjunto de pares (xi ; P(xi)), para i = 1, 2, ..., n, ... Para cada possível resultado de x teremos: (i) 0 ≤ P(x) ≤ 1 (ii) Px i 1 i1 Biostatística/UFAM - Profª Maria Ivanilde 18 Esperança e Variância de uma variável aleatória discreta Esperança de X, EX x iPx i i1 Variância de X, 2 Var X x i EX .P x i i1 ou Var(X) = E(X²) – [E(X)]² onde EX2 x i2 .Px i i 1 Biostatística/UFAM - Profª Maria Ivanilde 19 Função de Probabilidade de uma Variável Aleatória Contínua É uma função de probabilidade quando X é definida sobre um espaço amostral contínuo. Se quisermos calcular a probabilidade de X assumir um valor x entre “a” e “b” devemos calcular: Pa x b f x dx b a Biostatística/UFAM - Profª Maria Ivanilde 20 Distribuição de Probabilidade de uma Variável Aleatória Contínua f(x) x a b Onde a curva limitada pela área em relação aos valores de x é igual a 1 Biostatística/UFAM - Profª Maria Ivanilde 21 Função de Densidade de Probabilidade A função f(x) é uma função de densidade de probabilidade (f. d. p.) para uma v. a. contínua X, definida nos reais quando (i) f x 0; (ii) f x dx 1; (iii) Pa x b f x dx. b a Biostatística/UFAM - Profª Maria Ivanilde 22 Distribuições de Probabilidade Binomial Poisson Normal Normal Padrão Qui-quadrado t-student F de Snedecor Biostatística/UFAM - Profª Maria Ivanilde 23 Distribuição Binomial Um experimento aleatório é chamado binomial se em n repetições: 1) Os ensaios são independentes; 2) Cada resultado do ensaio pode assumir somente uma de duas possibilidades: sucesso ou fracasso; 3) A probabilidade de sucesso em cada ensaio, denotado por p, permanece constante. Biostatística/UFAM - Profª Maria Ivanilde 24 Distribuição Binomial A probabilidade de obtermos exatamente x sucessos em n tentativas é: P X x n p x(1 p)n x x x 0 ,1,...,n. E(X) = np e Var(X) = np(1 – p) Biostatística/UFAM - Profª Maria Ivanilde 25 Exemplo: Uma mulher engravida 20 vezes. Qual a probabilidade de nascerem 8 meninas? Biostatística/UFAM - Profª Maria Ivanilde 26 Solução: Seja X: número de sucessos (meninas); m = nascer menina. 1 X = 0, 1, 2, ..., 20 p = P(m) = 2 1 X~ B 20, 2 8 12 20 1 1 P(X = 8) = 0,12013 8 2 2 Biostatística/UFAM - Profª Maria Ivanilde 27 Exemplo: Suponha que 30% dos indivíduos de uma população sejam contrárias a um projeto de saneamento municipal. Se sortearmos 10 indivíduos desta população (amostra) qual é a probabilidade estimada de que exatamente 4 indivíduos sejam favoráveis? Seja X o nº de indivíduos favoráveis; 10 4 6 P(X = 4) = 0,7 0,3 0,0367569 3,7% 4 Biostatística/UFAM - Profª Maria Ivanilde 28 Distribuição Normal A distribuição normal é uma distribuição em forma de sino que é usada muito extensivamente em aplicações estatísticas em campos bem variados. Sua densidade de probabilidade (f.d.p.) é dada por: 1 1 2 f x exp x , x 2 2 2 Biostatística/UFAM - Profª Maria Ivanilde 29 Distribuição Normal Sua média é e sua variância é 2. Quando X tem uma distribuição normal com média e variância 2, escrevemos, de forma compacta, X N (,2). Biostatística/UFAM - Profª Maria Ivanilde 30 Distribuição Normal Características: Simétrica em relação à média ; A média, moda e mediana são iguais; A área total sob a curva é igual a 1, 50% à esquerda e 50% à direita da média. Biostatística/UFAM - Profª Maria Ivanilde 31 Distribuição Normal A área entre - 1 e + 1 é aproximadamente 68% Biostatística/UFAM - Profª Maria Ivanilde 32 Distribuição Normal A área entre - 2 e + 2 é aproximadamente 95% Biostatística/UFAM - Profª Maria Ivanilde 33 Distribuição Normal A área entre - 3 e + 3 é aproximadamente 99,7% Biostatística/UFAM - Profª Maria Ivanilde 34 Distribuição Normal A distribuição normal é completamente determinada pelos parâmetros e Biostatística/UFAM - Profª Maria Ivanilde 35 Distribuição Normal Padrão Caracterizada pela média igual a zero e desvio padrão igual a 1. Se X tem distribuição normal com média e variância 2 então: Z X f z z2 1 exp , z 2 2 Biostatística/UFAM - Profª Maria Ivanilde 36 Distribuição Normal Exemplo: (Predição de uma valor) Suponha uma população normal com colesterol médio de 200mg% e desvio padrão de 20mg%. Qual é a probabilidade de um indivíduo sorteado ao acaso desta população apresentar um colesterol entre 200 e 225 mg%? A estatística Z mede quanto um determinado valor afasta-se da média em unidades de desvio padrão (quando coincide c/ a média, o escore é Z = 0) Biostatística/UFAM - Profª Maria Ivanilde 37 Distribuição Normal Consultando a Tabela de Distribuição normal, ou um programa estatístico vemos que a probabilidade de Z assumir valor entre 0 e Z = 1,25 é 0,3944 ou 39,44 Biostatística/UFAM - Profª Maria Ivanilde 38 Exemplo: Seja X: N(100, 25). Calcular: = 100 e = 5 → X 100 Z 5 Biostatística/UFAM - Profª Maria Ivanilde 39 Solução: a) P(100 X 106 ) P(100 X 106 ) = 106 - 100 100 - 100 P Z 5 5 = P(0 Z 1,2 ) = 0,384930 Biostatística/UFAM - Profª Maria Ivanilde 40 Solução: b) P(89 X 107) P(89 X 107) = 107 - 100 89 - 100 P Z 5 5 = P(-2,2 Z 1,4) = P(-2,2 Z 0) + P(0 Z 1,4) = 0,486097 + 0,419243 = 0,90534 Biostatística/UFAM - Profª Maria Ivanilde 41 Exemplo: Sendo X: N(50, 16), determinar X tal que: = 50, = 4 a) P(X X) = 0,05 Procurando no corpo da tabela 0,45 (0,5 – 0,05), encontramos: Z= 1,64 como Xα μ Zα σ → X α 50 1,64 4 X= 56,56 P(X 56,56) = 0,05 Biostatística/UFAM - Profª Maria Ivanilde 42 Solução: b) P(X X) = 0,99 Procurando no corpo da tabela 0,49 (0,5 – 0,01), encontramos: Z= 2,32 X α 50 X = 59,28 2,32 4 P(X 59,28) = 0,99 Biostatística/UFAM - Profª Maria Ivanilde 43 Distribuição 2 (Qui-quadrado) Uma v. a. contínua Y, com valores positivos, tem uma distribuição qui-quadrado com n graus de liberdade (denotada por χ²(n) ), se sua densidade for dada por 1 y n 21e y 2 , y 0 f y ; n n 22n 2 y 0. 0, E(Y) = n, Var(Y) = 2n. Biostatística/UFAM - Profª Maria Ivanilde 44 A Distribuição 2 (Qui-quadrado) pode ser vista como: O quadrado de uma v.a. com distribuição normal padrão é uma v.a. com distribuição 2(1) ( seja Z~N(0,1) e considere Y = Z2. Então Y~2(1) ); A distribuição 2n é a distribuição da soma de n variáveis normais independentes padronizadas. Biostatística/UFAM - Profª Maria Ivanilde 45 Distribuição t de Student Se X N(0, 1) e Y 2n e X e Y são independentes, então t= X tem densidade dada por Y /n n 1 2 n 1 2 2 1 t n f t ; n , t . n 2 n tal v. a. tem distribuição t com n graus de liberdade. n E(t) = 0, Var(t) = . n2 Biostatística/UFAM - Profª Maria Ivanilde 46 A distribuição t é uma distribuição simétrica como a normal, um pouco mais achatada e com caudas mais longas que a normal. Quando o tamanho da amostra cresce, a distribuição t se aproxima da normal. Biostatística/UFAM - Profª Maria Ivanilde 47 Distribuição F 2 2 Se Y1 n1 e Y2 n e Y1 e Y2 são independentes, então 2 Y1 / n1 W= Y2 / n2 tem densidade dada por n1 n2 2 n1 g w ; n1 , n2 n1 2n2 2 n2 n1 2 w n1 2 2 n1 n2 2 , w 0. 1 n1.f n2 tal v. a. tem distribuição F com graus de liberdade n1 e n2. Escrevemos WF(v,r). n2 2n2 n1 n2 2 E(W) = , Var(W) = 2 n2 2 n1 n2 2 n2 4 2 Biostatística/UFAM - Profª Maria Ivanilde 48 Distribuições de Probabilidade 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Probabilidade de ocorrer valor entre zero e 1,25 Biostatística/UFAM - Profª Maria Ivanilde 49 Tipos de Estimações de Parâmetros i) Estimação Pontual ii) Estimação Intervalar Biostatística/UFAM - Profª Maria Ivanilde 50 Estimador e estimativa População: Amostra: Média = µ Variância = σ² Proporção = π Média = X estimador de µ Variância = S² estimador de σ² Proporção = p estimador de π Biostatística/UFAM - Profª Maria Ivanilde 51 Estimação intervalar Limitação da estimação pontual desconhecimento da magnitude do erro que se está cometendo; Surge a idéia da construção de um intervalo que contenha, com um nível de confiança conhecido, “ valor verdadeiro do parâmetro”; baseado na distribuição amostral do estimador pontual. Biostatística/UFAM - Profª Maria Ivanilde 52 Erro Máximo da Estimativa Representa a diferença máxima (erro) que será permitida entre a estimativa pontual ( X ) e o valor verdadeiro do parâmetro que está sendo estudado (μ). Biostatística/UFAM - Profª Maria Ivanilde 53 Erro Erro X X Z 2 X n LI – Limite Inferior * S X Z 2 n LS – Limite Superior Biostatística/UFAM - Profª Maria Ivanilde 54 Intervalo de Confiança da Média Populacional LI – Limite Inferior LS – Limite Superior Biostatística/UFAM - Profª Maria Ivanilde 55 Intervalo de confiança com variância desconhecida População X (µ, σ²) amostra 1 Amostra n1 X 1 1, 96 S x X X 1,96 X 2 1, 96 S X 1,96 x X1 n2 amostra 2 Amostra µ x X2 x amostra k Amostra nK X k 1 , 96 S Xk x Biostatística/UFAM - Profª Maria Ivanilde 95% dos intervalos Contêm µ 56 Estimação Intervalar É o intervalo definido pela estimativa pontual mais ou menos o erro máximo da estimativa. X Biostatística/UFAM - Profª Maria Ivanilde 57 Média populacional, quando σ é desconhecido IC para média; Estatística de t de Student. X t S n Biostatística/UFAM - Profª Maria Ivanilde 58 Intervalo de confiança da média Substituindo o t P(t / 2 t t / 2 ) 1 P ( t / 2 X t / 2 ) 1 S n Biostatística/UFAM - Profª Maria Ivanilde 59 Intervalo de Confiança da média Na tabela de t de Student S S P X t( n1; / 2) X t( n1; / 2) 1 n n Biostatística/UFAM - Profª Maria Ivanilde 60 Amostra de tamanho n ≤ 30 Para amostra de tamanho n ≤ 30 da população de interesse; Calcule os valores de X e S; Escolha o valor do coeficiente de confiança 1 – α ; Determine os valores de t(α/2;n – 1) apartir da tabela da distribuição t de Student; Calcule os limites do intervalo de confiança. Biostatística/UFAM - Profª Maria Ivanilde 61 Intervalo de Confiança da média Com um nível de confiança (1 ) 100% S S ; X t( n1; / 2) X t( n1; / 2) n n Biostatística/UFAM - Profª Maria Ivanilde 62 Encontre: média e desvio padrão n Média X X i 1 i n Desvio Padrão n S X i 1 2 i n Xi i 1 n n 1 Biostatística/UFAM - Profª Maria Ivanilde 2 63 Como calcular o Intervalo de Confiança da média ? Os intervalos de confiança da média X t( n1; / 2) S n Biostatística/UFAM - Profª Maria Ivanilde 64 Encontre o valor de t de Student gl n-1 n-1 α 0,05 0,01 2 4,303 9,925 ... ... ... 8 2,306 3,355 ... ... ... 1,960 2,576 Biostatística/UFAM - Profª Maria Ivanilde 65 Como calcular o intervalo de confiança da média? Os intervalos inferior e superior X Limite Inferior X Limite Superior X Biostatística/UFAM - Profª Maria Ivanilde 66 Exemplo Uma amostra de tamanho 9, extraída de uma população normal com X = 1,0 e S = 0,264. Construir intervalos de 95% e 99% de confiança para média populacional. Biostatística/UFAM - Profª Maria Ivanilde 67 Resultado Para 1 – α = 95% α = 0,05; α/2 = 0,025 graus de liberdade = 9 – 1 = 8, X = 1,0 e S = 0,264. 0, 264 2,306 0, 2029 9 X [0,797; 1,203]. Biostatística/UFAM - Profª Maria Ivanilde 68 Resultado Para 1 – α = 99% α = 0,01; α/2 = 0,005 graus de liberdade = 9 – 1 = 8. Intervalo: ∆ [3,355(0,264/3)] =0,088 LI=0,912 LS=1,088 [0,912; 1,088]. Biostatística/UFAM - Profª Maria Ivanilde 69 Resultado Para 1 – α = 95% α = 0,05; gl = 9 – 1 = 8. Intervalo: [0,797; 1,203]. Para 1 – α = 99% α = 0,01; gl = 9 – 1 = 8. Intervalo: [0,705; 1,295]. Nota: aumentando o nível de confiança, o tamanho do intervalo também aumenta. Biostatística/UFAM - Profª Maria Ivanilde 70 Estimação da média Estimativa por ponto, a qual consiste em apenas um valor da média=1; O intervalo de confiança para o parâmetro (μ), estamos fazendo uma estimativa por intervalo. Intervalo de 95% de confiança [0,797; 1,203]; Intervalo de 99% de confiança [0,705; 1,295]; Biostatística/UFAM - Profª Maria Ivanilde 71 Tabela 1 Intervalos de confiança para a média de cada parâmetro (físico e químico), das coletas realizadas em Manaus na época seca. São Raimundo Educandos Tarumã Parâmetros Químicos e Biológicos Inferior Superior Inferior Superior Inferior Superior Limites do CONAMA 357 pH 5,88 7,15 5,14 6,66 4,69 5,23 6a9 Cond. Elétrica 73,8 233,92 109,46 283,38 8,37 10,7 - Turbidez 12,36 38,14 4,14 21,03 0 23,84 <40unt O2 0,91 3,9 1,49 2,92 5,47 6,97 >6mg/L NO3 0,1 0,25 0,08 0,3 0,02 0,06 10,0m/L NH4 0,37 4,11 3,48 6 0 0,07 - Ferro Total 0,31 1,56 0,61 2,83 0,06 0,37 - Ferro Dissolvido 0,01 0,15 0 1,14 0,01 0,08 0,3mg/L Biostatística/UFAM - Profª Maria Ivanilde 72 Tabela 2 Intervalos de confiança para a média de cada parâmetro (físico e químico), das coletas realizadas em Manaus na época chuvosa. São Raimundo Educandos Tarumã Parâmetros Químicos e Biológicos Inferior Superior Inferior Superior Inferio r Superior Limites do CONAMA 357 pH 5,32 7,1 5,15 6,66 4,6 5,24 6a9 Cond. Elétrica 66,63 218,18 92,88 249,76 6,99 13,8 - Turbidez 2,99 31,67 68,09 274,55 0,19 12,98 <40unt O2 1,16 2,69 1,52 4,65 6,65 7,73 >6mg/L NO3 0,04 0,26 0,01 0,52 0,02 0,04 10,0m/L NH4 1,26 6,44 1,59 5,35 0,13 0,21 - Ferro Total 0,87 4,02 0,87 4,01 0,07 0,38 - Ferro Dissolvido 0,04 0,12 0,06 0,2 0,02 0,06 0,3mg/L Biostatística/UFAM - Profª Maria Ivanilde 73 Teoria da estimação Estimação por intervalo Intervalo de confiança para a média da população quando é conhecido. Intervalo de confiança para a média da população quando é desconhecido. Intervalo de confiança para a variância da população. Intervalo de confiança para o desvio-padrão da população. Intervalo de confiança para uma proporção populacional Biostatística/UFAM - Profª Maria Ivanilde 74 Exercício prático Considerando-se que uma amostra de cem elementos extraídas de uma população aproximadamente normal, cujo desvio-padrão é igual a 2,0, forneceu média x =35,6, construir um intervalo de 95% de confiança para a média dessa população Biostatística/UFAM - Profª Maria Ivanilde 75