Estatı́stica descritiva e probabilidades Métodos Numéricos e Estatı́sticos Parte II-Métodos Estatı́sticos Estatı́stica descritiva e probabilidades Luı́sa Morgado Lic. Eng. Biomédica e Bioengenharia-2009/2010 Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Podemos dividir a Estatı́stica em duas áreas: estatı́stica indutiva (ou inferência estatı́stica) e estatı́stica descritiva. Estatı́stica indutiva Se uma amostra é representativa de uma dada população, conclusões importantes sobre a população podem ser inferidas através da análise da amostra. Estatı́stica descritiva É a parte da estatı́stica que procura somente descrever e avaliar um certo grupo sem tirar conclusões (ou inferências) sobre um grupo maior. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Estatı́stica descritiva Fornecido um certo conjunto de dados relativo a uma amostra de uma população, podemos sempre apresentá-los, ou organizá-los de duas formas distintas: Recorrendo a gráficos e/ou tabelas; Apresentando medidas de posição e/ou dispersão. Os gráficos constituem uma das formas mais eficientes de apresentação de dados. Enquanto que as tabelas fornecem uma ideia mais precisa e possibilitam uma inspecção mais rigorosa dos dados, os gráficos são mais indicados em situações sempre que se pretende uma visão mais rápida e fácil a respeito das variáveis às quais se referem os dados. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Distribuição de frequência A organização dos dados em tabelas de frequências (absolutas or relativas), obedecem a certas normas e recomendações. Estas normas são úteis para que as tabelas possam ser interpretadas de uma forma simples, clara e rápida. Muito importante é o facto de que as tabelas tenham significado próprio, i.e., devem ser compreendidas mesmo quando não se lê o texto em que estão apresentadas. Exemplo Foram anotadas as notas de um exame final de uma disciplina dos alunos de uma certa universidade . Depois de feita a contagem, os dados foram organizados na seguinte tabela Notas 90 a 100 75 a 89 60 a 74 <60 Reprovação por faltas Número de alunos 14 32 50 63 39 198 Luı́sa Morgado Pecentagem 7.07 16.16 25.25 31.82 19.70 100.00 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Diagrama de pontos Útil sempre que se pretende apresentar um pequeno conjunto de dados. Permite ver de uma forma rápida e fácil a tendência dos dados, assim como a sua distribuição e variabilidade. Histograma Para alguns conjuntos de dados o número de valores observados é tão elevado que se torna inevitável o seu agrupamento pos classes. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Exemplo O barulho é medido em decibéis (dB). Um decibel corresponde ao nı́vel do som mais fraco que pode ser ouvido num local silencioso por alguém com boa audição. Um sussurro corresponde a cerca de 70dB, um rádio em volume alto cerca de 100dB. Acima dos 120dB, há desconforto para os ouvidos. O dados abaixo correspondem aos nı́veis de barulho medidos em 36 horários diferentes num determinado local. 82 89 94 110 74 122 112 95 100 78 65 60 90 83 87 75 114 85 69 94 124 115 107 88 97 74 72 68 83 91 90 102 77 125 108 65 Para agruparmos este conjunto de dados em classes, surge imediatamente uma primeira questão: quantas classes? Na prática, o número de classes é muita das vezes escolhido, fazendo a raı́z quadrada do número de observações. Assim sendo, neste caso, terı́amos 6 classes. O menor valor observado é 60, o maior é 125, pelo que a amplitude de cada classe poderia ser . Podı́amos então construir a seguinte tabela de frequências obtida a partir de 125−60 6 classes [60, 71[ [71, 82[ [82, 93[ [93, 104[ [104, 115[ [115, 126[ frequência absoluta 5 6 10 6 5 4 Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Se pretendessemos outras informações, poderı́amos aumentar a tabela, incluindo outros tipos de frequência, como por exemplo, a frequência relativa e/ou as frequências acumuladas. classes [60, 71[ [71, 82[ [82, 93[ [93, 104[ [104, 115[ [115, 126[ freq. abs. 5 6 10 6 5 4 freq. abs. acumulada 5 11 21 27 32 36 freq. relat. freq. relat. acumulada 5 36 6 36 10 36 6 36 5 36 4 36 5 36 11 36 21 36 27 36 32 36 1 O histograma pode ser feito a partir das frequências absolutas ou relativas, acumuladas ou não, de cada classe, basta para tal indicar correctamente o que seria usado no eixo vertical. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades No scilab, a execução do comando histplot(n,x,normalization=% f), onde n = 6 é o número de classes e x = [82 89 94 · · · 108 65] é o vector que contém os dados observados, devolve o seguinte histograma das frequências absolutas. 10 9 8 7 6 5 4 3 2 1 0 60 70 80 90 Luı́sa Morgado 100 110 120 130 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Medidas de posição Média aritmética Dado um conjunto de n valores numéricos, x1 , x2 , . . . , xn , a média aritmética desses valores, representa-se por x̄ é dada por Pn xi x̄ = i=1 n Exemplo Determinemos a média do seguinte conjunto de dados do exemplo anterior. Ora x̄ = 82 + 89 + 94 + 110 + · · · + 125 + 108 + 65 = 90.7 36 No scilab, basta executar o comando mean(x). Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Em alguns casos, queremos determinar a média de um conjunto de dados organizados numa tabela de distribução de frequências, indicando para cada valor distinto de xi , i = 1, . . . , k, a respectiva frequência absoluta fk . Nesse caso a média será dada por Pk i=1 xi fi x̄ = , n P onde n = ki=1 fi . Exemplo A seguinte tabela fornece informação acerca da idade de jovens que a uma determinada hora frequentam um dado café: Idade Freq. Absoluta 15 2 16 5 Neste caso, a média é dada por 17 11 18 9 19 14 20 13 x̄ = 2 × 15 + 5 × 16 + 11 × 17 + 9 × 18 + 14 × 19 + 13 × 20 = 18.24. 54 Se a tabela está organizada por classes, então para o cálculo da média devemos substituir cada classe pelo seu ponto médio e calcular a média como descrito acima. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Mediana É o valor intermédio do conjunto de dados, cujos n valores estão dispostos em ordem crescente. Se n for ı́mpar, a mediana será o valor que ocupa a posição n+1 ; se n for par, 2 a mediana será a média aritmética dos valores que ocupam as posições n2 e n + 1. 2 Exemplo Determinemos a mediana do conjunto de dados do exemplo anterior. Como n = 54 é par, a mediana será a média dos valores que ocupam as posições 27 e 28. Portanto a mediana será o valor 18.5. No scilab, depois de definido o vector que contém os dados, x = [15 15 16 16 16 16 16 17 . . . 20] basta executar o comando median(x). Moda É o valor que ocorre com maior frequência. Exemplo No exemplo anterior, a moda será o valor 19, uma vez que é o valor que ocorre mais vezes na distribuição. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Medidas de dispersão Estas medidas são úteis para complementar as informações fornecidas pelas medidas de posição. Descrevem a variabilidade ocorrendo no conjunto de dados. Variância A variância amostral de um conjunto de dados x1 , x2 , . . . , xn , é definida por Pn (xi − x̄)2 2 σ = 1=1 n−1 Exemplo A variância do conjunto de dados 3 2 é dada por 2 2 4 2 6 7 (3−6) +(4−6) +(6−6) +(7−6) +(10−7) 4 No scilab, define-se o vector dos dados, x = [3 Luı́sa Morgado 10 2 = 7.5 4 6 7 10], e faz-se variance(x). Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Desvio padrão O desvio padrão amostral de um conjunto de dados x1 , x2 , . . . , xn , é definido por s Pn 2 √ 1=1 (xi − x̄) 2 σ= σ = n−1 No exemplo anterior, σ = comando st deviation(x). √ 7.5 = 2.7386. No scilab executa-se o Amplitude A amplitude amostral de um conjunto de dados x1 , x2 , . . . , xn , é a diferença entre o maior e o menor valor observado. No exemplo anterior, a amplitude é 10 − 3 = 7. Paro o cálculo no scilab, faz-se max(x)-min(x). Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Noções básicas de probabilidade Experiência aleatória (E.A.) Chama-se experiência aleatória a toda a experiência cujo resultado exacto é desconhecido antes da sua realização. Exemplo E.A.1: Registo do número de recém-nascidos num grupo de dez com peso à nascença superior a 3.5Kg; E.A.2: Número de novos casos de sida num dado ano num certo paı́s; E.A.3: Medição da concentração de dióxido de carbono num recinto fechado. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Espaço de resultados É o conjunto de todos os resultados possı́veis de uma experiência aleatória. É usualmente, representado por Ω. Pode ser discreto (no caso de ser um conjunto finito ou infinito numerável) ou contı́nuo (no caso em que é um conjunto infinito não numerável). Exemplo No exemplo anterior: E.A.1: Ω = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} → discreto (finito); E.A.2: Ω = {0, 1, 2, 3, . . . . . .} →; discreto (infinito numerável) E.A.3: Ω = R+ 0 → (infinito não numerável) contı́nuo. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Acontecimento Acontecimento (ou evento) é qualquer subconjunto do espaço de resultados. O acontecimento A diz-se elementar se for constituı́do por apenas um elemento de Ω; certo se A = Ω e impossı́vel se A = ∅. Exemplo Na E.A.1, consideremos os evento A = nenhum dos recém-nascidos tem peso superior a 3.5kg. = {0}; B = pelo menos 8 dos recém-nascidos tem peso superior a 3.5kg. = {8, 9, 10} Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Acontecimentos disjuntos Dois acontecimentos dizem-se disjuntos (ou mutuamente exclusivos ou ainda incompatı́veis) sse A ∩ B = ∅, i.e., a realização simultânea de A e B é impossı́vel. Inclusão de acontecimentos Diz-se que o acontecimento A está acontecimento B, e escreve-se A ⊂ Realização de A ⇒ Realização de B Realização de B ; Realização de A contido no B quando Uma vez que os acontecimentos não passam de conjuntos, podemos efectuar operações sobre eventos já nossas conhecidas. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Operações sobre eventos A∩B A∪B A\B A Realização simultânea de A e de B Realização de pelo menos um dos eventos A ou B Realização de A sem que se realize B Não realização de A Esta operações gozam das propriedades Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Associatividade: (A ∩ B) ∩ C = A ∩ (B ∩ C ) (A ∪ B) ∪ C = A ∪ (B ∪ C ) Comutatividade: A∩B =B ∩A A∪B =B ∪A Distributividade: (A ∩ B) ∪ C = (A ∪ C ) ∩ (B ∪ C ) (A ∪ B) ∩ C = (A ∩ C ) ∪ (B ∩ C ) Idempotência: Absorção: Modulares: A∩A=A A∪A=A A⊂B ⇒A∩B =A A⊂B ⇒A∪B =B A∩Ω=A A∪Ω=Ω A∩∅=∅ A∪∅=A Leis de De Morgan: A ∩ B = Ā ∪ B̄ A ∪ B = Ā ∩ B̄ Dupla negação: A = A Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Probabilidade clássica de Laplace Considere-se uma E.A. com espaço de resultados Ω constituı́do por n elementos distintos, em número finito e igualmente prováveis. Suponha-se ainda que a realização do acontecimento A passa pela ocorrência de m dos n eventos de Ω. Então, a probabilidade de realização de A é dada por P(A) = m no de casos favoráveis à ocorrência de A = o n de casos possı́veis n Exemplo No lançamento de um dado não viciado, seja A =saı́da de um número par. Ora A = {2, 4, 6}, Ω = {1, 2, 3, 4, 5, 6}, logo P(A) = Luı́sa Morgado 3 = 0.5. 6 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Probabilidade clássica de Laplace Considere-se uma E.A. com espaço de resultados Ω constituı́do por n elementos distintos, em número finito e igualmente prováveis. Suponha-se ainda que a realização do acontecimento A passa pela ocorrência de m dos n eventos de Ω. Então, a probabilidade de realização de A é dada por P(A) = m no de casos favoráveis à ocorrência de A = o n de casos possı́veis n Exemplo No lançamento de um dado não viciado, seja A =saı́da de um número par. Ora A = {2, 4, 6}, Ω = {1, 2, 3, 4, 5, 6}, logo P(A) = 3 = 0.5. 6 E se o espaço dos resultados da E.A. não for finito? Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Frequência relativa Seja N o número de vezes que se realiza sob as mesmas condições uma certa E.A. e seja nN (A) o número de vezes que o evento A ocorreu nas N experiências realizadas (i.e., nN (A) representa a frequência absoluta do evento A). Então a frequência relativa do evento A é dada por fN (A) = nN (A) . N A frequência relativa satisfaz as seguintes propriedades 0 ≤ fN (A) ≤ 1; fN (Ω) = 1; fN (A ∪ B) = fN (A) + fN (B) se A ∩ B = ∅; fN (A) estabiliza à medida que N aumenta. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Probabilidade frequencista A probabilidade do evento A é o limite da frequência relativa do mesmo: nN (A) = lim fN (A) N→∞ N→∞ N P(A) = lim Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Probabilidade frequencista A probabilidade do evento A é o limite da frequência relativa do mesmo: nN (A) = lim fN (A) N→∞ N→∞ N P(A) = lim E se a E.A. não se puder realizar mais do que uma vez? Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades σ-álgebra de eventos É uma colecção não vazia de eventos, A, que satisfaz Ω ∈ A; A ∈ A ⇒ A ∈ A; Se Ai ∈ A, i = 1, 2, . . ., ondeS{A1 , A2 , . . .} é um conjunto numerável , então +∞ i=1 ∈ A. Exemplo 1 A1 = {∅, Ω}; 2 A2 = P(Ω), i.e., a colecção de todos os subconjuntos de Ω. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Função de probabilidade no sentido de Kolmogorov É uma função P : A → [0, 1] que satisfaz os seguintes axiomas P(Ω) = 1; 0 ≤ P(A) ≤ 1, ∀A ∈ A; Se {A1 , A2 , . . .} é um conjunto contável de eventos mutuamente exclusivos de A (Ai ∩ Aj = ∅, i 6= j), então ! +∞ +∞ [ X P Ai = P(Ai ) i=1 Luı́sa Morgado i=1 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades P(∅) = 0; P(A) = 1 − P(A); A ⊂ B ⇒ P(A) ≤ P(B); P(B \ A) = P(B) − P(A ∩ B) Um dado evento A 6= Ω diz-se quase certo se P(A) = 1. Um evento A diz-se quase impossı́vel se P(A) = 0. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades P(A ∪ B) = P(A) + P(B) − P(A ∩ B) Dem.: P(A ∪ B) = P[(A \ B) ∪ (A ∩ B) ∪ (B \ A)] = P(A \ B) + P(A ∩ B) + P(B \ A) = [P(A) − P(A ∩ B)] + P(A ∩ B) + [P(B) − P(B ∩ A)] = P(A) + P(B) − P(A ∩ B) Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Probabilidade condicionada A probabilidade do evento A condicionada pela ocorrência do evento B é dada por P(A|B) = P(A ∩ B) , P(B) desde que P(B) 6= 0. Exemplo Na extracção de uma carta de um baralho com 52 cartas (13 de cada naipe), qual a probabilidade dessa carta ser o Ás de copas, sabendo à partida que a carta extraı́da era de copas? Considerando os eventos 1 A = sair o Ás de copas, cuja probabilidade é P(A) = 52 . B = sair uma carta de copas, cuja probabilidade é P(B) = 13 52 A probabilidade pedida é dada por P(A|B) = P(A ∩ B) P(A = = P(B) P(B) Luı́sa Morgado 1 52 13 52 = 1 . 13 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Como P(·|B) é uma função de probabilidade no sentido de Kolmogorov, então 1 P(Ω|B) = 1; 2 0 ≤ P(A|B) ≤ 1, ∀A ∈ A 3 Sendo {A1 , A2 , . . .} é um conjunto contável de eventos mutuamente exclusivos de A, então " +∞ ! # +∞ [ X P Ai |B = P(Ai |B). i=1 Luı́sa Morgado i=1 Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Lei das probabilidades compostas Sendo {Ai }i=1,...,n uma colecção de n eventos tal que P(Ai ) > 0 e P(A1 ∩ A2 ∩ . . . ∩ An−1 ∩ An ) > 0, então P(A1 ∩ A2 ∩ . . . ∩ An−1 ∩ An ) = P(A1 ) × P(A2 |A1 ) × P[A3 |(A1 ∩ A2 )] × . . . × P[An |A1 ∩ A2 ∩ . . . ∩ An−1 ]. Esta lei é útil sempre que pretendermos calcular a probabilidade de sequências de eventos em experiências aleatórias. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Exemplo Considere-se um lote de 100 molas de um sistema de suspensão automóvel. Destas, 20 são consideradas defeituosas (D) por violarem a lei de Hooke quando se aplica uma força superior a 35 × 104 N. Extrairam-se uma a uma, sem reposição, três molas deste lote. Determinemos qual a probabilidade das 3 molas extraı́das não serem defeituosas. Para tal consideremos o evento D1 ∩ D2 ∩ D3 =1a , 2a e 3a molas não defeituosas. A probabilidade pedida é então dada por P(D1 ∩ D2 ∩ D3 ) = P(D1 ) × P(D2 |D1 ) × P[D3 |(D1 ∩ D2 )] 80 80 − 1 80 − 1 − 1 = × × 100 100 − 1 100 − 1 − 1 80 × 79 × 78 = 100 × 99 × 98 Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Partição de Ω Uma colecção de n eventos PΩ = {Ai }i=1,...,n diz-se uma partição de Ω sse Ai ∩ Aj = ∅, i 6= j; Sn i=1 Ai = Ω; P(Ai ) > 0, i = 1, . . . , n. Lei da probabilidade total Seja B um evento e PΩ = {Ai }i=1,...,n uma partição de Ω. Então P(B) = n X P(B|Ai )P(Ai ). i=1 Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Exemplo Testes realizados em dois dispositivos (A e B) de retenção de crianças em automóveis, revelaram que, em caso de acidente grave, o dispositivo A é eficaz em 95% dos casos, enquanto que o dispositivo B é eficaz em 96%. Adimitindo que no mercado só passarão a existir estes dois tipos de dispositivos, instalados em automóveis exactamente na mesma proporção, calculemos a probabilidade do dispositivo de retenção instalado num automóvel seleccionado ao acaso vir a ser eficaz em caso de acidente grave. Resumindo Evento probabilidade A =dispositivo do tipo A P(A) = 0.5 B =dispositivo do tipo B P(B) = 0.5 E =dispositivo eficaz em caso de acidente grave (DEAC) P(E ) =? E |A =DEAC dado que é do tipo A P(E |A) = 0.95 E |B =DEAC dado que é do tipo B P(E |B) = 0.96 Pela lei da probabilidade total, a probabilidade pedida é então dada por P(E ) = P(E |A) × P(A) + P(E |B) × P(B) = 0.95 × 0.5 + 0.96 × 0.5 = 0.955 Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Eventos independentes Dois eventos A e B dizem-se independentes (e denota-se por A q B sse P(A ∩ B) = P(A) × P(B). Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades 1 Sendo A e B dois eventos independentes tais que P(A) > 0 e P(B) > 0, então P(A|B) = P(A); P(B|A) = P(B); 2 I.e, o conhecimento de B não afecta a reavaliação da probabilidade de A e vice-versa. Sejam A e B dois eventos tais que A∩B =∅ P(A) > 0 e P(B) > 0. 3 Então A e B não são independentes. Para qualquer evento A tem-se A q ∅; A q Ω. 4 Se A e B são independentes, então A q B; A q B; A q B. Luı́sa Morgado Estatı́stica descritiva e probabilidades Estatı́stica descritiva e probabilidades Teorema de Bayes Seja B um evento e PΩ = {Ai }i=1,...,n uma partição de Ω. Então P(Ai |B) = P(B|Ai )P(Ai ) . P(B) Recorrendo à lei de probabilidade total, podemos ainda escrever P(B|Ai )P(Ai ) . P(Ai |B) = Pn j=1 P(B|Aj )P(Aj ) Exemplo Retomando o exemplo anterior, calculemos a probabilidade de o dispositivo ser do tipo A sabendo que foi eficaz em caso de acidente grave. Considerando o evento A|E =dispositivo do tipo A dado que foi eficaz em caso de acidente grave, a probabilidade pedida é dada por P(A|E ) = 0.95 × 0.5 P(E |A)P(A) = = 0.4974. P(E ) 0.955 Luı́sa Morgado Estatı́stica descritiva e probabilidades