Professora: Aula 3 Rosa M. M. Leão Probabilidade e Estatística Conteúdo: 1.1 Por que estudar ? 1.2 O que é ? 1.3 População e Amostra 1.4 Um exemplo 1.5 Teoria da Probabilidade 1.6 Análise Combinatória 3 1.1 Por que estudar Probabilidade e Estatística? A Estatística é empregada como ferramenta fundamental em várias áreas, tais como: • na área médica - metodologia adequada que possibilita decidir sobre a eficiência de um novo tratamento; • na indústria - controle de qualidade de produto e processo; • na pesquisa de mercado e de opinião pública - definição de novos produtos, lançamentos, vendas, etc; • em computação - estudo do desempenho de sistemas, algoritmos para aumentar a eficiência, etc; • na definição de indicadores econômicos e sociais; • meteorologia, ecologia, biologia, entre outras. 4 Grande parte das informações divulgadas pelos meios de comunicação provém de pesquisas e estudos estatísticos: → "a inflação esse mês foi ...." → "a taxa de desemprego no Brasil no ano de 2005...." → "o candidato A tem 32% da intenção de votos, o can- didato B tem 41% e 27% dos entrevistados não souberam ou não quiseram responder" → "o número de carros vendidos no país aumentou em 20%" → " a altura média da população aumentou em 5% " → "o time A teve 60% do tempo de posse de bola, ..." 5 Pode também ajudar a responder perguntas do nosso dia a dia, como por exemplo: 6 Pode também ajudar a responder perguntas do nosso dia a dia, como por exemplo: → Será que se jogarmos sempre no mesmo número na Me- ga Sena teremos uma possibilidade maior de ganhar? 7 Pode também ajudar a responder perguntas do nosso dia a dia, como por exemplo: → Será que se jogarmos sempre no mesmo número na Me- ga Sena teremos uma possibilidade maior de ganhar? → Se em um teste com várias perguntas onde teremos que responder "falso" ou "verdadeiro", dá para saber se teremos uma probabilidade de acertar um número maior de respostas se "chutarmos" sempre a mesma resposta? ou seria melhor alternarmos as respostas? 8 Para modelar e/ou avaliar o sistema a ser estudado é preciso coletar dados e/ou fazer algumas suposições: → Caso 1: Sistema já existe e deseja-se coletar dados para seu estudo/modelagem. → Caso 2: Sistema não existe e deseja-se criar um modelo para prever o seu desempenho. 9 • Sobre a obtenção dos dados para estudo/modelagem do sistema: 10 • Sobre a obtenção dos dados para estudo/modelagem do sistema: • Por quanto tempo deve-se coletar os dados ? • Pode-se usar os dados coletados durante um certo período (amostra), para concluir sobre o comportamento do sistema ? • Como definir o período no qual deve-se coletar os dados (24h, somente pela manhã, no horário de maior uso do sistema) ? • Se o sistema não existe, como obter os dados para criar o modelo ? 11 ii) O que fazer com os dados colhidos? • Como organizar esses dados? • Como extrair informações de interesse? • Como fazer para que os dados obtidos para esse período de tempo possam ser generalizados para obtermos infomações sobre o sistema ? 12 Ou seja, para colher os dados, organizá-los e analisá-los necessitamos de técnicas conhecidas, que nos permitam responder a essas questões com segurança e objetividade. 13 Ou seja, para colher os dados, organizá-los e analisá-los necessitamos de técnicas conhecidas, que nos permitam responder a essas questões com segurança e objetividade. Estas técnicas são: → Estatística → Probabilidade → Inferência estatística 14 Estatística: conjunto de técnicas destinadas a descrever, organizar e resumir os dados a fim de que possamos tirar conclusões de características de interesse. 15 Estatística: conjunto de técnicas destinadas a descrever, organizar e resumir os dados a fim de que possamos tirar conclusões de características de interesse. Probabilidade: teoria utilizada para estudar a "incerteza" dos fenômenos de caráter "aleatório". Pode-se dizer que é a teoria utilizada para quantificar o acaso. 16 Estatística: conjunto de técnicas destinadas a descrever, organizar e resumir os dados a fim de que possamos tirar conclusões de características de interesse. Probabilidade: teoria utilizada para estudar a "incerteza" dos fenômenos de caráter "aleatório". Pode-se dizer que é a teoria utilizada para quantificar o acaso. Inferência estatística: estudo de técnicas que possibilitam a análise e interpretação de dados com objetivo de generalizar e prever resultados. 17 1.3 População e amostra A população é o conjunto de todos os dados que que temos interesse. 18 1.3 População e amostra A população é o conjunto de todos os dados que que temos interesse. Exemplos: i) Se o objeto de estudo for uma aplicação P2P, como por exemplo o BitTorrent. O que é a população ? 19 1.3 População e amostra A população é o conjunto de todos os dados que que temos interesse. Exemplos: i) Se o objeto de estudo for uma aplicação P2P, como por exemplo o BitTorrent. O que é a população ? ii) Se o objeto de estudo for a confiabilidade de um produto de uma certa fábrica durante um período de tempo, por exemplo, a durabilidade das lâmpadas produzidas durante o ano de 2004, a população será composta por todas as lâmpadas produzidas pela fábrica em questão no ano de 2004. 20 População pode ser finita ou infinita 21 População pode ser finita ou infinita Em determindas situações há impossibilidade de se analisar toda população, ou por razões econômicas, ou pela população ser infinita. 22 Um exemplo: Sabemos que uma aplicação é usada por milhões de pessoas, por exemplo o Skype, e queremos avaliar quantos pacotes de voz, em média, são perdidos prejudicando a qualidade da comunicação: 23 Um exemplo: Sabemos que uma aplicação é usada por milhões de pessoas, por exemplo o Skype, e queremos avaliar quantos pacotes de voz, em média, são perdidos prejudicando a qualidade da comunicação: População - todos os pacotes de voz transmitidos pela aplicação Amostra - parcela dos pacotes coletados Como escolher? 24 Amostra subconjunto da população a ser estudado o mais parecido possível com a população que lhe deu origem 25 Amostra subconjunto da população a ser estudado o mais parecido possível com a população que lhe deu origem Análise: feita na população total ou em uma amostra 26 Amostra subconjunto da população a ser estudado o mais parecido possível com a população que lhe deu origem Análise: feita na população total ou em uma amostra população amostra A1 ? A2 ? 27 Amostra subconjunto da população a ser estudado o mais parecido possível com a população que lhe deu origem Análise: feita na população total ou em uma amostra população amostra A1 28 Teoria de Probabilidade: Conceitos Básicos Fenômeno Aleatório Situação ou acontecimento cujos resultados não podem ser previstos com certeza. 29 Teoria de Probabilidade: Conceitos Básicos Fenômeno Aleatório Situação ou acontecimento cujos resultados não podem ser previstos com certeza. Exemplos: → O resultado do lançamento de um dado. → O clima num determinado dia da semana que vem. → A média final que você tirará nesta disciplina. 30 Espaço amostral O conjunto de todos os resultados possíveis de um certo fenômeno aleatório. Denominaremos este espaço pela letra grega Ω (Ômega). 31 Espaço amostral O conjunto de todos os resultados possíveis de um certo fenômeno aleatório. Denominaremos este espaço pela letra grega Ω (Ômega). Os subconjuntos do espaço amostral são chamados de eventos e são representados por letras maiúsculas (A, B, C, ...). 32 Exemplos: → Uma moeda é lançada duas vezes e observam-se as faces obtidas Ω = {CC,CR,RC,RR}, onde aqui C é cara e R coroa. 33 Exemplos: → Uma moeda é lançada duas vezes e observam-se as faces obtidas Ω = {CC,CR,RC,RR}, onde aqui C é cara e R coroa. → Uma moeda é lançada consecutivamente até o aparecimento da primeira cara Ω = {C,RC,RRC,RRRC,...}, que contém um número infinito de elementos. 34 Lembrando da Teoria dos Conjuntos: → O conjunto vazio é denotado por ∅ → A união de dois eventos A e B representa a ocorrência de, pelo menos, um dos eventos A ou B. Denotamos a união de A com B por → A intersecção do evento A com B é a ocorrência simultânea de A e B. Denotamos a intersecção de A com B por 35 . Exemplo A Sejam A, B e C três eventos do espaço amostral Ω : B C Ω = {A,B,C} A B Pelo menos um dos eventos ocorre C 36 Exemplo A Sejam A, B e C três eventos do espaço amostral Ω : B C Ω = {A,B,C} Ambos os eventos ocorrem A B C 37 → Dois eventos A e B são disjuntos (ou mutuamente exclusivos) quando não têm elementos em comum, ou seja: → Dois eventos A e B são complementares se sua união é o espaço amostral e sua intersecção é vazia, ou seja: 38 Exemplo: A B C A e C: eventos disjuntos A B C Ac → complementar de A 39 A c A Outros exemplos → Pelo menos um dos eventos ocorre → O evento A ocorre mas o evento B não → Nenhum deles ocorre 40 4.3 Probabilidade Uma função P(.) é denominada probabilidade se satisfaz as condições: ,com todos os disjuntos. ou seja, probabilidade é a função que atribui valores numéricos aos eventos do espaço amostral. 41 Questão que se coloca: como atribuir probabilidade aos elementos do espaço amostral? 42 Questão que se coloca: como atribuir probabilidade aos elementos do espaço amostral? 1) Baseado nas características da realização de um fenômeno; 2) Usando as freqüências de ocorrência. 43 → Baseado nas características da realização de um fenômeno Exemplo: Lançamento de um dado cúbico perfeitamente homogêneo e simétrico com os lados numerados, teremos o espaço amostral: E nesse caso a probabilidade de ocorrência de cada evento será: 44 → Usando as freqüências de ocorrência Exemplo: Pegamos um dado e jogamos várias vezes. Para um número suficientemente grande de lançamentos, podemos usar as freqüências de ocorrência como probabilidades. Mas ...... 45 O que quer dizer número suficientemente grande de lançamentos ? Geralmente a medida que o número de repetições aumenta, as freqüências relativas vão se estabilizando em um número que chamaremos de probabilidade. 46 Exemplo: Usemos a tabela abaixo que mostra o número de alunos de cada sexo numa escola: Sexo n f F 37 0,74 M 13 0,26 Total 50 1 Sabendo que 52% dos alunos estão na turma A e 48% na turma B, escolhemos um estudante ao acaso. Qual a probabilidade de escolhermos um estudante do sexo feminino ou alguém da turma B? 47 Tabela Da tabela e das características das turmas A e B temos P(F) = 0,74; P(M) = 0,26; P(A) = 0,52; P(B) = 0,48. 48 Pergunta colocada: "Qual a probabilidade de escolhermos um estudante do sexo feminino ou alguém da turma B?" P(F) = 0,74; P(M) = 0,26; P(A) = 0,52; P(B) = 0,48. Queremos Não podemos simplesmente somar P(F) com P(B) já que teríamos probabilidade maior que 1. Estamos somando duas vezes alguns elementos pois há mulheres em ambas as turmas 49 Temos que é igual ao número de estudantes do sexo feminino e da turma B. Assim, para obter a probabilidade correta temos que somar as probabilidades P(F) com P(B) e, então subtrair deste valor ou seja, 50 Para o caso geral, temos que a regra da adição de probabilidades, a probabilidade da união de dois eventos A e B, é dada por observe que se os eventos A e B forem disjuntos (e somente neste caso),a probabilidade da intersecção de A com B é nula e temos que a união é igual a soma das probabilidades dos dois eventos. Esta regra pode ser estendida para soma de três ou mais termos. 51 Observe que e que 52 Observe que e que Logo, 53 → Como calcular as freqüências de ocorrência: Contando o número de casos favoráveis para ocorrência de um certo evento, se os eventos são equiprováveis Quando o espaço amostral é grande, temos que usar a análise combinatória P(E) = número de casos favoráveis/número total de casos 54