Análise de dados e probabilidade Guia do professor Experimento Jogo da trilha Objetivos da unidade 1. Discutir, através de um jogo, o conceito de probabilidade condicional; 2. Desenvolver a habilidade necessária para o tratamento de informações através de gráficos e tabelas; 3. Induzir o aluno à formulação de estratégias a partir de seu conhecimento matemático. licença Esta obrá está licenciada sob uma licença Creative Commons Secretaria de Educação a Distância Ministério da Ciência e Tecnologia Ministério da Educação Jogo da trilha Guia do professor Sinopse O Jogo da Trilha é bastante simples e exige como material apenas um dado de 6 faces. Além disso, nesta atividade a intuição dos alunos será desa­ fiada quando eles tiverem de optar por uma estratégia que acreditam ser vencedora. Por fim, o experimento culminará em uma análise probabilística guiada pelo professor. Conteúdos Probabilidade: Eventos Equiprováveis, Probabilidade Condicional, Repre­ sentação Gráfica, Permutação e Combinação; Objetivos 1. Discutir, através de um jogo, o conceito de probabilidade condicional; 2. Desenvolver a habilidade necessária para o tratamento de informações através de gráficos e tabelas; 3. Induzir o aluno à formulação de estratégias a partir de seu conhecimento matemático. Duração Uma aula dupla. Introdução A probabilidade é um tópico importante da Matemática que lida com o conceito de incerteza. Utilizamos a probabilidade para modelar experi­ mentos ou observações cujo resultado não conhecemos com precisão. Para sua formalização, utilizamos o conceito de experimento (ou observação) aleatório, que é qualquer experimento cujo resultado não é conhecido exa­ tamente. Alguns exemplos de experimento aleatório podem ser o resultado do próximo jogo de seu time, as faces observadas em dois lançamentos de um dado, a quantidade de etnias indígenas existentes no Brasil em 1500 etc. Chamamos de espaço amostral o conjunto de todos os resultados pos­ síveis do experimento aleatório. No primeiro exemplo, o espaço amostral poderia ser Ω1 = {Vitória, Empate, Derrota} ou um conjunto numé­ rico repre­sentando o saldo de gols marcados pelo seu time. No segundo exemplo, denotando por (i, j) o resultado i do primeiro lançamento e o resultado j do segundo, o espaço amostral pode ser Ω2 = {(i, j) : 1 ≤ i, j ≤ 6} = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), (2, 2), . . . , (6, 6)} ) : 1 ≤ i, j ≤ 6} = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), (2, 2), . . . , (6, 6)}. Por fim, no último exemplo, o espaço amostral pode ser o conjunto dos números naturais, Ω3 = N = {1, 2, 3, . . .}. Denominamos evento qualquer subconjunto do espaço amostral. Dessa forma, seguindo os exemplos anteriores, podemos dizer dos eventos que: Dois eventos de um experimento aleatório são chamados de mutuamente exclusivos se eles não puderem ocorrer simultaneamente. No exemplo dos lançamentos do dado, os eventos B e D = “a {((3, 6),das (4,faces 5), (5, = (6, {((3, 3))} 6), (4, 5), (5, 4), (6, 3))} soma éD 9”4), são mutuamente exclusivos, pois não podem ocorrer simultaneamente. Probabilidade é também um conceito fortemente relacionado com infor­ mação: a probabilidade de um evento representa a chance de este evento acontecer de acordo com a informação disponível ao observador. Para estar bem definida, uma probabilidade deve satisfazer certas regras. Definição Dizemos que P é uma função de probabilidade definida em um conjunto de eventos associados ao espaço amostral Ω se: 1. 0 ≤ P (E) ≤ 1, para todo evento E ; 2. P (Ω) = 1; 3. P (E ∪ F ) = P (E) + P (F ) sempre que E e F forem eventos mutua­ mente exclusivos. No exemplo do seu time, podemos concluir da informação disponível que, no próximo jogo, P (Vitória) = 0, 4 P (Empate) = 0, 3 P (Derrota) = 0, 3 A = “oAseu = “o “o time seunão time perde operde próximo o próximo jogo” {Vitória, = {Vitória, Empate} Empate} seu time nãonão perde o próximo jogo” =jogo” “segundolançamento lançamento B = “segundo é 2”é 2” = {(1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2)} nçamento é 2” = {(1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2)} C = C“pelo = “pelo “pelo menos menos 200 200 etnias” etnias” = {200, = {200, 201,201, 202,202, . . .}. . .} menos 200 etnias” Jogo da trilha Nos dois lançamentos do dado, pode ser razoável supor que todas as faces têm a mesma chance de ocorrer e, assim, nenhum par é mais provável que outro, ou seja, P ((i, j)) = 1/36, para todo (i, j) ∈ Ω1. Guia do professor 2 / 8 Sobre as etnias indígenas no Brasil, um antropólogo voltado a tais estudos poderia afirmar, por exemplo, que P (C) = 0, 5. Esse quadro, contudo, pode se modificar se houver uma nova informação a respeito das probabilidades em um evento. Por exemplo, qual é a proba­ bilidade de que seu time não perca o próximo jogo se souber que foi comprado um excelente jogador? Ou ainda, qual é a probabilidade de que o evento B ocorra se souber que ocorreu o evento “a faces obtidas 3” = ? 1)} E = “a E= soma “asoma soma das das faces das faces obtidas obtidas éé3” é 3” {(1,=2), {(1, (2,2), 1)}(2, O antropólogo Darcy Ribeiro estima que em 1957 havia 150 etnias indí­ genas no Brasil. Conhecendo o processo de dizimação que a popu­lação indígena sofreu, poderíamos dizer que, com essa nova informação, a pro­ babilidade de que houvesse mais de 200 etnias indígenas no Brasil em 1500 passa a ser 0,8, por exemplo. A atualização da probabilidade de um evento em face de uma nova informação é obtida pelo conceito de probabilidade condicional. P (E ∩ F ) . P (F ) No exemplo dos lançamentos de um dado, a probabilidade de ocorrer o evento B sabendo que ocorreu P (B | E), é dada pela definição anterior P (B | E) = = P (E ∩ F ) = P (E)P (F ) . Esta última equação é também válida para o caso em que P (F ) = 0. Caso contrário, dizemos que E e F são eventos dependentes. Motivação Definição Sejam E e F eventos, tais que P (F ) > 0 . Definimos a probabilidade condicional de E dado F como P (E | F ) = Observe que a probabilidade de o segundo lançamento ser 2, que era originalmente igual a ¹⁄6, passa a ser igual a ½ no momento em que nos é informado que a soma das faces é 3. Ao contrário, quando a nova informação não modifica a probabilidade original de um evento, dizemos que eles são independentes. Mais formal­ mente, dados dois eventos E , F , com P (F ) > 0, dizemos que E e F são independentes se P (E | F ) = P (E), ou seja, da definição de probabili­ dade condicional, E e F são independentes se P (B ∩ E) P (E) No lançamento de um dado, a maioria das pessoas estará de acordo em que se o dado for balanceado e o lançamento for equilibrado, então a chance de obter uma face qualquer é a mesma para cada face, ¹⁄6. Neste jogo, avançamos por uma trilha de acordo com lançamentos de um dado, até chegar à oitava casa da trilha (ou passar dela). Qual é a chance de obter uma da face dada no último lançamento? Saber que o lançamento é o último, muda a chance de obter face 1 ou face 4, por exemplo? Estes eventos são dependentes ou independentes? As perguntas anteriores são primeiro respondidas a partir da obser­ vação de um grande número de jogadas, e no Fechamento sua resposta exata é obtida pela teoria, corroborando os valores empíricos obtidos. 1/36 P ((1, 2)) = 2 = 1/2 . P ({(1, 2), (2, 1)}) /36 Jogo da trilha Guia do professor 3 / 8 O experimento Faces obtidas por rodada Total de Face do Conjunto lançamentos último vencedor lançamento Etapa 1 Jogando e coletando informações Lembremos que as regras do jogo são: 1. Cada aluno lança o dado e, por ordem decrescente do valor obtido no lançamento, escolhe um dos conjuntos A = {1, 2, 3} , B = {4} , C = {5, 6}; 2. Inicialmente o Peão deverá ser colocado na casa “Saída”; 3. O primeiro aluno lança o dado e move o peão pela trilha, de acordo com o resultado obtido; repete o procedimento até que o peão alcance o fim da trilha (a oitava casa) ou passe dela; 4. Marca um ponto o aluno que tiver escolhido o conjunto com a face obtida no último lance da rodada; 5. Vence a partida o aluno que somar 10 pontos primeiro. Nesta primeira etapa, os alunos realizam jogadas, registram e analisam os resultados obtidos. Faremos tal procedimento analisando um exemplo de jogo. Na Tabela 1, registramos os resultados de cada rodada. 4 4 2 4 B 5 4 2 4 B 1 5 3 3 A 6 2 2 2 A 1 5 2 3 2 A 4 2 6 3 6 C 4 6 2 6 C 4 1 5 3 5 C 4 2 1 4 1 A 6 5 2 5 C 5 4 2 4 B 3 3 3 3 3 A 3 4 5 3 5 C 1 4 2 4 2 A 6 4 2 4 B 2 1 5 3 A 5 4 2 4 B 3 3 3 2 A 5 5 2 5 C 5 5 2 5 C 6 5 2 5 C 1 3 3 4 B 2 6 2 6 C 2 1 3 6 C 3 1 2 4 6 1 2 1 3 tabela 1 O time C ganhou este jogo, completando 10 pontos, enquanto que o time A completou 8 pontos e o time B, 6 pontos. Jogo da trilha Guia do professor 4 / 8 Etapa 2 Representação gráfica 12 A TAbelA 2 resume a informação da tabela anterior, em relação às frequên­ cias observadas das faces: em cada lançamento (na 2ª linha) e apenas no último lançamento (na 3ª linha). 10 8 6 4 Face sorteada 1 2 3 4 5 6 Total 2 Frequência das 11 10 9 13 13 8 64 0 faces 1 2 3 4 5 6 4 5 6 FIG. 1 Todos os lançamentos Frequência no 1 4 3 6 6 4 24 último lançamento 6 5 tabela 2 4 3 Desta tabela, podemos extrair algumas informações, como por exemplo que o dado é aparentemente balanceado já que as faces têm aproximada­ mente a mesma frequência, de acordo com a 2ª linha da tabela. Já pela 3ª linha, observamos que no último lançamento as faces maiores são mais frequentes que as menores: no último lançamento, a face 1 só apareceu uma vez em 24, enquanto que a face apareceu 5 apareceu 6 vezes em 24. Nesta etapa, os dados da TAbelA 2 são representados também grafica­ mente. Nos gráficos a seguir são representadas as frequências de cada resultado em todos os lançamentos (FiGUrA 1) e apenas no último lança­ mento (FiGUrA 2). Jogo da trilha 2 1 0 1 2 3 FIG. 2 Último lançamento A variável “face obtida no último lançamento” é do tipo quantitativo discreto, pois pode assumir um número finito de resultados numéricos. Neste caso, o gráfico de barras é o mais indicado, pois respeita a ordem natural dos valores observados (1 é menor que 4). O gráfico de barras indica a frequência observada em cada categoria de acordo com a altura da barra correspondente. É indiferente se a frequência utilizada é a absoluta (11 faces 1, 10 faces 2, etc.) ou a relativa (17% de faces 1 e 16% de faces 2, etc.), pois a altura relativa entre as barras permanece a mesma. Em ambos os gráficos, o tamanho da amostra é sempre uma informação importante, pois amostras pequenas apresentam normalmente flutuações maiores do que amostras grandes, quando forem representativas. Observamos no gráfico anterior que faces maiores têm mais chance de aparecer no último lançamento. Guia do professor 5/8 Fechamento No Fechamento, propomos a solução teórica do jogo. Na Tabela 3, podemos ver um resumo dos resultados do último lança­ mento associados a cada um dos conjuntos, para o jogo do exemplo ante­ rior. Em sala de aula, devem ser considerados os resultados das jogadas de todos os grupos. Último lançamento Frequência A B C Total 1 2 3 4 5 6 1 4 3 6 6 4 6 10 8 Mais formalmente, denotemos por N o número de lançamentos neces­ sários para chegar à oitava casa, por SN −1 a posição do peão antes do lançamento final, e por XN a face nele observada. Se SN −1 = 7, então o lançamento seguinte pode ser qualquer face, com mesma chance. Por outro lado, SN −1 = 6 implica que o lançamento seguinte não pode ser 1, pois se fosse 1, este não seria o último lançamento. Então deve ser qualquer uma das faces 2, 3, 4, 5, ou 6, todas com mesma probabilidade igual a ¹⁄5. Assim, pela lei da probabilidade total, P r(XN = 1) = P r(SN −1 = 7) × 1/6 24 P r(XN = 2) = P r(SN −1 = 7) × 1/6 + P r(SN −1 = 6) × 1/5 > P r(XN = 1 P r(XN24= 2) = P r(SN −1 = 7) × 1/6 + P r(S N −1 = 6) × /5 > P r(XN = 1) tabela 3 O mesmo raciocínio pode ser utilizado com as demais faces, obtendo Observamos no gráfico anterior, o primeiro indício da baixa probabili­ assim que dade de obter faces pequenas no último lançamento. Este gráfico é refor­ çado pela Tabela 3, com os resultados de todas as jogadas. P r(XN = 6) > P r(XN = 5) > P r(XN = 4) > P r(XN = 3) > P r(XN = Intuitivamente, podemos esquematizar a solução deste problema da seguinte maneira: P r(XN = 6) > P r(XN = 5) > P r(XN = 4) > P r(XN = 3) > P r(XN = 2) > P r(XN = 1) a face 1 só pode sair no último lançamento se o peão estiver na casa 7; a face 2 só pode sair no último lançamento se o peão estiver nas casas 6 ou 7; a face 3 só pode sair no último lançamento se o peão estiver nas casas 6, 7 ou 8; e assim por diante até: a face 6 pode sair no último lançamento se o peão estiver em qualquer uma das casas de 2 a 7. Portanto, a face 6 tem mais chances de ser a última do que 5, que tem mais chances de ser a última do que a 4, e assim sucessivamente. Jogo da trilha Com estas desigualdades provamos que as faces maiores são mais prováveis no último lançamento. Para obter a probabilidade de cada face no último lançamento, preci­ samos calcular as probabilidades das possíveis posições depois do penúl­ timo lançamento, SN −1. O evento [SN −1 = 1]é impossível, pois nenhum resultado no dado fará do próximo o último lançamento. O evento [SN −1 = 2] ocorre se e somente se forem observadas as seguintes sequências nos lançamentos: {(1, 1), (2)}. Portanto, P r(SN −1 = 2) = P (1, 1) + P (2) = 1/6 × 1/6 + 1/6 = 7/36. Guia do professor 6 / 8 Do mesmo modo, o evento [SN −1 = 3] ocorre se e somente se forem observadas as seguintes sequências nos lançamentos:{(1, {(1,1, 1,1), 1), (1, (1,2), 2), (3)} (3)} 1), (1, 2), (3)} ou suas possíveis permutações. Portanto, P r(XN = 5) = 0, 24 P r(XN = 6) = 0, 27 1/6 +a1/ probabilidade de cada conjunto marcar um ponto é: P r(SN −1 = 3) = P (1, 1, 1) + P (1, 2) + P (2, 1) + P (3) = 1/6 × 1/6 × 1/6 + 2 × 1/6 × Logo, 6 = 49/216 P (1, 2) + P (2, 1) + P (3) = 1/6 × 1/6 × 1/6 + 2 × 1/6 × 1/6 + 1/6 = 49/216 conjunto marca um ponto P (conjunto PP (conjunto (conjunto A marca AA marca marca um um ponto) umponto) ponto) = P=r(X =P P r(X =N 1, =2=1,ou 1, 2 23) ouou = 3)3) 0,=29 =0,0, 2929 Nr(X N × 1/6 + 2 × 1/6 × 1/6 + 1/6 = 49/216 conjunto umum ponto P (conjunto PP (conjunto (conjunto B marca BBmarca marca marca um ponto) umponto) ponto) = P=r(X =P P r(X =N4) 4)4) 0,=2=0,0, 22 Nr(X N== 6 Continuando com esta contagem sistematicamente, obtemos P (conjunto P (conjunto P (conjunto C marca CC marca marca um um ponto) um ponto) ponto) = P=r(X = P r(X PNr(X =N5N=ou = 5 6) ou 5 ou = 6)0, 6) =51 = 0, 0, 5151 conjunto marca um ponto P r(SN −1 = 4) = 343/1296 P r(SN −1 = 5) = 2401/7776 P (conjunto umopção. ponto) = P r(XN = 5 ou 6) = 0, 51 Portanto, o conjunto C émarca a melhor Bibliografia P r(SN −1 = 6) = 16807/46656 P r(SN −1 = 7) = 70993/279936 Feller, W. Introdução à teoria das probabilidades e suas aplicações. Editora Edgard Blucher, 1976. Assim, finalmente, P r(XN = 1) = P r(SN −1 = 7) × 1/6 = 70993/279936 × 1/6 = 0, 04 P r(XN = 2) = P r(SN −1 = 7) × 1/6 + P r(SN −1 = 6) × 1/5 = 0, 04 + 0, 06 = 0, 1 Meyer, Paul. Probabilidade: Aplicações à Estatística. Livros Técnicos e Científicos Editora, 2003. + P r(SN −1 = 6) × 1/ 5 = 0, 04 + 0, 06 = 0, 1 P r(XN = 3) = P r(SN −1 = 7) × 1/6 + P r(SN −1 = 6) × 1/5 + P r(SN −1 = 6) × 1/4 = 0, 1 + 0, 05 = 0, 15 /6 + P r(SN −1 = 6) × 1/5 + P r(SN −1 = 6) × 1/4 = 0, 1 + 0, 05 = 0, 15 /5 + P r(SN −1 = 6) × 1/4 = 0, 1 + 0, 05 = 0, 15 P r(XN = 4) = 0, 2 Jogo da trilha Guia do professor 7 / 8 Ficha técnica Autora Laura Letícia Ramos Rifo Revisores Matemática Antônio Carlos Patrocínio Língua Portuguesa Ana Cecília Agua de Melo e Carolina Bonturi Pedagogia Ângela Soligo Projeto gráfico e ilustrações técnicas Preface Design Universidade Estadual de Campinas Reitor José Tadeu Jorge Vice-Reitor Fernando Ferreira da Costa Grupo Gestor de Projetos Educacionais (ggpe – unicamp) Coordenador Fernando Arantes Gerente Executiva Miriam C. C. de Oliveira Matemática Multimídia Coordenador Geral Samuel Rocha de Oliveira Coordenador de Experimentos Leonardo Barichello Instituto de Matemática, Estatística e Computação Científica (imecc – unicamp) Diretor Jayme Vaz Jr. Vice-Diretor Edmundo Capelas de Oliveira licença Esta obrá está licenciada sob uma licença Creative Commons Secretaria de Educação a Distância Ministério da Ciência e Tecnologia Ministério da Educação