análise de dados e probabilidade Guia do professor Ie\jmWh[ FheXWX_b_ZWZ[YeckhdWi Objetivos da unidade 1. Investigar o comportamento aleatório de um jogo com extração de bolinhas de uma urna; 2. Ler e compreender gráficos de evolução temporal. requisitos de software Requisitos de software Navegador moderno (Internet Explorer 7.0+ ou Firefox 3.0+) e Adobe Flash Player 9.0+. restrições de acessibilidade Não há suporte para navegação exclusiva via teclado ou recurso nativo de alto contraste. licença Esta obrá está licenciada sob uma licença Creative Commons Secretaria de Educação a Distância Ministério da Ciência e Tecnologia Ministério da Educação Probabilidade com urnas Guia do professor Sinopse Este software possibilita aos alunos explorar o cálculo de probabilidades envolvido em experimentos de extrações de bolinhas indistinguíveis, exceto pela cor, de uma urna. A primeira atividade, que introduz o conceito de independência entre eventos, consiste em realizar as extrações com reposição. Na segunda atividade, as extrações são realizadas sem reposição, sendo trabalhado o conceito de dependência entre eventos. A terceira atividade introduz um tipo específico de dependência entre os eventos através da chamada Urna de Polya. Conteúdos Probabilidade: Probabilidade condicional, Interdependência, Permutabilidade Objetivos 1. Investigar o comportamento aleatório de um jogo com extração de bolinhas de uma urna; 2. Ler e compreender gráficos de evolução temporal. Duração Uma aula dupla. Recomendação de uso Sugerimos que as atividades sejam realizadas em duplas. ?djheZke Em um processo de amostragem usual, selecionamos aleatoriamente indivíduos da população de interesse registrando, por exemplo, a existência ou não de certas características: pretende votar no candidato A (sim / não); é canhoto (sim / não); qual medicamento funciona melhor (A / B), e assim por diante. Desta maneira, podemos aprender de uma população a partir de perguntas com apenas duas respostas possíveis. A questão deste software é: na amostra, a proporção de indivíduos com tal característica é próxima da proporção encontrada na população? O processo de seleção de indivíduos de uma população pode ser representado por um modelo de extrações de bolinhas de duas cores diferentes de uma urna: as bolinhas da urna representam a população, enquanto a cor das bolinhas representa a existência ou não da característica de interesse. Se a proporção de bolinhas de certa cor na urna for igual a , como se comporta a proporção de bolinhas dessa cor na amostra? Esse comportamento é analisado no software Probabilidade com Urnas. FheXWX_b_ZWZ[YeckhdWi Eie\jmWh[ Estrutura do software O software “Probabilidade com urnas” é composto por três atividades, sendo que as duas primeiras abordam casos de urnas mais conhecidas, com reposição e sem reposição, e a terceira introduz um tipo diferente de urna, a Urna de Polya. tela 1 Mapa de navegação do software Todas as atividades possuem algumas questões que devem ser respondidas pelos alunos em seus cadernos, o que pode ser feito após a utilização do software, para o fechamento das discussões. A variável de interesse a ser analisada neste software é a proporção de bolinhas azuis amostrada na realização das extrações, vista como uma estimativa da proporção de bolinhas azuis na urna. =k_WZefhe\[iieh ( % . ' Urna com reposição 7J?L?:7:; Na primeira parte da atividade, o aluno deverá realizar simulações do experimento, “extraindo” virtualmente bolinhas da urna, com reposição. O aluno deverá inicialmente escolher o número total de bolinhas azuis de uma urna contendo 20 bolinhas, entre azuis e vermelhas. O objetivo é sensibilizar o aluno para o comportamento da variável de interesse, a proporção de bolinhas azuis na amostra, no caso de extrações com reposição. Os resultados serão representados automaticamente em um gráfico com a evolução da proporção observada de bolinhas azuis à medida que são feitas as extrações. O eixo y representa a proporção de bolinhas azuis observada até a extração x. No exemplo da tela 2, foram extraídas as bolinhas desenhadas abaixo do gráfico, donde a proporção de bolinhas azuis até a sétima extração, por exemplo, é igual a . tela 2 FheXWX_b_ZWZ[YeckhdWi Observa-se que, à medida que o número de extrações aumenta, a proporção de bolinhas azuis se estabiliza em torno da verdadeira proporção de bolinhas azuis na urna. A segunda parte introduz o conceito de independência e constitui a parte mais conceitual da atividade. A discussão começa com a Questão 6, relativa à probabilidade de obter uma bolinha azul em uma das extrações. Lembremos que a probabilidade de um evento representa a chance de este evento acontecer de acordo com a informação disponível ao observador. Para estar bem definida, uma probabilidade deve satisfazer certas regras. Definição Dizemos que é uma função de probabilidade definida em um conjunto de eventos associados ao espaço amostral se: 1. , para todo evento ; 2. ; 3. sempre que e forem eventos mutuamente exclusivos. Nessa definição chamamos de espaço amostral o conjunto de todos os resultados possíveis do experimento analisado e um evento é um subconjunto de . Dois eventos e são chamados mutuamente exclusivos se eles não puderem ocorrer simultaneamente, ou seja, se sua interseção for vazia, . Observemos que, após cada extração, repomos a bolinha extraída, de modo que na extração seguinte a urna se encontra como inicialmente. Além disso, cada bolinha tem a mesma chance de ser extraída, já que, exceto pela cor, elas são indistinguíveis. Desta forma, em cada uma das extrações, a probabilidade de obter uma bolinha azul é a mesma, igual à proporção de bolinhas azuis na urna (denotada por ) com relação ao número total de bolinhas (considerado igual a 20), . =k_WZefhe\[iieh ) % . A atualização da probabilidade de um evento em face de uma nova informação é obtida pelo conceito de probabilidade condicional. Definição Sejam e eventos, tais que . Definimos a probabilidade condicional de dado como . Intuitivamente, representa a probabilidade de que o evento ocorra, sabendo-se ou supondo-se que ocorreu. Quando a nova informação não modifica a probabilidade original de um evento, dizemos que os eventos são independentes. Mais formalmente, dados dois eventos , , com , dizemos que e são eventos independentes se . Caso contrário, dizemos que e são eventos dependentes. Da definição de probabilidade condicional, obtemos que e são independentes se . Essa última equação é também válida para o caso em que . Nesta atividade, pelo fato de que a cada extração a urna tem sempre a mesma configuração, é possível perceber que o resultado de uma extração não dá informação para a probabilidade de obter uma das cores em outra extração. Então, por exemplo, chamando o evento “obter bolinha azul”, temos que FheXWX_b_ZWZ[YeckhdWi Sendo assim, concluímos que as extrações são independentes. ( Urna sem reposição 7J?L?:7:; Na segunda atividade, o aluno deverá realizar simulações do experimento, extraindo bolinhas da urna, sem reposição. O aluno deverá inicialmente escolher o número total de bolinhas azuis de uma urna contendo 20 bolinhas, entre azuis e vermelhas. Os resultados serão novamente representados em um gráfico com a evolução temporal da proporção observada de bolinhas azuis. A primeira parte da Atividade 2 é a exploração do software no caso de extrações sem reposição e procura sensibilizar o aluno para o comportamento da variável de interesse, a proporção de bolinhas azuis. Observa-se que, à medida que o número de extrações aumenta, a proporção de bolinhas azuis se estabiliza em torno da verdadeira proporção de bolinhas azuis na urna. De fato, como era de se esperar, na última extração obtemos exatamente a proporção de bolinhas azuis que havia inicialmente na urna. A segunda parte introduz a discussão sobre o conceito de independência. A Questão 6 sobre a probabilidade de obter uma bolinha azul em uma das extrações é bastante importante, já que é comumente respondida erroneamente. Como a probabilidade é uma função real, então a probabilidade de um evento deve ser um único número. Assim, a resposta de que a probabilidade de obter bolinha azul na última extração é 1 ou 0 (alternativa (d)) está errada, pois dá dois possíveis resultados. =k_WZefhe\[iieh * % . Intuitivamente, podemos pensar nas extrações das 20 bolinhas como uma ordenação das mesmas em uma fileira. Deste modo, a -ésima posição da fileira representa a -ésima extração da urna. O evento “ na -ésima extração” é portanto o mesmo que “ na -ésima posição”. Como todas as permutações das 20 bolinhas na fileira têm a mesma probabilidade de ocorrer, a probabilidade de obter uma bolinha azul na -ésima posição é igual à proporção de bolinhas azuis na urna, . O mesmo vale para qualquer posição. A confusão com a Questão 6 ocorre porque, quando se pergunta a probabilidade de obter bolinha azul na segunda posição, as pessoas usualmente respondem: “depende; depende se a primeira bolinha foi azul ou não”. Ou seja, as pessoas querem responder , que não incorpora informação sobre no lugar de o que ocorreu na 1ª extração. A resposta “depende” mostra exatamente que as extrações sem reposição não são independentes. De fato, se tivermos bolinhas azuis em 20 bolinhas no total, teremos que já que o evento ocorreu na primeira extração, restam na urna 19 bolinhas, das quais ( ) são azuis. Este resultado é diferente de mostrando a dependência entre as extrações. Observemos que o mesmo é válido se trocarmos a ordem da condicional FheXWX_b_ZWZ[YeckhdWi já que, se soubermos que a segunda extração foi bolinha azul, para a primeira extração só restam 19 bolinhas possíveis, das quais ( ) são azuis. Chegamos com esse exemplo à definição de permutabilidade. Dados dois eventos , , dizemos que eles são permutáveis se Em palavras, os eventos e são permutáveis se a informação que a ocorrência de oferece a respeito da probabilidade de for a mesma que a ocorrência de oferece a respeito da probabilidade de . No exemplo, como a equação é válida para todo par de extrações, podemos dizer que as extrações são permutáveis. Em particular, a permutabilidade de e implica que , diretamente da definição de probabilidade condicional. No caso das extrações, concluímos novamente que a probabilidade de obter bolinha azul em qualquer uma das extrações é a mesma, . ) Urna de Polya 7J?L?:7:; Em termos gerais, a Urna de Polya funciona da seguinte maneira: realiza-se a extração aleatória de uma bolinha e devolve-se para a urna a bolinha extraída e mais uma da mesma cor. Esse tipo de urna ilustra um processo probabilístico bastante usado em modelagem de opinião a respeito de uma proporção ou de uma probabilidade desconhecida. Por exemplo, suponha que um médico deseja testar a eficiência de um novo medicamento em relação ao medicamento usual . Um planejamento comum é selecionar pares de pacientes, com histórico semelhante, e aplicar aleatoriamente, para cada par, o medicamento a um paciente e o medicamento ao outro, observando-se qual dos pacientes obtém melhor resposta. =k_WZefhe\[iieh + % . Denotemos por a probabilidade de que o medicamento seja melhor que o medicamento . Inicialmente, o médico tem alguma opinião a respeito de , que deve ser em torno de ou algum valor entre e , por exemplo. O médico começa então a observar pares de pacientes. Para cada par em que é melhor que , o médico modifica sua opinião sobre , atribuindo valores maiores que o inicial; inversamente, para cada par em que é melhor que , ele modifica sua opinião, atribuindo valores menores que o inicial. A atualização da opinião sobre pode ser feita através de uma Urna de Polya. Cada bolinha azul na urna representa um par em que o medicamento é melhor; à medida que obtemos mais bolinhas azuis, maior é em nossa opinião a probabilidade de obter bolinha azul na próxima extração. Esse raciocínio pode ser implementado adicionando-se, a cada obtenção de uma bolinha azul, uma bolinha azul extra. Do mesmo modo, cada vez que obtemos uma bolinha vermelha, adicionamos uma bolinha vermelha extra. A primeira parte da atividade consiste em familiarizar o aluno com a dinâmica da urna de Polya. Depois de várias extrações, podemos perceber que a proporção de bolinhas azuis observada se aproxima da proporção inicial de bolinhas azuis na urna. Na prática, essa proporção inicial é o valor desconhecido, que pode ser estimado, depois de algumas realizações do experimento, pela proporção observada na amostra. Na segunda parte, novamente o interesse é analisar a dependência entre as extrações e a probabilidade de obter bolinha azul em cada uma delas. Claramente as extrações são dependentes, pois a urna é modificada depois de cada extração, dependendo do valor esperado. Então, por exemplo, já que, se obtivermos bolinha azul na 1ª extração, para a 2ª extração teremos 21 bolinhas na urna, das quais são azuis. FheXWX_b_ZWZ[YeckhdWi , podemos utilizar a Lei da ProbaPara o cálculo de bilidade Total. Lei da Probabilidade Total Sejam e eventos. Então . Desta maneira, denotando por o evento “obter bolinha azul na -ésima extração”, podemos escrever Portanto, como é diferente de , temos que as extrações são dependentes. Analogamente ao feito anteriormente, podemos mostrar que as extrações são permutáveis para a urna de Polya, ou seja, que , para quaisquer extrações e . =k_WZefhe\[iieh , % . <[Y^Wc[dje A parte fundamental do software é composta pelas Atividades 1 e 2, de forma que a Atividade 3 deve ser encarada como algo complementar, podendo inclusive ser resolvida pelos alunos em suas casas. Com isso, propomos um fechamento dividido em duas partes: a primeira analisando o cálculo de probabilidades envolvido na Atividade 1, e a segunda explorando a Atividade 2. Este fechamento pode ser conduzido a partir das Questões para o Caderno disponíveis na terceira parte de cada uma das atividades, as quais foram discutidas detalhadamente nas seções anteriores. FheXWX_b_ZWZ[YeckhdWi 8_Xb_e]hWÅW W. Feller (1976). Introdução à Teoria das Probabilidades e suas Aplicações, vol I. Editora Edgard Blücher. P. Meyer (2000). Probabilidade: Aplicações à Estatística. Editora LTC. Site recomendado: ALEA – Acção Local de Estatística Aplicada, http://alea-estp.ine.pt =k_WZefhe\[iieh - % . <_Y^WjYd_YW Autores Laura Leticia Ramos Rifo Projeto gráfico Preface Design Revisores Matemática Samuel Rocha de Oliveira Língua Portuguesa Ana Cecília Agua de Melo Ilustrador Lucas Ogasawara Universidade Estadual de Campinas Reitor José Tadeu Jorge Vice-Reitor Fernando Ferreira da Costa Grupo Gestor de Projetos Educacionais (ggpe – unicamp) Coordenador Fernando Arantes Gerente Executiva Miriam C. C. de Oliveira Matemática Multimídia Coordenador Geral Samuel Rocha de Oliveira Coordenador de Software Leonardo Barichello Coordenador de Implementação Matias Costa Instituto de Matemática, Estatística e Computação Científica (imecc – unicamp) Diretor Jayme Vaz Jr. Vice-Diretor Edmundo Capelas de Oliveira licença Esta obrá está licenciada sob uma licença Creative Commons Secretaria de Educação a Distância Ministério da Ciência e Tecnologia Ministério da Educação