SEMINÁRIOS EM CIÊNCIAS ATUARIAIS E ESTATÍSTICA 2008 Seminários em Ciências Atuariais e Estatística – MAD236 Horário: sextas de 8-10h Sala: LIG- sala 02 Professores responsáveis: Natalie H. Hurtado e Flávia Landim Cronograma Datas dos seminários: Março07,14 e 28 Abril04, 11, 18 e 25 Maio9, 16 e 30 Junho 06, 13, 20 e 27 São ao todo 14 seminários. Informações importantes A presença é obrigatória! O(a) aluno(a) poderá ter no máximo duas faltas. A avaliação será com base em dois relatórios de temas a serem escolhidos entre os seminários apresentados. Relatório 1 Escolha entre o seminário de 28 de março e 9 de maio, para ser entregue no dia 16 de maio. Relatório 2 Escolha entre o seminário de 16 de maio e 27 de junho, para ser entregue no dia 2 de julho. Na avaliação também será levado em conta a participação nos seminários. Página de informações da disciplina www.im.ufrj.br/~flavia/seminarios.ht ml Cronologia de Alguns Conceitos e Fatos Importantes da Estatística (Gauss M. Cordeiro, 2006) Antes de Cristo: 5000 - Registros egípcios de presos de guerra 3000 - Jogos de dados (Objetos de ossos) 2000 - Censo Chinês 1100 - Registros de dados em livros da Dinastia Chinesa 585 - Thales de Mileto usa a geometria dedutiva 540 - Pitágoras (Aritmética e Geometria) 430 - Philolaus obtém dados de Astronomia e Hippocrates estuda doenças a partir da coleta de dados 400 - Estabelecido o Censo Romano - Descrição detalhada de coleta de dados em livros de Constantinopla 100 - Horácio usa um ábaco de fichas como instrumento de “cálculo portátil” Depois de Cristo: 120 - Menelaus apresenta tabelas estatísticas cruzadas 620 - Surge em Constantinopla um Primeiro Bureau de Estatística 695 - Utilização da média ponderada pelos árabes na contagem de moedas 826 - Os árabes usam cálculos estatísticos na tomada de Creta 840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de dados de astronomia 1303 - Origem dos números combinatórios (Shihchieh Chu) 1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de probabilidade com a fórmula do binômio 1447 - Surgem as primeiras tabelas de mortalidade construídas pelos sábios do Islã 1530 - Lotto de Firenze – Primeira Loteria Pública 1550 - Número Combinatório (Cardano) continuação 1654 - Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das Probabilidades 1656 - Huygens publica o primeiro tratado de Probabilidade 1660 - Fundação da Royal Society of London 1662 - Primeiros estudos demográficos (Graunt) 1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético e conceito de Valor Esperado (Pascal) 1693 - Edmund Halley publica tabelas de mortalidade e cria os fundamentos da Atuária 1713 - Distribuição Binomial (Bernoulli) 1718 – De Moivre publica Doutrina das Chances 1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling para n! 1733 - Teorema Central do Limite (De Moivre) 1763 - Inferência Estatística (Reverendo Thomas Bayes) 1764 - Probabilidade Condicional e Teorema de Bayes 1775 - William Morgan se torna o primeiro atuário 1777 - Primeiro exemplo de uso da verossimilhança na estimação de parâmetro (Daniel Bernoulli) 1800 - A França estabelece o seu Bureau de Estatística 1805 - Método dos Mínimos Quadrados (Legendre) 1810 - Teorema Central do Limite (Laplace) 1812 - Théorie Analytique des Probabilités – sendo a base da Inferência (Laplace) 1820 - Várias sociedades de Estatística são criadas 1834 - Primeiro Computador Analítico (Charles Babbage) e Fundação do Journal of the Royal Statistical Society - B 1835 - Lei dos Grandes Números (Poisson) 1836 - Distribuição Gama 1837 - Distribuição de Poisson 1839 - Fundação da American Statistical Association (ASA) 1846 - Uso de Quantis (Quetelet) 1853 - Distribuição de Cauchy e Primeira Conferência Internacional de Estatística em Bruxellas (Quetelet) 1867 - Desigualdade de Chebyshev 1876 - Primeiro uso de um Método do tipo Monte Carlo (Forest) 1885 – Fundação do ISI (International Statistical Institute) 1887 - Teoria de Regressão (Galton) e Índice de Marshall 1892 - Coeficiente de Correlação (Edgeworth) 1894 - Método dos Momentos e Uso pela primeira vez dos termos momento e desvio padrão (Karl Pearson) 1895 - Sistema de Distribuições e Coeficiente de Variação (Karl Pearson) 1896 - Métodos de Captura e Recaptura (Petersen) 1897 - Coeficiente de Correlação de Produto de Momentos (Pearson e Sheppard) e Distribuição de Pareto 1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e Coeficiente de Associação (Yule) 1901 - Fundação da Biometrika (Pearson, Weldon e Galton) 1904 - Análise Fatorial (Spearman), Coeficiente de Contingência (K. Pearson), Coeficiente de Spearman e Expansão de Edgeworth 1908 - Distribuição nula do coeficiente de correlação e distribuição t de Student (William Gosset) e Análise Fatorial (Spearman) 1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e Índice de Gini 1922 - Definição de Verossimilhança, Consistência e Suficiência (Fisher) e Prova Rigorosa do Teorema Central do Limite (Lindeberg) 1923 - Tabela ANOVA (Fisher) e Processo de Wiener 1925 - Livro Clássico “Statistical Methods for Research Workers”, Método escore para parâmetros e definição de p-valor (Fisher) 1926 - Planejamento de Experimentos (Fisher) e Conceito de Hipótese Altermativa (Gosset) 1928 - Distribuições Não- Centrais (Fisher), Intervalos de Confiança, Razão de Verossimilhanças e Poder dos Testes (Neyman e Pearson) e Distribuição de Wishart 1930 -Controle de Qualidade nas indústrias, Inferência Fiducial (Fisher) e Distância de Mahalanobis, Tempo Médio de Espera na Fila M/G/1 (Pollaczek) e Fundação da Econometrica 1931 - Noção de Espaco Amostral (von Mises), Cartas de Controle de Qualidade (Shewhart) e Teste de Fisher-Yates 1932 - Distribuição de Gumbel 1933 - Lema de Neyman & Pearson, Distância de Kolmogorov, Componentes Principais (Hotteling), Fundamentos de Probabilidade (Kolmogorov) e Permutabilidade (DeFinetti) 1934 - Estatística Ancilar, Família Exponencial e Princípios da Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de Confluência (Frisch) e Teorema de Cochran 1938 - Distribuição Assintótica da Razão de Verossimilhanças (Wilks) 1939 - Distribuição de Weibull e início dos Métodos Bayesianos (Jeffreys) 1976 - Enfoque Bayesiano em Modelos de Espaço de Estados (Harrison e Stevens) 1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise Exploratória de Dados (Tukey), Distribuições g e h (Tukey) e Performance dos estimadores de MV em pequenas amostras (Bowman e Shenton) 1990 - Métodos MCMC no contexto Bayesiano (Gelfand e Smith) e Mineração de Dados (“Data Mining”), Momentos L (Hosking) e Teoria da Perturbação Estocástica (Stewart) Estatística: o que é? O primeiro uso da palavra ESTATÍSTICA parece datar de 1589 (dc) e apareceu em um trabalho do historiador Girolomo Ghilini, quando se referiu a uma “ciência civil, política, estatística e militar”. (Berquó, 1981) As expressões “statistics”, “statist” e “statistical” parecem ter sido derivadas do latim status com duplo significado: estado político; e situação das coisas. DEFINIÇÃO No Aurélio (primeira edição) apresentam-se as seguintes definições: (1) Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados; (2) Qualquer parâmetro de uma amostra, como, por exemplo, a sua média, o seu desvio-padrão, a sua variância. Estatística: o que é ? Para Sir Ronald A. Fisher (1890-1962): Estatística é o estudo das populações, das variações e dos métodos de redução de dados. Estatística: o que é? “Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados... “ Jon Kettenring Presidente da American Statistical Association, 1997 Estatística: o que é? Uma boa definição é “Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.” Estatística: o que é? Toda atividade humana é baseada em previsões e tomadas de decisão sob incerteza: quando entramos para a universidade, quando arrumamos um emprego, quando nos casamos, quando investimos uma quantia no mercado de ações, etc. Estatística: o que é? Calyampudi R. Rao (1920- ), um estatístico indiano famoso apresenta a seguinte equação: Essa parte da equação Representa o papel fundamental do estatístico conhecimento + incerto conhecimento da quantidade = de incerteza conhecimento útil Quantificação da Incerteza Não há uma forma definida de quantificar incertezas e o assunto é bastante controverso. A primeira tentativa séria foi feita pelo Reverendo Thomas Bayes (?-1761) que foi dito ter 59 anos quando morreu em 17/04/1761 – não se sabe quando ele nasceu. Bayes introduziu o conceito de uma distribuição a priori sobre o conjunto das hipóteses possíveis, indicando os graus de crença para as diferentes hipóteses, antes dos dados serem observados, que nós denotaremos por p(h). Essa distribuição a priori junto com o conhecimento da distribuição de probabilidade dos dados d dada a hipótese h, denotada por p(d|h), capacita-nos obter a distribuição de probabilidade total (marginal) dos dados observados, denotada por p(d). p(h | d ) p ( h) p ( d | h) p(d ) Agora estamos em posição de calcular a distribuição condicional da hipótese dados os dados observados: que é chamada distribuição a posteriori ou distribuição de incertezas sobre as hipóteses à luz dos dados observados. A partir de um conhecimento a priori das hipóteses alternativas e dos dados observados, obtemos um conhecimento novo sobre as hipóteses possíveis e a solução de Bayes é, de fato, logicamente sólida. Alguns estatísticos, porém, sentem-se desconfortáveis sobre a introdução de uma distribuição a priori em um problema, a menos que a escolha de tal distribuição seja feita de maneira objetiva – por exemplo, baseada na evidência observacional do passado e não na crença de um indivíduo. Esforços foram empreendidos pelos fundadores da estatística moderna K. Pearson, R.A. Fisher, J. Neyman, A. Wald, para desenvolver teorias de inferência sem usar distribuições a priori. Esses métodos, porém, apresentam muitas vezes dificuldades lógicas. (Rao, 1996) Do determinismo ao estocástico Por muito tempo acreditou-se que todo evento natural tinha uma característica prédeterminada. Formulação mais extrema disso idéia de Laplace “existência de um demônio matemático, um espírito dotado de uma capacidade ilimitada de dedução matemática, que seria capaz de prever todos os eventos futuros no mundo, se em um dado momento ele conhecesse todas as magnitudes que caracterizam o estado presente.” A idéia de Laplace mostrou-se incorreta de duas formas. existem dificuldades tanto lógicas, quanto práticas na formulação de leis determinísticas para fenômenos naturais; é impossível medir o estado verdadeiro de um sistema em qualquer tempo dado. Na teoria do Caos tal fenômeno é chamado – Efeito Borboleta. CHANCE: inerente na natureza Três grandes desenvolvimentos se deram aproximadamente na mesma época em meados do século XIX em três campos distintos de averiguação. 1) O estatístico social belga Adolphe Quetelet (1796-1874) usou os conceitos de probabilidade ao descrever um fenômeno social e biológico. CHANCE: inerente na natureza 2) O botânico austríaco Gregor Mendel (1822-1884) formulou suas leis de hereditariedade, através de simples mecanismos de chance, como lançar dados. CHANCE: inerente na natureza 3) O físico austríaco Ludwig Boltzmann (18441906) deu uma interpretação estatística para uma das proposições mais fundamentais de física teórica, a segunda lei da termodinâmica. As leis básicas da física foram elas próprias expressas em termos probabilísticos, particularmente no nível microscópico das partículas fundamentais. o comportamento aleatório é considerado como uma parte indispensável e inerente do funcionamento normal de muitos tipos de coisas. modelos estocásticos foram construídos para explicar o comportamento de sistemas dados. Exemplos de tais descrições são: o movimento Browniano, cintilações causadas por radioatividade, o princípio da incerteza de Heisenberg, as distribuições de velocidade de Maxwell de moléculas de massas iguais. Todas eles indicando o caminho para a mecânica quântica. “Nós vimos como a Física Clássica lutou em vão para resignar-se ao crescimento de observações quantitativas com idéias preconcebidas sobre causalidade, derivadas da experiência de todo dia, mas elevou-se a um nível de postulados metafísicos, e como ela lutou uma batalha perdida contra a intrusão da chance. Hoje a ordem foi revertida: chance tornou-se uma noção primária, mecânica uma expressão de suas leis quantitativas, e a evidência esmagadora de casualidade com todos os seus atributos no domínio da experiência ordinária é satisfatoriamente explicada pela lei estatística dos grandes números.” (Max Born - 1882-1970) POSSIBILIDADE DE FALHA NO CONHECIMENTO CIENTÍFICO Todo conhecimento científico, sendo baseado em evidência que é formalmente incompleta, é somente provável e nunca absolutamente certo. Todas as predições baseadas em conhecimento científico. Devem, portanto, poder falhar e, de fato, mostrarem-se erradas a longo prazo. A longa história da filosofia e da ciência é em grande parte a história da emancipação progressiva da mente humana da teoria das verdades autoevidentes e dos postulados de certeza total com a marca da verdade científica. Em todo o campo da ciência os processos matemáticos dedutivos de inferência absolutamente certa estão sendo substituídos pelos métodos estatísticos de inferência incerta. Exemplos de situações em que se usa Estatística Mensuração das mudanças no meio-ambiente para avaliar os efeitos do aquecimento global; Mensuração da poluição do ar para avaliar os efeitos na saúde da população; Mensuração das mudanças nos padrões populacionais para avaliar que tipos de moradia são necessários e em que localizações; Análise de experimentos sobre o uso de fertilizantes para maximizar a produção de milho; Mensuração da eficácia de diferentes medicamentos para encontrar o melhor, e identificar efeitos colaterais; Cálculo de quão provável duas pessoas têm o mesmo perfil de DNA. Exemplo: Medicamentos genéricos Problema: verificar a eficácia do remédio que está sendo criado, comparando-o com o que já existe no mercado. Legislação brasileira: dois medicamentos são bioequivalentes se o intervalo de confiança de 90% para x estiver entre 80 e 125%. Etapas para o teste de bioequivalência: 1. Clínica: os medicamentos são analisados segundo sua monografia inscrita na Farmacopéia Brasileira. A diferença de teor do fármaco deve ser inferior a 5%. No mínimo 24 voluntários recebem os medicamentos em períodos alternados. O n.º de períodos é escolhido de modo a assegurar a validade estatística. Etapas para o teste de bioequivalência: 3. estatística: analisa-se a variância de CMAX (concentração máxima) e ASC (área sob a curva) para avaliar os efeitos de grupo, de voluntários, de período e de tratamento. Medidas da Concentração: Análise dos resultados: Concluiu-se que o remédio testado é equivalente ao já existente. Resumindo: A Estatística utiliza métodos matemáticos para solucionar problemas reais de tomada de decisão quando há incerteza. Em situações nas quais poderíamos contar unicamente com a sorte, temos um instrumento, que nos possibilita aumentar as chances de tomar a melhor decisão. Na prática, a Estatística pode ser empregada como ferramenta fundamental em várias outras ciências. Formação de Graduação A base da formação de graduação de um estatístico deve estar fundamentada em cálculo, álgebra linear, teoria das probabilidades e inferência estatística, técnicas e linguagens computacionais, métodos de análise estatística. Por conta da grande variedade de possibilidades de atuação, cerca de 25% do currículo é composto por disciplinas complementares. Formação de Graduação As disciplinas complementares são escolhidas de acordo com o interesse do estudante. No momento temos um convênio com o Hospital Universitário Clementino Fraga Filho, que oferece bolsas de Iniciação Científica para alunos do curso. As atividades envolvem apoio aos médicos do hospital, que têm muitos dados, mas não sabem como analisá-los. INSTITUTO DE MATEMÁTICA Diretoria Adjunta de Graduação Ciclo Básico de Ciências Atuariais e Estatística 1º Cálculo I Computação I Álgebra Linear I Análise Exploratória de Dados 2º Cálculo II Álgebra I Álgebra Linear II Introdução à Estatística 3º Cálculo III Cálculo das Probabilidades I Equações Diferenciais Cálculo Numérico Computação II 4º Análise I Cálculo das Probabilidades II Inferência Estatística I Matemática Financeira (*) Demografia(*) Elementos de Física Seminários em Estatística e Atuária (*) Opcional para o curso de Estatística. Estatística: ciclo profissional 5º Métodos Numéricos I Processos Estocásticos Inferência Estatística II Análise de Regressão Controle Estatístico de Qualidade 6º Técnicas de Amostragem Planejamento de Experimentos Análise Estatística Multivariada Estatística Computacional Complementar 7º Análise de Séries Temporais Complementar Complementar Complementar 8º Projeto Final em Estatística Complementar Complementar Complementar Complementar Ciências Atuariais: ciclo profissional 5º Matemática Atuarial I Processos Estocásticos Inferência Estatística II Análise de Regressão Direito Social e Legislação de Seguros I Introdução à Administração 6º Técnicas de Amostragem Matemática Atuarial II Análise Estatística Multivariada Estatística Computacional Teoria do Risco Introdução à Contabilidade 7º Análise de Séries Temporais Práticas Atuariais em Seguros Teoria da Credibilidade Economia 8º Projeto Final em Atuária Práticas Atuariais em Pensões Tarifação de Seguros Complementar Gerência Financeira de Complementar Reservas Técnicas Pós-Graduação O Instituto de Matemática oferece cinco pósgraduações nas áreas: matemática (mestrado e doutorado), matemática aplicada, estatística (mestrado e doutorado), informática e ensino da matemática. Seguindo as recomendações curriculares, em 6 anos pode-se concluir a Graduação e o Mestrado em Estatística. A Profissão A profissão “Estastístico” é regulamentada pelo decreto n. 62.497, DE 1.o DE ABRIL DE 1968. O exercício profissional é fiscalizado pelos Conselhos Regionais de Estatística (CONRE), sob a supervisão do Conselho Federal de Estatística (CONFE-www.confe.com.br), o qual orienta e disciplina o exercício da profissão de Estatística. Sociedades Científicas A comunidade estatística reúne-se em sociedades científicas e profissionais. A Associação Brasileira de Estatística (ABE www.ime.usp.br/~abe) promove vários encontros, entre eles, o SINAPE, a cada dois anos. Em www.im.ufrj.br/estatistica/linkestat.html vocês encontrarão vários links interessantes, relacionados à Estatística. Estatísticos formados pela UFRJ - onde estão? Diversos estatísticos formados pela UFRJ são hoje docentes em Instituições Federais e Estaduais de Ensino Superior, tendo concluído pelo menos o mestrado em Estatística (UFRJ, UFF, UERJ, UFPR,...). Dois em particular atuam em universidades americanas. Também há vários estatísticos formados pelo IM-UFRJ que se encontram no serviço público: IBGE, FIOCRUZ (Fundação Oswaldo Cruz), ANAC (Agência Nacional de Aviação Civil), Petrobras, ANS (Agência Nacional de Saúde), IRB (Instituto de Resseguros do Brasil), na CBTU (Companhia Brasileira de trens urbanos). Estatísticos formados pela UFRJ - onde estão? Na iniciativa privada também temos alunos egressos do curso, por exemplo, na Telemar, na Golden Cross, na FIRJAN (Federação das Indústrias do Rio de Janeiro), na Sul América, na Eletros, em companhias de pesquisa de opinião como a LIPE, Interação-Pesquisa, entre outras. Bacharelado em Estatística no IM-UFRJ Visite periodicamente página do curso para obter outras informações importantes. http://www.im.ufrj.br/estatistica Seminário de 14/03/2008: O que é Atuária? Professora Natalie Haawinckel Hurtado - IM/UFRJ Referências Berquó, Souza e Gotlieb. (1981). Bioestatística. EPU. Rao, C.R. (1996).Uncertainty, Statistics, and Creation of New Knowledge. Chance. pp 5-11. Cordeiro, G. M. (2006). Cronologia de Alguns Conceitos e Fatos Importantes da Estatística. http://www.rss.org.uk/main.asp?page=0