Estatística - Instituto de Matemática

Propaganda
SEMINÁRIOS EM
CIÊNCIAS ATUARIAIS E
ESTATÍSTICA
2008
Seminários em Ciências Atuariais e
Estatística – MAD236
Horário: sextas de 8-10h
 Sala: LIG- sala 02


Professores responsáveis: Natalie H. Hurtado
e Flávia Landim
Cronograma
Datas dos seminários:
Março07,14 e 28
Abril04, 11, 18 e 25
Maio9, 16 e 30
Junho 06, 13, 20 e 27
São ao todo 14 seminários.
Informações importantes





A presença é obrigatória! O(a) aluno(a) poderá ter no
máximo duas faltas.
A avaliação será com base em dois relatórios de temas
a serem escolhidos entre os seminários apresentados.
Relatório 1 Escolha entre o seminário de 28 de março
e 9 de maio, para ser entregue no dia 16 de maio.
Relatório 2 Escolha entre o seminário de 16 de maio e
27 de junho, para ser entregue no dia 2 de julho.
Na avaliação também será levado em conta a
participação nos seminários.
Página de informações da
disciplina
 www.im.ufrj.br/~flavia/seminarios.ht
ml
Cronologia de Alguns Conceitos e Fatos
Importantes da Estatística
(Gauss M. Cordeiro, 2006)
Antes de Cristo:









5000 - Registros egípcios de presos de guerra
3000 - Jogos de dados (Objetos de ossos)
2000 - Censo Chinês
1100 - Registros de dados em livros da Dinastia Chinesa
585 - Thales de Mileto usa a geometria dedutiva
540 - Pitágoras (Aritmética e Geometria)
430 - Philolaus obtém dados de Astronomia e Hippocrates estuda
doenças a partir da coleta de dados
400 - Estabelecido o Censo Romano - Descrição detalhada de
coleta de dados em livros de Constantinopla
100 - Horácio usa um ábaco de fichas como instrumento de
“cálculo portátil”
Depois de Cristo:










120 - Menelaus apresenta tabelas estatísticas cruzadas
620 - Surge em Constantinopla um Primeiro Bureau de Estatística
695 - Utilização da média ponderada pelos árabes na contagem de
moedas
826 - Os árabes usam cálculos estatísticos na tomada de Creta
840 - O astrônomo persa Yahyâ Abî Mansûr apresenta tabelas de
dados de astronomia
1303 - Origem dos números combinatórios (Shihchieh Chu)
1405 - O persa Ghiyat Kâshî realiza os primeiros cálculos de
probabilidade com a fórmula do binômio
1447 - Surgem as primeiras tabelas de mortalidade construídas pelos
sábios do Islã
1530 - Lotto de Firenze – Primeira Loteria Pública
1550 - Número Combinatório (Cardano)
continuação













1654 - Pierre de Fermat e Blaise Pascal estabelecem os Princípios do
Cálculo das Probabilidades
1656 - Huygens publica o primeiro tratado de Probabilidade
1660 - Fundação da Royal Society of London
1662 - Primeiros estudos demográficos (Graunt)
1679 - Distribuição de Pascal, Tratado do Triângulo Aritmético e
conceito de Valor Esperado (Pascal)
1693 - Edmund Halley publica tabelas de mortalidade e cria os
fundamentos da Atuária
1713 - Distribuição Binomial (Bernoulli)
1718 – De Moivre publica Doutrina das Chances
1730 - Distribuição Normal (De Moivre) e Fórmula de Stirling para n!
1733 - Teorema Central do Limite (De Moivre)
1763 - Inferência Estatística (Reverendo Thomas Bayes)
1764 - Probabilidade Condicional e Teorema de Bayes
1775 - William Morgan se torna o primeiro atuário

1777 - Primeiro exemplo de uso da verossimilhança na
estimação de parâmetro (Daniel Bernoulli)
 1800 - A França estabelece o seu Bureau de Estatística
 1805 - Método dos Mínimos Quadrados (Legendre)
 1810 - Teorema Central do Limite (Laplace)
 1812 - Théorie Analytique des Probabilités – sendo a base
da Inferência (Laplace)
 1820 - Várias sociedades de Estatística são criadas
 1834 - Primeiro Computador Analítico (Charles Babbage)
e Fundação do Journal of the Royal Statistical Society - B
 1835 - Lei dos Grandes Números (Poisson)
 1836 - Distribuição Gama
 1837 - Distribuição de Poisson
 1839 - Fundação da American Statistical Association
(ASA)












1846 - Uso de Quantis (Quetelet)
1853 - Distribuição de Cauchy e Primeira Conferência Internacional
de Estatística em Bruxellas (Quetelet)
1867 - Desigualdade de Chebyshev
1876 - Primeiro uso de um Método do tipo Monte Carlo (Forest)
1885 – Fundação do ISI (International Statistical Institute)
1887 - Teoria de Regressão (Galton) e Índice de Marshall
1892 - Coeficiente de Correlação (Edgeworth)
1894 - Método dos Momentos e Uso pela primeira vez dos termos
momento e desvio padrão (Karl Pearson)
1895 - Sistema de Distribuições e Coeficiente de Variação (Karl
Pearson)
1896 - Métodos de Captura e Recaptura (Petersen)
1897 - Coeficiente de Correlação de Produto de Momentos (Pearson
e Sheppard) e Distribuição de Pareto
1900 - Teste Qui-quadrado (Karl Pearson), Cadeias de Markov e
Coeficiente de Associação (Yule)











1901 - Fundação da Biometrika (Pearson, Weldon e Galton)
1904 - Análise Fatorial (Spearman), Coeficiente de Contingência (K.
Pearson), Coeficiente de Spearman e Expansão de Edgeworth
1908 - Distribuição nula do coeficiente de correlação e distribuição t
de Student (William Gosset) e Análise Fatorial (Spearman)
1912 - Método de Máxima Verossimilhança (Sir Ronald Fisher) e
Índice de Gini
1922 - Definição de Verossimilhança, Consistência e Suficiência
(Fisher) e Prova Rigorosa do Teorema Central do Limite (Lindeberg)
1923 - Tabela ANOVA (Fisher) e Processo de Wiener
1925 - Livro Clássico “Statistical Methods for Research Workers”,
Método escore para parâmetros e definição de p-valor (Fisher)
1926 - Planejamento de Experimentos (Fisher) e Conceito de
Hipótese Altermativa (Gosset)
1928 - Distribuições Não- Centrais (Fisher), Intervalos de Confiança,
Razão de Verossimilhanças e Poder dos Testes (Neyman e Pearson)
e Distribuição de Wishart
1930 -Controle de Qualidade nas indústrias, Inferência Fiducial
(Fisher) e Distância de Mahalanobis, Tempo Médio de Espera na Fila
M/G/1 (Pollaczek) e Fundação da Econometrica
1931 - Noção de Espaco Amostral (von Mises), Cartas de Controle de
Qualidade (Shewhart) e Teste de Fisher-Yates








1932 - Distribuição de Gumbel
1933 - Lema de Neyman & Pearson, Distância de Kolmogorov,
Componentes Principais (Hotteling), Fundamentos de Probabilidade
(Kolmogorov) e Permutabilidade (DeFinetti)
1934 - Estatística Ancilar, Família Exponencial e Princípios da
Verossimilhança (Fisher), Distribuição F (Snedecor), Análise de
Confluência (Frisch) e Teorema de Cochran
1938 - Distribuição Assintótica da Razão de Verossimilhanças
(Wilks)
1939 - Distribuição de Weibull e início dos Métodos Bayesianos
(Jeffreys)
1976 - Enfoque Bayesiano em Modelos de Espaço de Estados
(Harrison e Stevens)
1977 - Algoritmo EM (Dempster, Laird e Rubin), Análise Exploratória
de Dados (Tukey), Distribuições g e h (Tukey) e Performance dos
estimadores de MV em pequenas amostras (Bowman e Shenton)
1990 - Métodos MCMC no contexto Bayesiano (Gelfand e Smith) e
Mineração de Dados (“Data Mining”), Momentos L (Hosking) e Teoria
da Perturbação Estocástica (Stewart)
Estatística: o que é?
O primeiro uso da palavra ESTATÍSTICA
parece datar de 1589 (dc) e apareceu em um
trabalho do historiador Girolomo Ghilini,
quando se referiu a uma “ciência civil, política,
estatística e militar”. (Berquó, 1981)
 As expressões “statistics”, “statist” e
“statistical” parecem ter sido derivadas do
latim status com duplo significado:
 estado político; e situação das coisas.

DEFINIÇÃO
No Aurélio (primeira edição) apresentam-se as
seguintes definições:
(1) Parte da matemática em que se investigam os
processos de obtenção, organização e análise de
dados sobre uma população ou uma coleção de
seres quaisquer, e os métodos de tirar conclusões e
fazer ilações ou predições com base nesses dados;
(2) Qualquer parâmetro de uma amostra, como, por
exemplo, a sua média, o seu desvio-padrão, a sua
variância.

Estatística: o que é ?
Para Sir Ronald A. Fisher (1890-1962): Estatística é o
estudo das populações, das variações e dos métodos
de redução de dados.
Estatística: o que é?

“Eu gosto de pensar na
Estatística como a ciência de
aprendizagem a partir dos
dados... “
Jon Kettenring
Presidente da American
Statistical Association, 1997
Estatística: o que é?

Uma boa definição é “Estatística é um
conjunto de técnicas e métodos
que nos auxiliam no processo de
tomada de decisão na presença
de incerteza.”
Estatística: o que é?
Toda atividade humana é baseada em
previsões e tomadas de decisão sob
incerteza:
 quando entramos para a universidade,
quando arrumamos um emprego,
quando nos casamos, quando
investimos uma quantia no mercado
de ações, etc.

Estatística: o que é?

Calyampudi R. Rao (1920- ), um
estatístico indiano famoso apresenta a
seguinte equação:
Essa parte da equação
Representa o papel
fundamental do estatístico
conhecimento
+
incerto
conhecimento
da quantidade =
de incerteza
conhecimento
útil
Quantificação da Incerteza



Não há uma forma definida de quantificar incertezas e o
assunto é bastante controverso. A primeira tentativa séria foi
feita pelo Reverendo Thomas Bayes (?-1761) que foi dito ter
59 anos quando morreu em 17/04/1761 – não se sabe
quando ele nasceu.
Bayes introduziu o conceito de uma distribuição a priori sobre
o conjunto das hipóteses possíveis, indicando os graus de
crença para as diferentes hipóteses, antes dos dados serem
observados, que nós denotaremos por p(h).
Essa distribuição a priori junto com o conhecimento da
distribuição de probabilidade dos dados d dada a hipótese h,
denotada por p(d|h), capacita-nos obter a distribuição de
probabilidade total (marginal) dos dados observados,
denotada por p(d).
p(h | d ) 
p ( h) p ( d | h)
p(d )


Agora estamos em posição de calcular a distribuição
condicional da hipótese dados os dados observados:
que é chamada distribuição a posteriori ou distribuição de
incertezas sobre as hipóteses à luz dos dados observados.
A partir de um conhecimento a priori das hipóteses
alternativas e dos dados observados, obtemos um
conhecimento novo sobre as hipóteses possíveis e a solução
de Bayes é, de fato, logicamente sólida.
Alguns estatísticos, porém, sentem-se desconfortáveis
sobre a introdução de uma distribuição a priori em um
problema, a menos que a escolha de tal distribuição
seja feita de maneira objetiva – por exemplo, baseada
na evidência observacional do passado e não na
crença de um indivíduo.
 Esforços foram empreendidos pelos fundadores
da estatística moderna K. Pearson, R.A. Fisher, J.
Neyman, A. Wald, para desenvolver teorias de
inferência sem usar distribuições a priori. Esses
métodos, porém, apresentam muitas vezes
dificuldades lógicas. (Rao, 1996)
Do determinismo ao estocástico
Por muito tempo acreditou-se que todo evento
natural tinha uma característica prédeterminada.
Formulação mais extrema disso  idéia de
Laplace
“existência de um demônio matemático, um espírito dotado de
uma capacidade ilimitada de dedução matemática, que seria
capaz de prever todos os eventos futuros no mundo, se em
um dado momento ele conhecesse todas as magnitudes que
caracterizam o estado presente.”
A idéia de Laplace mostrou-se incorreta de
duas formas.
existem
dificuldades tanto lógicas, quanto
práticas na formulação de leis determinísticas
para fenômenos naturais;
é impossível medir o estado verdadeiro de
um sistema em qualquer tempo dado.
 Na teoria do Caos tal fenômeno é chamado
– Efeito Borboleta.

CHANCE: inerente na natureza
Três grandes desenvolvimentos se deram
aproximadamente na mesma época em
meados do século XIX em três campos
distintos de averiguação.
1) O estatístico social belga Adolphe
Quetelet (1796-1874) usou os conceitos de
probabilidade ao descrever um fenômeno
social e biológico.
CHANCE: inerente na natureza
2) O botânico austríaco Gregor Mendel
(1822-1884) formulou suas leis de
hereditariedade, através de simples
mecanismos de chance, como lançar
dados.
CHANCE: inerente na natureza
3) O físico austríaco Ludwig Boltzmann (18441906) deu uma interpretação estatística para
uma das proposições mais fundamentais de
física teórica, a segunda lei da termodinâmica.
As leis básicas da física foram elas próprias
expressas
em
termos
probabilísticos,
particularmente no nível microscópico das
partículas fundamentais.
 o comportamento aleatório é considerado
como uma parte indispensável e inerente do
funcionamento normal de muitos tipos de coisas.
 modelos estocásticos foram construídos para
explicar o comportamento de sistemas dados.
 Exemplos de tais descrições são: o movimento
Browniano, cintilações causadas por radioatividade, o
princípio da incerteza de Heisenberg, as distribuições
de velocidade de Maxwell de moléculas de massas
iguais. Todas eles indicando o caminho para a
mecânica quântica.
“Nós vimos como a Física Clássica lutou em vão para
resignar-se
ao
crescimento
de
observações
quantitativas com idéias preconcebidas sobre
causalidade, derivadas da experiência de todo dia,
mas elevou-se a um nível de postulados metafísicos, e
como ela lutou uma batalha perdida contra a intrusão
da chance. Hoje a ordem foi revertida: chance
tornou-se uma noção primária, mecânica uma
expressão de suas leis quantitativas, e a evidência
esmagadora de casualidade com todos os seus
atributos no domínio da experiência ordinária é
satisfatoriamente explicada pela lei estatística dos
grandes números.” (Max Born - 1882-1970)
POSSIBILIDADE DE FALHA NO
CONHECIMENTO CIENTÍFICO

Todo conhecimento científico, sendo baseado em
evidência que é formalmente incompleta, é somente
provável e nunca absolutamente certo.
 Todas as predições baseadas em conhecimento
científico. Devem, portanto, poder falhar e, de fato,
mostrarem-se erradas a longo prazo.
 A longa história da filosofia e da ciência é em grande
parte a história da emancipação progressiva da
mente humana da teoria das verdades autoevidentes e dos postulados de certeza total com a
marca da verdade científica.

Em todo o campo da ciência os processos
matemáticos dedutivos de inferência absolutamente
certa estão sendo substituídos pelos métodos
estatísticos de inferência incerta.
Exemplos de situações em que se usa
Estatística






Mensuração das mudanças no meio-ambiente para avaliar os
efeitos do aquecimento global;
Mensuração da poluição do ar para avaliar os efeitos na
saúde da população;
Mensuração das mudanças nos padrões populacionais para
avaliar que tipos de moradia são necessários e em que
localizações;
Análise de experimentos sobre o uso de fertilizantes para
maximizar a produção de milho;
Mensuração da eficácia de diferentes medicamentos para
encontrar o melhor, e identificar efeitos colaterais;
Cálculo de quão provável duas pessoas têm o mesmo perfil
de DNA.
Exemplo: Medicamentos genéricos
Problema: verificar a eficácia do remédio que está
sendo criado, comparando-o com o que já existe
no mercado.
Legislação brasileira: dois medicamentos são
bioequivalentes se o intervalo de confiança de 90% para
x estiver entre 80 e 125%.
Etapas para o teste de
bioequivalência:

1. Clínica: os medicamentos são analisados
segundo sua monografia inscrita na Farmacopéia
Brasileira. A diferença de teor do fármaco deve
ser inferior a 5%.
 No mínimo 24 voluntários recebem os
medicamentos em períodos alternados. O n.º de
períodos é escolhido de modo a assegurar a
validade estatística.
Etapas para o teste de
bioequivalência:

3. estatística: analisa-se a variância de
CMAX (concentração máxima) e ASC
(área sob a curva) para avaliar os efeitos
de grupo, de voluntários, de período e de
tratamento.
Medidas da Concentração:
Análise dos resultados:
Concluiu-se que o remédio testado é
equivalente ao já existente.
Resumindo:
A Estatística utiliza métodos matemáticos
para solucionar problemas reais de tomada
de decisão quando há incerteza.
 Em situações nas quais poderíamos contar
unicamente com a sorte, temos um
instrumento, que nos possibilita aumentar
as chances de tomar a melhor decisão.
 Na prática, a Estatística pode ser
empregada como ferramenta fundamental
em várias outras ciências.

Formação de Graduação

A base da formação de graduação de um
estatístico deve estar fundamentada em cálculo,
álgebra linear, teoria das probabilidades e
inferência estatística, técnicas e linguagens
computacionais, métodos de análise estatística.
 Por conta da grande variedade de possibilidades
de atuação, cerca de 25% do currículo é
composto por disciplinas complementares.
Formação de Graduação

As disciplinas complementares são escolhidas de
acordo com o interesse do estudante.
 No momento temos um convênio com o Hospital
Universitário Clementino Fraga Filho, que oferece
bolsas de Iniciação Científica para alunos do curso.
 As atividades envolvem apoio aos médicos do
hospital, que têm muitos dados, mas não sabem
como analisá-los.
INSTITUTO DE MATEMÁTICA
Diretoria Adjunta de Graduação
Ciclo Básico de Ciências Atuariais e Estatística
1º
Cálculo I
Computação I
Álgebra Linear I
Análise
Exploratória de
Dados
2º
Cálculo II
Álgebra I
Álgebra Linear II
Introdução à
Estatística
3º
Cálculo III
Cálculo das
Probabilidades I
Equações
Diferenciais
Cálculo Numérico
Computação II
4º
Análise I
Cálculo das
Probabilidades II
Inferência
Estatística I
Matemática
Financeira (*)
Demografia(*)
Elementos de Física
Seminários em
Estatística e Atuária
(*) Opcional para o curso de Estatística.
Estatística: ciclo profissional
5º
Métodos Numéricos
I
Processos
Estocásticos
Inferência
Estatística II
Análise de
Regressão
Controle Estatístico
de Qualidade
6º
Técnicas de
Amostragem
Planejamento de
Experimentos
Análise Estatística
Multivariada
Estatística
Computacional
Complementar
7º
Análise de Séries
Temporais
Complementar
Complementar
Complementar
8º
Projeto Final em
Estatística
Complementar
Complementar
Complementar
Complementar
Ciências Atuariais: ciclo profissional
5º
Matemática
Atuarial I
Processos
Estocásticos
Inferência
Estatística II
Análise de Regressão
Direito Social e
Legislação de
Seguros I
Introdução à
Administração
6º
Técnicas de
Amostragem
Matemática
Atuarial II
Análise Estatística
Multivariada
Estatística
Computacional
Teoria do Risco
Introdução à
Contabilidade
7º
Análise de Séries
Temporais
Práticas Atuariais
em Seguros
Teoria da
Credibilidade
Economia
8º
Projeto Final em
Atuária
Práticas Atuariais
em Pensões
Tarifação de
Seguros
Complementar
Gerência Financeira de
Complementar
Reservas Técnicas
Pós-Graduação

O Instituto de Matemática oferece cinco pósgraduações nas áreas: matemática (mestrado
e doutorado), matemática aplicada, estatística
(mestrado e doutorado), informática e ensino
da matemática.
 Seguindo as recomendações curriculares, em 6
anos pode-se concluir a Graduação e o
Mestrado em Estatística.
A Profissão
A profissão “Estastístico” é regulamentada pelo decreto
n. 62.497, DE 1.o DE ABRIL DE 1968.
O exercício profissional é fiscalizado pelos Conselhos
Regionais de Estatística (CONRE), sob a supervisão do
Conselho Federal de Estatística
(CONFE-www.confe.com.br), o qual orienta e disciplina
o exercício da profissão de Estatística.
Sociedades Científicas
A comunidade estatística reúne-se em
sociedades científicas e profissionais. A
Associação Brasileira de Estatística (ABE www.ime.usp.br/~abe) promove vários
encontros, entre eles, o SINAPE, a cada dois
anos.
 Em www.im.ufrj.br/estatistica/linkestat.html
vocês encontrarão vários links interessantes,
relacionados à Estatística.

Estatísticos formados pela
UFRJ - onde estão?
Diversos estatísticos formados pela UFRJ são hoje
docentes em Instituições Federais e Estaduais de
Ensino Superior, tendo concluído pelo menos o
mestrado em Estatística (UFRJ, UFF, UERJ, UFPR,...).
Dois em particular atuam em universidades
americanas.
Também há vários estatísticos formados pelo IM-UFRJ
que se encontram no serviço público: IBGE, FIOCRUZ
(Fundação Oswaldo Cruz), ANAC (Agência Nacional de Aviação
Civil), Petrobras, ANS (Agência Nacional de Saúde), IRB
(Instituto de Resseguros do Brasil), na CBTU (Companhia
Brasileira de trens urbanos).
Estatísticos formados pela
UFRJ - onde estão?

Na iniciativa privada também temos
alunos egressos do curso, por
exemplo, na Telemar, na Golden
Cross, na FIRJAN (Federação das
Indústrias do Rio de Janeiro), na Sul
América, na Eletros, em companhias
de pesquisa de opinião como a LIPE,
Interação-Pesquisa, entre outras.
Bacharelado em Estatística no IM-UFRJ
Visite periodicamente página do curso para
obter outras informações importantes.
http://www.im.ufrj.br/estatistica
Seminário de 14/03/2008:
O que é Atuária?
Professora Natalie Haawinckel Hurtado - IM/UFRJ
Referências
Berquó, Souza e Gotlieb. (1981).
Bioestatística. EPU.
 Rao, C.R. (1996).Uncertainty, Statistics, and
Creation of New Knowledge. Chance. pp 5-11.
 Cordeiro, G. M. (2006). Cronologia de Alguns

Conceitos e Fatos Importantes da Estatística.

http://www.rss.org.uk/main.asp?page=0
Download