Introdução à Bioinformática

Propaganda
Introdução à
Bioinformática
Ricardo de Godoi M. Ferreira
Laboratório de Epidemiologia Genética
Instituto de Ciências Biomédicas
Universidade de São Paulo
“Bio” o quê?



Bioinformática
Biologia computacional
Computação aplicada à biologia
DNA - Deoxyribonucleic
acid



Watson e Crick, 1953
http://www.nature.com/nature/dna50/
index.html
Rosalind Franklin?
Dogma central da biologia
A origem e o sentido da
bioinformática


João Carlos Setubal (coordenador do
Laboratório de Bioinformática da Unicamp )
em:
http://www.comciencia.br/reportagens/bioin
formatica/bio10.shtml
Problemas de 2 tipos:
– Biotecnológicos (ex: montagem de genomas)
– DNA como uma linguagem e entender os
efeitos da informação genética
Primeiras bases de dados


Em 1960, Dayhoff e colaboradores construíram um catálogo
contendo todas as seqüências de proteínas conhecidas até a
data. “Atlas of Protein Sequences and Structure”, de 1965. O
conteúdo dessa base de dados não deveria conter mais de
1Mb de informação, se transferida para computadores
modernos (Baxevanis e Ouellette, 2001).
Com o advento do sequenciamento do DNA e, principalmente,
a partir da década de 1990, do sequenciamento em larga
escala, foi necessária a construção de bancos de dados mais
robustos para abrigar a explosão no número de seqüências
obtidas pelos pesquisadores. O NCBI, por exemplo, foi criado
pelo NIH em 1988 para abrigar esse tipo de informação
(Wheller et al., 2002).
Bases de dados


INSDC (International Nucleotide Sequence
Database Colaboration):
100.000.000.000 bases !
•
•
•

NCBI - National Center for Biotechnology
Information (Criado em 1988 pelo NIH)
EMBL - European Molecular Biology Laboratory
DDJB - DNA Data Bank of Japan
http://www.nlm.nih.gov/news/press_release
s/dna_rna_100_gig.html
Classificação das bases de
dados biológicos

Primários:
– GenBank, EMBL (Stoesser et al., 2002) e
PDB (Westbrook et al., 2002)

Secundários:
– SWISS-PROT e o TrEMBL (Bairoch e
Apweiler, 2002)
GenBank

Crescimento exponencial do número de seqüências contidas no GenBank ao longo das duas
últimas décadas. Obtido em http://www.ncbi.nlm.nih.gov/ Genbank/genbankstats.html
Recursos disponíveis na
internet



http://www.ncbi.nlm.nih.gov/genome/
guide/human/
http://www.icb.ufmg.br/~franc/
http://www.comciencia.br/reportagens
/bioinformatica/bio01.shtml
Como chegar a esses sites?
 WWW.GOOGLE.COM!!!
Download