Introdução à Bioinformática Ricardo de Godoi M. Ferreira Laboratório de Epidemiologia Genética Instituto de Ciências Biomédicas Universidade de São Paulo “Bio” o quê? Bioinformática Biologia computacional Computação aplicada à biologia DNA - Deoxyribonucleic acid Watson e Crick, 1953 http://www.nature.com/nature/dna50/ index.html Rosalind Franklin? Dogma central da biologia A origem e o sentido da bioinformática João Carlos Setubal (coordenador do Laboratório de Bioinformática da Unicamp ) em: http://www.comciencia.br/reportagens/bioin formatica/bio10.shtml Problemas de 2 tipos: – Biotecnológicos (ex: montagem de genomas) – DNA como uma linguagem e entender os efeitos da informação genética Primeiras bases de dados Em 1960, Dayhoff e colaboradores construíram um catálogo contendo todas as seqüências de proteínas conhecidas até a data. “Atlas of Protein Sequences and Structure”, de 1965. O conteúdo dessa base de dados não deveria conter mais de 1Mb de informação, se transferida para computadores modernos (Baxevanis e Ouellette, 2001). Com o advento do sequenciamento do DNA e, principalmente, a partir da década de 1990, do sequenciamento em larga escala, foi necessária a construção de bancos de dados mais robustos para abrigar a explosão no número de seqüências obtidas pelos pesquisadores. O NCBI, por exemplo, foi criado pelo NIH em 1988 para abrigar esse tipo de informação (Wheller et al., 2002). Bases de dados INSDC (International Nucleotide Sequence Database Colaboration): 100.000.000.000 bases ! • • • NCBI - National Center for Biotechnology Information (Criado em 1988 pelo NIH) EMBL - European Molecular Biology Laboratory DDJB - DNA Data Bank of Japan http://www.nlm.nih.gov/news/press_release s/dna_rna_100_gig.html Classificação das bases de dados biológicos Primários: – GenBank, EMBL (Stoesser et al., 2002) e PDB (Westbrook et al., 2002) Secundários: – SWISS-PROT e o TrEMBL (Bairoch e Apweiler, 2002) GenBank Crescimento exponencial do número de seqüências contidas no GenBank ao longo das duas últimas décadas. Obtido em http://www.ncbi.nlm.nih.gov/ Genbank/genbankstats.html Recursos disponíveis na internet http://www.ncbi.nlm.nih.gov/genome/ guide/human/ http://www.icb.ufmg.br/~franc/ http://www.comciencia.br/reportagens /bioinformatica/bio01.shtml Como chegar a esses sites? WWW.GOOGLE.COM!!!