Seqüenciamento e genômica Descrição rápida de algumas estratégias de seqüenciamento e anotação. Alguns genomas... Haemophilus influenzae, Science 1995: – “Whole genome random sequencing na Assembly of Haemophilus influenzae Rd.” No Brasil, Xylella fastidiosa, Nature 2000 – The genome sequence of the plant pathogen “Xylella fastidiosa.” Genoma humano: Science e Nature, fevereiro de 2001 Shotgun Shotgun hierárquico ESTs Etiquetas de genes expressos – Expressed sequence tags Biblioteca de cDNA – mRNA amplificados por uma transcriptase reversa clonado em plasmídeos Permite comparações entre tecidos ou ciclos/fases da vida do organismo (estudos de expressão) ORESTES – ORF ESTs PCR inespecífico Dias-Neto (2000) – PNAS 97(7):3491 Vetores... YAC BAC – Cosmídeos Plasmídeos Base calling Base calling PHRED – um dos programas mais utilizados PHRED quality = - 10 log (Pe) Regiões de baixa qualidade Base calling Pe PHRED Quality 0,1 10 0,01 20 0,001 30 O,0001 40 0,00001 50 0,000001 60 Mascaramento de vetores e “trimming” Mascaramento das seqüências de baixa qualidade “trimming” – remoção dos primers Mascaramento das seqüências dos vetores de clonagem – Cross Match – compara a seqüência obtida com um banco de dados de seqüências a serem removidas Agrupamento de seqüências PHRAP CAP3 TIGR Assembler Formação de contigs GAPS!!! Agrupamento de seqüências - Gaps Seqüências repetitivas: AAATTAAA; AAAGGAAA; AAACCAAA AAAGGAAACCAAATTAAA? AAAGGAAATTAAACCAAA? AAACCAAAGGAAATTAAA? AAATTAAACCAAAGGAAA???? Agrupamento de seqüências - Gaps Segmentos do genoma não clonado – Incompatibilidade com o vetor? – Acaso? – Genes letais? Agrupamento de seqüências - Visualização PHRAP View CONSED Agrupamento de seqüências - Visualização Interface do programa Consed Anotação O que diz essa sopa de As,Ts,Gs,Cs??? Anotação O que diz essa sopa de As,Ts,Gs,Cs??? Buscas por similaridade Programas de previsão ORFs GENESCAN, GENOMESCAN Sabiá, para anotação de bactérias, LNCC Bancos de dados biológicos!!! Depois do genoma??? OMAS: – Genoma; – Transcriptoma; – Proteoma; Estudos de expressão gênica: ESTs, ORESTEs; Microarrays; SAGE; ... Quantos genomas (10/2004)? 1.628 de vírus 174 de bactérias e arqueobactérias 20 de eucariotos Francisco Prosdocimi e Fabrício R. Santos. Sobre bioinformática, genoma e ciência. Ciência Hoje, 35 (209):54-57. 2004.