Bioinformática e Genética Animal Pâmela A. Alexandre Doutoranda • Descoberta da estrutura do DNA » Watson e Crick, 1953 DNA RNA Proteína • Projeto Genoma Humano » » » » 1990 18 países US$ 2,7 Bi 13 anos (previsão = 15) • Projeto Genoma Humano • Projeto Genoma Humano » Queda de custo em 1 década (Revista FAPESP - 02/13) • Projeto Genoma Humano » Queda de custo em 1 década • Projeto Genoma Humano » 2008 - Sequenciadores automáticos Sequenciamento de um gene com 12 mil pb: 1983 - 1 ano 2000 - 20 min. 2003 – 1 min. 2016 - ? Brasil • 2000 – Genoma da bactéria xylella fastidiosa é sequencia do por pesquisadores paulistas e ganha a primeira capa da Nature para uma pesquisa brasileira • 12 milhões de dólares • 192 pesquisadores – primeira geração de bioinformatas brasileiros Geração de dados Sequenciamento Montagem Anotação Genoma de referência Re-sequenciamento Alinhamento com G. R. Descobertas de variantes O que é bioinformática? • Técnicas computacionais (estatística, matemática aplicada) para resolver problemas biológicos (interpretação e organização) O que é bioinformática? O que é bioinformática? O que é bioinformática? Armazenamento de informação Epigenoma DNA iDNA Epitranscriptoma RNA iRNA Epiproteoma Proteína iProteina • Banco de dados » Considerado uma coleção de dados inter-relacionados, projetado para suprir as necessidades de um grupo específico de aplicações e usuários. http://www.oxfordjournals.org/nar/database/a/ • • • • • • Genbank - Banco de dados americano de seqüências de DNA e proteína http://www.ncbi.nlm.nih.gov/ EBI - Banco de dados europeu de seqüências de DNA http://www.ebi.ac.uk/ PDB - Armazena estruturas tridimensionais resolvidas de proteínas http://www.rcsb.org/pdb SWISS-PROT - Armazena seqüências de proteínas e suas respectivas características moleculares, anotado anualmente por uma equipe de especialistas http://www.expasy.ch/spro/ KEGG - Banco com dados de seqüências de genomas de vários organismos diferentes e informações relacionadas às suas vias metabólicas http://www.genome.ad.jp/kegg/ Genome Browser http://genome.ucsc.edu • Banco de dados • Banco de dados Sistema Operacional e programação Sistemas Operacionais • O sistema operacional (SO) é o principal programa de um computador. Ele é responsável pelo gerenciamento da memória, pelo acesso aos discos e também intermedeia todo acesso aos componentes físicos da máquina(hardware). Muitas das aplicações utilizadas em bioinformática são compiladas e distribuídas para a execução em plataformas derivadas do Unix, portanto o conhecimento desse sistema operacional é de grande importância. Sistemas Operacionais • Linux é um sistema operacional de código aberto distribuído gratuitamente pela internet, criado em 1991 por Linus Torvalds na universidade de Helsinki na Finlândia. • Atualmente, o que chamamos de “Linux” é o Kernel + um conjunto de softwares. Essa combinação resulta no que chamamos de Distribuições Linux. Sistemas Operacionais • Linux é GRATUITO, e a maioria das suas ferramentas também; • Maioria das aplicações de Bioinformática são desenvolvidas para Linux; • Alto desempenho e fácil controle de processos/uso de recursos; • Amplamente utilizado pela comunidade científica; • Possibilidade de ser modificado significativamente para interesses específicos; • Excelente suporte para scripting e programação; • Excelente suporte para clusterização, multiprocessamento, computação distribuída; • Número expressivo de ferramentas Open Source/Free; Sistemas Operacionais Programação • As Linguagens de programação foram criadas para facilitar a especificação de tarefas a um computador. Existem milhares de linguagens de programação e cada uma delas possui um conjunto de comandos específicos que criam esta interface homem-máquina. User Maker Tipos de estudos Sequenciamento Montagem Anotação Genoma de referência Re-sequenciamento Alinhamento com G. R. Descoberta de variações Genotipagem • • • • • Indels (Inserções/Deleções) Inversões Translocações Variação no número de cópias (CNVs) Regiões repetitivas em tandem (Mini/Microssatélites) • Mutações • Polimorfismos de nucleotídeo único (SNP) SNP chip Sequenciamento • • • • • • WGS RNAseq miRNAseq Exome seq ChiPseq Bisulfite seq Filogenia Filogenia Similaridade de genoma RNAseq Expressão diferencial Co-expressão Biologia de sistemas Human disease network Expressão alelo específica Descobrimento de variações Ligação proteína-ligante Outras aplicações Obrigada! [email protected]