Bioinformática e Genética Animal

Propaganda
Bioinformática e Genética Animal
Pâmela A. Alexandre
Doutoranda
• Descoberta da estrutura
do DNA
» Watson e Crick, 1953
DNA
RNA
Proteína
• Projeto Genoma Humano
»
»
»
»
1990
18 países
US$ 2,7 Bi
13 anos (previsão = 15)
• Projeto Genoma Humano
• Projeto Genoma Humano
» Queda de custo em 1 década
(Revista FAPESP - 02/13)
• Projeto Genoma Humano
» Queda de custo em 1 década
• Projeto Genoma Humano
» 2008 - Sequenciadores automáticos
Sequenciamento de um
gene com 12 mil pb:
1983 - 1 ano
2000 - 20 min.
2003 – 1 min.
2016 - ?
Brasil
• 2000 – Genoma da
bactéria xylella
fastidiosa é sequencia
do por pesquisadores
paulistas e ganha a
primeira capa da
Nature para uma
pesquisa brasileira
• 12 milhões de dólares
• 192 pesquisadores –
primeira geração de
bioinformatas brasileiros
Geração de dados
Sequenciamento
Montagem
Anotação
Genoma de referência
Re-sequenciamento
Alinhamento com G. R.
Descobertas de variantes
O que é bioinformática?
• Técnicas computacionais (estatística, matemática
aplicada) para resolver problemas biológicos
(interpretação e organização)
O que é bioinformática?
O que é bioinformática?
O que é bioinformática?
Armazenamento de informação
Epigenoma
DNA
iDNA
Epitranscriptoma
RNA
iRNA
Epiproteoma
Proteína
iProteina
• Banco de dados
» Considerado uma coleção de dados inter-relacionados,
projetado para suprir as necessidades de um grupo
específico de aplicações e usuários.
http://www.oxfordjournals.org/nar/database/a/
•
•
•
•
•
•
Genbank - Banco de dados americano de seqüências de DNA e
proteína
http://www.ncbi.nlm.nih.gov/
EBI - Banco de dados europeu de seqüências de DNA
http://www.ebi.ac.uk/
PDB - Armazena estruturas tridimensionais resolvidas de
proteínas
http://www.rcsb.org/pdb
SWISS-PROT - Armazena seqüências de proteínas e suas
respectivas características moleculares, anotado anualmente por
uma equipe de especialistas
http://www.expasy.ch/spro/
KEGG - Banco com dados de seqüências de genomas de vários
organismos diferentes e informações relacionadas às suas vias
metabólicas
http://www.genome.ad.jp/kegg/
Genome Browser
http://genome.ucsc.edu
• Banco de dados
• Banco de dados
Sistema Operacional e
programação
Sistemas Operacionais
• O sistema operacional (SO) é o principal programa de um
computador. Ele é responsável pelo gerenciamento da memória,
pelo acesso aos discos e também intermedeia todo acesso aos
componentes físicos da máquina(hardware). Muitas das aplicações
utilizadas em bioinformática são compiladas e distribuídas para a
execução em plataformas derivadas do Unix, portanto o
conhecimento desse sistema operacional é de grande importância.
Sistemas Operacionais
• Linux é um sistema operacional de código aberto distribuído
gratuitamente pela internet, criado em 1991 por Linus Torvalds na
universidade de Helsinki na Finlândia.
• Atualmente, o que chamamos de “Linux” é o Kernel + um conjunto
de softwares. Essa combinação resulta no que chamamos de
Distribuições Linux.
Sistemas Operacionais
• Linux é GRATUITO, e a maioria das suas ferramentas também;
• Maioria das aplicações de Bioinformática são desenvolvidas para
Linux;
• Alto desempenho e fácil controle de processos/uso de recursos;
• Amplamente utilizado pela comunidade científica;
• Possibilidade de ser modificado significativamente para interesses
específicos;
• Excelente suporte para scripting e programação;
• Excelente suporte para clusterização, multiprocessamento,
computação distribuída;
• Número expressivo de ferramentas Open Source/Free;
Sistemas Operacionais
Programação
• As Linguagens de programação foram criadas para facilitar a
especificação de tarefas a um computador. Existem milhares de
linguagens de programação e cada uma delas possui um conjunto
de comandos específicos que criam esta interface homem-máquina.
User
Maker
Tipos de estudos
Sequenciamento
Montagem
Anotação
Genoma de referência
Re-sequenciamento
Alinhamento com G. R.
Descoberta de variações
Genotipagem
•
•
•
•
•
Indels (Inserções/Deleções)
Inversões
Translocações
Variação no número de cópias (CNVs)
Regiões repetitivas em tandem
(Mini/Microssatélites)
• Mutações
• Polimorfismos de nucleotídeo único (SNP)
SNP chip
Sequenciamento
•
•
•
•
•
•
WGS
RNAseq
miRNAseq
Exome seq
ChiPseq
Bisulfite seq
Filogenia
Filogenia
Similaridade de genoma
RNAseq
Expressão diferencial
Co-expressão
Biologia de sistemas
Human disease network
Expressão alelo específica
Descobrimento de variações
Ligação proteína-ligante
Outras aplicações
Obrigada!
[email protected]
Download