predição de estruturas de proteínas e construção de - IBB

Propaganda
!"#$%#!&'
PREDIÇÃO DE ESTRUTURAS
DE PROTEÍNAS E
CONSTRUÇÃO DE REDES DE
INTERAÇÃO PROTEICA
Marcos T. Geraldo
Guilherme Valente
PREDIÇÃO DE
ESTRUTURAS DE
PROTEÍNAS
MARCOS T. GERALDO
!'
!"#$%#!&'
Métodos para determinação de
estrutura proteica
Cristalografia de raio-X
NMR (Nuclear magnetic resonance)
Abordagens experimentais
Microscopia crioeletrônica
Modelagem por homologia
Threading
Abordagens computacionais
(modelos teóricos)
Ab initio
Modelagem por homologia
As estruturas se conservam mais durante a evolução do que a estrutura
primária das proteínas.
Na ausência de dados experimentais, a construção de modelos
baseados na estrutura tridimensional de proteínas homólogas é um dos
métodos mais confiáveis para a obtenção da informação estrutural.
('
!"#$%#!&'
Escolhido o template, segue-se para a etapa de geração
do modelo
Há vários programas que realizam modelagem por
homologia
Exemplo:
http://salilab.org/modeller/
)'
!"#$%#!&'
Ab initio / de novo
Construção de modelos estruturais baseado nas
propriedades físicas dos aminoácidos (sem template!)
Método ainda em desenvolvimento (imprecisão)
Somente é possível modelar pequenos trechos de
sequências
É o método mais custoso computacionalmente
&'
!"#$%#!&'
THREADING
Forma intermediária entre o método de homologia e o ab initio
Opera através de um reconhecimento de fold (fold recognition)
Utilizado para sequências de proteínas que não possuem uma proteína
homóloga no banco de dados de estrutura
Lembre-se
Sequências diferentes podem gerar estruturas
semelhantes!
No método de threading, cada aminoácido da sequência a ser modelada é
posicionado (alinhado) à estrutura de um possível template
É avaliado o quão bem cada aminoácido se encaixa no template
Isto é feito até que o melhor template seja escolhido
http://zhanglab.ccmb.med.umich.edu/I-TASSER/
*'
!"#$%#!&'
Análise de Interações
Ligações de hidrogênio
Pontes salinas
Interações hidrofóbicas
http://www.ebi.ac.uk/thornton-srv/software/LIGPLOT/
http://www.ebi.ac.uk/msd-srv/prot_int/pistart.html
http://www.ks.uiuc.edu/Research/vmd/
http://www.cgl.ucsf.edu/chimera/
Desenvolvimento de um
método de predição de
interação entre proteínas
usando machine learning
Guilherme T. Valente
FCA-UNESP
[email protected]
+'
!"#$%#!&'
Protein-protein interactions - PPIs
- 
- 
Proteínas - biomoléculas mais
abundantes;
Atuam em todas as vias biológicas;
Protein-protein interactions - PPIs
- 
- 
Proteínas - biomoléculas mais
abundantes;
Atuam em todas as vias biológicas;
-  Entendimento do cerne de traços
complexos;
-  Entendimento da interação molecular
entre um patógeno e o hospedeiro;
-  Pode contribuir para o design de drogas;
%'
!"#$%#!&'
PPIs – um nível do sistema
Omics e biologia de sistemas
Modelo computational do ciclo de
vida de uma célula de M. genitalium
Joyce e Palsson (2006). Nature.
Karr et al. (2012). Cell.
Machine learning
-  Definição?
1959 – Área de estudo que permite aos
computadores um aprendizado sem a
necessidade de ser explicitamente programado.
Arthur Samuel - Stanford
"'
!"#$%#!&'
Machine learning
-  Sub-área da inteligência artificial;
-  Lida com data mining;
-  Extrair padrões de um conjunto de dados
Machine learning
- Supervised learning
- Unsupervised learning
- Semisupervised learning
,'
!"#$%#!&'
Construção de um preditor
!"#"$%&'(')'*+,"-'./)%0,"
"""1'./)%0,2"&%'3+,2".,&%.45-,2"%"-'./)%0'2".6&'('2"-'./7&,-+'8,+2"
9"#":3%(+&'3"8;'<78+=%32,)"
""":%>7%8'"78+=%32'"(%"/3'&%?8,2"%"*%3,).%8&%"%2/6-+%<%2/%-?@-'"
A" #" :3'B)%.," %." ,)*782" /3'-%(+.%8&'2"
.%&'(')C*+-'2"
!$'
s represent physical or functional
evolution of some interaction or metabolic pathways, among other
ical elements [3]. These networks
biological aspects of a cell or organism.
phering the behavior of biological
Physical PPIs can be identified using experimental methods,
l inference can sharply reduce the
such as the yeast two-hybrid assay, mass spectrometry, protein
on of novel interactions [1,3] with
microarrays, phage display, X-ray crystallography, fluorescence
rgets discovery, for example [3].
resonance energy transfer, surface plasmon resonance, atomic
ed on similarity-based algorithms,
force microscopy and electron microscopy [5]. However, these
r probabilistic methods; the typical
experiments, in addition to being expensive and time demanding,
are concerning the reconstruction
are not suitable for all proteins and do not report all interactions
twork evolving mechanism, and
that can occur in cells or organisms [5–7]. Therefore, a
d networks [1]. In the molecular
computational approach capable of reliably predicting PPIs can
icted based on the node features
identify the potential interactions to be further interrogated using
UNISPPI
ains), by the similarities of edge
experimental approaches.
to an appropriated model, by
Several computational methods for predicting physical or
].
functional protein interactions based on the information from
abundant classes of biomolecules
several experimental and computational approaches, such as
her biomolecules in cells, such as
phylogenetic profile analysis, gene co-expression profiles, sequence
ther proteins. The latter interacco-evolution, synthetic lethality data, in silico two-hybrid systems,
ons (PPIs) – are essential interacgene cluster and gene neighbor analysis, protein domain
responsible for the functioning of
information [7,8], protein interface analysis, protein docking
s [4]. Consequently, building a list
methods [9,10], and orthology and ontology information [11],
1
!"#$%#!&'
May 2013 | Volume 8 | Issue 5 | e65587
D3%>7%8-+,"EF"(%"-,(,",,G"
1'./'2+H;'"EF"(%"-,(,"*37/'"(%"1DG"
!!'
!"#$%#!&'
I+2-3%5J,H;'"
400
K&3+B7&'2"#"/3'/3+%(,(%2"(%"7.,"+82&L8-+,"
441
841
20
21
41
!('
!"#$%#!&'
M3%+8'"('"K/3%8(+J,('"(%"
$4>7+8,"
NAOAPQ"%0%./)'2R"&'&,)"(%"9!"%2/6-+%2""
!)'
!"#$%#!&'
:%3S'3.,8-%"/3%(+5=,"
1'./'2+H;'"#"8;'"/'227+"
,2"+8S'3.,HT%2".,+2"
3%)%=,8&%2O"
V3='3%"(%"(%-+2;'"
:3+.%+3'"8?=%)"
--'./0'1'!$$2'34'--'564/40748'
U%*78('"8?=%)"
--'9:/';'*&8&2'34'--'564/4074<'
--'=>4'1'(+8*2'34'--'564/4074<'
--'./0'1'!,8!2'34'--'564/40748"
K28WK28X" Y)%WY)%" %" 1Z2W1Z2" /'227%." .,+'3%2"
=,)'3%2" (%" ?8(+-%" (%" /3%S%3[8-+," 3%),-+'8,('2"
,2",84)+2%2"(%"-'8&,&'2"+8&%3<-,(%+,2R"
\22%2" ,," %2&;'" /3%2%8&%2" 8," +8&%3S,-%R" :'8&%2"
(%"(+227)S%&'"2;'"+./'3&,8&%2"/,3,"::Y2O"
!&'
!"#$%#!&'
M%2&%"(%"1),22+@-,H;'"
N9ON]A"%0%./)'2R"&'&,)"(%"^_"%2/6-+%2""
!*'
!"#$%#!&'
F normal consensus
model
F’ normal consensus
model
\7-,3+'8&%2"
:3'-,3+'&%2"
`?372"
M+/'2"-%)O"
^_"%2/6-+%2"
Plasmodium falciparum e humanos; virus da imuno-deficiência humana, vírus Epstein-Barr, influenza A,
cytomegalovirus humano, vírus símio, hepatite de chimpanzee e humanos como hospedeiros; vírus Sendai
mouse como hospedeiro; fago e Escherichia coli como hospedeiro
!+'
!"#$%#!&'
Novidades do UNISPPI
-  Um dos menores atributos (20);
-  Baseado apenas na sequencia de aminoácidos!!!!
-  Revelou a importância dos atributos simétricos;
-  Gera “pequenos inputs” (ex. >770 milhões - ~50 Gbyte);
-  Um dos maiores set de treinamento;
-  Todos os exemplos são experimentalmente validados e incluem diversas
espécies;
-  O maior test set e incluiu diversas espécies;
-  Pode ser facilmente utilizado em procedimentos em larga-escala.
Uso do UNISPPI
1- Estudos de determinação e diferenciação sexual em vertebrados (Valente et al. em
preparação);
2- Gerar redes PPIs de Neospora caninum (Pollo-Oliveira et al. 2013);
3- Predizer interação entre proteínas positivamente selecionadas de T. cruzy e
Leischmania contra o proteoma de mamíferos (Lopez et al. em preparação);
!%'
!"#$%#!&'
JANEIRO-2015
I curso em genômica na Engenharia de Bioprocessos
e Biotecnologia
Módulo: Introdução à bioinformática e suas aplicações
Introdução à bioinformática;
Introdução à programação em bioinformática;
Tecnologias de sequenciamento de DNA;
Manipulação de dados de next- generation sequencing;
Anotação de transcritos e genomas;
Identificação e anotação de elementos repetitivos em dados de next-gen;
Princípios das análises filogenética e genômica comparativa;
Filogenômica;
Proteômica;
ncRNAs e surgimento de genes novos;
Modelagem de biomolecular: princípios e aplicações;
Modelagem de biomoléculas: proteínas;
Modelagem de biomoléculas: motores moleculares;
Biblioteca conformacional de Anticorpos: Inovação no desenvolvimento de
Vacinas;
Aprendizado de máquina;
Biologia de sistemas e biologia sintética: dois lados de uma mesma moeda
Biologia de sistemas e biologia
sintética aplicado ao estudo de
bioenergia
[email protected]
!"'
Download