!"#$%#!&' PREDIÇÃO DE ESTRUTURAS DE PROTEÍNAS E CONSTRUÇÃO DE REDES DE INTERAÇÃO PROTEICA Marcos T. Geraldo Guilherme Valente PREDIÇÃO DE ESTRUTURAS DE PROTEÍNAS MARCOS T. GERALDO !' !"#$%#!&' Métodos para determinação de estrutura proteica Cristalografia de raio-X NMR (Nuclear magnetic resonance) Abordagens experimentais Microscopia crioeletrônica Modelagem por homologia Threading Abordagens computacionais (modelos teóricos) Ab initio Modelagem por homologia As estruturas se conservam mais durante a evolução do que a estrutura primária das proteínas. Na ausência de dados experimentais, a construção de modelos baseados na estrutura tridimensional de proteínas homólogas é um dos métodos mais confiáveis para a obtenção da informação estrutural. (' !"#$%#!&' Escolhido o template, segue-se para a etapa de geração do modelo Há vários programas que realizam modelagem por homologia Exemplo: http://salilab.org/modeller/ )' !"#$%#!&' Ab initio / de novo Construção de modelos estruturais baseado nas propriedades físicas dos aminoácidos (sem template!) Método ainda em desenvolvimento (imprecisão) Somente é possível modelar pequenos trechos de sequências É o método mais custoso computacionalmente &' !"#$%#!&' THREADING Forma intermediária entre o método de homologia e o ab initio Opera através de um reconhecimento de fold (fold recognition) Utilizado para sequências de proteínas que não possuem uma proteína homóloga no banco de dados de estrutura Lembre-se Sequências diferentes podem gerar estruturas semelhantes! No método de threading, cada aminoácido da sequência a ser modelada é posicionado (alinhado) à estrutura de um possível template É avaliado o quão bem cada aminoácido se encaixa no template Isto é feito até que o melhor template seja escolhido http://zhanglab.ccmb.med.umich.edu/I-TASSER/ *' !"#$%#!&' Análise de Interações Ligações de hidrogênio Pontes salinas Interações hidrofóbicas http://www.ebi.ac.uk/thornton-srv/software/LIGPLOT/ http://www.ebi.ac.uk/msd-srv/prot_int/pistart.html http://www.ks.uiuc.edu/Research/vmd/ http://www.cgl.ucsf.edu/chimera/ Desenvolvimento de um método de predição de interação entre proteínas usando machine learning Guilherme T. Valente FCA-UNESP [email protected] +' !"#$%#!&' Protein-protein interactions - PPIs - - Proteínas - biomoléculas mais abundantes; Atuam em todas as vias biológicas; Protein-protein interactions - PPIs - - Proteínas - biomoléculas mais abundantes; Atuam em todas as vias biológicas; - Entendimento do cerne de traços complexos; - Entendimento da interação molecular entre um patógeno e o hospedeiro; - Pode contribuir para o design de drogas; %' !"#$%#!&' PPIs – um nível do sistema Omics e biologia de sistemas Modelo computational do ciclo de vida de uma célula de M. genitalium Joyce e Palsson (2006). Nature. Karr et al. (2012). Cell. Machine learning - Definição? 1959 – Área de estudo que permite aos computadores um aprendizado sem a necessidade de ser explicitamente programado. Arthur Samuel - Stanford "' !"#$%#!&' Machine learning - Sub-área da inteligência artificial; - Lida com data mining; - Extrair padrões de um conjunto de dados Machine learning - Supervised learning - Unsupervised learning - Semisupervised learning ,' !"#$%#!&' Construção de um preditor !"#"$%&'(')'*+,"-'./)%0," """1'./)%0,2"&%'3+,2".,&%.45-,2"%"-'./)%0'2".6&'('2"-'./7&,-+'8,+2" 9"#":3%(+&'3"8;'<78+=%32,)" """:%>7%8'"78+=%32'"(%"/3'&%?8,2"%"*%3,).%8&%"%2/6-+%<%2/%-?@-'" A" #" :3'B)%.," %." ,)*782" /3'-%(+.%8&'2" .%&'(')C*+-'2" !$' s represent physical or functional evolution of some interaction or metabolic pathways, among other ical elements [3]. These networks biological aspects of a cell or organism. phering the behavior of biological Physical PPIs can be identified using experimental methods, l inference can sharply reduce the such as the yeast two-hybrid assay, mass spectrometry, protein on of novel interactions [1,3] with microarrays, phage display, X-ray crystallography, fluorescence rgets discovery, for example [3]. resonance energy transfer, surface plasmon resonance, atomic ed on similarity-based algorithms, force microscopy and electron microscopy [5]. However, these r probabilistic methods; the typical experiments, in addition to being expensive and time demanding, are concerning the reconstruction are not suitable for all proteins and do not report all interactions twork evolving mechanism, and that can occur in cells or organisms [5–7]. Therefore, a d networks [1]. In the molecular computational approach capable of reliably predicting PPIs can icted based on the node features identify the potential interactions to be further interrogated using UNISPPI ains), by the similarities of edge experimental approaches. to an appropriated model, by Several computational methods for predicting physical or ]. functional protein interactions based on the information from abundant classes of biomolecules several experimental and computational approaches, such as her biomolecules in cells, such as phylogenetic profile analysis, gene co-expression profiles, sequence ther proteins. The latter interacco-evolution, synthetic lethality data, in silico two-hybrid systems, ons (PPIs) – are essential interacgene cluster and gene neighbor analysis, protein domain responsible for the functioning of information [7,8], protein interface analysis, protein docking s [4]. Consequently, building a list methods [9,10], and orthology and ontology information [11], 1 !"#$%#!&' May 2013 | Volume 8 | Issue 5 | e65587 D3%>7%8-+,"EF"(%"-,(,",,G" 1'./'2+H;'"EF"(%"-,(,"*37/'"(%"1DG" !!' !"#$%#!&' I+2-3%5J,H;'" 400 K&3+B7&'2"#"/3'/3+%(,(%2"(%"7.,"+82&L8-+," 441 841 20 21 41 !(' !"#$%#!&' M3%+8'"('"K/3%8(+J,('"(%" $4>7+8," NAOAPQ"%0%./)'2R"&'&,)"(%"9!"%2/6-+%2"" !)' !"#$%#!&' :%3S'3.,8-%"/3%(+5=," 1'./'2+H;'"#"8;'"/'227+" ,2"+8S'3.,HT%2".,+2" 3%)%=,8&%2O" V3='3%"(%"(%-+2;'" :3+.%+3'"8?=%)" --'./0'1'!$$2'34'--'564/40748' U%*78('"8?=%)" --'9:/';'*&8&2'34'--'564/4074<' --'=>4'1'(+8*2'34'--'564/4074<' --'./0'1'!,8!2'34'--'564/40748" K28WK28X" Y)%WY)%" %" 1Z2W1Z2" /'227%." .,+'3%2" =,)'3%2" (%" ?8(+-%" (%" /3%S%3[8-+," 3%),-+'8,('2" ,2",84)+2%2"(%"-'8&,&'2"+8&%3<-,(%+,2R" \22%2" ,," %2&;'" /3%2%8&%2" 8," +8&%3S,-%R" :'8&%2" (%"(+227)S%&'"2;'"+./'3&,8&%2"/,3,"::Y2O" !&' !"#$%#!&' M%2&%"(%"1),22+@-,H;'" N9ON]A"%0%./)'2R"&'&,)"(%"^_"%2/6-+%2"" !*' !"#$%#!&' F normal consensus model F’ normal consensus model \7-,3+'8&%2" :3'-,3+'&%2" `?372" M+/'2"-%)O" ^_"%2/6-+%2" Plasmodium falciparum e humanos; virus da imuno-deficiência humana, vírus Epstein-Barr, influenza A, cytomegalovirus humano, vírus símio, hepatite de chimpanzee e humanos como hospedeiros; vírus Sendai mouse como hospedeiro; fago e Escherichia coli como hospedeiro !+' !"#$%#!&' Novidades do UNISPPI - Um dos menores atributos (20); - Baseado apenas na sequencia de aminoácidos!!!! - Revelou a importância dos atributos simétricos; - Gera “pequenos inputs” (ex. >770 milhões - ~50 Gbyte); - Um dos maiores set de treinamento; - Todos os exemplos são experimentalmente validados e incluem diversas espécies; - O maior test set e incluiu diversas espécies; - Pode ser facilmente utilizado em procedimentos em larga-escala. Uso do UNISPPI 1- Estudos de determinação e diferenciação sexual em vertebrados (Valente et al. em preparação); 2- Gerar redes PPIs de Neospora caninum (Pollo-Oliveira et al. 2013); 3- Predizer interação entre proteínas positivamente selecionadas de T. cruzy e Leischmania contra o proteoma de mamíferos (Lopez et al. em preparação); !%' !"#$%#!&' JANEIRO-2015 I curso em genômica na Engenharia de Bioprocessos e Biotecnologia Módulo: Introdução à bioinformática e suas aplicações Introdução à bioinformática; Introdução à programação em bioinformática; Tecnologias de sequenciamento de DNA; Manipulação de dados de next- generation sequencing; Anotação de transcritos e genomas; Identificação e anotação de elementos repetitivos em dados de next-gen; Princípios das análises filogenética e genômica comparativa; Filogenômica; Proteômica; ncRNAs e surgimento de genes novos; Modelagem de biomolecular: princípios e aplicações; Modelagem de biomoléculas: proteínas; Modelagem de biomoléculas: motores moleculares; Biblioteca conformacional de Anticorpos: Inovação no desenvolvimento de Vacinas; Aprendizado de máquina; Biologia de sistemas e biologia sintética: dois lados de uma mesma moeda Biologia de sistemas e biologia sintética aplicado ao estudo de bioenergia [email protected] !"'