30/05/16 NG110 Métodos Computacionaisem Bioinformá9ca IntroduçãoaBiologiadeSistemas Prof. Renato Vicentini – [email protected] • • • • NG264 Princípiosda BiologiadeSistemas • Introdução • ConceitosbásicosdeBiologiadeSistemas Prof. Renato Vicentini – [email protected] OmétodocienGfico AcomplexidadenaBiologia Observaçãodosistemadeinteresse; Desenvolvimentodehipótesessobreosistemaobservado; Prediçõesbaseadasnashipótesespropostas; Conduçãodeexperimentosquevalidemouinvalidema predição(econseqüentementeashipóteses); • Abiologiaéumadisciplinaexperimental; • Masbonsexperimentossãooresultadodeelucubrações, planejamentoeanálisesconsideráveis; • Comastecnologiasexperimentaissetornandomais complexas,estestrêspassosdemandamcadavezmaisouso dointelecto; • Comoresultado,aconstruçãodemodeloscomputacionaisea analisesdestesmodelossetornamparteintegraldabiologia; AcomplexidadenaBiologia OciclodeumapesquisaemBiologia Molecular • Theoristvs.experimentalistjokes. Bancosde dados/literatura – Experimentalistsobservethingsthatcannotbeexplained – Theore9ciansexplainthingsthatcannotbeobserved Analisede dados • Theonlytruescienceisphysics,everythingelseisstamp collec9ng Experimentospara testarashipóteses Construção domodelo Analisedo modelo Planejamento experimental Ernest Rutherford Formulação dehipóteses 1 30/05/16 BiologiadeSistemas • AdisciplinadaBiologiadeSistemasexamina: – comooscomponentesbiológicos,emumacélulaouorganismo, interagemeproduzemredesdeinteração; – comoasredesfornecemafunçãocelularnecessáriaparaofenó9po observado. Anecessidadedaintegraçãodaspartes BiologiadeSistemas • Premissa: – Acomplexidadedabiologiapodesercompreendidaemtermosda organizaçãodeseuscomponentes(“designprinciples”); • Generalizando: – Porqueumsistemaéconstruídodaformaemqueeleé? Circuitosgené9cos • Funçõescelularessãoresultantesdeumaaçãocoordenada doprodutosdemúl9plosgenes; OparadigmadaBiologiadeSistemas AsduasraízesdaBiologiadeSistemas OsquatropassosprincipaisnaimplementaçãodaBiologiadeSistemas.Notemqueo segundopassoéúnicoeéainterfaceentredadosHTeanalisesinsilico. 2 30/05/16 Compreendendoosistemabiológicocomoum sistema • Iden9ficaçãodaestruturadosistema: – Relacionamentoentreoscomponentes(genes,proteínas,etc); – Microarrays,qRT-PCR,PPI; • Analisedocomportamentodosistema: Iden9ficaçãodaestruturadosistema • Bo/on-up: – Compilaçãodedadosexperimentaisindependentes; • Top-down: – DadosHT; – Respostaaes9mulo; • Controledosistema: – Perturbação; • Design: – Biologiasinté9ca; ABiologianotempoenoespaço • Adescriçãodeen9dadesbiológicasesuaspropriedades abrangemdiferentesníveisdeorganizaçãoediferentes escalasdetempo; Oqueéummodelo? ModeloseModelagem • Seobservarmososprocessosbiológicos,seremos confrontadoscomváriosprocessoscomplexosquenão podemserexplicadospelosprincípiosbásicosdabiologia,e osresultadosnãopodemserprevistosintui9vamente; • Amodelagemmatemá9caeasimulaçãocomputacional podemnosajudaraentenderanaturezainternaeadinâmica destesprocessos; Oqueéummodelo? • Algunsmodelospodemseraplicadosamuitoselementos similares: – Ciné9cadeMichaelis-Menten:váriasenzimas; – TF-promotor:váriosgenes; • Enquantooutrossãoespecíficosdeumelementoem par9cular: – Modelo3Ddeumaproteína; • Resolvendoasequações,sãoob9dasprediçõesdaconcentração/tempo. Seestasprediçõesnãocorroboramosdadosexperimentais,istoquer dizerqueomodeloestaerradooumuitosimplificado. 3 30/05/16 Oqueéummodelo? Duasestratégiasdemodelagemmatemá9ca • Osmodelossãogeralmentebaseadosemleishsicasbem definidas: – ex:termodinâmicadasreaçõesquímicas; Métodoexploratório Testaahipótese “Assumindoestasinterações,podeo sistemasecomportardaformacomo observamos?” Métodopredi9vo Extrapolação “Oqueacontecesenocautearmos estesgenes?” Classesderedesbiológicas BiologiadeSistemas BiologiadeSistema BiologiadeSistema • Osistemadeveserdescrito igualmentetantononíveldos genes,dasviasbioquímicas, dasorganelas,dascélulas,dos órgãos,doorganismo,eda comunidadeeambiente (ecossistema). • Aumentodecomplexidade quandonosmovemosda escalamolecularparaaescala doorganismocomoumtodo. • Estudarprocessosemlargaescala: – nãocomomecanismosindividuais,masapar9rdeinteraçõese regulações. • Aunidadefundamentaldosprocessosbiológicoséacélula. • Amelhorformadeconstruirumapontedabiologiamolecular paraafisiologiaéreconhecerqueasredesdeinteração formamumsistemadinâmicoqueevoluinoespaçoeno tempodeacordocomleisfundamentais. • Integrarinformaçõescomplexasealtamentediversasemuma mesmaestruturaconceitual: – sendoestaholís9ca,quan9ta9vaepredi9va. 4 30/05/16 Redesderegulação ... Signal1 Signal2 Signal3 Signal4 SignalN Environment Transcrip9on factors ConceitosbásicosdeBiologiade Sistemas X2 gene2 gene3 X3 ... Xm genes gene1 Prof. Renato Vicentini – [email protected] Redesderegulação gene4 gene5 gene6 ...genek Redesderegulação promoter X DNA X1 X Ac3vator Y geneY Xbindingsite protein Y Y Y Sx X TRANSLATION mRNA geneY RNApolymerase geneY Y X* X* TRANSCRIPTION Y INCREASEDTRANSCRIPTION Boundac3vator Redesderegulação RedederegulaçãoemE.coli X Boundrepressor Y • Representaçãode20%dasinteraçõestranscricionais conhecidas. Sx X X* NOTRANSCRIPTION X* Y Boundrepressor Unboundrepressor X Y Y Y 5 30/05/16 Modelagemdesistemasdinâmicos Modelagemdesistemasdinâmicos • Descreveaevoluçãotemporaldeumsistemausandoum conjuntofixoderegras: – ODEderivaçãodeumaciné9caenzimá9ca; Modelagemdesistemasdinâmicos EquaçãodeMichaelis-Menten • Aobtençãodedadosquan9ta9vosnabiologiacomeçoua cercadeumséculoatrás; • QuandoMichaeliseMentenpublicaramseutrabalhosobre osmecanismosdaciné9caenzimá9ca(1913); • Elesmostraramqueataxadeumareaçãoenzimá9caé hiperbólicaedependedaconcentraçãodosubstrato; • Basedamaiorpartedaciné9caenzimá9camono-substrato; Curva de saturação para uma enzima mostrando a relação entre a concentração do substrato e a velocidade de reação. Km (constante de Michaelis) é definida como a concentração para a qual a velocidade da reação enzimática é metade de Vmax Oqueéumsistema? • Linearidadevsnão-linearidade Comportamentodesistemasdinâmicos Função linear de uma única entrada Função não-linear de uma única entrada • Analisedocomportamentodesistemasdinâmicos: – Funçãolineardeumaúnicaentrada – Funçãonão-lineardeumaúnicaentrada 6 30/05/16 Linearidadevsnão-linearidade • Ocomportamentodesistemasnãolineareségeralmente dihcildepredizer; • Sistemasnãolinearessãoanorma,enãoaexceçãoem biologia; • GRNeredesdeinteraçãobioquímicasapresentam geralmenteumcomportamentodinâmiconão-linear; Modelagemciné9cadereaçõesenzimá9cas • OmodelodeMichaelis-Mentenparaataxadeumareação irreversíveldeumsubstratoéparteintegraldabioquímica; • Massac9onratelaw; Leidaaçãodasmassas • Ataxadeumareaçãoéproporcionalaprobabilidadede colisãodosreagentes; • Ouseja: Modelagemdesistemasdinâmicos • Funçãolineardeduasentradas; • ConsidereumgeneGreguladopordoisfatoresdetranscrição AeB; – proporcionalaconcentraçãodosubstrato; A B G B* A*eB* A* Funçãolineardeduasentradas; • SeAeBregulamGdeformaindependente,oefeito combinadodosdoisemGseráadi9vo; Funçãonãolineardeduasentradas • SeAeBinteragementreeles,opadrãodeexpressãodeG nãoéasimplessomadopadrãodeexpressãodeAeB. • AregulaçãodeGporAeBnãoélinear; A B G B* A*eB* Padrãode expressão deG A* B* A*eB* GapresentaumafunçãolineardeAeB A* 7 30/05/16 Funçãonãolineardeduasentradas Sistemasnãolineares • AeBsozinhosnãosãocapazesdeexplicaraexpressãodeG; • Interaçõesnãolinearesdeelementoscissãocomunsno desenvolvimentocelular; • Variáveisdeumafunçãonãolinearseafetamentresie influenciamnoresultado; B* A*eB* A* Sistemasnãolineares Sistemasnãolineares • Considereumcenárionoqualcélulasdeinteresseestãoem suspensão(ex:sangue); • ImaginequeAeBsãoiniciadoresdeduasviasdesinalização diferentes; • Exp1:A9vamosapenasaviadesinalizaçãoAemedimosG; • Exp2:A9vamosapenasaviadesinalizaçãoBemedimosG; A B • Nosdoiscasos,Gnãofoia9vado; • ErroneamenteconcluímosqueasviasAeBnãoregulamG; • Estaconclusãoestariacorretaapenasparaumsistemalinear ondeAeBatuamdeformaindependente; G Sistemasnãolineares • Narealidade,AeBpodeminteragireregularGdeformanão linear; • Estadificuldadeempredizerocomportamentodeum sistema,fazcomquesejanecessárioumplanejamento experimentalcuidadoso; • SenóssabemosqueAeBsãoa9vadores,umconjuntode experimentosmaisinforma9voseriacomeçarcomcélulas ondeasduasviasestãoa9vaseentãodesa9varumaviade cadavez. • Masseumfora9vadoreooutrorepressor? Sistemasnãolineares • Oconjuntodecomponentesdeterminaoestadodosistema; • Sistemaspodemser: • complicados(númerodecomponentes); • complexos(comportamentosdihceisdeimaginar); • Algumassistemaspodemsertãocomplexosquechegamaser contra-intui9vos: • comportamentoemergente; 8 30/05/16 Comportamentoemergente Comportamentoemergente • Pontosrandomicamentedistribuídosseauto-organizamem umcirculoaolongodotempo; • Apenasduasregrassimples: – Ficarpróximoaseusdoisvisinhosmaispróximos; – Distanciar-sedetodososoutrospontos; • Nãoexisteumadefiniçãoexplicitaparaformaocirculo; Comportamentoemergente • Aformaçãodocirculoéumapropriedadeemergenteda interaçãodosagentesautônomos; Comportamentoemergente • Nãoexistenadademágiconestaspropriedades; • Nesteexemploasregras: – Maximizamaáreatotal; – Minimizamadistanciaentreosvizinhosmaispróximos; • Umapropriedadebemconhecidadoscírculos; Porquedesenvolvermodelos? • Imaginequeatranscriçãodeumgenedeinteresseseja a9vadaporumcomplexoformadoportrêsproteínas; • Umadestasproteínasatuacomoscaffoldparaasoutrasduas; • Apenasoul9mocasoécapazdea9varatranscrição; • Vamosconsiderarqueaconcentraçãodastrêsproteínasé estacionaria(steadystate); • U9lizandomassac9onkine9csnóspodemoscalculara concentraçãoestacionariaparaocomplexo; Porquedesenvolvermodelos? • Anãolinearidadelevaacomportamentosurpreendentes; Comoesperadoaconcentraçãosegueuma simplesciné9cadesaturação 9 30/05/16 Porquedesenvolvermodelos? • Variandoaproporçãodaconcentraçãofinaldastrês proteínas: – Afetaoestadoestacionáriodocomplexo; Efeitobifásico • Éomecanismoparaaregulaçãodasinalizaçãonaviadas MAPkinases; Porquedesenvolvermodelos? • Noexperimentoacimanãoserápossívelverificaro comportamentobifásico; • Aconcentraçãodoscaffoldnuncaserámaiorqueadasoutras proteínas; Comportamentosurpreendente • Dependênciadaconcentraçãodocomplexoemrelação concentraçãototaldaproteínascaffold. • Surpreendentementeaconcentraçãodocomplexocaia medidaqueaconcentraçãodoscaffoldaumentaemrelaçãoa concentraçãodasproteínasvermelhaeverde. Porquedesenvolvermodelos? • Vamossuporqueastrêsproteínassãonecessáriasparaa9var atranscrição; • Masnosnãosabemosqueumaéumscaffold; • Precisaríamoscomeçarumexperimentocomquan9dade iguaisdastrêsproteínas; • Entãoirdiminuindoaconcentraçãodecadaumadas proteínasemedirodecréscimonaconcentraçãodo complexo; Somentemodelosmecanis9camentecorretos realizamboaspredições Modelo simulado Interpolação – predições dentro das amostras Extrapolação– predições fora dos dados 10 30/05/16 Porquedesenvolvermodelos? • Todososmodelossãoaproximações; • Novosexperimentosdevemsermontadosparatestaro modelo; • Falhasnomodelopodemauxiliarnodesenhodenovos experimentos; Oqueéummodelo? • Étudoaquiloqueéu9lizadocomoumsubs9tutoparao sistemaquedesejamosentender; • U9lizadoparavisualizarsistemascomplexo; • Explorarseuscomportamentosemcondiçõesdeinteresse; Oqueéummodelo? Editorial All systems go! November 2006 Reviews Linking publication, gene and protein data Data-driven modelling of signal-transduction networks Paul Kersey and Rolf Apweiler Nature Cell Biology advance online publication, 22 October 2006 Kevin A. Janes and Michael B. Yaffe Nature Reviews Molecular Cell Biology 7, 820-828 (2006) Modelling data across labs, genomes, space and time Modelling microtubule patterns Jason R. Swedlow, Suzanna E. Lewis and Ilya G. Goldberg Nature Cell Biology advance online publication, 22 October 2006 Eric Karsenti, François Nédélec and Thomas Surrey Nature Cell Biology advance online publication, 22 October 2006 Collecting and organizing systematic sets of protein data John G. Albeck, Gavin MacBeath, Forest M. White, Peter K. Sorger, Douglas A. Lauffenburger and Suzanne Gaudet Perspective Nature Reviews Molecular Cell Biology 7, 803-812 (2006) Essay Back to the future: education for systems-level biologists Linking data to models: data regression Ned Wingreen and David Botstein Nature Reviews Molecular Cell Biology 7, 829-832 (2006) Khuloud Jaqaman and Gaudenz Danuser Nature Reviews Molecular Cell Biology 7, 813-819 (2006) Tutorial Physicochemical modelling of cell signalling pathways Yasushi Sako Molecular Systems Biology 2, published online: 17 October 2006 Imaging single molecules in living cells for systems biology Bree B. Aldridge, John M. Burke, Douglas A. Lauffenburger and Peter K. Sorger Nature Cell Biology advance online publication, 22 October 2006 PrincípiosdaBiologia deSistemas Redesderegulaçãogênica Elementosderegulaçãoemredesde transcrição Prof. Renato Vicentini – [email protected] 11 30/05/16 Redesregulatóriasdatranscrição • Aexpressãodegenesemumgenomaéumprocesso cuidadosamenteregulado; • Existemcomplexasredesregulatóriasquecontrolamquais genesserãoexpressosemrespostasadiversosesGmulos ambientaiseasinaisdedesenvolvimento; Propriedadesbásicas • Especificidade: – Especificidadedaligaçãoeassociaçãocommacromoléculas; • Co-localizaçãodoscomponentes; • Passocri9co,governadopelafreqüênciadecolisão,oupela ciné9cadeaçãodasmassas; Propriedadesbásicas • Associaçãoeinteraçãodemacromoléculas: – Proteína-proteína; – DNA-proteína; • Nãoseconhecebemaredesmetabólicasenvolvidasno processodeGRN; OoperonlacemEscherichiacoli • Trêsgenesestruturais: – lacA,lacZ,elacY; – Envolvidosnau9lizaçãodelactose; • Reguladoporsinaisdelactoseeglicose; • EnvolvendoduasproteínasregulatóriasdeligaçãoaoDNA: – orepressorlac(lactose); – CAP(glicose); • OrepressorlacseligaaoDNAsomentenaausênciade lactose; • AproteínaCAPseligaaoDNAsomentenaausênciade glicose; OoperonlacemEscherichiacoli • Dependendodaconcentraçãodeglicoseelactosenomeio, trêsestadosdiferentesdosistemapodemserobservados: RegulonGALemlevedura • GenesGALsãonecessáriosparaaquebradagalactose; • Transcriçãoinduzidapelagalactose; – A9vadordeligaçãoaoDNA,Gal4; • Reprimidapelaglicose; – RepressordeligaçãoaoDNA,Mig1; 12 30/05/16 RegulonGALemlevedura • Trêsestadosdiferentesdosistemapodemserobservados, sendoqueGal80atuacomouminibidor; Redesregulatóriasdatranscrição Redesregulatóriasdatranscrição • Notemqueapesardeevidenciasexperimentaisseremabase paraestesdoisúl9mosexemplos,elessãodescritos essencialmenteemtermosdepresençaeausência; • Podemmuitasvezesserrepresentadosmatema9camente; ProteínasqueseligamaoDNA • MasnarealidadeestesdiferentesestadosdeligaçãoaoDNA representameventosquímicos,quesãodeterminadospor: – Concentração; – Afinidadedeligação; • SeasequaçõesquímicasquedescrevemaligaçãoaoDNAde proteínaregulatóriasforemconhecidas,estescircuitos regulatóriospodemserdescritosestequiometricamente; ProteínasqueseligamaoDNA • QuandotodasasproteínasqueseligamaoDNA,assimcomo seusalvos,sãoconsideradosjuntos,umacomplexarede regulatóriaemerge; • Comcascatasdetranscriçãoeloopsdeauto-regularão; Blocosfundamentas • Blocofundamentaldeumarederegulatória: – Regiãopromotora; • Rederegulatóriadatranscrição: – QualTFseligaaqualpromotor,equaléoefeitointegradodetodos osTFsnaexpressãodogene; • Existeumpequenoconjuntodemo9voscomumente encontradosembactérias; 13 30/05/16 Mo9voscomumenteencontrados Hierarquiadasredesdetranscrição • ExistemdiversosníveisdeabstraçãoparaasGRN Reconstruindoredesregulatórias Top-downapproach • Dadosemlargaescala(HT)quesejamcapazesdemedir simultaneamenteumgrandenumerodevariáveis/estados; • Medindoexperimentalmenteaexpressãodeumgenoma: – WT/knockoutdeumTF; – Perturbandooexperimento(es9mulo,etc); • Iden9ficaçãodetodosossí9osempromotoresu9lizando bioinformá9ca; • LocalizaçãoexperimentaldaligaçãoDNA-proteína: – ChIP-chip; ChIP-chip Boyom-upapproach • Usodedadosderivadosdabioquímica/gené9catradicionais; • Focamempoucasvariáveis,oumesmoapenasuma; • ExemplodooperonlacedoregulonGAL; 14 30/05/16 Reconstruindoredesregulatórias Modelagemimplícita • ModeloscomputacionaisdeGRNnãonecessariamente precisamserformuladosmatema9camente; • DadosdeHTdemediçõesdeabundanciaoumodificaçõesde estados: – RNAs,proteínas,lipídiosemetabolitos; • Culpadosporassociação; Modelagemimplícita • Data-driven(top-down) • Associaçãoporfunção; • Cytoscape; Modelagemimplícita • Noteasimilaridadeentreascondiçõesnacolunadadireita; • Omesmoparaascolunasdaesquerda; Modelagemimplícita • Exemplosdousodemapasdeinteraçãocomomodelos predi9vos: – – – – – – Novosmembrosemgruposdaredes; Evidenciasquesuportamfracaspredições; Padrõesdeinteraçãoemlargaescala; Conservaçãoevolu9vadatopologiadarede; Redeemmul9escalas; Dadosmul9dimensionais; Modelagemimplícita • Asduascolunasparecemsercomplementaresemtermosda expressãogênica; • Padrõescomoestepodemauxiliarainterpretargrandes volumesdedados; • Podemsertestadosesta9s9camente; • Servemcomopontodeinicioparanovosestudos; 15 30/05/16 Modelagemimplícita RededetranscriçãoemE.coli • U9lizandoaanalisedosgrafospodemos: – Avaliaraevoluçãonoespaçoenotempodeumsistema; • Ajudandoassimaencontrarpotenciaisrelaçõescausa-efeito; • Valer-sedeferramentasdateoriadegrafos: – Umaáreadematemá9cajábemestabelecida; N=420 Nodes E=520 Edges Es=40 self-edges RededetranscriçãoemE.coli • Estaéumaredecomplexa; • Vamostentardefinirpadrõesquesirvamcomoblocos básicosdaconstruçãodestarede(networkmo3fs); Blue nodes have self-edges Networkmo9fs • Paradefinirumpadrãoesta9s9camentesignificante,nos comparamosaredeob9dacomumconjuntoderedes randomizadas; • Devempossuirasmesmascaracterís9casdaredereal(ex: numerodenoseligações); • Masasconexõesentreosnossãofeitasrandomicamente; Networkmo9fs Networkmo9fs • Padrõesqueocorremnarederealsignifica9vamentemais vezesdoquenasredesrandomizadassãochamadosnetwork mo9fs; • Ouseja,estãosendoevolu9vamenteconservado: • Seummo9vonãooferecevantagemsele9va,eleéremovido eocorreraemquan9dadesimilaremumarederandomizada; – mutaçõesquemodificamasinterações; • Aperdadeumaligaçãoéalgosimples(umamutaçãoem apenasumabase); 16 30/05/16 Networkmo9fs Auto-regularão Randomized network (Erdos – Renyi model) ‘Real’ Network • Vamoscompararredesreaiscomredesrandômicas; • Vamoscomeçarpelaautoregulação(40casosnoexemploa servistoparaE.coli); • Aceleraotempoderespostadarede; • Estabilizaarede; N=10 nodes E= 14 edges Es=4 self-edges N=10 nodes E= 14 edges Es=1 self-edge Regulaçãosimples Auto-regularão • Amaioriasãoauto-reguladoresnega9vos A X A Auto-regularão X Auto-regularão • 40casosvistosnaredereal,contraapenas1vistonasredes simuladas; Randomized network ‘Real’ Network (Erdos – Renyi model) N=10 nodes E= 14 edges Es=4 self-edges K • Porqueaauto-regularãoéumnetworkmo9f? • Elaapresentaalgumafunçãoú9l? N=10 nodes E= 14 edges Es=1 self-edge 17 30/05/16 Auto-regularão Auto-regularão • Auto-regularãonega9vapodeu9lizarumpromotorfortepara umaproduçãoinicialrápida; • Eentãou9lizaraauto-repressãoparapararaproduçãono estadoestacionáriodesejado; • Emumgenesimplesmenteregulado,oestagioestacionárioé umbalançoentreaproduçãoeadegradação; • Sumarizando:Aauto-regularãonega9vanosforneceomelhor dedoismundos: Dinâmicadeumgeneauto-regulado nega9vamente(linhacon9nua) Dinâmicadoprodutodeumgeneautoreguladonega9vamente(linhacon9nua) – Umpromotorfortepodegerarumarápidaprodução; – Aauto-repressãoéfinamentecontrolada; • Omesmopromotoremumcircuitoderegulaçãosimplesiria levaraumasuper-expressãoindesejada; 2 X(t) / K 1.5 1.8 1.6 1.4 X/Xst 1 1.2 1 0.8 0.6 0.5 0.4 0.2 0 0 0 0.2 T1/2 (nar) 0.4 0.6 0.8 T1/2 1 (simple) 1.2 1.4 1.6 1.8 time α t 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Time (α t) 18