COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA Andréia Cristina Hypólito José 11075810 Fernando Caldas Oliveira 11085410 Giovana Zaninelli 11017210 Renato Fernandes Sartori 11061110 Rodrigo de Mello 11105310 Professora Dra. Silvia Dotta Disciplina: Comunicação e Redes Turma G 24/07/2011 COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA INTRODUÇÃO As redes complexas podem ser entendidas como ligações entre elementos que possuem alguma interação entre si. Os nós são os elementos, enquanto as arestas ligam os mesmos. O trabalho a seguir visa entender a ligação entre as informações contidas no DNA e RNA. O DNA é o detentor da informação genética, que deve ser transcrita para moléculas de RNA, e após finalizar todos os processos envolvidos, obtêm-se as proteínas (sequência de aminoácido), que são os principais fatores das atividades biológicas. LITERATURA ÁCIDOS NUCLEICOS Constituem-se como macromoléculas fundamentais para os sistemas biológicos, estando presentes em todos os organismos nas formas de ácido desoxirribonucleico (DNA) e ácido ribonucleico (RNA). O DNA é o principal componente responsável pela armazenagem de informação genética. Esta informação deve ser transcrita (copiada) para moléculas de RNA, já que apresenta as sequências de nucleotídeos (“código”) para a sequência de aminoácidos. Em seguida, as proteínas são sintetizadas a partir da tradução do RNA. DNA TRANSCRIÇÃO DNA RNA DUPLICAÇÃO TRADUÇÃO PROTEÍNAS DNA O DNA está localizado nos núcleos das células, no interior dos cromossomos; bem como no citoplasma, presente em mitocôndrias e cloroplastos. O RNA, por sua vez, está localizado no núcleo (local onde é produzido) e no citoplasma (onde ocorre a síntese proteica). Também conhecidos como nucleotídeos (nucleosídeo unido ao ácido fosfórico), os ácidos nucleicos são compostos que apresentam uma molécula de açúcar (pentose), bases nitrogenadas (púricas e pirimídicas) e ácido fosfórico. Pentoses: podem ser diferenciadas em ribose no RNA e desoxirribose no DNA, sendo que a última apresenta um átomo de oxigênio a menos; Bases Nitrogenadas: podem ser diferenciadas em púricas e pirimídicas. No DNA, as púricas são Adenina (A) e Guanina (G); e as pirimídicas são Citosina (C) e Timina (T). No RNA, a Timina é substituída pela Uracila (U); Ácido fosfórico OCORRÊNCIA BASES PÚRICAS BASES PIRIMÍDICAS DNA RNA Núcleo Citoplasma Mitocôndrias Nucléolo Cloroplastos Cromossomos Adenina Adenina Guanina Guanina Citosina Citosina Timina Uracila COMPOSIÇÃO DO DNA Qualquer informação genética de um ser vivo está armazenada numa sequência composta pelas quatro bases nitrogenadas. Sendo que as bases A, C, G e T codificam os aminoácidos que constituem as proteínas. Esta composição de bases pode ser diferente de uma espécie para outra, porém, a quantidade de adenina é sempre igual à de Timina (A = T) e o mesmo acontece com a Citosina e a Guanina (C = G). Desta forma, a quantidade de bases púricas sempre corresponde a de bases pirimídicas. Sendo a razão AT/ GC variável entre as espécies. A estrutura do DNA é composta por dupla hélice (diferente do RNA que é composto por uma única cadeia), ou seja, duas cadeias helicoidais de polinucleotídeos girando para a direita. Estas duas fitas caracterizam-se por serem antiparalelas e por estarem conectadas por ligações de hidrogênio que ocorrem entre os pares de bases (AT e CG). As fitas também são complementares na sua sequência. No processo de duplicação do DNA, as duas fitas se separam e cada uma serve como modelo para a formação da complementar. O que resulta na produção de duas moléculas de DNA de dupla hélice. As extremidades de cada fita são conhecidas como 3’ e 5’. Sendo que a extremidade de uma fita 3’ sempre corresponde a uma extremidade 5’ da outra fita. Para que haja desta forma, a união de bases complementares: A com T e G com C. TRANSCRIÇÃO O RNA é transcrito a partir das fitas de DNA, catalisado por várias enzimas como a RNA-polimerase (sintetiza o RNA-ribossômico, o RNA pré-mensageiro e o RNA de transferência). A sequência dos nucleotídeos do RNA é complementar a uma das fitas de DNA (filamento com sentido), porém no lugar da Timina, tem-se a Uracila. A região que foi transcrita a partir do DNA para o RNA é conhecida como região codificante. E está apta para a fase seguinte da tradução. São sintetizados três tipos de moléculas de RNA: RNA – mensageiro (RNAm) = determina a especificidade de uma sequência de aminoácidos. No citoplasma, ocorre a cópia das bases de DNA para uma cadeia complementar de RNA, sendo utilizada apenas uma cadeia do primeiro a partir do critério de emparelhamento das bases. Esta síntese é controlada pela RNApolimerase que passa pelo e DNA e abre as cadeias (no sentido 5’ -> 3’). Depois que a RNA-polimerase passa, a cadeia de DNA volta a se fechar, reestabelecendo as ligações de hidrogênio. Assim, o RNAm estará apresentado com trincas de bases (denominadas códons). RNA – transportador (RNAt) = são moléculas de adaptação, que trazem as trincas de bases correspondentes (anticódons) as do RNAm para a formação dos aminoácidos e consequentemente, síntese da proteína. RNA – ribossômico (RNAr) e ribossomos = O ribossomo apresenta-se como o local em que ocorre a síntese de polipeptídeos, sendo composto por proteínas e RNAr. TRADUÇÃO Trata-se do processo de síntese de proteínas (cadeia sequencial de aminoácidos), em que os ribossomos decodificam a mensagem presente na molécula de RNAm para uma cadeia de aminoácidos. Esta decodificação consiste no emparelhamento dos anticódons aos seus respectivos códons, para diferenciar os aminoácidos. Esta correspondência de uma trinca de bases a um aminoácido é denominada código genético. O que sugere 64 combinações, com o combinado de 4 nucleotídeos em triplas de códons, número superior aos 20 aminoácidos, uma vez que mais que um códon pode representar um mesmo aminoácido. Dentre estes códons, existem os códons de parada, que não especificam aminoácidos, e são utilizados para o término da síntese da cadeia de aminoácidos. REDES BIOLÓGICAS Um sistema vivo é composto por várias unidades biológicas que se interagem entre si compondo um sistema complexo. E essas unidades biológicas se renovam com o passar do tempo, e a única coisa que se mantêm constante durante o percurso de um ser vivo são as informações sobre seu funcionamento. Tais informações podem ser encontradas no genoma que é formado por DNA, neste ultimo contém todas as informações necessárias para executar as atividades que compõem o ser vivo. Para que as informações genéticas sejam executadas na forma de processos biológicos, é necessária toda uma interação entre DNA, RNA, proteínas e pequenas moléculas. Essas interações podem ser representadas na forma de um grafo, compondo as redes celulares. Não são as unidades celulares isoladas que executam as instruções, mas todas as unidades que, funcionando em conjunto, executam-nas. As redes presentes em uma célula ligam-se a redes em outras células formando uma estrutura hierárquica. INFORMAÇÃO BIOLÓGICA As informações necessárias para a execução das atividades biológicas encontram-se armazenadas no genoma, mas como essa informação se transforma em atividade biológica? As informações se encontram codificadas dentro da molécula de DNA através de seus nucleotídeos que se ligam em uma sequência linear. Esses nucleotídeos podem ser de quatro tipos: adenina (A), guanina (G), citosina (C) ou timina (T). Assim o DNA forma uma sequência linear em que se ordenam 4 unidades distintas, de tal forma que, esse ordenamento possibilita a codificação de informações, por exemplo, AACGTA... Logo, as informações contidas no DNA são traduzidas e utilizadas para construir as proteínas. As proteínas são formadas por aminoácidos, que se ligam linearmente formando uma cadeia. Existem 20 tipos de aminoácidos. Como o idioma do DNA contem 4 letras e o da proteína contem 20 letras, não é possível obter uma tradução de letra para letra. Para que seja possível uma tradução, cada conjunto de 3 nucleotídeos, conhecido como códon, é traduzido em um aminoácido. Uma observação importante é que mais de um códon pode representar o mesmo aminoácido, por exemplo, os códons GCA, GCC, GCG, GCT representam a alanina. A sequência de aminoácidos, por sua vez, determina as propriedades químicas de ligação das proteínas. A sequência de aminoácidos garante uma especificidade imensa nas ligações entre as proteínas e as várias outras moléculas, o que torna as proteínas agentes especializados na execução de praticamente todas as atividades biológicas. A codificação da informação no DNA apresenta uma série de aspectos positivos. As células não precisam manter um estoque de todas as proteínas, pois elas são produzidas somente quando são necessárias. Se uma determinada molécula é necessária para a manutenção de uma atividade, mas essa molécula não pode ser adquirida via alimentação, basta recorrer à informação de como produzi-la e isto se encontra no DNA. As informações não se perdem de uma geração para a outra dentro da mesma espécie, pois a informação genética é transmitida integralmente no ato da reprodução. Em uma tradução de codificação existe o risco de ocorrer erros, obtendo como resultado uma informação diferente da imaginada. Nos sistemas vivos, surge uma grande diferença no esquema de codificação, tradução e erro. Existe o código, contido no DNA, e existe a tradução do código, em termos de proteínas. Freqüentemente surgem erros na codificação da informação que leva a construção de uma proteína diferente. Esse erro pode ser considerado uma modificação adaptativa as contingências do meio em que vivem, assim, a nova proteína pode trazer ao organismo uma maior capacidade de sobrevivência, assim podemos dizer que o sistema vivo sofreu uma evolução. Esses erros ocorrem devido a mutações do DNA. Figura 1 – Esquema exemplificando a formação de rede de proteínas. CONTROLE TRANSCRICIONAL Para o desenvolvimento da vida é necessário que as informações contidas nos genes sejam controladas. A fim de coordenar as várias atividades biológicas, um sistema rigoroso de controle da expressão dos genes é requerido. Uma das formas de controle da expressão gênica é o controle transcricional, onde a molécula envolvida nos mecanismos da informação é o RNA. O RNA é uma molécula parecida com o DNA, diferindo somente na constituição do tipo de açúcar e no fato de que a base timina é substituída pela uracila (U), além de se apresentar somente em uma fita simples. Nesse processo de transcrição a fita dupla do DNA é aberta por uma enzima chamada RNA polimerase (RNAp). Essa enzima lê a ordem de nucleotídeos no DNA e transcreve essa mesma ordem em uma fita de RNA, só que com os nucleotídeos complementares, isto é, se a fita de DNA contém a sequência TAGC, a fita de RNA conterá AUCG. Esse processo é conhecido como transcrição e o RNA é conhecido como RNA mensageiro (mRNA). Durante a transcrição, a sequência de nucleotídeos contidas em um gene foi lida e transcrita para uma fita de RNA. Após a transcrição, o mRNA se dirige para uma organela (ribossomo), situada no citosol, onde ocorre a tradução da informação para o idioma das proteínas. Em linhas gerais, a fita de mRNA acopla-se ao ribossomo e este se utiliza de mecanismos auxiliares para buscar os aminoácidos correspondentes aos códons. Os aminoácidos são ligados em sequência até que a proteína esteja confeccionada. REDES REGULATÓRIAS As redes regulatórias são redes que regulam a transcrição, onde os nós são os genes e os produtos desses genes, e as ligações representam ativação ou inibição dos genes por parte dos fatores de transcrição. A atuação dessa rede regulatória de transcrição deve ser capaz de controlar as atividades biológicas de maneira coordenada. Um exemplo dessa rede regulatória é apresentado na figura 2. Nesse circuito, os nós X e Y representam fatores de transcrição enquanto o nó Z representa um gene. O símbolo PL mediando a atuação dos fatores de transcrição representa uma porta lógica, nesse caso, porta lógica E. Nesse circuito o fator de transcrição X ativa o fator Y e ambos ativam o gene Z. A porta lógica deve representar o que acontece no mecanismo de transcrição, então a porta lógica é diferente no caso em que somente um dos fatores é necessário. Contudo, num circuito com muitos nós, uma porta lógica E não é suficiente para capturar a atuação de vários fatores de transcrição. Nesse caso, se o número de fatores de ativação é maior que o de inibição, então o gene é ativado e em caso contrário é inativado. A integração de vários circuitos proporcionará um sistema de controle eficaz no controle dos processos biológicos. Figura 2 – Exemplo de rede regulatória Sendo assim, a rede regulatória é o ultimo estágio do processo de transformação da informação biológica. Inicialmente a informação contida nos genes traduz-se na informação contida nas proteínas e RNA. Por sua vez, as informações contidas nas proteínas traduzem-se nas interações que executam as atividades biológicas. E por fim, o objeto matemático que captura as informações genéticas em termos das interações entre os genes e seus produtos é o grafo, rede. O maior desafio é elucidar as funções das redes complexas de interação das proteínas, é conhecer e entender o proteoma dos organismos. REFERÊNCIAS BIBLIOGRÁFICAS Introdução à biologia celular e molecular. Revisão de artigos. Disponível em: < www.inf.puc-rio.br/~melissa/publicacao/.../biologia/anexo_biologia.pdf>. Acessado em: 18/07/11; WARDIL, Lucas Lages. Redes em biologia: introdução às redes complexas, estudo dos aspectos estruturais e dinâmicos do ciclo celular e dos ritmos circadianos. Minas Gerais: UFMG, 2008. Dissertação (Mestrado) - Curso de PósGraduação em Física da Universidade Federal de Minas Gerais, Minas Gerais, 2008. LOPES, Fabrício Martins. Redes complexas de expressão gênica: síntese, identificação, análise e aplicações. São Paulo: USP, 2011. Tese (Doutorado) – Programa de Pós-Graduação em Bioinformática, Universidade de São Paulo, São Paulo, 2011.