Mestrado Integrado em Engenharia Biomédica Engenharia Genética Trabalho prático 2: Amplificação do gene pgi a partir do DNA cromossómico de Pseudomonas aeruginosa por recurso à técnica de PCR Docente: Miguel Teixeira Novembro de 2014 75559, Ana Palma 75720, Diogo Cardoso 75726, Bernardo Noronha Novembro de 2014 Engenharia Genética MEBiom Índice 1. Resumo ............................................................................................................................................................ 3 2. Resultados ...................................................................................................................................................... 4 3. Discussão e conclusões ........................................................................................................................... 13 4. Referências .................................................................................................................................................. 19 2 Novembro de 2014 Engenharia Genética MEBiom 1. Resumo Este trabalho tem como objectivo demonstrar, in silico, os passos necessários para: i) realizar uma experiência de Southern Blotting; ii) super-produzir e purificar uma proteína pelo método de PCR; iii) prever a função de um gene/proteína não caracterizado. Em relação à primeira parte, foram escolhidas enzimas de restrição e primers para construir a sonda. Os primers escolhidos apresentam boas características, sendo as suas temperaturas de melting 59.9ºC e 60.0ºC, conteúdo GC 55% e tamanho 20bp. A sonda produzida tem um tamanho adequado (503bp), pelo que se pode afirmar que o Southern Blotting, se efetuado com uma célula que de facto contém o gene em causa, provavelmente dará resultado positivo. Na segunda parte do trabalho, o primeiro passo foi a escolha de um vetor de clonagem, tendo este sido o pET-Blue-2. De seguida, escolheram-se as enzimas de restrição EcoRI e XhoI. Finalmente, escolheram-se os primers adequados. Ao analisá-los com ferramentas online, concluiu-se que o primer forward é de boa qualidade e o primer reverse é de má qualidade, pelo que provavelmente o PCR, como técnica de amplificação do gene pgi, é uma má técnica. Avaliou-se ainda cada primer quanto à formação de selfdimers, heterodímeros e hairpins. Na parte final, procedeu-se à pesquisa de grelhas de leitura aberta (ORF’s) de maneira a encontrar possíveis zonas codificantes numa sequência de nucleótidos de P.aeruginosa. Seleccionou-se um dos resultados e, através de ferramentas de BLAST disponíveis no NCBI, comparou-se essa sequência com outras sequências conhecidas de nucleótidos e de aminoácidos, confirmando-se que a sequência analisada codifica a glucose-6-fosfato isomerase. Para além disso, foram usadas ferramentas que permitiram a previsão das características físico-químicas e estruturais, a possibilidade de ocorrência de modificações pós-traducionais na proteína e os domínios típicos da família de proteínas em questão. 3 Novembro de 2014 Engenharia Genética MEBiom 2. Resultados i) Preparação, in silico, de uma experiência de southern blotting para sondar o gene pgi O gene que nos foi atribuído foi o pgi, o gene que codifica a expressão da proteína glicose-6-fosfatase isomerase. No NEBcutter, pudemos ver o seu mapa de restrição e escolher enzimas de restrição que não cortem o gene. Deste modo, as enzimas de restrição escolhidas foram: XhoI; BamHI; OraI; EcoRI; Os primers escolhidos através da ferramenta de escolha de primers fornecida pelo Biotools (Primer3Plus), bem como as suas características mais relevantes apresentam-se na Tabela 1: Tabela 1 - Primers seleccionados para a experiência de Southern Blotting, assim como a temperatura de melting, conteúdo GC, comprimento e local de começo no gene Primer Temperatura de melting (ºC) Conteúdo GC (%) Comprimento (pb) Local de começo do primer (pb) ACATCGACGGTAGCGAGTTC 59.9 55.0 20 560 GTTGCAGGTGGTCGGTGATA 60.0 55.0 20 1063 Distância entre os dois primers (tamanho da sonda): 1063bp – 560bp = 503bp ii) Preparação, in silico, de uma estratégia para super-produzir e purificar a proteína G-6-P Isomerase Com o objetivo de selecionar um plasmídeo adequado à tarefa em questão, acedeuse à “Vector Database”, uma base de dados de vetores de clonagem, como indica o nome. Escolheu-se um plasmídeo bacteriano com uma cauda de histidinas (HIS tag), com marca de seleção AMPR (resistente à Ampicilina) e pequeno (3653 bp): pET-Blue-2. De seguida, selecionou-se as enzimas de restrição a utilizar, escolhendo de entre as que cortam no MCS do vetor escolhido mas não o gene pgi. Para facilitar, escolheu-se duas das enzimas utilizadas na secção i) de Southern Blotting: EcoRI e XhoI (indicadas na fig.1). Estas enzimas podem ser utilizadas na mesma solução tampão de restrição – tampão tipo H com concentração final 1X [4 ]. 4 Novembro de 2014 Engenharia Genética MEBiom Finalmente selecionou-se os primers a utilizar de forma a amplificar o gene completo, sendo que o Primer Forward (𝑝1𝐹𝑤 ) coincide com os primeiros 20 nucleótidos da sequência de nucleótidos do gene pgi, enquanto que o Primer Reverse (𝑝1𝑅𝑒𝑣 ) é o inverso do complementar dos últimos 20 nucleótidos da sequência de DNA. 𝑝1𝐹𝑤 → 𝐴𝑇𝐺 𝐴𝐴𝐺 𝐶𝐴𝐶 𝐶𝐴𝐶 𝐶𝑇𝐶 𝐴𝐶𝑇 𝐶𝐶 𝑝1𝑅𝑒𝑣 → 𝑇𝐶𝐴 𝐺𝐶𝐶 𝐺𝐶𝐺 𝐴𝑇𝐺 𝐺𝐶𝐺 𝐺𝐶𝐶𝐺𝐶 Figura 1- Mapa do plasmídeo pETBlue-2, incluindo as enzimas do MCS, com indicação (seta vermelha) nas enzimas de restrição escolhidas [2] Para que o gene pgi amplificado pelo processo de PCR tenha extremidades coesivas correspondentes às do plasmídeo pEtBlue-2 utilizado, de forma a ser facilmente inserido neste, adicionou-se aos primers locais de restrição para as enzimas escolhidas (EcoRI e XhoI). Ao primer FW acrescentou-se a zona de restrição da enzima EcoRI e ao primer Rev a zona de restrição da enzima XhoI, de forma a que o gene pgi fique bem orientado – caso contrário não seria expresso. Estas sequências estão apresentadas numa tabela fornecida na página da cadeira de Engenharia Genética. Acrescentou-se ainda à esquerda dos primers os três nucleótidos indicados na mesma tabela, que permitem um melhor 5 Novembro de 2014 Engenharia Genética MEBiom funcionamento da enzima. Os primers finais têm então as seguintes sequências (sendo que a sombreado temos os locais de restrição das enzimas): 𝑝𝐹𝑤 → 𝐶𝐶𝐺 𝐺𝐴𝐴 𝑇𝑇𝐶 𝐴𝑇𝐺 𝐴𝐴𝐺 𝐶𝐴𝐶 𝐶𝐴𝐶 𝐶𝑇𝐶 𝐴𝐶𝑇 𝐶𝐶 𝑝𝑅𝑒𝑣 → 𝐶𝐶𝐺 𝐶𝑇𝐶 𝐺𝐴𝐺 𝑇𝐶𝐴 𝐺𝐶𝐶 𝐺𝐶𝐺 𝐴𝑇𝐺 𝐺𝐶𝐺 𝐺𝐶𝐶𝐺𝐶 Através do site “Oligoanalyzer” verificou-se a qualidade dos primers elaborados. Os resultados obtidos para o conteúdo GC e a temperatura de melting (𝑇 𝑚 ) são apresentados na tabela 2. A terceira linha refere-se a 𝑝1𝑅𝑒𝑣 , um primer semelhante a 𝑝𝑅𝑒𝑣 ao qual foram retirados os três últimos nucleótidos, numa tentativa de diminuir o conteúdo GC deste. Tabela 2 - Características dos primers desenhados primers % 𝑮𝑪 𝑻𝒎 (℃) 𝒑𝑭𝒘 𝒑𝑹𝒆𝒗 55 80 76.5 57.1 71 65 𝒑𝑹𝒆𝒗 𝟏 É importante referir que os primers analizados foram os que inicialmente se definiu (𝑝1𝐹𝑤 𝑒 𝑝1𝑅𝑒𝑣 ), ou seja, os primers sem as zonas de restrição das enzimas. Isto porque esta “cauda” de nucleótidos não tem homologia na sequência de DNA onde o primer se vai ligar, ou seja, não hibrida no processo de PCR e, como tal, não tem influência na temperatura de melting nem no conteúdo GC relevante para a ligação. Testou-se ainda os primers quanto à existência de hairpins, selfdimers e heterodímeros. Na tabela 3, em baixo, encontram-se listadas as temperaturas de melting ou os ∆𝐺𝑠 associados a estas estruturas, para cada primer (aos quais também se encontra associado um ∆𝐺, também apresentado na tabela). Tabela 3 - Temperatura de melting e delta G associados às estruturas hairpins, selfdimer e heterodímeros no primer fw e rev primers Hairpin (𝑻𝒎 ) Selfdimer (∆𝑮𝒎𝒂𝒙 ) Heterodímero (∆𝑮𝒎𝒂𝒙 ) 𝒑𝑭𝒘 (∆𝑮 = −𝟓𝟕. 𝟑𝟒 𝒌𝒄𝒂𝒍/𝒎𝒐𝒍) 25℃ −12.42 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙 −73.67 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙 𝒑𝑹𝒆𝒗 (∆𝑮 = −𝟕𝟑. 𝟔𝟒 𝒌𝒄𝒂𝒍/𝒎𝒐𝒍 25℃ −22.78 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙 −73.67 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙 6 Novembro de 2014 Engenharia Genética MEBiom iii) Prever a função da proteína gpi Para encontrar grelhas de leitura aberta (open reading frames – ORFs) na sequência que se pretende analisar, recorreu-se à ferramenta ORF Finder disponível online no site do NCBI, que teve em conta parâmetros como: a presença de um codão de iniciação (normalmente ATG[7]), tamanho da sequência e a presença de codões de terminação unicamente no fim da sequência. Dado que cada codão é composto por três nucleótidos, haverá três leituras diferentes do mesmo segmento, dependendo do local de início de leitura, se no primeiro, segundo ou terceiro aminoácido. Após introdução da sequência de nucleótidos no ORF Finder foram apresentados os resultados para cada uma das seis leituras possíveis, três para a sequência de nucleótidos inserida e as restantes para a cadeia complementar. Destas diferentes leituras obtiveramse 8 zonas compatíveis com os critérios considerados, que podemos observar na figura. Figura 2 - Resultados da pesquisa de ORFs Para procurar semelhanças entre diferentes sequências de nucleótidos, das diferentes ferramentas de BLAST, utilizou-se a disponível no sítio do NCBI para comparar a sequência de nucleótidos com outras sequências conhecidas. Pode-se observar o resultado da busca nas figuras seguintes (figuras 3 a 5). 7 Novembro de 2014 Engenharia Genética MEBiom Figura 3 – Grau de semelhança da sequência de nucleótidos da glucose-1-fosfato isomerase com diferentes sequências codificantes da base de dados. Figura 4 – Lista de resultados do BLAST relativos à análise nucleotídica. 8 Novembro de 2014 Engenharia Genética MEBiom Para procurar semelhanças entre proteínas, recorreu-se novamente à ferramenta de BLAST disponibilizada pelo NCBI, desta vez utilizada para comparação das sequências de aminoácidos codificadas com proteínas da base de dados. Observa-se o resultado da busca nas figuras abaixo: Figura 5 - Grau de semelhança da glucose-1-fosfato isomerase com as proteínas da base de dados. Cada linha vermelha representa a comparação com diferentes proteínas da base de dados 9 Novembro de 2014 Engenharia Genética MEBiom De seguida, para analisar as propriedades físico-químicas da proteína consultou-se o site sugerido no guia [8] e elaborou-se a seguinte tabela. Número de aminoácidos Peso molecular (Dalton) pI Teórico Composição de aminoácidos Ala (A) 49 554 61944.3 6.10 8.8 % Lys (K) 18 3.2 % Arg (R) 35 6.3 % Met (M) 11 2.0 % Asn (N) 21 3.8 % Phe (F) 24 4.3 % Asp (D) 27 4.9 % Pro (P) 23 4.2 % Cys (C) 4 0.7 % Ser (S) 35 6.3 % Gln (Q) 26 4.7 % Thr (T) 21 3.8 % Glu (E) 36 6.5 % Trp (W) 12 2.2 % Gly (G) 48 8.7 % Tyr (Y) 17 3.1 % His (H) Ile (I) Leu (L) 21 31 60 3.8 % 5.6 % 10.8 % Val (V) Pyl (O) Sec (U) 35 0 0 6.3 % 0.0 % 0.0 % Número total de resíduos carregados negativamente ( Asp + Glu) Número total de resíduos carregados positivamente ( Arg + Lys ) Carbono Hidrogénio Composição Atómica Azoto Oxigénio Enxofre Fórmula C2782H4302N778O801S15 Número total de Átomos 8678 Índice de Instabilidade Índice Alifático GRAVY (Grand hydropathicity) average 63 53 2782 4302 778 801 15 41.79 (proteína instável) 91.23 of -0.200 Tabela 2- Características físico-químicas da proteína gpi 10 Novembro de 2014 Engenharia Genética MEBiom O passo seguinte foi o de procura de segmentos transmembranares, tendo-se obtido o gráfico seguinte. O site utilizado analisa a polaridade da proteína, sendo que a sequências de DNA hidrofóbicas correspondem segmentos transmembranares da proteína e a sequências hidrofílicas correspondem segmentos fora da membrana plasmática da célula (sendo portanto intra ou extra celulares).[9] Figura 6 – Probabilidade de a proteína gpi ter ou não segmentos transmembranares Posteriormente analisou-se a proteína para modificações pós traducionais utilizado a base de dados InterPro base de dados de famílias de proteínas e domínios – o resultado foi negativo para a existência destas. Finalmente procurou-se domínios típicos da família de proteínas a que pertence a enzima em estudo (família das fosfoglucose isomerases (PGI)), estando estes apresentados na figura 7. 11 Novembro de 2014 Engenharia Genética MEBiom Figura 7 - Domínios típicos das enzimas da família PGI [10] 12 Novembro de 2014 Engenharia Genética MEBiom 3. Discussão e conclusões i) Preparação, in silico, de uma experiência de southern blotting para sondar o gene pgi Em relação à primeira parte do trabalho – preparação, in silico, de uma experiência de southern blotting para sondar o gene pgi -, há algumas considerações a serem feitas. Em primeiro lugar, as enzimas de restrição foram escolhidas de tal maneira que não cortassem o gene em estudo porque se o fizessem, tornaria a experiência bastante mais difícil de realizar, se não mesmo impossível. Isto deve-se ao facto de a escolha de primers ser bastante mais limitada (podendo ser necessário recorrer a primers com pouca qualidade) pois estes não poderiam conter, entre si, a zona onde a enzima de restrição cortou o gene, uma vez que assim a sonda criada não iria hibridar. Mesmo que a sonda criada não contivesse uma das zonas onde a enzima de restrição atua, a posterior localização do gene no genoma torna-se bastante difícil, pelo que, por esta e pela razão já referida, é muito importante escolher enzimas que não seccionem o gene. Em segundo lugar, podemos afirmar que os primers escolhidos são de boa qualidade uma vez que: têm 20pb, que é o tamanho ideal para o tamanho de um primer (17-28 bp)(1); o seu conteúdo GC é adequado (40-55 %)(1), ou seja, não é demasiado baixo de tal maneira que a força das ligações de hibridação seja fraca, diminuindo a taxa de hibridação, nem é demasiado elevado de maneira a que seja favorecida a formação de ligações inespecíficas; o tamanho do fragmento entre os dois primers – ou seja, o tamanho da sonda - é de 503 bp, que é também um tamanho adequado (100-1000)(1), uma vez que é suficientemente grande para garantir que a hibridação ocorre apenas com o gene; as suas temperaturas de melting são quase iguais, o que faz com que se separem da cadeia de DNA quase ao mesmo tempo, e são também próximas da temperatura de annealing (50-65ºC)(1). É necessário que a temperatura de annealling (𝑇 𝑎 ) seja inferior à de melting (𝑇 𝑚 ) para o primer se poder ligar à cadeia de DNA. Se a 𝑇 𝑚 fosse muito pequena, a ligação entre o primer e a sua região complementar no DNA a amplificar seria muito fraca e este seria facilmente deslocado da cadeia. Na situação contrária (𝑇 𝑎 ≪ 𝑇 𝑚 ) estariam muito favorecidas ligações inespecíficas. É portanto importante que estas temperaturas sejam semelhantes para se poder controlar melhor a etapa de hibridação. 13 Novembro de 2014 Engenharia Genética MEBiom ii) Preparação, in silico, de uma estratégia para super-produzir e purificar a proteína G-6-P Isomerase O objectivo deste segundo passo na actividade experimental foi o de preparar uma estratégia para super-produzir e purificar a proteína codificada pelo gene pgi, através de ferramentas bioinformáticas online que permitem selecionar o vector e as enzimas de restrição e desenhar os primers mais adequados à clonagem deste gene em E. coli. Como descrito na secção 2, o primeiro passo na preparação da estratégia para super-produzir e purificar a proteína G-6-P Isomerase foi a escolha do vector de clonagem a utilizar. Selecionou-se então um plasmídeo com as características descritas na secção 2 do relatório: 1) Bacteriano: o plasmídeo utilizado tem que ser bacteriano por forma a ter uma origem de replicação reconhecível pela E. coli, onde vai ser transformado. 2) Cauda de histidinas (HIS Tag): esta cauda de seis aminoácidos é importante no processo de purificação da proteína, permitindo-nos separar a pgi das outras proteínas da E. coli através de uma cromatografia de afinidade com níquel. 3) Marca de selecção (AMPR): possibilta a selecção das colónias de E. coli transformantes das colónias que não incluiram o plasmídeo – só as colónias que transformadas com o vector de clonagem é que são resistentes ao antibiótico ampicilina, visto que a E. coli é naturalmente sensível a este. 4) Pequeno: quanto menor a dimensão do plasmídeo mais fácil é a sua inserção nas células de E. coli, ou seja, maior é a eficiência de transformação. O plasmídeo pETBlue-2 reúne todas estas condições, pelo que foi o escolhido para vector de clonagem. Seguidamente procedeu-se à escolha das enzimas de restrição responsáveis pela abertura do plasmídeo. Convém que se selecionem duas enzimas para diminuir o risco de recircularização do vector e para garantir a correcta orientação do fragmento de DNA de inserção (o gene pgi resultante do PCR) – se este ficar com o sentido errado não é expresso, naturalmente. É ainda importante que as regiões de restrição correspondentes a estas enzimas existam no MCS (Multiple Cloning Site) do plasmídeo, por forma a garantir que não o cortem em mais do que um local. Desta forma, a escolha recaiu sobre as enzimas EcoRI e XhoI, sendo que ambas dão origem a extremidades coesivas [3], um factor também importante para que seja mais favorável a ligação entre o fragmento de DNA de inserção e o plasmídeo - a maior parte da ligação entre as extremidades de cada um é feita por 14 Novembro de 2014 Engenharia Genética MEBiom complementaridade de bases. De notar que no MCS do pETBlue-2 já se encontram o promotor e o terminador (responsáveis pelo início e fim da transcrição, respectivamente). Um outro factor determinante para a escolha destas duas enzimas foi o facto de terem ambas actividade máxima para a mesma solução tampão, o que é importante para que se possa realizar a digestão do DNA por estas enzimas ao mesmo tempo[4], evitando perda de tempo e de material genético. Passou-se então à seleção dos primers adequados. Este passo é necessariamente manual, porque queremos primers específicos que amplifiquem todo o gene. Desta forma, escolhemos os primeiros 20 nucleótidos da sequência de DNA do gene pgi que funcionarão como primer forward, ligando-se à cadeia de baixo (ou seja, a cadeia complementar à sequência de DNA que temos) e fazendo a replicação no sentido 5’ – 3’. Como referido na secção “Resultados”, para o primer reverse fez-se o inverso do complementar dos últimos 20 nucleótidos da sequência. Este primer ligar-se-à à cadeia de DNA de cima, replicando-a naturalmente também no sentido 5’ – 3’. A análise dos primers construídos permite concluir que o 𝑝𝐹𝑤 tem bastante qualidade, visto ter um conteúdo GC (55%) dentro dos limites que optimizam a hibridação e uma temperatura de melting (𝑇 𝑚 = 57.1℃) também dentro do intervalo da temperatura de annealling (𝑇 𝑎 ) no processo de PCR, o que permite ter uma 𝑇 𝑎 menor do que a 𝑇 𝑚 . O seu tamanho (20 bp) é também adequado ao PCR. Testou-se ainda o primer quanto à existência de estruturas como hairpins, selfdimers e heterodímeros (tabela 3). A temperatura de melting associada à formação de hairpins é 25ºC pelo que será impossível a formação deste tipo de estruturas durante o processo de PCR, uma vez que a temperatura mínima por ele atingida é entre 50-60ºC. A variação da energia livre de Gibbs (∆𝐺) do primer é −57.34 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙: é para este valor que a sua estrutura é estável. O ∆𝐺𝑚𝑎𝑥 de formação de um selfdimer para este primer é −12.42 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙, o que não é um valor ideal mas representa uma estrutura relativamente instável, que terá pouca probabilidade de se transformar (é de referir que quando acrescentamos locais de restrição aos primers temos sempre selfdimers). Já ao heterodímero está associado um ∆𝐺 muito negativo, pelo que está estrutura terá muita tendência a formar-se, o que não é positivo para o processo de PCR. Contudo, como o heterodímero resulta da ligação entre os dois primers, uma possível mudança no primer rev poderia alterar o valor do ∆𝐺 neste caso. Avaliando todos estes fatores, podemos afirmar que o primer fw tem qualidade. 15 Novembro de 2014 Engenharia Genética MEBiom Por outro lado, o 𝑝𝑅𝑒𝑣 não tem qualidade – com um conteúdo GC tão elevado (80%) é impossível realizar o PCR com resultados satisfatórios, pois as ligações do primer ao fragmento de DNA são muito fortes. Isto resulta numa 𝑇 𝑚 também demasiada elevada (71ºC) e, portanto, as ligações inespecíficas estão extremamente favorecidas. Numa tentativa de solucionar este problema, retirou-se ao primer reverse os três últimos nucleótidos, obtendo-se então o 𝑝1𝑅𝑒𝑣 . Contudo, apesar de este ser ligeiramente melhor que o anterior, continua a não ser provável que se obtenham bons resultados com a técnica do PCR. Na tentativa de contornar esta situação de outra forma, analisou-se a sequência de DNA do gene pgi e percebeu-se facilmente que por adição de nucleótidos à direita do 𝑝𝑅𝑒𝑣 é também impossível obter um primer com qualidade. Assim, a técnica de PCR não poderia ser utilizada para amplificar o gene. Fez-se ainda uma análise análoga à do primer fw para a formação de hairpins, heterodímeros e selfdimers. A esta última estrutura já está associado um ∆𝐺 menor (tabela 3), ou seja, é mais estável e, portanto, mais provável a sua formação. Este resultado vem apenas reforçar a conclusão anterior. iii) Prever a função da proteína gpi Como se verifica na secção “Resultados”, existem 8 ORFs na sequência que codifica a proteína em estudo, ou seja, 8 potenciais genes. Provavelmente, nem todas as zonas encontradas codificarão proteínas utilizadas pelo organismo. Para se ter uma ideia do tipo de proteína resultante da expressão destes segmentos pode recorrer-se a ferramentas computacionais que, comparando a sequência nucleotídica ou proteica do segmento com outras de diversos organismos presentes numa base de dados, nos podem indicar a semelhança com outras proteínas conhecidas dando uma noção acerca daquela que será a função da proteína expressa naquela zona. Ou seja, viu-se a homologia da nossa sequência com outras conhecidas. De seguida, procurou-se semelhanças em sequências de nucleótidos e de aminoácidos. Há uma correspondência de 100% com a glucose-6-fosfato isomerase da P. aeruginosa, tanto pela comparação com a sequência de nucleótidos do gene que codifica esta enzima como pela comparação dos aminoácidos constituintes. Salienta-se que esta correspondência era a esperada, dado que a sequência de nucleótidos analisada foi obtida através do NCBI como a sequência que codifica a enzima em questão. Se isto não sucedesse, procurar-se-ia a sequência com maior correspondência (que não seria 100%) e poderíamos prever qual a actividade da proteína codificada pelo gene 16 Novembro de 2014 Engenharia Genética MEBiom em questão. Posteriormente, em laboratório, iríamos testar esta hipótese por observação (ou não) do fenótipo desejado. A probabilidade de obter um maior grau de semelhança através do BLAST de comparação de aminoácidos é maior, visto que com uma sequência de aminoácidos teríamos um maior número de sequências semelhantes, uma vez que o código genético é redundante e vários codões codificam o mesmo aminoácido – existem portanto mutações silenciosas de DNA, ou seja, mudanças de nucleótidos que não se traduzem numa mudança de aminoácido. Neste caso, como foi obtida uma correspondência de 100% para ambas as pesquisas isto não se verifica. Prosseguiu-se para a análise das propriedades físico-químicas da proteína. Estas são importantes para que saibamos como manusear de forma mais adequada a enzima em laboratório. Os dados obtidos, como o número de aminoácidos e peso molecular (entre outros), são coerentes com os da proteína que estamos a analisar[6],, tendo em atenção que, na referência utilizada para comparação, se observa aproximadamente o dobro do valor do peso molecular, o que está de acordo com a previsão da formação de dímeros desta proteína na mesma referência. A formação de dímeros é algo importante a ter em conta no caso de se vir a realizar uma electroforese em laboratório. Entre os diversos valores apresentados na tabela podemos salientar o índice de instabilidade de 41.79, o que classifica a proteína como instável, algo a ter em conta ao trabalhar com esta enzima, visto que tem um elevado grau de perecibilidade. O passo seguinte foi o de procura de segmentos transmembranares. Observa-se que a proteína em questão se localiza no exterior da membrana celular, sendo extremamente reduzida a probabilidade de se encontrar segmentos no espaço transmembranar. Isto está de acordo com o que se sabe sobre esta enzima: a glucose-6fosfato isomerase é uma enzima dimérica que cataliza a reacção reversível de transformação de glucose-6-fosfato em fructose-6-fosfato. Está envolvida em diversos pahtways, tanto intra como extracelulares. Um dos mais relevantes é o da glicólise, que acontece no citoplasma. [11] A actividade das proteínas pode ser condicionada por modificaçõs póstraducionais, como é o caso da fosforilação (adição de um grupo fosfato) e desfosforilação (remoção de um grupo fosfato), glicosilação, modificação de aminoácidos, entre outros. Por forma a prever a existência de este género de alterações utilizou-se a base de dados 17 Novembro de 2014 Engenharia Genética MEBiom InterPro, que contém uma lista de padrões ou motivos (sequência de aminoácidos dispostos de deterninada forma) que se confirmou experimentalmente estarem associados a alguma propriedade biológica.[7] Confirmou-se que à proteína gpi não estão associados nenhum destes motivos, ou seja, nenhuma modificação pós-traducional. Finalmente, procurou-se os domínios típicos da família de proteínas. Embora haja um grande número de diferentes proteínas, a maior parte delas pode ser agrupada num número limitado de famílias com base em semelhanças nas suas sequências. Domínios de proteínas pertencendo a uma família em particular partilham atributos funcionais e derivam do mesmo ancestral comum. [5] A chamada “assinatura da proteína” (ou padrão, como mencionámos anteriormente) pode ser utilizada para colocar uma proteína recém-sequenciada numa família de proteínas pré-existente e, desta forma, formular hipóteses sobre a sua função. Em suma, pode-se concluir que o recurso a ferramentas bioinformáticas pode ser muito útil na preparação de uma actividade laboratorial no âmbito da Engenharia Genética, permitindo que se poupe tempo e dinheiro na execução das mesmas. 18 Novembro de 2014 Engenharia Genética MEBiom 4. Referências Slides das aulas teóricas de Engenharia Genética; [1] [2] www.snapgene.com/resources/plasmid_files/pet_and_duet_vectors_(novagen)/pETBlue-2/ [3] http://www.escience.ws/b572/L6/L6.htm [4] clontech.com/takara/US/Support/Applications/Restriction_Enzymes/Double_Digestion_Buffers [5] http://prosite.expasy.org/PDOC00157.txt [6] http://www.ncbi.nlm.nih.gov/pubmed/6115414 [7] Guia de laboratório da TP2 www.expasy.ch/tools/#primary [8] [9] www.cbs.dtu.dk/services/TMHMM-2.0 [10] www.ebi.ac.uk/interpro/sequencesearch/iprscan5-S20141103-100017-0391-5086550-es [11] http://www.ebi.ac.uk/interpro/entry/IPR023096 19