Engenharia Genética

Propaganda
Mestrado Integrado em Engenharia Biomédica
Engenharia Genética
Trabalho prático 2: Amplificação do gene
pgi a partir do DNA cromossómico de
Pseudomonas aeruginosa por recurso à
técnica de PCR
Docente: Miguel Teixeira
Novembro de 2014
75559, Ana Palma
75720, Diogo Cardoso
75726, Bernardo Noronha
Novembro de 2014
Engenharia Genética
MEBiom
Índice
1.
Resumo ............................................................................................................................................................ 3
2.
Resultados ...................................................................................................................................................... 4
3.
Discussão e conclusões ........................................................................................................................... 13
4.
Referências .................................................................................................................................................. 19
2
Novembro de 2014
Engenharia Genética
MEBiom
1. Resumo
Este trabalho tem como objectivo demonstrar, in silico, os passos necessários para:
i) realizar uma experiência de Southern Blotting; ii) super-produzir e purificar uma
proteína pelo método de PCR; iii) prever a função de um gene/proteína não caracterizado.
Em relação à primeira parte, foram escolhidas enzimas de restrição e primers para
construir a sonda. Os primers escolhidos apresentam boas características, sendo as suas
temperaturas de melting 59.9ºC e 60.0ºC, conteúdo GC 55% e tamanho 20bp. A sonda
produzida tem um tamanho adequado (503bp), pelo que se pode afirmar que o Southern
Blotting, se efetuado com uma célula que de facto contém o gene em causa, provavelmente
dará resultado positivo.
Na segunda parte do trabalho, o primeiro passo foi a escolha de um vetor de
clonagem, tendo este sido o pET-Blue-2. De seguida, escolheram-se as enzimas de
restrição EcoRI e XhoI. Finalmente, escolheram-se os primers adequados. Ao analisá-los
com ferramentas online, concluiu-se que o primer forward é de boa qualidade e o primer
reverse é de má qualidade, pelo que provavelmente o PCR, como técnica de amplificação
do gene pgi, é uma má técnica. Avaliou-se ainda cada primer quanto à formação de
selfdimers, heterodímeros e hairpins.
Na parte final, procedeu-se à pesquisa de grelhas de leitura aberta (ORF’s) de
maneira a encontrar possíveis zonas codificantes numa sequência de nucleótidos de
P.aeruginosa. Seleccionou-se um dos resultados e, através de ferramentas de BLAST
disponíveis no NCBI, comparou-se essa sequência com outras sequências conhecidas de
nucleótidos e de aminoácidos, confirmando-se que a sequência analisada codifica a
glucose-6-fosfato isomerase. Para além disso, foram usadas ferramentas que permitiram a
previsão das características físico-químicas e estruturais, a possibilidade de ocorrência de
modificações pós-traducionais na proteína e os domínios típicos da família de proteínas
em questão.
3
Novembro de 2014
Engenharia Genética
MEBiom
2. Resultados
i) Preparação, in silico, de uma experiência de southern blotting para sondar o gene
pgi
O gene que nos foi atribuído foi o pgi, o gene que codifica a expressão da proteína
glicose-6-fosfatase isomerase. No NEBcutter, pudemos ver o seu mapa de restrição e
escolher enzimas de restrição que não cortem o gene. Deste modo, as enzimas de restrição
escolhidas foram:




XhoI;
BamHI;
OraI;
EcoRI;
Os primers escolhidos através da ferramenta de escolha de primers fornecida pelo
Biotools (Primer3Plus), bem como as suas características mais relevantes apresentam-se
na Tabela 1:
Tabela 1 - Primers seleccionados para a experiência de Southern Blotting, assim como a temperatura de melting,
conteúdo GC, comprimento e local de começo no gene
Primer
Temperatura
de melting
(ºC)
Conteúdo
GC (%)
Comprimento
(pb)
Local de
começo do
primer (pb)
ACATCGACGGTAGCGAGTTC
59.9
55.0
20
560
GTTGCAGGTGGTCGGTGATA
60.0
55.0
20
1063
Distância entre os dois primers (tamanho da sonda): 1063bp – 560bp = 503bp
ii) Preparação, in silico, de uma estratégia para super-produzir e purificar a
proteína G-6-P Isomerase
Com o objetivo de selecionar um plasmídeo adequado à tarefa em questão, acedeuse à “Vector Database”, uma base de dados de vetores de clonagem, como indica o nome.
Escolheu-se um plasmídeo bacteriano com uma cauda de histidinas (HIS tag), com marca
de seleção AMPR (resistente à Ampicilina) e pequeno (3653 bp): pET-Blue-2.
De seguida, selecionou-se as enzimas de restrição a utilizar, escolhendo de entre as
que cortam no MCS do vetor escolhido mas não o gene pgi. Para facilitar, escolheu-se duas
das enzimas utilizadas na secção i) de Southern Blotting: EcoRI e XhoI (indicadas na fig.1).
Estas enzimas podem ser utilizadas na mesma solução tampão de restrição – tampão tipo
H com concentração final 1X [4 ].
4
Novembro de 2014
Engenharia Genética
MEBiom
Finalmente selecionou-se os primers a utilizar de forma a amplificar o gene
completo, sendo que o Primer Forward (𝑝1𝐹𝑤 ) coincide com os primeiros 20 nucleótidos da
sequência de nucleótidos do gene pgi, enquanto que o Primer Reverse (𝑝1𝑅𝑒𝑣 ) é o inverso do
complementar dos últimos 20 nucleótidos da sequência de DNA.
𝑝1𝐹𝑤 → 𝐴𝑇𝐺 𝐴𝐴𝐺 𝐶𝐴𝐶 𝐶𝐴𝐶 𝐶𝑇𝐶 𝐴𝐶𝑇 𝐶𝐶
𝑝1𝑅𝑒𝑣 → 𝑇𝐶𝐴 𝐺𝐶𝐶 𝐺𝐶𝐺 𝐴𝑇𝐺 𝐺𝐶𝐺 𝐺𝐶𝐶𝐺𝐶
Figura 1- Mapa do plasmídeo pETBlue-2, incluindo as enzimas do MCS, com indicação (seta vermelha) nas
enzimas de restrição escolhidas [2]
Para que o gene pgi amplificado pelo processo de PCR tenha extremidades coesivas
correspondentes às do plasmídeo pEtBlue-2 utilizado, de forma a ser facilmente inserido
neste, adicionou-se aos primers locais de restrição para as enzimas escolhidas (EcoRI e
XhoI). Ao primer FW acrescentou-se a zona de restrição da enzima EcoRI e ao primer Rev a
zona de restrição da enzima XhoI, de forma a que o gene pgi fique bem orientado – caso
contrário não seria expresso. Estas sequências estão apresentadas numa tabela fornecida
na página da cadeira de Engenharia Genética. Acrescentou-se ainda à esquerda dos
primers os três nucleótidos indicados na mesma tabela, que permitem um melhor
5
Novembro de 2014
Engenharia Genética
MEBiom
funcionamento da enzima. Os primers finais têm então as seguintes sequências (sendo que
a sombreado temos os locais de restrição das enzimas):
𝑝𝐹𝑤 → 𝐶𝐶𝐺 𝐺𝐴𝐴 𝑇𝑇𝐶 𝐴𝑇𝐺 𝐴𝐴𝐺 𝐶𝐴𝐶 𝐶𝐴𝐶 𝐶𝑇𝐶 𝐴𝐶𝑇 𝐶𝐶
𝑝𝑅𝑒𝑣 → 𝐶𝐶𝐺 𝐶𝑇𝐶 𝐺𝐴𝐺 𝑇𝐶𝐴 𝐺𝐶𝐶 𝐺𝐶𝐺 𝐴𝑇𝐺 𝐺𝐶𝐺 𝐺𝐶𝐶𝐺𝐶
Através do site “Oligoanalyzer” verificou-se a qualidade dos primers elaborados. Os
resultados obtidos para o conteúdo GC e a temperatura de melting (𝑇 𝑚 ) são apresentados
na tabela 2. A terceira linha refere-se a 𝑝1𝑅𝑒𝑣 , um primer semelhante a 𝑝𝑅𝑒𝑣 ao qual foram
retirados os três últimos nucleótidos, numa tentativa de diminuir o conteúdo GC deste.
Tabela 2 - Características dos primers desenhados
primers
% 𝑮𝑪
𝑻𝒎 (℃)
𝒑𝑭𝒘
𝒑𝑹𝒆𝒗
55
80
76.5
57.1
71
65
𝒑𝑹𝒆𝒗
𝟏
É importante referir que os primers analizados foram os que inicialmente se
definiu (𝑝1𝐹𝑤 𝑒 𝑝1𝑅𝑒𝑣 ), ou seja, os primers sem as zonas de restrição das enzimas. Isto
porque esta “cauda” de nucleótidos não tem homologia na sequência de DNA onde o
primer se vai ligar, ou seja, não hibrida no processo de PCR e, como tal, não tem influência
na temperatura de melting nem no conteúdo GC relevante para a ligação.
Testou-se ainda os primers quanto à existência de hairpins, selfdimers e
heterodímeros. Na tabela 3, em baixo, encontram-se listadas as temperaturas de melting
ou os ∆𝐺𝑠 associados a estas estruturas, para cada primer (aos quais também se encontra
associado um ∆𝐺, também apresentado na tabela).
Tabela 3 - Temperatura de melting e delta G associados às estruturas hairpins, selfdimer e
heterodímeros no primer fw e rev
primers
Hairpin
(𝑻𝒎 )
Selfdimer
(∆𝑮𝒎𝒂𝒙 )
Heterodímero
(∆𝑮𝒎𝒂𝒙 )
𝒑𝑭𝒘
(∆𝑮 = −𝟓𝟕. 𝟑𝟒 𝒌𝒄𝒂𝒍/𝒎𝒐𝒍)
25℃
−12.42 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙
−73.67 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙
𝒑𝑹𝒆𝒗
(∆𝑮 = −𝟕𝟑. 𝟔𝟒 𝒌𝒄𝒂𝒍/𝒎𝒐𝒍
25℃
−22.78 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙
−73.67 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙
6
Novembro de 2014
Engenharia Genética
MEBiom
iii) Prever a função da proteína gpi
Para encontrar grelhas de leitura aberta (open reading frames – ORFs) na
sequência que se pretende analisar, recorreu-se à ferramenta ORF Finder disponível online
no site do NCBI, que teve em conta parâmetros como: a presença de um codão de iniciação
(normalmente ATG[7]), tamanho da sequência e a presença de codões de terminação
unicamente no fim da sequência.
Dado que cada codão é composto por três nucleótidos, haverá três leituras
diferentes do mesmo segmento, dependendo do local de início de leitura, se no primeiro,
segundo ou terceiro aminoácido.
Após introdução da sequência de nucleótidos no ORF Finder foram apresentados os
resultados para cada uma das seis leituras possíveis, três para a sequência de nucleótidos
inserida e as restantes para a cadeia complementar. Destas diferentes leituras obtiveramse 8 zonas compatíveis com os critérios considerados, que podemos observar na figura.
Figura 2 - Resultados da pesquisa de ORFs
Para procurar semelhanças entre diferentes sequências de nucleótidos, das
diferentes ferramentas de BLAST, utilizou-se a disponível no sítio do NCBI para comparar
a sequência de nucleótidos com outras sequências conhecidas.
Pode-se observar o resultado da busca nas figuras seguintes (figuras 3 a 5).
7
Novembro de 2014
Engenharia Genética
MEBiom
Figura 3 – Grau de semelhança da sequência de nucleótidos da glucose-1-fosfato isomerase com
diferentes sequências codificantes da base de dados.
Figura 4 – Lista de resultados do BLAST relativos à análise nucleotídica.
8
Novembro de 2014
Engenharia Genética
MEBiom
Para procurar semelhanças entre proteínas, recorreu-se novamente à ferramenta
de BLAST disponibilizada pelo NCBI, desta vez utilizada para comparação das sequências
de aminoácidos codificadas com proteínas da base de dados. Observa-se o resultado da
busca nas figuras abaixo:
Figura 5 - Grau de semelhança da glucose-1-fosfato isomerase com as proteínas da base de dados. Cada
linha vermelha representa a comparação com diferentes proteínas da base de dados
9
Novembro de 2014
Engenharia Genética
MEBiom
De seguida, para analisar as propriedades físico-químicas da proteína consultou-se
o site sugerido no guia [8] e elaborou-se a seguinte tabela.
Número de aminoácidos
Peso molecular (Dalton)
pI Teórico
Composição de aminoácidos
Ala (A)
49
554
61944.3
6.10
8.8 %
Lys (K)
18
3.2 %
Arg (R)
35
6.3 %
Met (M)
11
2.0 %
Asn (N)
21
3.8 %
Phe (F)
24
4.3 %
Asp (D)
27
4.9 %
Pro (P)
23
4.2 %
Cys (C)
4
0.7 %
Ser (S)
35
6.3 %
Gln (Q)
26
4.7 %
Thr (T)
21
3.8 %
Glu (E)
36
6.5 %
Trp (W)
12
2.2 %
Gly (G)
48
8.7 %
Tyr (Y)
17
3.1 %
His (H)
Ile (I)
Leu (L)
21
31
60
3.8 %
5.6 %
10.8 %
Val (V)
Pyl (O)
Sec (U)
35
0
0
6.3 %
0.0 %
0.0 %
Número total de resíduos carregados negativamente
( Asp + Glu)
Número total de resíduos carregados positivamente
( Arg + Lys )
Carbono
Hidrogénio
Composição Atómica
Azoto
Oxigénio
Enxofre
Fórmula
C2782H4302N778O801S15
Número total de Átomos
8678
Índice de Instabilidade
Índice Alifático
GRAVY
(Grand
hydropathicity)
average
63
53
2782
4302
778
801
15
41.79 (proteína instável)
91.23
of -0.200
Tabela 2- Características físico-químicas da proteína gpi
10
Novembro de 2014
Engenharia Genética
MEBiom
O passo seguinte foi o de procura de segmentos transmembranares, tendo-se
obtido o gráfico seguinte. O site utilizado analisa a polaridade da proteína, sendo que a
sequências de DNA hidrofóbicas correspondem segmentos transmembranares da proteína
e a sequências hidrofílicas correspondem segmentos fora da membrana plasmática da
célula (sendo portanto intra ou extra celulares).[9]
Figura 6 – Probabilidade de a proteína gpi ter ou não segmentos transmembranares
Posteriormente analisou-se a proteína para modificações pós traducionais
utilizado a base de dados InterPro base de dados de famílias de proteínas e domínios – o
resultado foi negativo para a existência destas.
Finalmente procurou-se domínios típicos da família de proteínas a que pertence
a enzima em estudo (família das fosfoglucose isomerases (PGI)), estando estes
apresentados na figura 7.
11
Novembro de 2014
Engenharia Genética
MEBiom
Figura 7 - Domínios típicos das enzimas da família PGI [10]
12
Novembro de 2014
Engenharia Genética
MEBiom
3. Discussão e conclusões
i) Preparação, in silico, de uma experiência de southern blotting para sondar o gene
pgi
Em relação à primeira parte do trabalho – preparação, in silico, de uma experiência
de southern blotting para sondar o gene pgi -, há algumas considerações a serem feitas. Em
primeiro lugar, as enzimas de restrição foram escolhidas de tal maneira que não
cortassem o gene em estudo porque se o fizessem, tornaria a experiência bastante mais
difícil de realizar, se não mesmo impossível. Isto deve-se ao facto de a escolha de primers
ser bastante mais limitada (podendo ser necessário recorrer a primers com pouca
qualidade) pois estes não poderiam conter, entre si, a zona onde a enzima de restrição
cortou o gene, uma vez que assim a sonda criada não iria hibridar. Mesmo que a sonda
criada não contivesse uma das zonas onde a enzima de restrição atua, a posterior
localização do gene no genoma torna-se bastante difícil, pelo que, por esta e pela razão já
referida, é muito importante escolher enzimas que não seccionem o gene.
Em segundo lugar, podemos afirmar que os primers escolhidos são de boa qualidade
uma vez que: têm 20pb, que é o tamanho ideal para o tamanho de um primer (17-28 bp)(1);
o seu conteúdo GC é adequado (40-55 %)(1), ou seja, não é demasiado baixo de tal maneira
que a força das ligações de hibridação seja fraca, diminuindo a taxa de hibridação, nem é
demasiado elevado de maneira a que seja favorecida a formação de ligações inespecíficas;
o tamanho do fragmento entre os dois primers – ou seja, o tamanho da sonda - é de 503
bp, que é também um tamanho adequado (100-1000)(1), uma vez que é suficientemente
grande para garantir que a hibridação ocorre apenas com o gene; as suas temperaturas de
melting são quase iguais, o que faz com que se separem da cadeia de DNA quase ao mesmo
tempo, e são também próximas da temperatura de annealing (50-65ºC)(1). É necessário
que a temperatura de annealling (𝑇 𝑎 ) seja inferior à de melting (𝑇 𝑚 ) para o primer se
poder ligar à cadeia de DNA. Se a 𝑇 𝑚 fosse muito pequena, a ligação entre o primer e a sua
região complementar no DNA a amplificar seria muito fraca e este seria facilmente
deslocado da cadeia. Na situação contrária (𝑇 𝑎 ≪ 𝑇 𝑚 ) estariam muito favorecidas ligações
inespecíficas. É portanto importante que estas temperaturas sejam semelhantes para se
poder controlar melhor a etapa de hibridação.
13
Novembro de 2014
Engenharia Genética
MEBiom
ii) Preparação, in silico, de uma estratégia para super-produzir e purificar a
proteína G-6-P Isomerase
O objectivo deste segundo passo na actividade experimental foi o de preparar uma
estratégia para super-produzir e purificar a proteína codificada pelo gene pgi, através de
ferramentas bioinformáticas online que permitem selecionar o vector e as enzimas de
restrição e desenhar os primers mais adequados à clonagem deste gene em E. coli.
Como descrito na secção 2, o primeiro passo na preparação da estratégia para
super-produzir e purificar a proteína G-6-P Isomerase foi a escolha do vector de clonagem
a utilizar. Selecionou-se então um plasmídeo com as características descritas na secção 2
do relatório:
1) Bacteriano: o plasmídeo utilizado tem que ser bacteriano por forma a ter uma
origem de replicação reconhecível pela E. coli, onde vai ser transformado.
2) Cauda de histidinas (HIS Tag): esta cauda de seis aminoácidos é importante no
processo de purificação da proteína, permitindo-nos separar a pgi das outras proteínas da
E. coli através de uma cromatografia de afinidade com níquel.
3) Marca de selecção (AMPR): possibilta a selecção das colónias de E. coli
transformantes das colónias que não incluiram o plasmídeo – só as colónias que
transformadas com o vector de clonagem é que são resistentes ao antibiótico ampicilina,
visto que a E. coli é naturalmente sensível a este.
4) Pequeno: quanto menor a dimensão do plasmídeo mais fácil é a sua inserção nas
células de E. coli, ou seja, maior é a eficiência de transformação.
O plasmídeo pETBlue-2 reúne todas estas condições, pelo que foi o escolhido para
vector de clonagem.
Seguidamente procedeu-se à escolha das enzimas de restrição responsáveis pela
abertura do plasmídeo. Convém que se selecionem duas enzimas para diminuir o risco de
recircularização do vector e para garantir a correcta orientação do fragmento de DNA de
inserção (o gene pgi resultante do PCR) – se este ficar com o sentido errado não é
expresso, naturalmente. É ainda importante que as regiões de restrição correspondentes a
estas enzimas existam no MCS (Multiple Cloning Site) do plasmídeo, por forma a garantir
que não o cortem em mais do que um local. Desta forma, a escolha recaiu sobre as enzimas
EcoRI e XhoI, sendo que ambas dão origem a extremidades coesivas [3], um factor também
importante para que seja mais favorável a ligação entre o fragmento de DNA de inserção e
o plasmídeo - a maior parte da ligação entre as extremidades de cada um é feita por
14
Novembro de 2014
Engenharia Genética
MEBiom
complementaridade de bases. De notar que no MCS do pETBlue-2 já se encontram o
promotor e o terminador (responsáveis pelo início e fim da transcrição, respectivamente).
Um outro factor determinante para a escolha destas duas enzimas foi o facto de terem
ambas actividade máxima para a mesma solução tampão, o que é importante para que se
possa realizar a digestão do DNA por estas enzimas ao mesmo tempo[4], evitando perda de
tempo e de material genético.
Passou-se então à seleção dos primers adequados. Este passo é necessariamente
manual, porque queremos primers específicos que amplifiquem todo o gene. Desta forma,
escolhemos os primeiros 20 nucleótidos da sequência de DNA do gene pgi que funcionarão
como primer forward, ligando-se à cadeia de baixo (ou seja, a cadeia complementar à
sequência de DNA que temos) e fazendo a replicação no sentido 5’ – 3’. Como referido na
secção “Resultados”, para o primer reverse fez-se o inverso do complementar dos últimos
20 nucleótidos da sequência. Este primer ligar-se-à à cadeia de DNA de cima, replicando-a
naturalmente também no sentido 5’ – 3’.
A análise dos primers construídos permite concluir que o 𝑝𝐹𝑤 tem bastante
qualidade, visto ter um conteúdo GC (55%) dentro dos limites que optimizam a hibridação
e uma temperatura de melting (𝑇 𝑚 = 57.1℃) também dentro do intervalo da temperatura
de annealling (𝑇 𝑎 ) no processo de PCR, o que permite ter uma 𝑇 𝑎 menor do que a 𝑇 𝑚 . O
seu tamanho (20 bp) é também adequado ao PCR.
Testou-se ainda o primer quanto à existência de estruturas como hairpins,
selfdimers e heterodímeros (tabela 3). A temperatura de melting associada à formação de
hairpins é 25ºC pelo que será impossível a formação deste tipo de estruturas durante o
processo de PCR, uma vez que a temperatura mínima por ele atingida é entre 50-60ºC. A
variação da energia livre de Gibbs (∆𝐺) do primer é −57.34 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙: é para este valor
que a sua estrutura é estável. O ∆𝐺𝑚𝑎𝑥 de formação de um selfdimer para este primer é
−12.42 𝑘𝑐𝑎𝑙/𝑚𝑜𝑙, o que
não é um valor ideal mas representa uma estrutura
relativamente instável, que terá pouca probabilidade de se transformar (é de referir que
quando acrescentamos locais de restrição aos primers temos sempre selfdimers). Já ao
heterodímero está associado um ∆𝐺 muito negativo, pelo que está estrutura terá muita
tendência a formar-se, o que não é positivo para o processo de PCR. Contudo, como o
heterodímero resulta da ligação entre os dois primers, uma possível mudança no primer
rev poderia alterar o valor do ∆𝐺 neste caso. Avaliando todos estes fatores, podemos
afirmar que o primer fw tem qualidade.
15
Novembro de 2014
Engenharia Genética
MEBiom
Por outro lado, o 𝑝𝑅𝑒𝑣 não tem qualidade – com um conteúdo GC tão elevado
(80%) é impossível realizar o PCR com resultados satisfatórios, pois as ligações do primer
ao fragmento de DNA são muito fortes. Isto resulta numa 𝑇 𝑚 também demasiada elevada
(71ºC) e, portanto, as ligações inespecíficas estão extremamente favorecidas. Numa
tentativa de solucionar este problema, retirou-se ao primer reverse os três últimos
nucleótidos, obtendo-se então o 𝑝1𝑅𝑒𝑣 . Contudo, apesar de este ser ligeiramente melhor que
o anterior, continua a não ser provável que se obtenham bons resultados com a técnica do
PCR. Na tentativa de contornar esta situação de outra forma, analisou-se a sequência de
DNA do gene pgi e percebeu-se facilmente que por adição de nucleótidos à direita do 𝑝𝑅𝑒𝑣
é também impossível obter um primer com qualidade. Assim, a técnica de PCR não poderia
ser utilizada para amplificar o gene.
Fez-se ainda uma análise análoga à do primer fw para a formação de hairpins,
heterodímeros e selfdimers. A esta última estrutura já está associado um ∆𝐺 menor (tabela
3), ou seja, é mais estável e, portanto, mais provável a sua formação. Este resultado vem
apenas reforçar a conclusão anterior.
iii) Prever a função da proteína gpi
Como se verifica na secção “Resultados”, existem 8 ORFs na sequência que codifica
a proteína em estudo, ou seja, 8 potenciais genes. Provavelmente, nem todas as zonas
encontradas codificarão proteínas utilizadas pelo organismo. Para se ter uma ideia do tipo
de proteína resultante da expressão destes segmentos pode recorrer-se a ferramentas
computacionais que, comparando a sequência nucleotídica ou proteica do segmento com
outras de diversos organismos presentes numa base de dados, nos podem indicar a
semelhança com outras proteínas conhecidas dando uma noção acerca daquela que será a
função da proteína expressa naquela zona. Ou seja, viu-se a homologia da nossa sequência
com outras conhecidas.
De seguida, procurou-se semelhanças em sequências de nucleótidos e de
aminoácidos. Há uma correspondência de 100% com a glucose-6-fosfato isomerase da P.
aeruginosa, tanto pela comparação com a sequência de nucleótidos do gene que codifica
esta enzima como pela comparação dos aminoácidos constituintes. Salienta-se que esta
correspondência era a esperada, dado que a sequência de nucleótidos analisada foi obtida
através do NCBI como a sequência que codifica a enzima em questão.
Se isto não sucedesse, procurar-se-ia a sequência com maior correspondência (que
não seria 100%) e poderíamos prever qual a actividade da proteína codificada pelo gene
16
Novembro de 2014
Engenharia Genética
MEBiom
em questão. Posteriormente, em laboratório, iríamos testar esta hipótese por observação
(ou não) do fenótipo desejado.
A probabilidade de obter um maior grau de semelhança através do BLAST de
comparação de aminoácidos é maior, visto que com uma sequência de aminoácidos
teríamos um maior número de sequências semelhantes, uma vez que o código genético é
redundante e vários codões codificam o mesmo aminoácido – existem portanto mutações
silenciosas de DNA, ou seja, mudanças de nucleótidos que não se traduzem numa mudança
de aminoácido. Neste caso, como foi obtida uma correspondência de 100% para ambas as
pesquisas isto não se verifica.
Prosseguiu-se para a análise das propriedades físico-químicas da proteína. Estas
são importantes para que saibamos como manusear de forma mais adequada a enzima em
laboratório.
Os dados obtidos, como o número de aminoácidos e peso molecular (entre outros),
são coerentes com os da proteína que estamos a analisar[6],, tendo em atenção que, na
referência utilizada para comparação, se observa aproximadamente o dobro do valor do
peso molecular, o que está de acordo com a previsão da formação de dímeros desta
proteína na mesma referência. A formação de dímeros é algo importante a ter em conta no
caso de se vir a realizar uma electroforese em laboratório. Entre os diversos valores
apresentados na tabela podemos salientar o índice de instabilidade de 41.79, o que
classifica a proteína como instável, algo a ter em conta ao trabalhar com esta enzima, visto
que tem um elevado grau de perecibilidade.
O passo seguinte foi o de procura de segmentos transmembranares. Observa-se
que a proteína em questão se localiza no exterior da membrana celular, sendo
extremamente reduzida a probabilidade de se encontrar segmentos no espaço
transmembranar. Isto está de acordo com o que se sabe sobre esta enzima: a glucose-6fosfato isomerase é uma enzima dimérica que cataliza a reacção reversível de
transformação de glucose-6-fosfato em fructose-6-fosfato. Está envolvida em diversos
pahtways, tanto intra como extracelulares. Um dos mais relevantes é o da glicólise, que
acontece no citoplasma. [11]
A actividade das proteínas pode ser condicionada por modificaçõs póstraducionais, como é o caso da fosforilação (adição de um grupo fosfato) e desfosforilação
(remoção de um grupo fosfato), glicosilação, modificação de aminoácidos, entre outros.
Por forma a prever a existência de este género de alterações utilizou-se a base de dados
17
Novembro de 2014
Engenharia Genética
MEBiom
InterPro, que contém uma lista de padrões ou motivos (sequência de aminoácidos
dispostos de deterninada forma) que se confirmou experimentalmente estarem
associados a alguma propriedade biológica.[7] Confirmou-se que à proteína gpi não estão
associados nenhum destes motivos, ou seja, nenhuma modificação pós-traducional.
Finalmente, procurou-se os domínios típicos da família de proteínas. Embora haja
um grande número de diferentes proteínas, a maior parte delas pode ser agrupada num
número limitado de famílias com base em semelhanças nas suas sequências. Domínios de
proteínas pertencendo a uma família em particular partilham atributos funcionais e
derivam do mesmo ancestral comum. [5]
A chamada
“assinatura
da proteína”
(ou padrão, como
mencionámos
anteriormente) pode ser utilizada para colocar uma proteína recém-sequenciada numa
família de proteínas pré-existente e, desta forma, formular hipóteses sobre a sua função.
Em suma, pode-se concluir que o recurso a ferramentas bioinformáticas pode ser
muito útil na preparação de uma actividade laboratorial no âmbito da Engenharia
Genética, permitindo que se poupe tempo e dinheiro na execução das mesmas.
18
Novembro de 2014
Engenharia Genética
MEBiom
4. Referências
Slides das aulas teóricas de Engenharia Genética;
[1]
[2]
www.snapgene.com/resources/plasmid_files/pet_and_duet_vectors_(novagen)/pETBlue-2/
[3]
http://www.escience.ws/b572/L6/L6.htm
[4] clontech.com/takara/US/Support/Applications/Restriction_Enzymes/Double_Digestion_Buffers
[5]
http://prosite.expasy.org/PDOC00157.txt
[6]
http://www.ncbi.nlm.nih.gov/pubmed/6115414
[7]
Guia de laboratório da TP2
www.expasy.ch/tools/#primary
[8]
[9]
www.cbs.dtu.dk/services/TMHMM-2.0
[10]
www.ebi.ac.uk/interpro/sequencesearch/iprscan5-S20141103-100017-0391-5086550-es
[11]
http://www.ebi.ac.uk/interpro/entry/IPR023096
19
Download