Engenharia Genética

Propaganda
Engenharia Genética
Matéria 2º teste
1º Semestre - 2010/2011
3º ano - Mestrado Integrado em Engenharia Biomédica
Instituo Superior Técnico
Baseado nas aulas e nos livros Principles of Gene Manipulation
and Genomics e Gene Cloning and DNA analysis
Resumo por Inês Amorim
Índice
Sequenciação de DNA............................................................................................................................. 3
Método de terminação da cadeia ....................................................................................................... 3
Método de degradação química ......................................................................................................... 7
Pirosequenciação ............................................................................................................................... 8
Sequenciação de genomas ................................................................................................................. 9
Expressão e função de genes ................................................................................................................ 10
Hibridação de Northern .................................................................................................................... 10
Técnica de protecção por nucleases ................................................................................................. 11
RT-PCR, PCR quantitativo.................................................................................................................. 11
Genes repórter ................................................................................................................................. 14
Microarrays...................................................................................................................................... 15
Tipagem Molecular ............................................................................................................................... 18
Análise do genoma por electroforese de campo pulsado – PFGE ....................................................... 18
Ribotipagem..................................................................................................................................... 20
Amplificação de regiões polimórficas por PCR – RAPD....................................................................... 21
Multi locus Sequece Typing - MLST ................................................................................................... 22
Proteínas recombinantes ...................................................................................................................... 23
Vectores de expressão...................................................................................................................... 24
Construção de um gene híbrido e proteínas de fusão........................................................................ 26
Purificação de proteínas recombinantes ........................................................................................... 28
Problemas da produção de proteínas recombinantes em E. coli ........................................................ 30
Produção de proteínas recombinantes em eucariotas ....................................................................... 31
Produção de farmacêuticos recombinantes ...................................................................................... 32
Western Boltting .............................................................................................................................. 34
Genómica funcional.............................................................................................................................. 37
Preparação das amostras proteicas .................................................................................................. 38
Electroforese bidimensional (2-DE) ................................................................................................... 39
Identificação de proteínas ................................................................................................................ 40
Interacções proteína-proteína .............................................................................................................. 41
Dois híbridos .................................................................................................................................... 41
Biblioteca de fagos ........................................................................................................................... 42
Co-imunoprecipitação ...................................................................................................................... 43
SPR – Surface Plasmon Ressonance .................................................................................................. 43
Marcadores (Tags)............................................................................................................................ 44
Sequenciação de DNA
A sequenciação de DNA permite determinar a sequência ordenada de nucleótidos de um
fragmento de DNA, nomeadamente de genes ou até de genomas completos. No final da
década de 70’ foram desenvolvidas duas técnicas principais:
Métodos por degradação química, por Maxam e Gilbert. Praticamente não é utilizado;
Método da terminação da cadeia, por Sanger e Coulson. É o método mais utilizado
pois é relativamente fácil e pode ser automatizado, permitindo a sequenciação de até
96 fragmentos em simultâneo. Entretanto foi desenvolvida uma técnica ainda mais
eficiente, a pirosequenciação, que possibilita a sequenciação simultânea de milhares
de pequenos fragmentos.
Método de terminação da cadeia
O método de terminação da cadeia assenta na ideia de que é possível separar, por
electroforese em gel de poliacrilamida, fragmentos que diferem apenas de uma base.
Aspectos principais do método:
O fragmento de DNA a clonar tem que estar em cadeia simples (geralmente obtida por
clonagem num vector M13);
Ocorre síntese enzimática de uma segunda cadeia de DNA complementar à cadeia
molde. É necessário um primer (universal e, por vezes, interno), ao qual se vai ligar a
DNA polimerase (fragmento knelow ou sequenase);
Durante a polimerização são incorporados didesoxinucleotidos (ddNTP’s), que
terminam a reacção de polimerização e permitem a marcação das cadeias. Vão
formar-se várias cadeias com tamanhos diferentes;
As moléculas são separadas de acordo com o seu tamanho por electroforese em gel de
poliacrilamida;
A marcação das sequências pelos ddNTP’s permite a identificação do último nucleótido
de cada cadeia e a sequência do fragmento.
Obter fragamentos de DNA em cadeia simples
Os fragmentos alvo, que se desejam sequenciar, têm que ser obtidos sob a forma de cadeia
simples, pelo que normalmente se clonam utilizando o fago M13. No entanto, fragmentos de
tamanho superior a 3kb tornam-se instáveis nesse vector e podem sofrer eliminações e
rearranjos, pelo que o M13 é apenas usado para sequenciar pequenos fragmentos. Para
sequenciar fragmentos maiores faz-se clonagem em plasmídeos e depois converte-se a cadeia
dupla em cadeia simples:
Recorre-se a desnaturação alcalina ou por temperatura. Contudo, é difícil evitar a
contaminação do DNA plasmídico por DNA/RNA bacteriano que pode actuar como
cadeia molde ou como primer durante a sequenciação;
Clona-se o fragmento num fagemídeo. Permite clonar fragmentos com 10Kb ou mais.
Síntese de cadeias complementares
Uma vez obtidos os fragmentos de ssDNA o próximo passo é a síntese da cadeia
complementar. Utiliza-se:
DNA polimerase;
Primer;
Nucleótidos: dNTP’s e ddNTP’s (desoxinucleótidos trifosfato), nucleótidos modificados
e marcados com fluorescência ou com compostos radioactivos.
A DNA polimerase usada deve ter apenas e função de polimerase e não também de
endonuclease, para que o tamanho das cadeias não seja alterado e/ou não sejam removidos
os ddNTP’s que permitem a marcação de nucleótidos essencial à sequenciação. Inicialmente
utilizava-se o fragmento Knelow mas como este permite apenas a polimerização de 250bp
passou a fazer-se uso da sequenase, uma enzima só com actividade de polimerase que
adiciona até 750 nucleótidos por reacção.
O primer utilizado é único para que a síntese de todas as cadeias tenha início no mesmo local.
Esse primer é normalmente um primer universal que se liga a uma região do vector de
clonagem próxima do ponto onde se encontra o DNA a sequenciar. Deste modo, a região
sequenciada engloba não só o DNA alvo mas também uma pequena sequência do vector de
clonagem. Quando se utilizam plasmídeos como vectores podem ser usados primers universais
“normais” e “inversos”, de modo a que a sequenciação seja feita a partir de ambos os lados do
fragmento. Isto é particularmente útil quando se têm sequências longas (maior de 750bp) que
não é possível sequenciar de uma só vez. Alternativamente podem ainda utilizar-se primers
internos que se ligam em zonas intermédias específicas do DNA e permitem a sequenciação do
fragmento total a partir de várias sequências mais pequenas. Cada uma dessas sequências irá
conter uma pequena região que se sobrepõe ao fragmento anterior.
A DNA polimerase actua adicionando dNTP’s à cadeia molde e a polimerização termina quando
é adicionado um ddNTP – no qual o grupo OH do carbono 3’ está substituído apenas por H,
não sendo assim possível estabelecer uma ligação fosfodiéster com nucleótidos subsequentes.
Como foram adicionados ddNTP’s ao meio de reacção numa proporção muito inferior à dos
nucleótidos regulares, podem ser incorporados muitos dNTP’s antes de um ddNTP, dando
origem a cadeias com tamanhos variados. Na reacção global acaba por se ter virtualmente
uma cadeia de cada tamanho.
Para a sequenciação de um fragmento de DNA são necessárias 4 reacções in vitro: só se
adiciona um tipo de ddNTP a cada meio de reacção, sendo assim necessários 4 meios
diferentes.
No método descrito anteriormente é necessário adicionar uma grande quantidade de DNA aos
tubos de reacção para que se consigam analisar os dados. Com o desenvolvimento de PCR
deixo de ser necessário adicionar essas grandes quantidades pois o DNA pode ser amplificado
durante a reacção de sequenciação. Este método, que alia o PCR à sequenciação, designa-se
sequenciação cíclica.
Para o PCR adiciona-se apenas um primer pois só necessitamos de amplificar uma das cadeias
(ocorre amplificação linear). A polimerização é levada a cabo pela Taq polimerase, que
adiciona tanto dNTP’s como ddNTP’s, e deixa de ser necessário termos uma molécula inicial
em cadeia simples pois ocorre desnaturação das cadeias em cada ciclo. A clonagem num
vector M13 passa a ser desnecessária e o DNA pode ou não ser inserido num plasmídeo,
conforme a sua sequência inicial seja ou não conhecida (necessária para o desing de um
primer).
Identificação dos nucleótidos marcados
Os produtos de polimerização são sujeitos a electroforese em gel de poliacrilamida de alta
resolução, onde é utilizada ureia e uma voltagem alta. O gel chega a ter 50cm de altura e
permite a distinção de cadeias na ordem de 1 base. Em cada poço é colocada uma amostra
marcada com um ddNTP’s diferente, de modo a englobar os 4 nucleótidos que constituem o
DNA (A, C, T, G).
Quando a marcação é radioactiva, a análise do gel é feita por autoradiografia e a
determinação da sequência do DNA é feita manualmente. Lê-se a sequência por ordem de
pesos moleculares e obtém-se a sequência complementar de interesse, sendo depois
necessário convertê-la para a sequência original.
Este tipo de leitura tem algumas desvantagens pois nem sempre as bandas vão ter a mesma
intensidade, tornado por vezes a sua distinção complicada. Por outro lado, compressões no gel
dificultam a identificação das bandas, um problema que ganha importância à medida que o
tamanho dos fragmentos aumenta e a resolução fica mais fraca.
A partir do final dos anos 80’ passou a utilizar-se sequenciação de DNA automatizada. Este
método permite a identificação dos ddNTP’s, agora marcados com compostos fluorescentes –
fluoroforos, à medida que os produtos de polimerização são separados no gel de
poliacrilamida. Enquanto o gel corre um laser (fixo) excita os marcadores. A fluorescência é
identificada por um receptor e convertida num sinal transmitido a um computador, permitindo
a identificação da base em questão. Os dados recolhidos são apresentados num
cromatograma/electroferograma.
Se a marcação dos ddNTP’s for feita com o mesmo marcador, então é necessário ter 4
amostras para cada fragmento, à semelhança do que acontecia com a marcação radioactiva.
Por outro lado, se forem utilizados 4 fluoroforos em cada poço pode ser identificada uma
sequência completa, não havendo necessidade de a separar em quatro amostras.
A nova geração de sequenciadores permite a chamada sequenciação de DNA por
capilaridade. Neste tipo de sequenciação o gel de poliacrilamida é substituído por uma série
de capilares de vidro muito finos (≈2mm) preenchidos pelo gel. A electroforese dá-se ao longo
desses capilares, no final dos quais se identifica a fluorescência dos marcadores.
A principal vantagem deste método é que é necessário muito pouco trabalho manual: o
sequenciador pode analisar até 96 sequências em simultâneo, num total de até 750 000
nucleótidos por dia.
Método de degradação química
O método Maxam-Gilbert, ou método de degradação química, é pouco aplicado hoje em dia
mas ainda é utilizado quando o fragmento que queremos sequenciar forma uma estrutura
secundária após a desnaturação e não permite o avanço da DNA polimerase.
Para este método utiliza-se DNA de cadeia dupla que tem uma cadeia leve e uma cadeia
pesada. As extremidades 5’ da cadeia dupla são marcadas radioactivamente (enzima cinase
polinucleotídica 32P-dATP) e a desnaturação é feita pela adição do composto DMSO e
aquecimento a 90ºC. Uma vez em cadeia simples, as cadeias de DNA são separadas por
electroforese e uma delas (a leve ou a pesada) é purificada e dividida em 4 tubos. A cada um
desses tubos é então adicionado um reagente que corta o DNA nos locais onde há um
nucleótido específico – é preciso controlar o tempo de reacção e a concentração do reagente
de modo a que só ocorra um corte em cada cadeia.
À semelhança do que já foi descrito anteriormente para a sequenciação por terminação da
cadeia, a separação das cadeias cortadas é feita por electroforese e a sequência é determinada
por autoradiografia.
Pirosequenciação
A pirosequenciação permite a sequenciação de fragmentos de 150bp em cada leitura, mas
como podem ser feitas milhares de leituras em paralelo, o total de DNA sequenciado pode
chegar a 1000Mb por corrida. Este método é assim mais rápido que a sequenciação por
terminação da cadeia.
O processo de pirosequenciação pode ser sumarizado nos seguintes passos:
O DNA alvo é isolado ou obtido por PCR ou clonagem, e fragmentado em moléculas
com 300bp a 800bp;
Os fragmentos são tratados de modo a lhes serem adicionados dois adaptadores
diferentes A e B às extremidades 3’ e 5’, respectivamente;
Os fragmentos são desnaturados e ligados a esferas de agarose que têm uma pequena
sequência complementar a um dos adaptadores. Cada esfera deve estar apenas
associada a um fragmento, o que se consegue através de sucessivas diluições;
Adicionam-se ao meio reagentes de PCR e óleo, de modo a que se formem micelas que
incluem uma esfera de agarose e reagentes. Cada uma destas micelas funciona como
um microrreactor onde ocorre PCR – PCR de emulsão;
Após vários ciclos de PCR cada microrreactor vai conter, ligadas à esfera, milhares de
cópias de um único fragmento. O primer utilizado é complementar ao adaptador que
não está a ser utilizado para a ligação à esfera;
Finda a reacção de amplificação remove-se o óleo e a solução é colocada numa placa
que contém pequenos compartimentos onde apenas uma esfera pode ser inserida;
Em cada compartimento vai ocorrer sequenciação do fragmento amplificado. A placa
tem milhares de compartimentos, podendo sequenciar-se milhares de fragmentos em
pararelo;
A identificação dos nucleótidos é feita por quimioluminescência em simultâneo com a
sua polimerização na reacção de sequenciação. Sempre que é adicionado um
nucleótido a uma cadeia em crescimento é libertado um pirofosfato (PPi) que reage
com APS para originar ATP e sulfato (enzima ATP-sulfurilase). O ATP reage com
luciferina (um composto adicionado ao meio) e O2 numa reacção que leva à emissão
de luz. (enzima luciferase).
Em cada compartimento é adicionado um nucleótido de cada vez (os 4 dNTP’s são
adicionados sempre na mesma ordem) e verifica-se se há emissão de luz ou não. Antes
da adição do nucleótido seguinte é necessário lavar ou inactivar os dNTP’s que ficaram
em solução. Quando na sequência surge um nucleótido repetido (ex: GGGG) o sinal
captado é superior ao esperado para um só nucleótido, sendo interpretado
correctamente como uma repetição.
Como consequência da pirosequensiação, a mesma região é sequenciada tantas vezes
que, mesmo que ocorram erros de leitura ou de reacção, a maioria das sequências
estará correcta, levando a um resultado global positivo e menos falível que a técnica
clássica de terminação da cadeia.
Sequenciação de genomas
A sequenciação de genomas, ou de grandes moléculas de DNA, baseia-se na sequenciação de
pequenos fragmentos da molécula original, clonados em vectores, e na sobreposição de
regiões comuns das diferentes sequências obtidas de modo a obter a sequência completa.
Existem duas estratégias fundamentais para a sequenciação de genomas:
Whole genome shotgun sequencing: todo o genoma é partido aleatoriamente em
pequenos fragmentos que são sequenciados separadamente. As sequências obtidas
são analisadas em busca de regiões idênticas e o genoma é reconstruído pela
sobreposição dessas regiões. Em genomas que contenham várias regiões idênticas é
possível que a sequenciação não seja feita correctamente, sobrepondo-se sequências
idênticas ou eliminando-se algumas regiões. Este tipo de sequenciação não é assim
indicada para genomas grandes, como os de eucariotas;
Clone-by-clone shotgun sequencing: cada cromossoma é tratado individualmente e
partido em vários fragmentos da ordem dos Mb. Determina-se previamente a ordem
desses fragmentos no genoma e só depois se aplica shotgun a cada fragmento. Uma
vez sequenciados os fragmentos de maior dimensão a sequência do cromossoma é
facilmente determinada. Embora mais fiável, este método é mais demorado e mais
caro que o anterior.
Expressão e função de genes
Existem várias técnicas para estudar a expressão e função de genes, entre elas:
Hibridação de Northen;
Técnica de protecção por nucleases;
RT-PCR: PCR quantitativo;
Genes repórter;
Tecnologia de microarrays de DNA.
Como o primeiro passo na expressão de um gene é a sua transcrição em mRNA, a maioria
destas técnicas faz uso dessa molécula. No entanto, o RNA é mais instável que o DNA e
portanto são necessários cuidados extra na sua extracção e armazenamento (-180ºC).
Uma das análises que se pode fazer ao RNA de modo a testar o seu estado de degradação
(equivalente a testar a sua qualidade) faz uso do equipamento Bioanalyser. Extrai-se RNA total
(ribossómico e mensageiro), tendo atenção em adicionar formaldeído (um composto tóxico)
ao gel de agarose durante a electroforese para evitar a formação de estruturas secundárias
intra e intermoleculares. O RNA extraído é colocado em poços da máquina bioanalyser e, após
aplicação de corrente eléctrica, corre durante cerca de 1 min em microcanais preenchidos com
uma matriz de resina. A detecção do RNA é feita por fluorescência e apresentada sob a forma
de electroferogramas. Na análise dos gráficos obtidos devem identificar-se picos que
correspondem ao DNA ribossómico, que é muito abundante. Caso existam vários picos, de
tamanhos distintos, é sinal que o rRNA foi degradado e que o mRNA também deverá estar
degradado, embora não seja visível no electroferograma devido à sua baixa concentração. O
RNA degradado deve ser rejeitado.
Hibridação de Northern
A hibridação de Northern é, em termos de processamento, equivalente à hibridação de
Southern mas utiliza uma sonda de DNA para reconhecer locais numa sequência de RNA. O
RNA extraído deve ser corrido num gel de agarose que contém formaldeído (evita formação de
estruturas secundárias) e fixado a uma membrana de nylon ou nitrocelulose. A sonda, formada
por um gene de interesse (completo ou parcial) é marcada radioactivamente ( 32P) e detectada
por autoradiografia. A presença da sonda num fragmento indica que o gene que se está a
estudar foi expresso. A hibridação de várias bandas numa única amostra de RNA pode
identificar transcritos homólogos de vários tamanhos, indicadores da ocorrência de splicing
alternativo.
O tamanho do transcrito é determinado por comparação com o padrão de pesos moleculares,
uma vez que os fragmentos corridos no gel têm o tamanho original. A quantidade de transcrito
pode ser estimada por análise de densitometria ou por comparação de várias amostras. Após o
isolamento de um transcrito pode sintetizar-se o seu cDNA e convertê-lo em dsDNA para
clonagem e sequenciação. A comparação da sequência obtida com a sequência do gene no
DNA pode evidenciar a localização de intrões e os locais de inicio e termino da transcrição.
Uma outra aplicação da hibridação de northern é a determinação de estruturas operónicas. Se
um gene for usado como sonda e o fragmento que sofreu hibridação com mRNA for de
tamanho superior ao gene, então as evidências indicam que o gene está inserido num operão.
Técnica de protecção por nucleases
Os passos fundamentais da técnica de protecção por nucleases são:
Extrai-se o RNA complexo e hibrida-se com uma sonda de RNA antisense
(complementar a um transcrito da célula) marcada;
Adicionam-se nucleases ao meio de reacção. O RNA de cadeia simples é degradado
mas as regiões onde ocorreu hibridação, que estão sob a forma de RNA de cadeia
dupla, são preservadas;
Inactivam-se as nucleases e precipita-se o RNA;
Correr-se um gel e identifica-se o transcrito que sobreviveu à digestão.
Esta técnica é bastante sensível e permite a quantificação das moléculas alvo (transcritos),
uma vez que a hibridação da sonda é uma reacção estequiométrica.
RT-PCR, PCR quantitativo
O RT-PCR (reverse transcription polymerase chain reaction) permite analisar a presença de um
determinado transcrito e quantificar a sua quantidade, sendo especialmente útil para mRNA
raros e para o controlo da expressão de um gene. Em células cancerígenas, por exemplo, é
possível monitorizar o desenvolvimento e tratamento do cancro através da quantificação da
transcrição de oncogenes.
PCR amplifica DNA pelo que se quisermos amplificar mRNA temos que recorrer à sua
conversão em cDAN. Na técnica de RT-PCR uma população de mRNA é transcrita reversamente
(transcriptase reversa) de modo a originar uma população equivalente de cDNA que vai ser
amplificada e utilizada para quantificar a quantidade inicial de transcrito.
Extrai-se o RNA e adiciona-se à mistura de reacção um primer 3’ e a enzima transcriptase
reversa, de modo a que seja sintetizada uma primeira cadeia de cDNA. O tipo de primer
utilizado depende do cDNA que queremos obter: se forem usados primers aleatórios
virtualmente todo o RNA vai ser transcrito em cDNA; um primer poli-T liga-se à cadeia poli-A
do mRNA e permite transcrever qualquer mRNA de eucariotas; um primer específico é o ideal
para a amplificação de um gene alvo.
Após a síntese de cDNA degrada-se o RNA e acrescentam-se os reagentes de PCR (taq
polimerase, dNTP’s, primer 5’, Mg2+, etc). A reacção de PCR decorre normalmente sendo
amplificado DNA que corresponde ao mRNA em estudo.
Teoricamente, há uma relação quantitativa entre a quantidade de material no inicio da
reacção e em qualquer ponto do ciclo. Na prática, como as reacções têm rendimentos
diferentes, a quantificação é falível. No entanto, é possível analisar a cinética do PCR em
tempo real através de PCR quantitativo (qPCR).
Actualmente utiliza-se PCR em tempo real, ou seja, mede-se a quantidade de produto à
medida que este é formado. Para esse fim pode incluir-se na mistura de PCR uma tinta que
emite fluorescência quando se liga a dsDNA. SYBR Green é um exemplo de um composto que
se intercala entre cadeias duplas de DNA, emitindo cerca de 100x mais fluorescência do que
quando se encontra livre. A medição dessa fluorescência ao longo dos vários ciclos de PCR
permite quantificar a quantidade de produto formado. Contudo, a formação de dímeros de
primers ou de produtos inespecíficos originam dsDNA e o aumento da fluorescência emitida
pode sobrestimar a quantidade de DNA amplificado. Para evitar este problema utiliza-se uma
sonda repórter, como as sondas TaqMan, que emite um sinal fluorescente apenas quando
hibrida com um produto de PCR.
As sondas repórter são complementares a regiões centrais do gene em estudo, sendo por isso
necessário uma sonda diferente para cada gene. Em cada extremidade as sondas têm
marcadores: numa extremidade têm um repórter (que emite fluorescência) e na outra têm um
quencher (que mascara a fluorescência.). Quando estão em solução as sondas formam
ganchos e a proximidade entre os dois marcados impede que seja emitida qualquer
fluorescência. Mas quando há hibridação com o DNA que está a ser amplificado a distância
entre o repórter e o quencher é suficiente para que seja emitida fluorescência. Para além
disso, quando a DNA polimerase I (utilizada nesta técnica) atinge o local de hibridação da
sonda funciona como exonuclease e degrada a sonda, libertando os marcadores e permitindo
que o repórter continue a emitir fluorescência.
As sondas utilizadas são específicas para um dado gene, pelo que é necessário construi-las
propositadamente para cada caso. Se se quiserem estudar vários genes em simultâneo (análise
multiplex) é possível utilizar sondas com fluoroforos diferentes, de modo a que estes emitam
fluorescências distinguíveis.
A quantificação, propriamente dita, do DNA é feita através da análise de um gráfico de
fluorescência versus número de ciclos, onde se distinguem 3 fases:
Basal: nesta fase inicial apesar de ser emitida alguma fluorescência ainda não é
suficiente para ser detectada;
Exponencial: quando é ultrapassado um determinado limiar de detecção a
fluorescência acumulada passa a ser detectável e cresce exponencialmente. Na
prática, é fixado um limite e define-se o parâmetro CT (treshold cycle) como o número
de ciclos necessários para que seja atingido o limite de fluorescência. O valor desse
parâmetro depende da concentração inicial de DNA alvo, de tal modo que quanto
menor for a quantidade de produto inicial maior será o número de ciclo necessários
até se ultrapassar o limiar;
Saturação: fase final, na qual há saturação da reacção e a amplificação deixa de ser
exponencial, podendo mesmo estagnar.
Representando CT em função do logaritmo da concentração inicial de DNA obtém-se uma recta
de calibração que pode ser usada para analisar e comparar as quantidade iniciais de amostras
desconhecidas, permitindo assim a quantificação do mRNA numa célula.
Genes repórter
Um gene repórter é um gene de teste que é fundido à região a montante de um gene em
estudo, substituindo-o. Quando um vector com este gene é inserido um organismo hospedeiro
(que deve ser o organismo de origem do gene cuja actividade se está a estudar) o padrão de
expressão do gene repórter deve mimetizar exactamente o padrão do gene original, pois as
condições de controlo são as mesmas. O gene repórter deve assim codificar para um fenótipo
que não seja apresentado pelo organismo hospedeiro e que seja de fácil identificação e
quantificação, como por exemplo a resistência a antibióticos, β-galactosidase ou
bioluminescência.
Um gene repórter pode ser utilizado para estudar a regulação de um gene, o seu nível de
expressão e até para comparar a força entre diversos promotores. Neste último caso clonamse promotores em plasmídeo que já contém o gene repórter e quanto maior for a produção do
gene repórter maior será a força do promotor.
Microarrays
Para organismos cujo genoma já esteja sequenciado, a análise do transcriptoma (mRNA de
uma célula, revela o padrão de expressão génica) pode ser feita através de microarrays de
cDNA.
Um microarray é um pequeno suporte sólido (por exemplo, de vidro) no qual estão
imobilizadas milhares de sondas. Cada sonda que corresponde a uma sequência diferente está
fixa num determinado local (spot), permitindo a análise da expressão de um gene através da
medição da quantidade de mRNA (ou cDNA) que hibrida nesse spot.
O processamento de microarrays envolve, regra geral, os seguintes passos:
Extrai-se o RNA e purifica-se o mRNA. Para purificar mRNA de eucariontes utilizam-se
colunas que contêm uma resina onde estão ligadas caudas poli-T, com as quais as
caudas poli-A do mRNA hibridam. O restante mRNA é descartado;
Recorre-se à transcriptase reversa para sintetizar cDNA e marcam-se essas cadeias,
geralmente com compostos fluorescentes. Podem analisar-se várias amostras em
simultâneo desde que se usem marcadores diferentes. Por exemplo, é possível
comparar dois transcriptomas usando os fluorocromos cinanina 3 (Cy3, cor vermelha)
e cinanina 5 (Cy5, cor verde);
Adiciona-se a amostra marcada ao array, após esta ter sido desnaturada. Se houver
complementaridade entre a sonda e o cDNA estes hibridam e o fragmento de DNA fica
imobilizado. Caso não ocorra hibridação a amostra é lavada;
Faz-se a leitura do microarray. Os fluorocromos são excitados por um laser e a emissão
de luz é medida usando um microscópio a laser confocal de scanning. A imagem é
analisada e a intensidade dos pixéis é calculada subtraindo-se a fluorescência de
fundo. Quando há comparação de transcriptomas devem comparar-se duas imagens e
calcula-se um ratio normalizado entre as intensidades dos fluorocromos (ex.
R=Cy3/Cy5). Se R=1 não há diferença na expressão de determinado gene nas duas
amostras. Se R<1 ou se R>1 há expressão decrescida ou acrescida, respectivamente, na
amostra Cy3 em relação à Cy5.
Este tipo de análise de microarrays tem a desvantagem de só existir uma sonda por
gene (pode não ser reconhecida ou podem ocorrer hibridações não específicas) e de a
intensidade de fluorescência não ser equivalente para os vários fluorocromos. Em
amostras múltiplas é preferível fazer dois microarrays para que seja feita uma média
das intensidades.
Existem essencialmente dois tipos de microarrays:
Microarrays de baixa densidade (spotted DNA microarrays): têm uma densidade de
1.000 a 10.000 spots por cm2 e os spots devem estar suficientemente afastados para
que não ocorra hibridação cruzada. Cada sonda deve estar marcada e ser o mais
específica possível para o gene a que corresponde (cada gene é representado por uma
só sonda pelo que há um maior risco de se perder informação). Como sonda são
utilizados clones de cDNA, mRNA ou oligonucleótidos de 50-80pb amplificados por
PCR. Em cada spot coloca-se a mesma quantidade dos produtos de PCR e faz-se a sua
imobilização à matriz (vidro) por cozedura ou exposição a radiação UV.
Após hibridação, o método de detecção é o descrito anteriormente;
Microarrays de elevada densidade (GeneChip arrays): para cada gene existem várias
sondas (por volta de 11) de modo a garantir resultados mais fiáveis. Sintetizam-se 11
sondas com homologia perfeita para o gene (Perfect Match - PM) e outras 11 sondas
com um nucleótido trocado (MisMatch – MM). Quando se analisam os chips espera-se
que as sondas MM não hibridem (controlo negativo) e as diferenças entre hibridações
em PM e MM são avaliadas e tidas em conta na análise final.
As sondas são oligonucleótidos 25-mer sintetizados directamente no array através da
técnica de fotolitografia. Para sintetizar cada camada de nucleótidos produz-se uma
máscara que bloqueia todas as posições do array excepto aquelas onde se vai
adicionar um tipo de nucleótido (A, T, C ou G. Para cada mer são necessárias 4
máscaras) e que, portanto, queremos que estejam reactivas. O nucleótido é
adicionado ao meio associado a um composto bloqueante. A máscara é retirada e é
colocada a máscara seguinte. A incidência de luz desbloqueia os nucleótidos que vão
reagir e permite a síntese de mais um mer. Repete-se este processo até todas as
sondas terem sido sintetizadas (são necessárias 100 máscaras).
O DNA que vai hibridar com as sondas do chip é preparado através de mRNA. A partir
do mRNA sintetiza-se cDNA (utiliza-se primer poli-T com promotor T7 para a RNA
polimerase) e, de seguida, faz-se a sua transcrição in vitro com nucleótidos marcados
com biotina. O cRNA gerado é fragmentado (35-200bp cada fragmento) e adicionado
ao chip.
A leitura dos microarrays é feita em duplicado, PM e MM, e a informação obtida é
processada informaticamente. Para organismos modelo existem bases de dados onde
se podem mapear os genes nas suas vias metabólicas e relacionar os seus níveis de
expressão com condições biológicas.
GeneChips já são aplicados para identificar diferentes subtipos de cancro ou diferenças na
eficiência do metabolismo de drogas.
Tipagem Molecular
A tipagem molecular consiste na diferenciação de estirpes abaixo da espécie de modo a
determinar a sua identidade, origem e dispersão. Tem aplicação em várias áreas, entre as
quais:
Microbiologia médica: controlo de doenças contagiosas, identificação de fontes de
infecção e mecanismos de transmissão;
Estudos ecológicos que envolvam a libertação de organismos geneticamente
manipulados;
Estudo das diversidade genotípica e fenotípica de microorganismos na natureza;
Validação de processos industriais onde é necessário determinar se um microrganismo
produtor é exactamente o mesmo de um processo para o seguinte.
Um sistema de tipagem deve apresentar várias características:
Ser capaz de diferenciar a grade maioria das estirpes;
Apresentar boa reprodutibilidade ao longo de tempo e em diferentes laboratórios
(mesmo resultado em Labs diferentes e em alturas diferentes);
Ser aplicado a qualquer isolada ambiental e não apenas a colecções de estirpes
laboratoriais;
Não ser complicado nem dispendioso;
Ser rápido.
Para identificar estirpes abaixo da espécie não é necessário recorrer a técnicas como a
sequenciação de DNA ou de rRNA. Para esse fim, alguns dos métodos mais utilizados são:
Análise do genoma por electroforese de campo pulsado (PFGE). Permite análise do
genoma;
Ribotipagem por hibridação de ácidos nucleicos;
Amplificação de regiões aleatórias por PCR (RAPD);
Multilocos sequence typing (MLST). É a técnica mais utilizada hoje em dia.
Análise do genoma por electroforese de campo pulsado – PFGE
Para obter os perfis de restrição de um genoma devem usar-se endonucleases de restrição que
actuem em poucos locais de modo a que não se obtenham bandas contínuas, como no caso da
PstI ou EcoRI. No entanto, fragmentos superiores a 30kb migram todos à mesma velocidade
em géis de agarose convencionais. Esse problema é ultrapassado pela PFGE (pulsed-fiel gel
electroforesis), na qual a utilização de dois campos eléctricos alternados forçam as moléculas
de DNA a mudar continuamente de direcção de migração. Quanto maior for a molécula maior
é o tempo que ele necessita para mudar de direcção e portanto a separação faz-se por
retardação.
Ao tempo que uma molécula de DNA leva a mudar de direcção de migração dá-se o nome de
tempo de reorientação tr, e depende não só do tamanho da molécula como também da força
do campo eléctrico aplicado, da concentração de agarose e da temperatura do meio.
O tempo de duração da aplicação do campo eléctrico numa dada direcção, antes de esta
mudar, é designado tempo de pulso tp e é o parâmetro crítico deste tipo de electroforese.
Caso:
Electroforese convencional: tp >> tr
Molécula sente a média de dois campos: tp << tr
Ideal: 0,1 < tp/tr < 1
Um dos problemas da técnica inicial de PFGE é que as moléculas não migram em linha recta.
Desenvolveu-se então a OFAGE (ortogonal-fiel alternating gel electrophoresis), na qual o
ângulo de reorientação está fixo em 120º e tr=90s.
O tempo de corrida destes tipos de electroforese é muito superior ao da electroforese
convencional, podendo levar de dias a meses. Para que o tempo não seja demasiado longo
devem obter-se fragmentos relativamente pequenos, entre 30kb e 700kb. Devem por isso terse cuidado ao escolher as enzimas de restrição.
O método de preparação de DNA para PFGE tem alguns passos fundamentais:
As células, na sua fase de crescimento exponencial, são imobilizadas numa matriz de
agarose (misturar as células numa solução líquida de agarose);
Colocar a solução em moldes. Garante-se que não há quebra do DNA;
Aplicar uma solução de lise contendo lisozima, RNase e SDS, durante 24h;
Aplicar uma solução com proteínase K, durante 48h, para digerir as proteínas das
células;
Lavar os blocos com tampão, durante 24h. Nesta altura apenas os cromossomas,
intactos, estão nos blocos de agarose;
Digerir o DNA com enzimas de restrição apropriadas (poucos locais de
reconhecimento). Deve colocar-se uma concentração elevada da enzima para garantir
que esta é difundida pelo gel e actua no DNA;
Colocar o DNA restringido no gel e fazer separação electroforética.
PFGE tem a vantagem de originar perfis de restrição reprodutíveis e se ser uma técnica
discriminatória. Contudo, requer equipamentos específicos, a preparação do DNA é demorada,
as enzimas de restrição são dispendiosas e a técnica é insensível a pequenas alterações no
genoma.
Apesar das suas vantagens e desvantagens, PFGE é utilizada em epidemologia, para análise de
genomas de bactérias patogénicas por restrição com várias endonucleases, e na análise física
do genoma, determinando o seu tamanho, número de replicões, organização genética e
linearidade ou circularidade das moléculas.
Ribotipagem
Na ribotipagem o DNA cromossómico é restringido por uma ou mais enzimas de restrição e os
fragmentos obtidos são separados por electroforese e sujeitos a hibridação com RNA 16S e
23S de E. coli (uma sonda universal). As regiões 16S e 23S são muito conservadas ao longo da
evolução mas apresentam diferentes sequências intermédias, o que permite identificar
diferentes perfis de hibridação em bactérias de estirpes distintas e, deste modo, caracterizálas. O número de cópias de rRNA 16S e 23S presente num organismo é também uma
informação importante na medida em que um maior número de cópias representa uma maior
variabilidade genética.
Para analisar os ribotipos de determinadas estirpes podem usar-se dois processos. No
processo mais rápido faz-se PCR das regiões conversadas utilizando primers universais (regiões
16S e 23S) e amplificando regiões variáveis. Os produtos de PCR são cortados com eznimas de
restrição e corridos num gel de agarose para posterior análise. Não é necessário extrair DNA
cromossómico, bastando lisar as células através de fervura, descartar o sobrenadante e aplicar
PCR.
A técnica clássica é bastante mais lenta pois é necessário extrair e purificar o DNA
cromossómico. O procedimento seguido baseia-se no seguinte:
Extrai-se o DNA das estirpes em questão;
Restringe-se o DNA cromossómico (com uma ou mais enzimas);
Separam-se os fragmentos restrição por electroforese;
Faz-se hibridação de Southern com uma sonda universal (radioactiva ou não).
Através da análise dos perfis de hibridação visíveis no gel pode construir-se um denograma
que representa a proximidade entre as várias estirpes analisadas. No denograma seguinte foi
utilizado o coeficiente de Dice, um coeficiente que atribui o mesmo peso a similaridades e
diferenças entre os ribotipos. Quanto maior for o valor desse coeficiente maior é a
proximidade entre estirpes.
A ribotipagem tem a desvantagem de ter uma metodologia complexa e de só fornecer
informação acerca de uma pequena região do genoma. Apesar disso, é uma técnica bastante
usada pois apresenta muitas vantagens:
É aplicável a uma grande variedade de microrganismo;
Utiliza uma sonda universal;
Alguns microrganismo apresentam múltiplas cópias do operão do rRNA, resultanto
numa maior discriminação;
Os padrões de hibridação são reprodutíveis e de fácil interpretação;
Existem bancos de dados para comparar padrões.
Amplificação de regiões polimórficas por PCR – RAPD
A técnica de RAPD (randomly amplified polymorfic DNA fingerprints) consiste em PCR seguido
de electroforese. No entanto, a PCR difere da convencional na medida em que são utilizados
primers 10-mer (aproximadamente) com conteúdo GC elevado (50-80%), e a temperatura de
ligação é baixa. Os primers ligam-se a regiões aleatórias ao longo do genoma e, caso se liguem
perto uns dos outros, ocorre PCR das regiões intermédias. Como cada estirpe apresenta um
genoma diferente vão ser amplificados fragmentos diferentes, podendo esses fragmentos ser
usados para diferenciar os organismo.
Apesar de RAPD ser uma técnica rápida tem a desvantagem de ser muito susceptível a
pequenas variações, devido ao tamanho reduzido dos primers, não sendo por isso reprodutível
em condições experimentais diferentes.
Multi locus Sequece Typing - MLST
MLST é utilizado para estudos continuados sobre uma determinada estirpe e baseia-se na
amplificação e sequenciação de 7 genes essenciais/constitutivos (housekeeping genes,
necessários ao funcionamento normal de uma célula). São sequenciados fragmentos de 450500bp de cada gene e é feita uma análise filogenética baseada na comparação entre os
fragmentos estudados e bases de dados já existentes. Para bactérias de uma mesma espécie,
sequências diferentes são designadas alelos e, para cada isolado, o local de cada alelo constitui
um sequence type (ST).
O procedimento experimental utilizado para uma analise MLST é o seguinte:
Extrai-se o DNA cromossómico do organismo em estudo;
Realizam-se 7 reacções de PCR diferentes;
Sequenciam-se os 7 produtos obtidos;
Introduz-se as sequências na base de dados para MLST;
Determinam-se os ST e faz-se a análise filogenética.
Proteínas recombinantes
Microrganismos, especialmente bactérias, que produzem compostos de interesse, como
antibióticos, podem ser cultivados em larga escala de modo a produzirem o composto de
interesse também em larga escala. São utilizados dois tipos de sistema de cultura:
Cultura em banho: cultura em grandes recipientes a partir dos quais se extraem as
células ou o composto de interesse. O meio não é renovável;
Cultura contínua: cultivam-se células num fermentador onde o meio é continuamente
extraído e renovado, proporcionando uma fonte contínua de produto. Este tipo de
cultura tem vindo a substituir a cultura em banho.
Com o desenvolvimento da clonagem genética passou a ser possível produzir em grande
quantidade diversos compostos que não são sintetizados naturalmente por microrganismo
passíveis de serem utilizados em culturas a grande escala. Surgiram então as proteínas
recombinantes - proteínas produzidas noutros organismos, geralmente bactérias, que não o
organismo de origem.
Para produzir proteínas recombinantes, por exemplo, de um animal é necessário clonar o gene
de interesse num vector de expressão, introduzi-lo num hospedeiro apropriado para que este
faça a sua transcrição e síntese da proteína. Os hospedeiros são geralmente bactérias, pois a
sobrexpressão de proteínas é aí mais fácil do que em células animais.
Para produzir grandes quantidades de proteínas recombinantes é necessário ter em conta
outros aspectos. Por exemplo, as estirpes bacterianas usadas devem expressar maior
quantidade de chepronas (para permitir a formação adequada da estrutura 3D das proteínas
recombinantes), as suas proteases devem ser menos eficientes (para evitar a degradação
proteica) e a sua taxa de crescimento deve ser acentuada (maximiza a produção).
Vectores de expressão
Um vector de expressão é um vector de clonagem com algumas características especiais que
permitem a expressão do gene de interesse no microrganismo hospedeiro (E. coli,
geralmente). Para além da habitual origem de replicação e marca de selecção, os vectores de
expressão devem apresentar:
Promotor: marca o local de inicio da transcrição. É reconhecido pela subunidade σ da
RNA polimerase;
Ribossome Binding Site (RBS): pequena sequência de nucleótidos complementar ao
rRNA 16S (região Shine-Delgarno). Esta zona é reconhecida pelo ribossoma,
favorecendo a sua ligação e o inicio da transcrição alguns nucleótidos a seguir;
Terminador: local a seguir a um codão stop onde a transcrição termina. É geralmente
um sequência de nucleótidos capaz de, por complementaridade de bases, formar uma
estrutura em forma de gancho que induz a dissociação da RNA polimerase.
Os genes de organismos superiores são controlados de diversas formas, estando normalmente
rodeados de sequências sinalizadoras. No entanto, nem essas sequências nem os promotores
de eucariotas são reconhecidos por bactérias como E. coli, sendo necessário utilizar
promotores específicos para estes microrganismos.
O promotor é o componente mais importante de um vector de expressão na medida que é
este que controla a ligação da RNA polimerase e o ritmo ao qual é feita a transcrição e,
consequentemente, a expressão da proteína recombinante. A força de um promotor depende
das zonas consenso - sequências específicas ricas em T e A (TATA box), que estão relacionadas
com a afinidade da RNA polimerase:
Promotor forte: permite um ritmo elevado de transcrição, resultando na expressão
elevada de uma proteína. As TATA box associadas a promotores fortes são, por
exemplo, TATAAT. Os promotores fortes são, geralmente, os ideais para se usar na
produção de proteínas recombinantes;
Promotor fraco: a menor afinidade da RNA polimerase dita um ritmo de transcrição
menor e uma menor expressão da proteína. Está associado a TATA box’s modificadas,
como TATAAAT. Usam-se promotores fracos, por exemplo, quando se querem
produzir proteínas tóxicas - ao impor que a expressão da proteína não é muito elevada
evita-se a morte celular precoce, permitindo assim que a cultura cresça e seja
produzida mais proteína antes de serem atingidos níveis elevados de toxicidade
Também é comum inibir-se a transcrição até que determinado ponto do crescimento
da cultura, mais uma vez maximizando a expressão proteica.
A regulação de um promotor, e consequentemente a regulação da expressão de um gene,
pode ser feita de dois modos:
Indução: a transcrição é promovida pela adição de um composto ao meio de cultura,
geralmente um substrato da enzima que vai ser produzida pelo gene recombinante;
Repressão: a transcrição é inibida pela adição de um composto ao meio.
Como exemplo de alguns promotores reguláveis temos:
Promotor lac: sequência promotora do gene lacZ, que codifica a β-galactosidase. Este
promotor é induzido por IPTG (um análogo químico à lactose), verificando-se que a
adição deste composto ao meio activa a transcrição;
Promotor trp: promotor do triptofano, é induzido por ácido 3- β-indoleacrilico e
reprimido pelo aminoácido triptofano;
Promotor tac: construído a partir dos promotores lac e trp, é mais forte que cada um
deles individualmente e é induzido por IPTG;
Promotor λPL: promotor do fago λ. É bastante forte e é inibido pelo produto do gene
λcI. Os vectores de expressão que usam este promotor em E. coli sintetizam uma
forma mutante da proteína cI sensível à temperatura: T>30ºC há transcrição; T<30ºC
não há transcrição (forma activa da proteína);
Promotor T7: promotor do fago T7. É reconhecido apenas pela RNA polimerase do
fago pelo que esta tem que ser expressa em E. coli. Utilizam-se estirpes lisogénicas
para fagos (incluem uma cópia do fago no seu genoma), modificando o genoma do
fago de modo a que o promotor da pol-RNA seja o lac. A adição de IPTG ao meio de
cultura induz a expressão da RNA polimerase de fago, que tem uma actividade mais
elevada que a RNA de E. coli, traduzindo-se assim numa maior transcrição e expressão
proteica.
Construção de um gene híbrido e proteínas de fusão
Como já foi visto, um vector de expressão para E. coli deve conter não só um promotor mas
também um local RBD (ribossome binding site) e um terminador. Na maioria dos casos o
conjunto destas estruturas forma uma cassete com um local de restrição único, onde é
inserido o gene de interesse.
Em alguns vectores, a sequência do gene que vai ser expresso não se encontra logo a seguir ao
RBS, sendo precedida pelo inicio de um gene de E. coli – forma-se um gene híbrido. Nestes
casos, a proteína produzida é designada uma proteína de fusão e contém alguns aminoácidos
no terminal N que não fazem parte da proteína nativa. O promotor lacZ e o gene da βgalactosidase são dos mais usados para criar proteínas de fusão, pois foram optimizados ao
longo do processo evolutivo e portanto são bastante eficientes.
Quando se criam proteínas de fusão o gene inserido já não necessita de ter um codão de
iniciação, pois este está incluído no gene de E. coli. Adicionalmente, tem que se ter atenção ao
modo de inserção para que a grelha de leitura de leitura dos dois genes esteja em sintonia.
Para manter a grelha de leitura correcta pode ser necessário eliminar ou adicionar algum
aminoácido, o que não é muito relevante visto que já foram alterados outros aa devido à
fusão. Para estudos laboratoriais ou cristalografia estas modificações não apresentam
problemas, no entanto, para aplicações farmacêuticas as caudas que não pertencem à
proteína nativa têm que ser eliminadas pois podem alterar as propriedades da proteína
recombinante. A remoção das caudas pode ser feita através de métodos químicos ou
enzimáticos.
Apesar de apresentarem algumas desvantagens as proteínas de fusão têm inúmeras
vantagens, de entre as quais destacamos as seguintes:
A eficiência de transcrição e tradução depende não só do RBS mas também da
sequência de nucleótidos do inicio da região codificante, pois podem formar-se
estruturas secundárias que impeçam ou dificultem a ligação do ribossoma. Este
problema é evitado pelo uso exclusivo de sequências naturas de E. coli;
A presença de péptidos bacterianos no inicio das proteínas de fusão pode estabilizar as
moléculas e prevenir a sua degradação pela célula hospdeira. Verifica-se que proteínas
que não apresentem nenhum segmento típico de bactérias são mais frequentemente
destruídas;
Os segmentos fundidos podem ser péptidos sinal, geralmente com 18 a 20 aa, que
direccionem a proteínas recobinante para o seu local de acção ou que a exportem para
o meio extracelular. A presença da proteína no sobrenadante em vez de no
periplasma, que pode ser facilmente conseguida através da fusão com o péptido sinal
adequado (ex. gene ompA e malE), é útil pois facilita os processos de extracção e
purificação;
O segmento bacteriano pode conferir características que ajudem à purificação da
proteína por cromatografia de afinidade.
Purificação de proteínas recombinantes
Para a purificação de proteínas recombinantes é comum utilizarem-se segmentos de caudas
de histidina ou, para cromatografia de afinidade, caudas de GST fusion protein.
As caudas de histidina são das fusões mais utilizadas porque requerem a introdução de poucos
aminoácidos (6-7 aa), podem estar em terminal N ou C e, na maioria das vezes, não precisam
de ser retiradas. O vector utilizado inclui o promotor lac e um local múltiplo de clonagem a
seguir a uma sequência codificadora para 6 aa de histidina.
O procedimento utilizado para o crescimento da cultura, comum à maioria dos processos de
produção de proteínas recombinantes, é o seguinte:
Clonagem do gene num vector de expressão adequado;
Sobrexpressão da proteína recombinante. Inoculação das células em meio LB
suplementado com glucose para que o aumento da fonte de carbono promova o
crescimento celular e a expressão proteica;
Crescimento da cultura até uma densidade óptica DOλ=0,5;
Adição do indutor de transcrição IPTG;
Recolha das células e lise (a proteínas é expressa no meio intracelular). A lise deve ser
mecânica (sunicação, prensa francesa, esferas de vidro, etc)) e não química, de modo a
evitar contaminações da amostra.
Após a lise obtém-se um meio, o chamado extracto bruto, que contém a proteína
recombinante juntamente com todos os constituintes celulares e reagentes/produtos do meio.
Em proteínas tóxicas ou produzias em quantidades demasiado elevadas pode ocorrer que se
formem corpos de inclusão - agregados ou cristais de proteína pura desnaturada que
precipitam. Apesar de a proteína estar desnaturada ainda pode ser purificada e, apesar de
muitas vezes não ser possível renaturá-la in vitro, ainda pode ser utilizada, por exemplo, para a
produção de anti-corpos.
Inicia-se então o processo de purificação, que pode ser feito em condições nativas ou
desnaturantes:
Aplica-se o lisado a uma coluna que contém Nitrilotriacitico e Níquel, substâncias com
afinidade para a cauda de histidinas. A proteína fica “presa” na coluna enquanto o
resto do lisado é descartado;
Fazem-se diversos passos de lavagem;
Fazem-se eluições com imidizol. Este composto tem afinidade para o níquel, que se vai
dissociar da proteína;
Obtém-se a proteína purificada.
A conformação da proteína recombinante, podendo esta estar na forma nativa ou em corpos
de inclusão, pode esconder a cauda de histidinas e não permitir a purificação. Nestes casos
pode tentar trocar-se o terminal (N ou C) onde a cauda se encontra ou utilizar uma cauda
maior, como a cauda GST (glutationa-S-transferase).
A GST fusion protein tem grandes dimensões, cerca de 30kb, e pode ser purificada por
cromatografia de afinidade. Ao passarem numa coluna com esferas de agarose acopladas a
glutationa as proteínas recombinantes com cauda GST associam-se às esferas e são retidas
durante as lavagens que se seguem. Eluições com glutationa livre numa maior concentração
do que a das esferas fazem com que a proteína se ligue preferencialmente à molécula livre e
possa ser recolhida. Caso a purificação não tenha sido total, pode ainda recorrer-se à exclusão
molecular, na qual se separam as proteínas, num gel, de acordo com o seu peso molecular.
Problemas da produção de proteínas recombinantes em E. coli
A expressão de recombinantes em E. coli pode trazer problemas devido à sequência do gene
exógeno ou às limitações da bactéria enquanto hospedeiro.
Em relação aos problemas devido à sequência do gene exógeno há três questões principais
que dificultam a expressão proteica:
Presença de intrões, pois as bactérias não possuem os mecanismos necessários à sua
remoção dos transcritos.
Ocorrência de sequências que actuam como terminadores em E. coli pode determinar
a terminação precoce da transcrição.
A redundância do código genético implica que um mesmo aminoácido pode ser
codificado por vários codões. Espécies diferentes têm codões preferenciais e a
eficiência de transcrição pode ser seriamente afectada se o gene exógeno apresentar
uma elevada proporção de codões desfavoráveis.
Os problema dos intrões pode ser resolvido sintetizando-se cDNA a partir de mRNA
processado. Já para as sequências potencialmente terminadoras e os codões desfavoráveis,
pode utilizar-se mutagénese digirida para mudanças pontuais de nucleótidos. No entanto,
tanto neste caso no anterior não é viável fazer mutações para muitos nucleótidos, podendo
sintetizar-se o gene artificialmente se as suas dimensões forem pequenas (menor que 1kb).
Os problemas de E. coli como hospedeiro são maioritariamente problemas de pós-tradução,
de entre os quais podemos destacar:
O processamento das proteínas pode não ser o correcto. A maioria das proteínas sofre
modificações químicas, como a glicosilação (adição de açúcares a aminoácidos), e as
bactérias não são, grande parte das vezes, capazes de fazer os processamentos
correctos. Consequentemente, as proteínas produzidas, apesar de terem a sequência
de aa certa, não têm a actividade biológica correcta;
A estrutura terciária da proteína recombinante pode não ser feita de modo correcto e
as pontes dissulfureto normalmente não são sintetizadas, o que pode levar à formação
de corpos de inclusão. Apesar de a proteína poder ser recuperada não é fácil fazer com
que recupere a sua forma activa;
A proteína recombinante pode ser degradada. (O processo de reconhecimento e
degradação ainda não é bem percebido).
A resolução dos problemas acima passa pela sobrexpressão de chaperonas, proteínas
intervenientes no processo de formação da estrutura tri-dimensional proteica, e pelo uso de
estirpes deficientes na produção de proteases, evitando-se a degradação proteica. Contudo,
ainda não se conseguiu resolver o principal problema, que é a falta de glicosilação, uma
modificação pós-tradução comum em proteínas animais.
Produção de proteínas recombinantes em eucariotas
E. coli é o hospedeiro preferencial para a expressão de proteínas recombinantes, mas para
proteínas grandes ou complexas é necessário recorrer a outros organismos, nomeadamente a
eucariontes como leveduras e fungos. Estes microrganismos podem ser cultivados em meio
contínuo, tal como as bactérias; por estarem mais próximos das células animais são capazes de
sintetizar proteínas recombinantes mais eficientemente; e conseguem expressar genes de
organismos superiores e processar as proteínas recombinantes de uma forma mais parecida
com a original.
A levedura Saccharomyces cerevisiae é a levedura mais utilizada para produzir proteínas
recombinantes de animais. No entanto, os promotores e terminadores de animais não
funcionam muito bem neste organismo e, portanto, tiveram que ser desenvolvidos vectores de
expressão específicos para levedura. Esses vectores são baseados nos vectores de clonagem
para levedura mas contêm, geralmente, um terminador específico de levedura e o promotor
GALB. Este promotor está associado à galactose epimerase e é induzido pela presença de
galactose, permitindo um fácil método de regulação.
Apesar de útil para a síntese de várias proteínas, como insulina, glucagina e factor de
crescimento, a levedura ainda não é capaz de realizar a glicosilação correcta de proteínas
animais (faz hiperglicosilação), tem preferência por alguns codões e não tem um sistema
eficiente de excreção de proteínas para o meio de crescimento.
Pichia pastoris é uma outra espécie de levedura utilizada para produzir proteínas
recombinantes. Tem um rendimento bastante superior ao de S. cerevisiae e as suas
capacidades de glicosilação são muito semelhantes às dos animais (acrescenta apenas mais um
açúcar). Para além disso, proteínas glicosiladas por este organismo não costumam induzir
reacções antigénicas se injectadas directamente na corrente sanguínea, em contraste com o
que acontece com as de S. cerevisiae. Apresenta o problema de degradar as proteínas muito
rapidamente impedindo, antes de ser possível purificá-las, mas este facto pode ser
ultrapassado usando um meio de crescimento especial. O promotor usado para expressão
nesta levedura é o promotor AOX, induzido por metanol.
Produção de farmacêuticos recombinantes
Algumas proteínas para uso farmacêutico que podem ser produzidas artificialmente incluem a
insulina, as hormonas de crescimento somatostatina e somatotrofina, e o factor VIII.
A insulina é naturalmente produzida nas células-β dos ilhéus de Langherhans do pâncreas,
controla os níveis de glucose no sangue e uma deficiência na sua produção ou acção pode
levar ao desenvolvimento de doença Diabete mellitus. Esta proteína é formada por dois
péptidos - péptido A (21 aa) e péptido B (30 aa), ligados por duas pontes dissulfureto e
apresenta características que facilitam a sua produção artificial através de DNA recombinante:
é pequena (tem apenas as duas cadeias mencionadas) e não sofre glicosilações pós-tradução.
Quando se começou a sintetizar artificialmente insulina, na década de 70, construíram-se
vectores de expressão para cada um dos péptidos A e B usando o vector pBR322 e o promotor
lac. As proteínas de fusão obtidas apresentavam assim os primeiros aminoácidos relativos à βgalactosidase. A separação deste segmento do fragmento de insulina era feita por um
aminoácido metionina, pelo que podia ser clivado. Os dois péptidos eram então adicionados
ao mesmo meio para que se formassem as pontes dissulfureto. No entanto, este processo era
extremamente ineficiente e só quando se descobriu que, no gene original, os péptidos A e B
eram transcritos em simultâneo e intercalados por um péptido C é que o processo melhorou.
O péptido inicial que dá origem à insulina designa-se preproinsulina e é constituído por 4
péptidos: péptido leader, A, B e C. Após a clivagem da região leader obtém-se proinsulina. A
proinsulina forma facilmente as pontes dissulfureto, sofrendo depois clivagem do péptido C
para se obter a insulina funcional.
A hormona de crescimento somatostatina tem apenas 14 aminoácidos e foi a primeira a ser
expressa em E. coli. A estratégia utilizada foi semelhante à da produção de insulina, utilizandose um gene sintetizado artificialmente a partir da sequência de aa, inserindo-se num vector
com o promotor lac e separando-se a proteína de fusão por uma metionina para permitir
posterior clivagem. Como a somatostatina não sofre modificações pós-tradução a síntese foi
logo bem sucedida.
A síntese da somatotrofina foi mais complicada pois esta proteína tem 191 aminoácidos, o que
tornava a síntese química das suas cerca de 600bp impossível na década de 70. Extrai-se então
o mRNA da glândula pituitária e construiu-se uma biblioteca de cDNA. Após se identificar o
gene da somatotrofina por hibridação de Southern e de se descobrir que esta tinha um único
local de restrição para a HaeIII, utilizou-se esta enzima para dividir a molécula em dois
fragmentos. O fragmento maior (do aa 24 ao 191) foi usado para construir um plasmídeo
recombinante. O fragmento mais pequeno (até ao aa 24) foi sintetizado quimicamente de
modo a incluir os sinais necessários à transcrição em E. coli. O gene modificado foi depois
introduzido num vector de expressão com o promotor lac.
O factor VIII, um anticoagulante que não é sintetizado pelos doentes hemofílicos, tem um
gene bastante complexo com mais de 186kb, 26 exões e 25 intrões. A proteína resultante tem
2351 aminoácidos, duas subunidades ligadas por 17 pontes dissulfureto e vários locais de
glicosilação, pelo que tem que ser expressa em células animais (E. coli e S. cerevisiae não são
capazes de expressar a proteína correcta).
As primeiras tentativas de produção de factor VIII recombinante utilizaram um vector que
continha todo o cDNA e introduziram-no em células de hamster. Apesar de a proteína ter sido
sintetizada na sua forma activa o rendimento era bastante baixo, não sendo viável
economicamente. Tentou-se então outra abordagem, na qual se sintetizaram as duas
subunidades em fragmentos separados e se utilizou o promotor Ag (um híbrido entre β-actina
de galinha e β-globina de coelho). O rendimento obtido foi mais elevado e a proteína era
indistinguível da forma nativa. É este segundo método que é utilizado hoje em dia.
Western Boltting
Western blotting é uma técnica, baseada em interacções proteína-proteína, que permite
identificar uma proteína a partir de uma mistura complexa utilizando uma sonda de
anticorpos. Pode determinar-se ainda o seu tamanho, a sua quantidade (usando marcadores
com corantes) e em que tecido é expressa (usando o anticorpo em extratos celulares de
diferentes origens).
Para realizar western blotting necessita-se de:
Proteína pura ou um extracto celular (mais comum);
Anticorpo primário, que reconhece a proteína de interesse como antigénio. Estes
anticorpos geralmente não estão marcados;
Anticorpo secundário, reconhece o primeiro anticorpo e está marcado, podendo ser
identificado;
Sistema de detecção permite identificar o anticorpo secundário e, consequentemente,
a proteína que está a ser estudada.
Para realizar esta técnica preparam-se as amostras através de fervura com SDS. Este composto
confere excesso de carga negativa às proteínas desnaturadas e permite estas migrem num gel
vertical SDS-page de poliacrilamida. Após a corrida no gel as proteínas são transferidas para
uma membrana de nitrocelulose através da aplicação de um campo eléctrico e fixadas à
membrana. Esta deve ser bloqueada com proteínas heterólogas (soro de leite, gelatina,
albumina, etc) e só depois se deve adicionar o anticorpo primário, para que este se ligue à
proteína de interesse. Após lavagem incuba-se a membrana com o anticorpo secundário. Este
reconhece o anticorpo primário e está marcado (ex. fluorescência), permitindo a sua posterior
detecção.
Por definição um anticorpo é uma proteína, secretada pelas células B do sistema imunitário de
um animal, que reconhece e se liga a uma determinado antigénio, geralmente uma proteína
exógena.
Existem dois tipos de anticorpos:
Anticorpos monoclonais são sintetizados em linhas celulares de células de rato e só
reconhecem a proteína de um modo. São bastante específicos;
Anticorpos policlonais são sintetizados pelo sistema imunitário de animais e portanto
são produzidos anticorpos em várias células B. Consequentemente o antigénio pode
ser reconhecido de várias formas. São menos específicos e podem levar ao
reconhecimento de várias proteínas no extracto bruto.
Para produzir anticorpos primários (monoclonais) injecta-se uma determinada proteína num
animal e espera-se (alguns meses) até que o sistema imunitário desse animal crie anticorpos.
Sacrifica-se então o animal e recolhe-se o seu soro, removendo-se o anticorpo de interesse.
Utilizam-se geralmente coelhos e estes não podem estar em contacto com mais nenhum
antigénio para não fabricarem outros anticorpos.
Para produzir anticorpos secundários (policlonais) injectam-se proteínas de coelho num outro
animal (cabra, cavalo, etc) e este produz anticorpos que reconhecem qualquer proteína (como
é o caso do anticorpo primário) de coelho. Devem estar marcados, por exemplo com um
substrato luminescente, de modo a permitir a identificação da proteína que está a ser
estudada.
Para localizar proteínas ou seguir processos celulares in vivo utilizam-se fusões com proteínas
bioluminescentes, como a GFP (green fluorescence protein). Estas proteínas têm um canal
com 4 aa no seu interior que, na presença de oxigénio, alteram a sua conformação e levam à
emissão de fluorescência. A GFP tem a particularidade de manter esta sua característica
noutros organismos que não o seu nativo e mesmo estando ligado a outra proteína. Para a
utilizar basta criar um vector de expressão e clonar o gene de interesse na mesma grelha de
leitura que a da GFP.
A GFP permite localizar organismos completos, como as bactérias, ou proteínas e estruturas
celulares em eucariotas, pois só neste o tamanho das células permite a distinção de
componente com microscopia confocal. Para saber em que locais é expressa uma proteína
pode marcar-se o promotor do gene. Para seguir vários compostos em simultâneo utilizam-se
variantes da GFP (ou de outras proteínas luminescentes) que emitam em comprimentos de
onda distintos.
Genómica funcional
A genómica funcional estuda as funções e interacções entre genes e/ou proteínas recorrendo
ao transcriptoma e proteoma. É a análise conjugada dos dados recolhidos por estas duas
análises que permite o estudo completo da célula num dado momento.
O transcriptoma é o conjunto de todos os transcritos de uma célula num dado momento, e
pode ser estudado através de microarrays. Fornece informação valiosa acerca dos genes que
estão activos mas não propriamente acerca das proteínas expressas, pois estas dependem do
ritmo de tradução do mRNA e de degradação por proteases. O conjunto das proteínas
expressas por uma amostra biológica num dado momento é assim desginado proteoma.
A proteómica estuda os proteomas com o objectivo de:
Identificar todas as proteínas num proteoma;
Caracterizar a sua função, localização celular, modificações pós-tradução, etc;
Fazer uma análise diferencial comparando proteomas provenientes de diferentes
condições;
Perceber interacções proteicas e a fisiologia celular.
A proteómica divide-se em 3 categorias:
Proteómica de expressão ou analítica é o estudo quantitativo da expressão proteica
entre amostras sujeitas a condições diferentes. Recorre às técnicas de electroforese
bidimensional e à espectrometria de massa. É neste tipo de proteómica que nos
vamos focar;
Proteómica funcional ou de interacção utiliza um ligando proteico para isolar tipos
específicos de proteínas. É particularmente importante para estudos de sinalização ou
interacção proteína-droga e recorre aos domínios e motivos proteicas bem como a
modificações pós-tradução;
Proteómica estrutural determina a estrutura 3D das proteínas e como actuam dentro
de um complexo. Permite assim mapear complexos proteicos nas células ou organelos
e determinar as interacções proteína-proteína. Recorre a cristalografia de raios-X e
espectroscopia NMR.
Como exemplo da dinâmica transcriptoma/proteoma podemos analisar as curvas de
crescimento de uma população bacteriana (Pseudomonas) sujeita a 3 condições diferentes:
1. Verde. Meio de crescimento nutritivo sem toxicidade. A curva de crescimento é a
esperada, com uma fase inicial exponencial seguida de um período de latência;
2. Vermelho. Meio de crescimento nutritivo ao qual foi adicionado fenol, um composto
tóxico, em baixa concentração. O crescimento inicial é semelhante ao do meio 1 pois a
toxicidade não é suficiente para impedir o crescimento. Porém não se verifica fase de
latência mas sim de morte celular;
3. Azul. Meio nutritivo com alta concentração de fenol. O período de crescimento
exponencial e fase de latência é retardado algumas horas, durante as quais a célula
altera o seu transcriptoma/proteoma e se adapta ao meio tóxico.
Em todos os estes casos apesar de o genoma da população se ter mantido intacto o
transcriptoma/proteoma variou conforme as condições de crescimento de modo a permitir a
adaptação ao meio.
Na análise de proteomas comparam-se sempre amostras provenientes de condições
diferentes, não sendo usual fazerem-se proteomas isolados. Deve comparar-se sempre a
presença/ausência de proteínas e também a sua quantidade. A técnica mais utilizada é a SDSpage bidimensional.
Preparação das amostras proteicas
A preparação e purificação das amostras é uma fase crucial porque as proteínas têm que ser
solubilizadas, obtidas com boa qualidade e em quantidade suficiente para se puderem obter
resultados reprodutíveis, para além de não poderem conter contaminantes.
A preparação dos extractos pode ser feita por lise osmótica/enzimática/por detergentes, ciclos
de congelação-descongelação, sunicação, entre outros. Como as proteínas membranares não
solubilizam facilmente em tampões aquosos é necessário adicionar detergentes especiais.
Para purificar os isolados proteicos precipitam-se as proteínas, lavam-se os preparados e
utilizam-se nucleases, lipases e outras substâncias ou enzimas que degradem as constituintes
celulares mas que mantenham a integridade das proteínas. É comum, durante a electroforese,
usaram-se inibidores de proteases e manter-se o ambiente a 4ºC.
Electroforese bidimensional (2-DE)
E electroforese bidimensional em gel de poliacrilamida permite a separação, em condições
desnaturantes, de proteínas de acordo com o seu ponto isoeléctrico e peso molecular. As duas
dimensões de separação são:
1ª dimensão: focagem isoeléctrica. A solução proteica é colocada numa tira IPG
(immobilzed pH gradients) e a migração dá-se na direcção decrescente de pH. As
proteínas param quando atingem o seu ponto isoeléctrico e obtém-se uma
distribuição de acordo com o pI. Geralmente correm-se amostras em duplicado para
haver relevância estatística;
2º dimensão: gel SDS-page. Cada tira é colocada num gel com SDS e a aplicação de
campo eléctrico provoca a separação das proteínas de acordo com o seu peso
molecular (mais leves migram mais). Tem que se ter atenção pois estes géis não têm
em conta modificações pós-tradução, que podem levar à adição/remoção de grupos e,
portanto, à alteração do peso molecular total. O gel deve ser preparado com cuidado
para impedir uma polimerização incorrecta da poliacrilamida e contaminações.
No final da 2-DE a coloração do gel revela um padrão de pontos com vários tamanhos e
intensidades, correspondendo cada ponto a uma proteína diferente. A análise de vários
proteomas num mesmo gel é benéfica pois elimina alguns erros de distorção dos resultados
(géis diferentes não correm exactamente da mesma maneira).
Utiliza-se frequentemente nitrato de prata para a coloração, mas deve ter-se cuidado porque o
gel pode ficar demasiado escuro e perder definição. Comassie é outro corante utilizado mas se
quisermos analisar várias amostras num só gel temos que usar fluorocromos. Marcando cada
extracto com um fluorocromo diferente lêem-se os vários comprimentos de onda emitidos
pelo gel e identificam-se as proteínas pertencentes a cada amostra.
A análise comparativa de proteomas é feita com recurso a softwares específicos, como o
ImageMaster Platinum que permite a verificar a ausência/presença de proteínas em várias
amostras bem como as suas quantidades relativas.
A electroforese 2D tem algumas limitações, nomeadamente:
É difícil de automatizar, porque tem muitos passos, e portanto torna-se um trabalho
intensivo e demorado;
Está limitado ao número e tipo de proteínas que o gel consegue resolver. Por exemplo,
um lisado de células eucarióticas é demasiado complexo para ser poder ser separado
com esta técnica;
Proteínas com grandes dimensões ou hidrofóbicas podem não entrar no gel;
Proteínas com pI inferior a 3 ou superior a 1º são difíceis de separar e encontram-se
subrepresentadas. Podem utilizar-se IPG não lineares que amplificam uma
determinada região do gradiente de pH, normalmente a região entre pH 4 e 7 (mais
representativa das proteínas humanas);
Não permite a detecção de proteínas raras ou que estejam representadas em baixa
quantidade.
Identificação de proteínas
A maioria das vezes quando se estuda um proteoma não existe nenhum mapa onde se possam
identificar as proteínas. Nesses casos é necessário extrair as proteínas de interesse e identificálas. Podem utilizar-se vários métodos:
Electroblotting: permite extrair uma proteína por aplicação de corrente eléctrica.
o Sequenciação de Edman: a partir do terminal N sequenciam-se os primeiros
20 a.a. de uma proteína. No entanto, este método está limitado aos 20 a.a. e é
muito demorado;
o Imunodetecção: utilizam-se anticorpos para identificar proteínas;
Espectrometria de massa: permite identificar proteínas de genomas já sequenciados
baseando-se na relação massa/carga das formas ionizadas quando lhes é aplicado um
campo de alta energia.
PMF (peptide mass fingerprinting) é uma inovação da espectrometria de massa e é muito
utilizada hoje em dia. No entanto só pode ser aplicada a fragmentos com menos de 50 a.a.,
pelo que proteínas maiores necessitam de ser quebradas.
Os passos gerais da técnica de PMF são:
Retiram-se/cortam-se os pedaços do gel que contêm a proteína de interesse;
Colocam-se em tubos e adiciona-se tripsina, uma protease que cliva péptidos
imediatamente a seguir a resíduos de arginina ou lisina. Obtemos vários fragmentos da
proteína original, geralmente com tamanhos entre 5 a 75 a.a.;
Ionizam-se as amostras através de electrosrpay ionization (ESI) ou MALDI – matrixassisted lase desorption/ionazition. São adicionados ou removidos protões aos
péptidos;
Mede-se a massa dos péptidos através da relação massa/carga;
Comparam-se os valores obtidos com bases de dados que contém sequências
proteicas e/ou genomas. O software analisa o genoma e os péptidos que poderiam
apresentar as características medidas, dando o resultado estatisticamente mais
correcto.
Interacções proteína-proteína
As proteínas actuam normalmente em complexos. A interatómica preocupa-se com as
interacções proteína-proteína e faz uso de duas abordagens:
Abordagem genética:
o Dois híbridos em levedura;
o Dois híbridos em bactérias;
Abordagem bioquímica:
o Bibliotecas de fagos (phage display);
o Co-imunoprecipitação (pull down experiments);
o Chip (SPR – surface plasmon ressonance);
o Marcadores in vivo.
Dois híbridos
A técnica de dois híbridos de levedura baseia-se na descoberta que a expressão de genes em
Saccharomyces cerevisiae depende da interacção entre dois factores de transcrição. Cada
factor tem dois domínios – um domínio de ligação (reconhece o promotor, ligando-se ao DNA)
e um domínio activador (activa a RNA polimerase).
Para testar se duas proteínas interagem criam-se dois híbridos que contém parte do factor de
transcrição e parte da proteína. São realizados duas clonagens:
1. A proteína que está a ser estudada é clonada, juntamente com um dos factores de
transcrição, em levedura. As leveduras recombinantes não expressão o gene porque
este não é transcrito, devido às modificações inseridas no factor de transcrição;
2. A proteína que se vai testar se interage com a primeira é clonada num vector que
contém o outro factor de transcrição. Se as duas proteínas interagirem então também
os factores vão poder interagir e verifica-se transcrição.
Se não houver transcrição não se pode concluir logo que as proteínas não interagem
pois estas podem ser demasiado grandes para permitir a interacção dos factores de
transcrição ou podem ser hidrofóbicas e portanto não entrarem no núcleo.
O sistema bacteriano de dois híbridos adenilato-ciclase (BATCH – bacterial adenylate-cyclase
two-hybrid system) baseia-se no mesmo principio que o sistema de dois híbridos de levedura e
pode ser usado também para proteínas membranares.
A adenilato-ciclase tem 2 domínios (T25 e T18) que juntos levam à síntese de cAMP e à
activação da transcrição de alguns operões, nomeadamente do operão da lactose. O operão
lac é activado quando há pouca glicose no meio através da síntese de cAMP, que se associa à
proteína CAP (catabolite activator protein) e actua como factor de transcrição para a RNA
polimerase.
Para testar a interacção entre duas proteínas constroem-se plasmídeos híbridos, introduzemse em estirpes de E. coli deficientes para a produção de adenilato-ciclase e mede-se a
actividade da β-galactosidase. Essa actividade deve estar aumentado se o houve interacção
proteica e o operão estiver activo.
Biblioteca de fagos
Na técnica de phage display constrói-se uma biblioteca de fagos, geralmente fagos M13, cada
um capaz de expressar uma determinada proteína. Cada proteína exógena (preparada a partir
de uma mistura de cDNA de um tecido particular ou por clonagem de fragmentos de DNA) é
inserida num gene da cápsula de modo a que a sua expressão resulta numa proteína híbrida
que se mantém na cápsula. A proteína que se pretende testar é imobilizada no fundo de um
tubo ao qual é adicionada a mistura de fagos. Após algumas lavagens, as únicas proteínas que
ficarão no tubo são as que interagem com a proteína imobilizada. No entanto, não se sabe à
partida que proteínas são essas.
Co-imunoprecipitação
Na co-imunoprecipitação um anticorpo é utilizado para precipitar uma proteína alvo. Um
lisado celular, contendo o antigénio em estudo mas também muitas outras proteínas, é
passado numa coluna que contém o anticorpo. O antigénio fica retido na coluna, assim como
todas as proteínas que com ele interagem e o complexo antigénio/anticorpo é recuperado por
SDS-page ou espectrometria de massa.
Nesta técnica temos que ter atenção às condições do meio pois estas não podem ser
desnaturantes, correndo-se o risco de não ocorrem interacções proteicas.
SPR – Surface Plasmon Ressonance
Para esta técnica in vitro é necessário conhecer-se previamente as proteínas cuja interacção se
vai testar. Uma das proteínas é imobilizada num sensor (fase sólida) e a outra é adicionada
(fase líquida) ao meio ficando ou não ligada à primeira, conforme haja ou não interacção. A
detecção da interacção é feita por um sensor que mede o índice de refracção do complexo
proteico.
SPR é importante para testas especificidades, por exemplo de drogas, pois permite o cálculo
de constantes cinéticas.
Marcadores (Tags)
Marcadores são usados para purificar complexos proteicos num só passo. Para isso sintetiza-se
a proteína que está a ser estudada fundida com um marcador, como por exemplo uma cauda
de histidinas, e passa-se o extracto bruto que a contém por uma coluna com níquel. A cauda
de histidinas vai ligar-se ao níquel e o complexo, que possivelmente se formou, fica
imobilizado na coluna. Após lavagens e eluições obtém-se o complexo purificado e podem
identificar-se as proteínas que interagiram com a proteína inicial.
Download