INSTITUTO SUPERIOR TÉCNICO MESTRADO INTEGRADO EM ENGENHARIA BIOMÉDICA Relatório de Engenharia Genética TP2 – Desenho in silico de uma experiência de Southern Blotting, de uma experiência de clonagem de um gene, e previsão da função de uma sequência de DNA não caracterizada Ana Raquel Aguiar nº72727, Marta Ferreira nº72767, Nuno Matias nº73614 Professora Miguel Teixeira Novembro 2013 1 Relatório TP2 – Engenharia Genética 2013/2014 Introdução Neste trabalho experimental, pretendeu-se analisar as sequências de nucleótidos e de aminoácidos de um determinado gene, através de algumas ferramentas bioinformáticas essenciais em Engenharia Genética, disponibilizadas na Internet. Para tal, realizaram-se três experiências, in silico, que permitiram explorar os passos necessários de modo a: I) Conduzir uma experiência de Southern Blotting II) Superproduzir e purificar uma proteína III) Prever a função de um gene/proteína não caracterizado. Com a finalidade de produzir uma sonda para a primeira experiência, criou-se um mapa de restrição a partir da sequência de nucleótidos, que permitiu seleccionar as enzimas de restrição. Para a ampliação por PCR criaram-se primers adequados. Para superproduzir a proteína que o gene codifica, foi necessário escolher um vector de clonagem adequado para introduzir o gene numa bactéria que não o possuía. Para este processo também foram usados métodos bioinformáticos para a selecção de enzimas de restrição e de primers. Respectivamente à análise de sequências de nucleótidos do gene, inclui-se a pesquisa de grelhas de leitura aberta (open reading frames – ORFs) que permitiram identificar o gene desconhecido e a proteína codificada por este com o recurso a ferramentas de BLAST na plataforma do NCBI. A partir da análise de sequências de aminoácidos foi possível prever as propriedades físico-químicas da proteína assim como a sua estrutura. 2 Relatório TP2 – Engenharia Genética 2013/2014 Resultãdos e Anãlise de Resultãdos O gene estudado para os efeitos desta experiência foi o gene ABY19312.1 que codifica para a enzima “farnesyl diphosphate synthase 1”(FDS1) do organismo Myzus persicae um afídio vulgarmente conhecido como pulgão-verde-do-pessegueiro [1]. Desenho in silico de uma experiência de Southern blotting A experiência laboratorial consiste na criação de uma sonda de DNA contendo uma porção de um determinado gene. Essa sonda é modificada de modo a ser detectável e, ao ser colocada em contacto com uma porção genómica de origem desconhecida, liga-se com elevada especificidade apenas àquela porção do gene, assinalando a sua presença no conteúdo genético analisado com a sonda. Na experiência computacional realizada, procurou-se definir as melhores condições para a formação da sonda, nomeadamente os primers e as enzimas de restrição a utilizar. Isto foi realizado para o gene codificante da FDS1, no caso de se querer localizar este gene no DNA do organismo onde é expresso. De forma a obter-se a sequência de nucleótidos do gene que codifica a enzima em estudo, recorreu-se à base de dados do NCBI (National Center for Biotechnology Information), tendo-se obtido o seguinte resultado em formato FASTA contendo 1185 bp [2]: 3 Relatório TP2 – Engenharia Genética 2013/2014 >gb|EU334430.1|:248-1432 Myzus persicae farnesyl diphosphate synthase 1 (FPS1) mRNA, complete cds ATGAACAAAATGCTGACTTTTACGAGAGCCCTAAGTCGCCGGAGCGCGTTTTTGCTCTGTGACTCGGCTGTCGTTCGGAA TAATAACTTTCGGGCTATGAGTACAGTTCGCGCACCGCCAGTCCCTCCGGTCATAACTGGTACAGCCGTCAGCAAGGACG AGACCAGGGATTTCATGGCAGTGTTCCCAGATGTAGTCAGGGATCTGACGGACACCGGCCGTAACTTAGACGTGCCCGAT GTTACCAAGTGGCTCGCAAAGCTGTTGCAATACAATGTGCCCGGTGGTAAGAAAAACCGAGGATTGGCTTTGGTACTGTC ATACAAAATGTTATCCTCGCCTTCTGATCAGACTGATGAAAACCTTAAATTGTCTTACATACTGGGATGGTGTGTTGAAA TTCTGCAAGCCTATCAATTAGTGTTAGATGACATAATGGATAACGCAATAACTAGACGAGGACGTCCATGTTGGTATCGG CACAATGATATTGGTCTAATGGCAGTGAACGATGGTGTTCTCCTCGAACAGGCCATTTACCAGTTGATTAAAAAGTACTT CAAGGATAAGCCTTACTACACACATATTTTGGAGCTGTTCTTTGACGTTACAATGAAAACTGCGATGGGTCAGTGTCTTG ATATGTTAACCGCCAATAGCTTCAAGTCAAAAAAACTTGAAAAATATACCATGGAAAATTATACAGCTATTGTGAAATAT AAGACTGCTTATTATTCTTTTTTTCTTCCAGTATGTCTTGCAATGCGCATGACAAACATCAATGACCCAGAAATCTTTCG ACAAGCAAAGACTATACTGCTTGAAATGGGACACTTCTTTCAAGTTCAAGATGACTTTTTAGACTGTTATGGAGATCCAG ACGTCATGGGAAAAATTGGCACAGACATAGAAGATGGTAAATGTTCATGGTTAGCTGTAGTGGCTTTGCAAAAAGTCAAT TCTGAACAAAAGAAAATTATGGAGGACAACTATGGTATTGATGATCCAGCCAATGTTGCAATCATCAAAGATTTGTATGC ACAGTTGAAATTAGCAGACACATTTCATCTCTACGAAGAAGAAAGTTATAAATTAATATGCACTCATATTCAACAGTTGT CACGAGGTTTGTCACAAGACATGTTTTTCAAATTTTTGGAAAAGATTTACAAGAGAACACTCTAA Fig.1 Sequência de nucleótidos do gene da FDS1 Computação do mapa de restrição do gene A execução da técnica de Southern blotting implica a digestão da porção genómica que se quer sondar, por parte de enzimas de restrição. Usando o software NEBcutter V2.0 [3], foi possível, a partir da sequência de DNA do gene, encontrar a maior grelha de leitura aberta – ORFs (open reading frames) utilizando o código genético de E.Coli. Este software permitiu também a selecção de enzimas de restrição cuja sequência de corte está presente ou ausente no gene introduzido como input. Tratando a sequência de DNA como linear e escolhendo enzimas de restrição comercialmente disponíveis, obtém-se o mapa de restrição do gene em estudo [4]. 4 Relatório TP2 – Engenharia Genética 2013/2014 Fig.2 Mapa de restrição do gene da FDS1 Este diagrama mostra as enzimas que cortam o gene em sequências específicas do mesmo. As enzimas que se devem escolher neste caso são as que preferencialmente não têm sequências de corte localizadas no interior do gene. Tais enzimas estão listadas na Tabela 1 [5]. Poderia ser utilizada uma enzima que cortasse o gene numa zona exterior à zona sondada, mas para escolher tal enzima tem de se ter em atenção os primers e verificar se estes abrangem uma zona que é cortada pela enzima eleita. 5 Relatório TP2 – Engenharia Genética 2013/2014 Tabela.1 Lista de enzimas cujas sequências de corte localizam-se no exterior do gene # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Enzyme AarI AbsI Acc65I AccI AclI AcuI AfeI AflII AgeI AhdI AjuI AleI AlfI AloI AlwNI ApaI ApaLI ApeKI ArsI AscI AsiSI AvaI AvaII AvrII BamHI BanI BarI BbsI BbvCI BbvI BcgI BciVI BfuAI BglI BglII BlpI BmtI BplI BpmI Bpu10I 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 BpuEI BsaAI BsaBI BsaXI BseYI BsgI BsiHKAI BsiWI BsmBI BsmI BsoBI BspCNI BspDI BspEI BspHI BspMI BspQI BsrBI BsrGI BssHII BstAPI BstBI BstEII BstXI BstZ17I Bsu36I ClaI CspCI DraI DraIII EarI EciI Eco53kI EcoO109I EcoP15I EcoRI EcoRV FalI FauI Fnu4HI 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 FseI HaeII HgaI HindIII HphI Hpy99I KasI KflI KpnI MauBI MfeI MluI MmeI MreI MscI MspA1I NaeI NarI NdeI NgoMIV NheI NlaIV NotI NruI NsiI PacI PaeR7I PasI PcsI PflFI PflMI PfoI PluTI PmeI PmlI PpuMI PshAI PspOMI PspXI PsrI 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 PstI PvuI PvuII RsrII SacI SacII SalI SapI Sau96I SbfI SexAI SfaNI SfiI SfoI SgrAI SgrDI SmaI SmlI SnaBI SpeI SphI SspI StuI SwaI TaqII TauI TfiI TseI TspMI Tth111I XbaI XhoI XmaI 6 Relatório TP2 – Engenharia Genética 2013/2014 Desenho de primers para PCR Para a realização desta técnica é necessário a presença de uma elevada quantidade de sonda, pelo que se deve recorrer à utilização da técnica de PCR, conhecida pela sua utilidade na amplificação de zonas especificas de DNA. Torna-se necessário definir a secção a ampliar, recorrendo por isso ao desenho de dois primers; as sequências que ao ligarem-se à cadeia complementar ou à cadeia codificadora permitem a acção da polimerase. Este desenho é feito recorrendo ao auxílio do programa informático Primer3Plus [6]. O software utilizado no desenho de primers selecciona vários pares de primers dos quais se selecciona 1 par, de acordo com os critérios enunciados abaixo. É claro que essa selecção tem por base as características mais úteis à sua função na técnica de PCR. As características mais importantes na análise de um primer são: • Ter um comprimento entre 17 a 28 bases. Um comprimento superior a 17 já garante especificidade suficiente para que se ligue exclusivamente no local seleccionado, enquanto que um comprimento superior a 28 bases torna-se pouco eficiente, aumentando a probabilidade de se formarem estruturas secundárias. É geralmente aceite que o comprimento ideal para a PCR é 18-22 bases. Este comprimento garante especificidade e facilidade de hibridação à temperatura de melting (Tm). • Possuir um conteúdo GC de 50% a 60%. As ligações G-C são mais estáveis, pelo que promovem a ligação do primer à molécula de DNA. Quanto mais elevado for o conteúdo GC, maior é a Tm, o que é conveniente pois impede que os primers exijam uma temperatura muito baixa para a hibridação, evitando o risco de renaturação do DNA. Também os terminais 3’ devem ser C, G, CG ou GC de modo a aumentar a eficiência da acção da polimerase, não podendo ter 3 ou mais nucleótidos de bases C e G seguidos, pois estas sequências geram erros por ligação a outros locais do DNA com elevado conteúdo GC. 7 Relatório TP2 – Engenharia Genética 2013/2014 • As temperaturas de melting deve estar entre os 55°C e os 80°C, evitando a renaturação do DNA. É também necessário que a Tm esteja abaixo da temperatura óptima do funcionamento da polimerase. Os primers para os quais são obtidos melhores resultados possuem Tm pertencentes ao intervalo 52-58°C. • Deve evitar-se a complementaridade entre as extremidades de modo a prevenir a formação de dímeros e perturbar a actividade da polimerase; • Devem evitar-se primers que tenham tendência para formar estruturas secundárias. Após a simulação, o par de primers seleccionado que cumpre os requisitos enunciados em cima, está representado em seguida juntamente com as respectivas localizações dentro do gene. Fig.3 Primers obtidos e respectivas características 8 Relatório TP2 – Engenharia Genética 2013/2014 Fig.4 Localização dos primers no gene Super-produção e purificação de uma proteína Com o objectivo de produzir a proteína pretendida, recorrendo a uma bactéria neste caso a E.coli, a informação genética que permita a tradução tem de ser contemplada no seu genoma, o que não se verifica. Para produzir esta proteína recorrendo a esta bactéria é então necessário introduzir o gene no interior da E.coli, através de um vector de clonagem. Torna-se então necessário seleccionar um vector pequeno, de modo a facilitar a introdução de DNA recombinante, como é o caso do PETBlueII. 9 Relatório TP2 – Engenharia Genética 2013/2014 Selecção do vector de clonagem Utilizou-se a base de dados do site addgene [7] para encontrar um plasmídeo propício a servir de vector recombinante contendo o gene da FDS1. Foram procurados plasmídeos com “HIS tag”, de origem bacteriana e com resistência a, por exemplo, ampicilina. Um dos plasmídeos com estas características é o PETBlueII, que por ser um vector relativamente pequeno facilita a introdução de DNA recombinante [8]. Este plasmídeo está representado em seguida: Tabela.2 Enzimas de restrição XbaI BgIII NheI EcoRV XmaI SmaI SacI BamHI EcoRI AscI PstI SaII NcoI AatII KpnI ClaI BstBI HindIII NotI EagI PvuII PmII XhoI AgeI PacI Fig.5 Vector PETBlueII 10 Relatório TP2 – Engenharia Genética 2013/2014 Selecção das enzimas de restrição Procedeu-se seguidamente à selecção das enzimas para abrir o vector no local onde o gene seria clonado. A escolha das enzimas de restrição deve ser feita de modo que estas cortem o vector de clonagem na zona de corte de múltiplas enzimas (regiões azuis escuras no vector PetblueII), mas que não abranjam o gene. De preferência devem usar-se duas enzimas com segmentos de corte diferentes para evitar a recircularização do vector antes da incorporação do gene. Comparando a Tabela 1 (enzimas que não cortam o gene) com a lista das enzimas com segmentos de corte situados na região múltipla de corte (Tabela 2) chega-se à conclusão que as todas as últimas enzimas podem ser utilizadas para segmentar o plasmídeo à excepção das seguintes: NcoI, AatII, EagI. Em seguida foi necessário escolher duas destas enzimas possíveis. A página da internet clontech [9] disponibiliza informação sobre os meios de solução tampão onde duas enzimas diferentes são compatíveis e têm eficiência máxima. As enzimas escolhidas foram a BamHI e SmaI em meio de solução tampão 0.5X T+BSA cuja composição pode ser consultada na respectiva fonte bibliográfica. Selecção dos primers Seguidamente, desenharam-se os primers que devem ser sintetizados tendo em conta que para a proteína ser expressa, todo o gene tem de estar contido na região a amplificar, o que não se verificava quando se estavam a desenhar primers para a amplificação de DNA para sondas. Os primers receberam os nomes de forward (Fw) e reverse (Rv). O forward tem de ser complementar do complementar, ou seja, tem de ser igual ao original e vai hibridar com a cadeia complementar. Já o reverse tem de ser complementar da cadeia que contem o gene. Quando apresentados, os primers devem apresentar-se na forma 5’->3’. 11 Relatório TP2 – Engenharia Genética 2013/2014 Fw: TCCCCCGGGATGAACAAAATGCTGACT Rv: CGCGGATCCAGAGTGTTCTCTTGTAAA O primer Fw foi construído a partir dos primeiros 18 nucleótidos da sequência de DNA do gene, complementaridade enquanto dos últimos que 18 o primer nucleótidos Rv da foi construído mesma por sequência, representados a sublinhado. Se os primers fossem só constituídos por estes segmentos o conteúdo GC era cerca de 33%, o que revela um valor longe do de 55% requerido para bons primers. Este rácio era ainda menor se, em vez de 18 nucleótidos se tivessem escolhido 20, acrescentando mais 2 nucleótidos de adenina e timina, e por isso diminuindo ainda mais o conteúdo CG. Vê-se portanto à partida a dificuldade acrescida de gerar bons primers já que a sequência complementar de DNA é naturalmente muito rica em Adeninas e Timinas e pobre em Guaninas e Citosinas. Aos primers foi ainda acrescentada uma sequência de restrição que deve ter em atenção a forma como o gene será transcrito e acrescentar aos primers as sequências que permita ao gene ser inserido no sentido correcto em que a leitura por parte de uma enzima proporcionará a transcrição e posterior tradução de uma proteína funcional. De modo a compensar o baixo conteúdo GC da sequência de 18 nucleótidos, é preferível adicionar sequências ricas em guaninas e citosinas. As enzimas escolhidas anteriormente, SmaI e BamHI satisfazem esta condição, tendo regiões de corte dadas a vermelho: SmaI : TCCCCCGGGGGA BamHI : CGCGGATCCGCG Para além da zona de restrição podem ainda adicionar-se alguns nucleótidos CG pois está a lidar-se com a actividade de endonucleases que verão a sua eficiência aumentada caso a sua sequência de corte não esteja localizada numa 12 Relatório TP2 – Engenharia Genética 2013/2014 extremidade. Após a ampliação do gene, este tem de ser digerido pelas mesmas enzimas que cortaram o vector, de modo a apresentarem extremidades coesivas que facilmente se liguem ao vector, passando este a estar clonado e a puder passar-se à sua inserção numa bactéria para a produção da proteína. Utilizou-se em seguida o software OligoAnalyzer [10] para averiguar a qualidade dos primers e prever a temperatura de fusão dos mesmos, tendo-se chegado às figuras seguintes. Fig.6 Características do primer Fw Fig.7 Características do primer Rv Analisando estes resultados conclui-se que o comprimento dos dois primers está dentro do intervalo estipulado (17-28 bases). Verifica-se que o conteúdo GC e Tm (temperatura de fusão) são valores razoáveis embora não ideais visto que o conteúdo GC ideal é perto de 55% e Tm entre 52-58ºC. 13 Relatório TP2 – Engenharia Genética 2013/2014 Ferramentas básicas para prever a função de um gene/proteína não caracterizado De forma a obter-se a sequência de aminoácidos da proteína FDS1 recorreu-se novamente à base de dados do NCBI (National Center for Biotechnology Information) [11], tendo-se obtido o seguinte resultado em formato FASTA contendo 394 aminoacidos: >gi|162538561|gb|ABY19312.1| farnesyl diphosphate synthase 1 [Myzus persicae] MNKMLTFTRALSRRSAFLLCDSAVVRNNNFRAMSTVRAPPVPPVITGTAVSKDETRDFMAVFPDVVRDLT DTGRNLDVPDVTKWLAKLLQYNVPGGKKNRGLALVLSYKMLSSPSDQTDENLKLSYILGWCVEILQAYQL VLDDIMDNAITRRGRPCWYRHNDIGLMAVNDGVLLEQAIYQLIKKYFKDKPYYTHILELFFDVTMKTAMG QCLDMLTANSFKSKKLEKYTMENYTAIVKYKTAYYSFFLPVCLAMRMTNINDPEIFRQAKTILLEMGHFF QVQDDFLDCYGDPDVMGKIGTDIEDGKCSWLAVVALQKVNSEQKKIMEDNYGIDDPANVAIIKDLYAQLK LADTFHLYEEESYKLICTHIQQLSRGLSQDMFFKFLEKIYKRTL Fig.8 Sequênica de aminoácidos da enzima FDS1 Procura por semelhança de nucleótidos Quando se sequencia um gene, não se consegue caracterizar de imediato qual(ais) a(s) proteína(s) produzida(s). É muitas vezes possível encontrar dentro de uma sequência vários conjuntos de possíveis genes que codifica para uma ou mais proteínas. Os possíveis genes são localizados por se iniciarem com codões de iniciação (ATG) e terminarem com os codões de terminação (TAA, TAG, TGA). Inserindo a sequência de nucleótidos (Fig.1) na ferramenta Blast do NCBI e o algoritmo blastn [12], obtiveram-se uma representação dos genes possíveis, representados nas imagens seguintes. 14 Relatório TP2 – Engenharia Genética 2013/2014 Fig.9 Representação gráfica dos resultados da procura por semelhança de nucleótidos Fig.10 Representação descritiva dos resultados da procura por semelhança de nucleótidos Através da análise desta tabela conclui-se que o resultado 100% compatível com a sequência de nucleótidos fornecida é precisamente o gene que codifica para a enzima “farnesyl diphosphate synthase 1”(FDS1) do organismo Myzus persicae. Caso, à partida, não soubéssemos o gene codificado por esta sequência de nucleótidos, chegava-se a esta mesma conclusão. 15 Relatório TP2 – Engenharia Genética 2013/2014 Procura por semelhança de proteínas Pode comparar-se um o conjunto de nucleótidos que codifica para uma proteína com outras sequências semelhantes, no entanto quando se pretende determinar qual a função de determinada proteína torna-se mais preciso comparar as sequências de aminoácidos. Usando a ferramenta Blast do NCBI e o algoritmo blastp [13], obtiveram-se uma representação das proteínas possíveis, representados nas figuras (apenas 23 dos 100 resultados) seguintes: Fig.11 Representação gráfica dos resultados da procura por semelhança de proteínas 16 Relatório TP2 – Engenharia Genética 2013/2014 Fig.12 Representação descritiva dos resultados da procura por semelhança de proteínas Utilizando o software Expasy e o algoritmo ProtParam [14], onde se inseriu a sequência de aminoácidos, obtiveram-se as propriedades físicoquímicas associadas à proteína correspondente. 17 Relatório TP2 – Engenharia Genética 2013/2014 Fig.13 Propriedades físico-químicas da enzima FDS1 Desta figura podemos estudar a composição relativa da proteína FSD1 em termos de aminoácidos e dos pesos moleculares das proteínas. Caso conseguíssemos obter os pesos moleculares das proteínas correspondentes dos ORF’s e se superproduzíssemos essa sequencia de DNA, através da electroforese conseguiríamos concluir qual o ORF é que estaria a ser expresso. Podemos também retirar outras propriedades físico-químicas da proteína, entre elas a instabilidade. Verifica-se que a proteína FDS1 é instável. 18 Relatório TP2 – Engenharia Genética 2013/2014 Análise da estrutura primária É também importante quando se estuda a função de uma proteína ter a noção do seu tempo de vida, da sua estrutura tridimensional; por exemplo as proteínas transmembranares têm de se estruturar de modo a serem hidrofóbicas. A ferramenta TMHMM permitiu aferir sobre a localização da proteína dentro da célula [15]. Fig.14 Representação gráfica da probabilidade de localização da enzima FDS1 dentro da célula Conclui-se que a proteína FSD1 é, sem margem para dúvidas, citosólica (outside-fora da membrana celular), indicando que não está associada a funções como por exemplo o transporte de substâncias através da membrana. Uma proteína classificada como ‘outstide’ seria mais fácil de purificar e compreender do que uma proteína membranar, que muito provavelmente teria uma função dependente de outros sistemas enzimáticos. Outro factor importante na funcionalidade das proteínas são as modificações pós-tradução como a fosforilação e a metilação; caso estas não ocorram, torna-se impossível a determinação da função da proteína. 19 Relatório TP2 – Engenharia Genética 2013/2014 Conclusão Através das ferramentas bioinformáticas foi possível aferir a sequência de nucleótidos do gene estudado e descobrir que esse gene codifica para a enzima FDS1 do organismo eucariota Myzus persicae. Neste trabalho aprendeu-se a utilizar ferramentas bioinformáticas, que permitiram o desenho do mapa de restrição do gene que codifica a FDS1, o desenho de primers tendo em conta as características que estes devem possuir, a identificação do gene e da proteína correspondente a uma sequência de nucleótidos e aminoácidos e a caracterização da mesma em termos de estrutura e propriedades. Pode então constatar-se o quão vasta é a aplicação da simulação computacional para a realização de certas experiências. Estes métodos revelam ser muito importantes pois facilitam o trabalho de muitos investigadores, poupando tempo laboratorial e tornando os trabalhos menos dispendiosos. 20 Relatório TP2 – Engenharia Genética 2013/2014 Referenciãs Bibliogrã ficãs [1] http://www.ncbi.nlm.nih.gov/ [2] http://www.ncbi.nlm.nih.gov/nuccore/162538560?report=fasta [3] http://tools.neb.com/NEBcutter2/index.php [4] http://tools.neb.com/NEBcutter2/cutshow.php?name=775ac6f9[5] http://tools.neb.com/NEBcutter2/listbycuts.php?name=775ac6f9-&numcuts=0 [6] http://biotools.umassmed.edu/cgi-bin/primer3plus/primer3plus.cgi [7] http://www.addgene.org/vector-database/ [8] http://www.addgene.org/vector-database/2658/ [9] http://www.clontech.com/takara/US/Support/Applications/Restriction_Enzymes/Buffer_Activity_ Chart [10] http://eu.idtdna.com/analyzer/Applications/OligoAnalyzer/ [11] http://www.ncbi.nlm.nih.gov/gorf/gorf.html [12] http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=bl asthome [13] http://blast.ncbi.nlm.nih.gov/Blast.cgi [14] http://web.expasy.org/protparam/ [15] www.cbs.dtu.dk/services/TMHMM-2.0 Para recolha de informação: http://www.premierbiosoft.com/tech_notes/PCR_Primer_Design.html Protocolo: Guia de trabalhos laboratoriais de Engenharia Genética (2013/2014) de Leonilde M. Moreira, Cristina A. Viegas, Arsénio Fialho, Jorge H. Leitão e Isabel Sá Correia 21