universidade federal do rio grande do norte centro de

Propaganda
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS BIOLÓGICAS
DEPARTAMENTO DE BIOQUÍMICA
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA
MIONECROSE INFECCIOSA EM CAMARÕES E
DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE
POLIMORFISMOS
NATAL
2014
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA
MIONECROSE INFECCIOSA EM CAMARÕES E
DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE
POLIMORFISMOS
Dissertação apresentada ao Programa
de Pós-Graduação em Bioquímica da
Universidade Federal do Rio Grande do
Norte como requisito parcial para
obtenção do título de Mestre em
Bioquímica.
Orientador: Professor Dr. Daniel Carlos
Ferreira Lanza
NATAL
2014
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA
EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE
POLIMORFISMOS
Dissertação apresentada ao Programa de
Pós-Graduação em Bioquímica da
Universidade Federal do Rio Grande do
Norte como requisito parcial para
obtenção do título de Mestre em
Bioquímica.
Aprovado em: 01/08/2014
BANCA EXAMINADORA
___________________________________________________
Prof. Dr. Daniel Carlos Ferreira Lanza
Departamento de Bioquímica - UFRN
Orientador
____________________________________________________
Prof. Dr. Leonardo Lima Pepino de Macedo
Pesquisador da EMBRAPA - Recursos Genéticos e Biotecnologia
Examinador externo
____________________________________________________
Prof. Dr. João Paulo Matos Santos Lima
Departamento de Bioquímica – UFRN
Examinador interno
Dedico esta obra
À minha querida avó Maria da Luz Santos, que agora está descansando ao lado do
Senhor, mas que, com certeza, continua olhando por mim. Obrigado por toda
dedicação, amor e carinho. Guardarei a senhora para sempre em meu coração.
AGRADECIMENTOS
Agradeço a todos que direta ou indiretamente participaram da realização deste
trabalho, em especial agradeço:
A Deus, pai de infinito amor e bondade, pela sua presença constante em minha vida,
me abençoando e iluminando meus caminhos.
Aos meus pais, Maria do Socorro de Araújo Dantas e Luis de Vasconcelos Dantas,
por todo amor, carinho e dedicação. Vocês são os principais responsáveis pela
pessoa que sou hoje e por todas as minhas conquistas.
Ao meu namorado, Pedro Henrique Sales da Costa, por todo amor, amizade e
companheirismo e por sempre estar ao meu lado me apoiando em todos os
momentos.
Ao Programa de Pós-Graduação em Bioquímica, Departamento de Bioquímica da
Universidade Federal do Rio Grande do Norte (UFRN) pelos conhecimentos
adquiridos na área.
Aos amigos do Laboratório de Biologia Molecular Aplicada – Laplic, Raffael, Allan,
Douglas, Jéssica e Natália, pela amizade e pelos momentos de descontração
durante os trabalhos. Em especial agradeço a Raffael por toda ajuda com as
análises de Bioinformática.
Ao professor Dr. João Paulo Matos Santos Lima e seus alunos Diego e Ricardo pela
ajuda durante o desenvolvimento deste trabalho.
Ao pessoal do Laboratório de Imunogenética pela disponibilidade de equipamentos
extremamente necessários para a realização deste trabalho.
À professora Drª Suely Ferreira Chavante pelo incentivo e apoio em ingressar na
pós-graduação.
Às empresas Camanor, Concepto Azul e Genearch pela doação das amostras de
camarão sem as quais não seria possível a realização deste trabalho.
Aos colegas da minha turma de pós-graduação por compartilhar comigo tantos
momentos de alegria e desespero durante esses anos de estudo.
Aos meus grandes amigos da Biologia pelos quatros anos de companheirismo e
amizade. Em especial às amigas Sinara Carla, Larissa Maria e Larissa Bahia. Vocês
tornaram os meus momentos mais felizes durante a graduação.
À CAPES pelo fornecimento da bolsa de pesquisa e à FAPERN pelo auxílio
financeiro ao projeto de pesquisa.
E claro, o meu muito obrigada ao meu querido orientador Professor Dr. Daniel
Carlos Ferreira Lanza pela sua orientação, paciência, profissionalismo e
compromisso com seus orientandos. Obrigada pela sua atuação direta na ampliação
dos meus conhecimentos. O senhor, com certeza, é um exemplo de pessoa e de
profissional.
O cientista não é o homem que fornece as
verdadeiras respostas, é quem faz as
verdadeiras perguntas.
Claude Lévi-Strauss
RESUMO
A carcinicultura é uma das atividades que mais contribui para o crescimento
da aquicultura mundial. Entretanto, esta atividade vem sofrendo perdas econômicas
significativas devido ao surgimento de doenças virais como a Mionecrose Infecciosa
(IMN). A IMN já está disseminada em toda região Nordeste do Brasil e vem
causando sérios danos à carcinicultura na Indonésia. O principal sintoma da doença
é a mionecrose, que consiste na necrose dos músculos estriados do abdômen e do
cefalotórax do camarão. A IMN é causada pelo vírus da mionecrose infecciosa
(IMNV), um vírus não envelopado que apresenta protrusões ao longo de seu
capsídeo. O genoma viral é formado por uma única molécula de RNA dupla fita e
possui duas Open Reading Frames (ORFs). A ORF1 codifica a proteína principal do
capsídeo (MCP) e uma possível proteína de ligação a RNA (RBP). A ORF2 codifica
uma provável RNA polimerase dependente de RNA (RdRp) e classifica o IMNV
dentro da família Totiviridae. Assim, o objetivo desse estudo foi estudar o genoma
completo do IMNV e as proteínas codificadas no intuito de desenvolver um sistema
que identificasse diferentes isolados do vírus com base na presença de
polimorfismos. A relação filogenética entre alguns totivírus foi investigada e mostrou
um novo grupo para o IMNV dentro da família Totiviridae. Dois novos genomas
foram sequenciados, analisados e comparados a outros dois genomas já
depositados no GenBank. Os novos genomas foram mais semelhantes entre si do
que com aqueles já descritos. Regiões variáveis e conservadas do genoma foram
identificadas através de gráficos de similaridade e alinhamentos utilizando as quatro
sequências do IMNV. Esta análise possibilitou o mapeamento de sítios polimórficos
e revelou que a região mais variável do genoma se encontra na primeira metade da
ORF1 e coincide com as regiões que possivelmente codificam a protrusão viral,
enquanto que as regiões mais estáveis se encontraram em domínios conservados
de proteínas que interagem com o RNA. Além disso, estruturas secundárias foram
preditas para todas as proteínas empregando diversos softwares e modelos
estruturais proteicos foram calculados usando modelagens por threading e
simulações ab initio. A partir dessas análises foi possível observar que as proteínas
do IMNV possuem motivos e formas similares às proteínas de outros totivírus, e
novas possíveis funções proteicas foram propostas. O estudo do genoma e das
proteínas foi essencial para o desenvolvimento de um sistema de detecção baseado
em PCR capaz de discriminar os quatro isolados do IMNV com base na presença de
sítios polimórficos.
Palavras-chave: IMNV Brasil. Sítios polimórficos. Região variável. Domínios
conservados. Modelagem proteica. RNA.
ABSTRACT
Shrimp farming is one of the activities that contribute most to the growth of
global aquaculture. However, this business has undergone significant economic
losses due to the onset of viral diseases such as Infectious Myonecrosis (IMN). The
IMN is already widespread throughout Northeastern Brazil and has caused serious
damage to shrimp farming in Indonesia. The main symptom of disease is
myonecrosis, which consists of necrosis of striated muscles of the abdomen and
cephalothorax of shrimp. The IMN is caused by infectious myonecrosis virus (IMNV),
a non-enveloped virus which has protrusions along its capsid. The viral genome
consists of a single molecule of double-stranded RNA and has two Open Reading
Frames (ORFs). The ORF1 encodes the major capsid protein (MCP) and a potential
RNA binding protein (RBP). ORF2 encodes a probable RNA-dependent RNA
polymerase (RdRp) and classifies IMNV in Totiviridae family. Thus, the objective of
this research was study the IMNV complete genome and encoded proteins in order
to develop a system differentiate virus isolates based on polymorphisms presence.
The phylogenetic relationship among some totivirus was investigated and showed a
new group to IMNV within Totiviridae family. Two new genomes were sequenced,
analyzed and compared to two other genomes already deposited in GenBank. The
new genomes were more similar to each other than those already described.
Conserved and variable regions of the genome were identified through similarity
graphs and alignments using the four IMNV sequences. This analyze allowed
mapping of polymorphic sites and revealed that the most variable region of the
genome is in the first half of ORF1, which coincides with the regions that possibly
encode the viral protrusion, while the most stable regions of the genome were found
in conserved domains of proteins that interact with RNA. Moreover, secondary
structures were predicted for all proteins using various softwares and protein
structural models were calculated using threading and ab initio modeling approaches.
From these analyses was possible to observe that the IMNV proteins have motifs
and shapes similar to proteins of other totiviruses and new possible protein functions
have been proposed. The genome and proteins study was essential for development
of a PCR-based detection system able to discriminate the four IMNV isolates based
on the presence of polymorphic sites.
Keywords: IMNV Brazil. Polymorphic sites. Variable region. Conserved domains.
Protein modeling. RNA.
LISTA DE FIGURAS
Figura 1 - Camarões Litopenaeus vannamei infectados com o vírus da mionecrose
infecciosa....................................................................................................................22
Figura 2 - Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs
não sobrepostas.........................................................................................................25
Figura 3 - Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å...........28
Figura 4 - Modelo em 3D da subunidade A do capsídeo de Saccharomyces
cerevisae L-A (ScV-L-A).............................................................................................29
Figura 5 - Estrutura tridimensional prevista para o vírus da mionecrose
infecciosa....................................................................................................................30
Figura 6 - Estrutura da RNA polimerase dependente de RNA do poliovírus.............33
Figura 7 - Estratégia empregada para amplificar o genoma completo do IMNV.......46
Figura
8
-
Análise
filogenética
de
membros
representativos
da
família
Totiviridae...................................................................................................................54
Figura 9 - Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas
completos do IMNV....................................................................................................57
Figura 10 - Representação esquemática do genoma do IMNV e análise de
variabilidade...............................................................................................................59
Figura 11 - Sítios polimórficos identificados no genoma do IMNV.............................60
Figura 12 - Análise de composição de aminoácidos e predição de estrutura
secundária para RBP.................................................................................................62
Figura 13 - Análise de composição de aminoácidos e predição de estrutura
secundária para SP1 e SP2.......................................................................................63
Figura 14 - Análise de composição de aminoácidos e predição de estrutura
secundária para MCP.................................................................................................65
Figura 15 - Análise de composição de aminoácidos e predição de estrutura
secundária para RdRp................................................................................................67
Figura 16 - Modelo estrutural para a proteína RBP do IMNV gerado pelo ITASSER.....................................................................................................................69
Figura 17 - Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER.............70
Figura 18 - Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER...........71
Figura 19 - Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb
referentes às regiões variável e conservada, respectivamente.................................73
Figura 20 - Sistema de detecção do IMNV.................................................................74
Figura 21 - Análises de predição de estrutura secundária e curva de melting de fita
simples e dupla para a região R2...............................................................................76
Figura 22 - Análises de predição de estrutura secundária e curva de melting de fita
simples e dupla para a região R3...............................................................................77
Figura 23 - Predição de estrutura secundária de RNA e curva de melting de fita
simples realizada in silico para o fragmento de 456 pb..............................................78
Figura 24 - Esquema proposto para a formação da protrusão do IMNV...................86
Figura Suplementar 1 - Análise filogenética de membros representativos dos grupos
TVV-like, LRV-like e GLV-like...................................................................................111
Figura Suplementar 2 - Sequência genômica completa (7.561 pb) e regiões
codificantes do IMNVgen1........................................................................................112
Figura Suplementar 3 - Sequência genômica completa (7.561 pb) e regiões
codificantes do IMNVgen2........................................................................................118
Figura Suplementar 4 - Predição de regiões estruturadas e desestruturadas para as
proteínas do IMNV....................................................................................................132
Figura Suplementar 5 - Predição de estrutura terciária para a Proteína Principal do
Capsídeo do IMNV...................................................................................................134
Figura Suplementar 6 - Predição de estrutura terciária para a RNA Polimerase
Dependente de RNA do IMNV.................................................................................135
Figura Suplementar 7 - Predição de estrutura terciária usando modelagem por
threading no programa Phyre2 para as proteínas do isolado da Indonésia.............136
LISTA DE TABELAS
Tabela 1 - Lista dos primers usados em cada análise para identificar o IMNV nas
amostras de camarões Litopenaeus vannamei..........................................................42
Tabela 2 - Lista de primers usados para amplificar o genoma completo do IMNV....46
Tabela 3 - Comparação das sequências de nucleotídeos e aminoácidos do
IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2...............56
Tabela 4 - Comparação das sequências de nucleotídeos e aminoácidos do
IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1...............56
Tabela 5 - Lista de primers empregados no sistema de identificação do IMNV........72
Tabela 6 - Regiões selecionadas para o teste de detecção baseado na análise da
curva de melting de fita simples.................................................................................75
Tabela Suplementar 1 - Nome e números de acesso das sequências dos totivírus
usados
neste
estudo
agrupados
de
acordo
com
a
análise
filogenética...............................................................................................................106
Tabela Suplementar 2 - Nome e números de acesso das sequências dos
Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados
de acordo com a análise filogenética.......................................................................107
Tabela Suplementar 3 - Identificação do IMNV em amostras de camarão marinho
Litopenaeus vannamei.............................................................................................108
Tabela Suplementar 4 - Identificação dos sítios polimórficos (SP) no genoma do
IMNV.........................................................................................................................124
Tabela Suplementar 5 - Avaliação dos modelos tridimensionais das proteínas RBP,
MCP e RdRp............................................................................................................133
LISTA DE ABREVIATURAS / SIGLAS
Aa
Aminoácidos
ABCC
Associação Brasileira dos Criadores de Camarão
BLAST
CDD
Basic Local Alignment Search Tool
Conserved Domains Database
cDNA
DNA complementar
DNA
Ácido desoxirribonucleico
dNTP
Deoxinucleotídeos trifosfatados
DSRM
Double-strand RNA binding motif
dsRNA
RNA dupla fita
EMPARN
ExPASy
Empresa Brasileira de Pesquisa Agropecuária do RN
Expert Protein Analysis System
ha
hectare
HIV
Human immunodeficiency virus
HRMA
High-Resolution Melting Analysis
IBDV
Vírus da doença infecciosa da Bursa
ICTV
Comitê Internacional de Taxonomia de Vírus
IHHNV
IMN
IMNV
Infectious hypodermal and haematopoietic virus
Infectious Myonecrosis
Infectious myonecrosis virus
kDa
Kilodaltons
Kg
Quilogramas
LOS
Limphoid organ spheroids
MCP
Proteína Principal do Capsídeo
ml
mililitros
mM
milimolar
µg
µl
microgramas
microlitros
µM
micromolar
NCBI
nt
National Center for Biotechnology Information
Nucleotídeo
OIE
World Organization for Animal Health
ORF
Open Reading Frame
PCR
Polymerase Chain Reaction
PDB
Protein Data Bank
PMCV
Piscine myocarditis virus
pmol
Picomole
RBP
Proteína de ligação a RNA
RdRp
RNA polimerase dependente de RNA
RMSD
Root-mean-square deviation
RNA
Ácido Ribonucleico
RNAi
RNA de interferência
RNAP
RT
RNA polimerase
Transcriptase reversa
RT-LAMP
RT-PCR
SP
Reverse Transcription Loop Mediated Isothermal Amplification
Reverse Transcription Polymerase Chain Reaction
Sítio polimórfico
SP1
Small Protein 1
SP2
Small Protein 2
TLR3
receptor Toll-like 3
TM
Temperatura de melting
TSV
Taura syndrome virus
U
Unidade
UniProt
Universal Protein Resource
WEEV
Western equine encephalitis virus
WSSV
White spot syndrome virus
YHV
Yellow head virus
SUMÁRIO
1
INTRODUÇÃO
19
1.1
MIONECROSE INFECCIOSA
20
1.2
VÍRUS DA MIONECROSE INFECCIOSA
23
1.2.1 Proteína de ligação a RNA (RBP)
26
1.2.2 Proteína Principal do Capsídeo (MCP)
27
1.2.3 Protrusões virais
30
1.2.4 RNA Polimerase Dependente de RNA (RdRp)
32
1.3
VARIABILIDADE GENÉTICA EM VÍRUS
34
1.4
SISTEMAS DE DETECÇÃO PARA O IMNV
36
2
OBJETIVOS
39
3
MATERIAIS E MÉTODOS
40
3.1
ANÁLISE FILOGENÉTICA
40
3.2
OBTENÇÃO DAS AMOSTRAS DE CAMARÃO
41
3.3
SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
42
3.3.1 Extração de RNA total
43
3.3.2 RT-PCR
43
3.3.2.1
Síntese de cDNA
43
3.3.2.2
Reação em Cadeia da Polimerase (PCR)
44
3.4
AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL
45
3.5
ANÁLISE DAS SEQUÊNCIAS
47
3.6
ANÁLISE ESTRUTURAL DE PROTEÍNAS
48
3.7
MODELAGEM PROTEICA
49
3.8
SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
50
3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
50
3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 51
4
RESULTADOS
53
4.1
ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE
53
4.2
SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
54
4.3
AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS
55
4.4
CARACTERIZAÇÃO DOS NOVOS GENOMAS
55
4.5
IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS
58
4.6
ANÁLISE
DE
COMPOSIÇÃO
DE
AMINOÁCIDOS
E
PREDIÇÃO
DE
ESTRUTURA SECUNDÁRIA
61
4.7
MODELAGEM DE PROTEÍNAS
68
4.8
SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
71
4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
71
4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 74
5
DISCUSSÃO
79
6
CONCLUSÃO
91
REFERÊNCIAS
93
APÊNDICE
105
19
1 INTRODUÇÃO
Durante a década de 80, os avanços na produção de camarão
proporcionaram um rápido crescimento na carcinicultura (LOTZ, 1997). A produção
de crustáceos foi a atividade que mais cresceu na aquicultura mundial nos últimos
anos, atingindo 4,5 milhões de toneladas e US$ 17,95 bilhões de dólares em 2006.
No mesmo ano a produção de camarão cultivado correspondeu a 17% do valor total
dos produtos pesqueiros internacionalmente negociados (FAO, 2008).
No Brasil, as pesquisas com camarão começaram na década de 70 com o
Projeto Camarão da Empresa Brasileira de Pesquisa Agropecuária do Rio Grande
do Norte S/A EMPARN (BRASIL, 2001). Várias espécies de camarão nativas
(Farfantepenaeus subtilis, F. brasiliensis, F. paulensis e Litopenaeus schmitti) foram
consideradas como opções de cultivo, porém vários fatores relacionados à produção
tornaram estas espécies inviáveis comercialmente (MADRID, 1999). Apenas em
meados da década de 80, com a introdução do camarão branco do Pacífico,
Litopenaeus vannamei, a carcinicultura brasileira se consolidou (BRASIL, 2001).
Entre os anos de 1996 e 2002, a produção de camarão passou de 2.880
toneladas para mais de 60 mil toneladas e a produtividade, de 900 kg/ha/ano para
5.458 kg/ha/ano (ORMOND, 2004), tonando o Brasil o país líder do hemisfério
ocidental, com 90.190 toneladas, e líder mundial em produtividade, com 6.084
kg/ha/ano, no ano de 2003 (ROCHA, 2005a).
Segundo dados da Associação Brasileira dos Criadores de Camarão (ABCC),
a produção brasileira de camarão deve ser da ordem de 100.000 toneladas em
2014. Em 2013, a produção alcançou 85.000 toneladas e foi destinada basicamente
ao mercado interno, com algumas exportações para países como Vietnã e França.
20
Os principais produtores são os estados do Ceará e do Rio Grande do Norte.
Existem quase 2.000 produtores no Brasil, a maioria com pequenos cultivos.
Atualmente os maiores produtores mundiais de camarão são China, Vietnã,
Tailândia, Indonésia, Índia e Equador. O Equador produziu 300.000 toneladas de
camarão em 2013 e obteve US$ 1,67 bilhão com a exportação de 215.000 toneladas
do produto (Disponível em MPA - Ministério da Pesca e Aquicultura).
Apesar desse crescimento na produtividade, os carcinicultores têm sofrido
perdas econômicas significativas nas últimas décadas devido a problemas
ambientais relacionados às práticas de cultivo e às doenças virais (MOSS, 2002).
Dentre as doenças virais que acometem a carcinicultura mundial, destacam-se
aquelas causadas pelo vírus da Mancha Branca (WSSV – White spot syndrome
virus), vírus da Cabeça Amarela (YHV – Yellow head virus), vírus da Taura (TSV –
Taura syndrome virus), vírus da Necrose Hipodermal e Hematopoiética Infecciosa
(IHHNV – Infectious hypodermal and haematopoietic virus) e o vírus da Mionecrose
Infecciosa (IMNV – Infectious myonecrosis virus) (LOTZ, 1997; LIU et al., 2009).
1.1 MIONECROSE INFECCIOSA
A Mionecrose Infecciosa (Infectious Myonecrosis - IMN) é uma das doenças
de maior impacto na carcinicultura da região Nordeste do Brasil. A IMN foi
identificada pela primeira vez em 2002 em cultivos de camarão da espécie
Litopenaeus vannamei no estado do Piauí e no ano seguinte foi detectada nos
estados do Ceará e Rio Grande do Norte (LIGHTNER et al., 2004; LIGHTNER &
PANTOJA, 2004). Hoje a doença já está disseminada em toda região Nordeste do
Brasil e vem causando sérios danos à carcinicultura na Indonésia (NUNES,
21
MARTINS & GESTEIRA, 2004; ANDRADE et al., 2007; SENAPIN et al., 2007;
LIGHTNER, 2011). Devido à importância econômica cada vez maior do L. vannamei
na região Ásia-Pacífico e ao consequente aumento do transporte dessa espécie
entre fronteiras, em janeiro de 2006 a IMN foi adicionada à lista Quartely Aquatic
Animal Disease Report com o propósito de aumentar a vigilância e sua detecção
(QAAD, 2006).
De acordo com a Associação Brasileira dos Produtores de Camarão, a
produção de camarão, no período em que a doença surgiu no Brasil (2002-2005), foi
de 150.000 toneladas a menos que o total esperado. Embora essa redução também
seja atribuída a variações no cambio e à ação antidumping dos Estados Unidos,
estima-se que 60 a 70% das perdas foram causadas por ação da IMN, causando
prejuízos próximos a 400 milhões de dólares naquele período (MADRID, 2005a, b;
ROCHA, 2005a, b; ANDRADE et al., 2007).
O principal sintoma da IMN é a mionecrose, que consiste na necrose dos
músculos estriados do abdômen e do cefalotórax do camarão. Os segmentos
abdominais podem apresentar opacidade focal ou multifocal (Figura 1A) que
progride do último segmento para o restante do corpo do animal e, em estágios mais
avançados, músculos e apêndices podem exibir coloração avermelhada (Figura 1B)
(LIGHTNER et al., 2004; NUNES, MARTINS & GESTEIRA, 2004; POULOS et al.,
2006). Além desses sintomas, os camarões também podem apresentar redução no
consumo de alimentos, nado desorientado e amolecimento do exoesqueleto
(NUNES, MARTINS & GESTEIRA, 2004). Análises histológicas dos músculos
esqueléticos de camarões infectados revelam necrose muscular coagulativa,
infiltração hemocítica, fibrose e aparecimento de esferoides do órgão linfoide
(Limphoid organ spheroids - LOS). Os locais comuns para LOS incluem o
22
hemoceloma nas brânquias, coração próximo à glândula antenal e cordão nervoso
ventral (TANG et al., 2005).
Figura 1: Camarões Litopenaeus vannamei infectados com o vírus da mionecrose infecciosa. (A) O
camarão acima mostra sinais de necrose, evidenciada pela opacidade do sexto segmento abdominal
(fase aguda); abaixo se encontra o camarão sadio, sem sinais de infecção (adaptado de POULOS et
al., 2006). (B) O camarão apresenta pigmentação avermelhada nos últimos segmentos abdominais –
seta (fase crônica) (adaptado de NUNES, MARTINS & GESTEIRA, 2004).
Nos últimos anos, as características de infecção da doença parecem ter
mudado nos camarões cultivados na região nordeste do Brasil. Os camarões
cultivados nas estações de baixa precipitação podem ser positivos para a doença
em testes de detecção e não exibir os sintomas histopatológicos da infecção ou
apresentarem sintomas brandos e baixas taxas de mortalidade (FEIJÓ et al., 2013;
LANZA D. C. F, dados não publicados). Variações nas características da doença
podem ocorrer por várias razões, incluindo condições ambientais, técnicas de
cultivo, contagem viral, co-infecção ou por variações interespecíficas no genoma do
agente etiológico (BACHERE, 2000). O agente etiológico da IMN foi purificado e
caracterizado pela primeira vez no ano de 2006 por Poulos e colaboradores e é
denominado de vírus da mionecrose infecciosa (IMNV).
23
1.2 VÍRUS DA MIONECROSE INFECCIOSA
Quando comparado a outros vírus que infectam camarão o IMNV apresenta
sintomas mais brandos que os vírus da Taura (Taura syndrome virus - TSV), e que
os vírus causadores da Mancha Branca (White spot syndrome virus - WSSV) e da
Cabeça Amarela (Yellow head virus - YHV). Animais desafiados pelos vírus TSV,
WSSV e YHV, em condições de laboratório, apresentam 100% de mortalidade
acumulada 10 dias após desafio enquanto os animais desafiados com IMNV só
atingem taxas semelhantes 52 dias após o desafio (LU et al., 1994; OVERSTREET
et al., 1997; TANG & LIGHTNER, 2000; TANG et al., 2005). A maioria dos vírus
patogênicos que acometem camarões pode causar infecções persistentes, mas em
baixo nível. Em decorrência disso, geralmente, o cultivo dos camarões infectados
por IMNV não é interrompido, permitindo o estabelecimento do vírus em animais
saudáveis e gerando grandes prejuízos advindos de gastos com alimentação e
manejo.
Geralmente as doenças virais surgem como resultado de um aumento na
contagem viral em decorrência de várias formas de estresse ambiental ou fisiológico
(PENG et al., 1998; COWLEY et al., 2002; LOTZ, ANTON & SOTO, 2005;
SANCHEZ-MARTINEZ
et
al.,
2007).
Um
camarão
pode
ser
infectado
simultaneamente ou sequencialmente por múltiplos vírus e/ou por diferentes
linhagens de um mesmo vírus (FLEGEL et al., 2004; HOA et al., 2005). Um
levantamento epidemiológico para monitoramento de TSV e IMNV em fazendas do
estado de Pernambuco mostrou que a incidência de TSV é baixa, mas nove das
onze propriedades analisadas apresentaram camarões infectados com IMNV
(PINHEIRO et al., 2007). Quatro espécies de camarão já foram identificadas como
24
susceptíveis ao IMNV: L. vannamei, de maior interesse comercial no Brasil, e as
espécies L. stylirostris, Farfantepenaeus subtilis e Penaeus monodon (LIGHTNER et
al., 2004; TANG et al., 2005).
O IMNV é um vírus não envelopado, com simetria icosaédrica e 40 nm de
diâmetro.
A
partícula
também
possui
protrusões
em
seu
capsídeo
que
provavelmente estão envolvidas na transmissão extracelular e patogenicidade viral
(POULOS et al., 2006; TANG et al., 2008). O genoma viral é formado por uma única
molécula de RNA dupla fita contendo 7.561 pares de bases e apresenta duas ORFs
(Open Reading Frames) em diferentes frames: A ORF1 no frame 1 (nucleotídeos
136 a 4.953) e a ORF2 no frame 3 (nucleotídeos 5.241 a 7.490). A ORF1 codifica
uma proteína de 1.605 aa (179 kDa) que provavelmente é clivada, gerando a
proteína principal do capsídeo (MCP) e uma proteína que compartilha motivos de
uma proteína de ligação a dsRNA (RBP). Além disso, duas outras proteínas
menores (Small Proteins), de 32 kDa e 38 kDa, foram visualizadas em gel
desnaturante e parecem corresponder às protrusões que estariam envolvidas na
entrada do vírus na célula, incluindo a ligação ao receptor e/ou penetração na
membrana. A ORF2 (nucleotídeos 5241 a 7490) codifica uma proteína de 749 aa (85
kDa) que contém domínios característicos de uma RNA polimerase dependente de
RNA (RdRp) e classificam o IMNV como sendo um membro da família Totiviridae.
Estas ORFs aparentemente não se sobrepõem, existindo um espaço de 287
nucleotídeos entre elas (Figura 2) (POULOS et al., 2006; TANG et al., 2008).
25
Figura 2: Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs não sobrepostas.
1 – Proteína de ligação ao dsRNA (10 kDa); 2 – Protrusão? (31 kDa); 3 – Protrusão? (36 kDa); 4 –
Proteína principal do capsídeo (99 kDa); 5 – RNA polimerase dependente de RNA (85 kDa)
(adaptado de POULOS et al., 2006; NIBERT, 2007).
Posteriores análises na sequência genômica revelaram a presença de dois
motivos 2A-like (GDVESNPGP e GDVEENPGP) na ORF1 do IMNV precedendo a
proteína do capsídeo. Os nonapeptídeos GDVESNPGP e GDVEENPGP abrangem
os aminoácidos 86-94 e 370-378, respectivamente. A presença desses dois motivos
reforça o pressuposto de que a ORF1 é uma poliproteína que posteriormente é
clivada gerando fragmentos consecutivos de 93, 284 e 1.228 aa. Esse último
fragmento provavelmente também é clivado gerando a MCP (901 aa) e outro
fragmento de 327 aa. O fragmento de 93 aa possivelmente corresponde à proteína
de ligação a dsRNA (RBP) e os fragmentos de 284 e 327 aa corresponderiam às
proteínas de 32kDa e 38 kDa, respectivamente, vistas em gel desnaturante
(NIBERT, 2007).
É provável que, em alguns vírus, as duas ORFs estejam sobrepostas em
199 nucleotídeos, sendo traduzidas conjuntamente e gerando uma proteína de 1.734
aminoácidos (196 kDa) que seria, posteriormente, clivada. Isso é possível se ocorrer
frameshift ribossomal -1 na região de sobreposição das ORFs (NIBERT, 2007). O
26
frameshifti ribossomal -1 é frequentemente associado a um motivo “shifty heptamer”,
XXXYYYZ, onde X é A, C, G ou U, Y é A ou U, e Z é A, C ou U (BEKAERT et al.,
2003; JACKS et al., 1988). A sequência GGGUUUU, que se qualifica como um
“shifty heptamer” foi encontrada na região de sobreposição das ORFs do IMNV
(NIBERT, 2007). Além disso, imediatamente antes dessa sequência se encontra o
dinucleotídeo UC que pode favorecer o frameshifting ribossomal -1 (BEKAERT &
ROUSSET, 2005). Esta estratégia de codificação é semelhante aos vírus que
infectam Giardia lamblia (WANG et al., 1993; LI, WANG & WANG, 2001) e
Saccharomyces cerevisae (DINMAN, ICHO & WICKNER, 1991).
1.2.1 Proteína de ligação a RNA (RBP)
O primeiro produto codificado pela ORF1 (93 aa) apresenta uma região de 60
aminoácidos na extremidade N-terminal que compartilha um domínio conservado de
ligação a dsRNA (DSRM) (POULOS et al., 2006). Esses domínios são encontrados
em uma variedade de proteínas de ligação a RNA, apresentando diferentes
estruturas e funções (BURD & DREYFUSS, 1994).
Devido à natureza de seu genoma, os vírus de RNA precisam utilizar muitas
RBPs (LI & NAGY, 2011). O vírus da influenza possui uma nucleoproteína de ligação
a RNA (NP) cuja função primária é a encapsidação do genoma viral para fins de
transcrição, replicação e empacotamento. Essa proteína pode interagir com uma
grande variedade de moléculas virais ou da célula do hospedeiro, incluindo o próprio
RNA, RNA polimerases dependentes de RNA e a proteína da matriz viral (PORTELA
& DIGARD, 2002). Também foi visto que as proteínas NS1-BP e hnRNP K do vírus
da Influenza A podem estar envolvidas no processo de splicing do RNA. No vírus da
27
Hepatite C, a RBP NS5A pode desempenhar um papel significante na regulação da
passagem do processo de tradução para replicação do genoma, recrutamento das
polimerases e helicases para o RNA viral e aumento nas processividades das
mesmas (HUANG et al., 2005). Além do seu papel nos processos de replicação e
transcrição, as RBPs virais também parecem aumentar a resposta imune inata
iniciada pelo receptor Toll-like 3 (TLR3) (LAI et al., 2011).
1.2.2 Proteína Principal do Capsídeo (MCP)
A MCP do IMNV compreende os aminoácidos 705-1.605 (901 aa), possuindo
uma massa predita de 99 kDa e sequência N terminal IVSMENQSEID (POULOS et
al., 2006). A estrutura tridimensional do capsídeo do IMNV foi elucidada em 2008 por
Tang e colaboradores (Figura 3). Análises de crio-microscopia eletrônica de
transmissão (cryo-TEM) e reconstrução de imagem 3D revelam que o IMNV tem um
capsídeo formado por 120 subunidades organizado como um arranjo T=2 e
apresenta-se como uma estrutura dobrada em forma pentamérica na qual possui um
complexo de fibras de natureza proteica (Figura 3A). Assim como observado para o
capsídeo de outros totivirus, existem 60 cópias quimicamente idênticas de cada
subunidade, denominadas A e B. As subunidades A formam clusters pentaméricos
em torno de cada um dos 12 eixos quíntuplos, e as subunidades B formam clusters
triméricos em torno dos 20 eixos triplos. Além disso, cinco subunidades B se
encontram em torno de cada pentâmero A formando um decâmero compacto
centrado em cada eixo quíntuplo. As interações entre os decâmeros podem ocorrer,
principalmente, de duas formas: (i) duas subunidades A de decâmeros adjacentes
participam de contatos assimétricos através de cada eixo icosaédrico duplo, e (ii)
28
três subunidades B de decâmeros adjacentes participam de interações assimétricas
em torno de cada eixo triplo (Figura 3B). Todos os contatos entre as subunidades A
e B são assimétricos. Essas unidades assimétricas são formadas pelo dímero MCPA/B, totalizando 60 unidades diméricas formando o capsídeo. Com relação ao RNA
dupla fita encontrado dentro do capsídeo, este parece se organizar de forma
helicoidal, de maneira bastante simétrica (Figura 3A) (TANG et al., 2008).
A
B
Figura 3: Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å. (A) Secção central com
valores de densidade codificados em escala de cinza (quanto mais escuro, mais denso). Os eixos de
simetria estão indicados no quadrante superior direito. (B) Visão da superfície do IMNV mostrando a
simetria icosaédrica do capsídeo e as subunidades A (azul e ciano) e B (vermelho, rosa e laranja)
(adaptado de TANG et al., 2008).
Dados estruturais de alta resolução sobre as proteínas do capsídeo de vírus
da família Totiviridae são escassos. Somente uma estrutura em cristal disponível foi
resolvida, para a MCP do vírus que infecta Saccharomyces cerevisae L-A (ScV-L-A)
(Figura 4) (NAITOW et al., 2002). Como observado no capsídeo do IMNV e de
outros totivírus, o capsídeo do ScV-L-A é formado a partir de 60 cópias de pseudo
capsômeros, cada um composto de duas moléculas de MCP que possuem
sequências de aminoácidos idênticas mas suas estruturas terciárias são diferentes,
principalmente nos resíduos localizados na superfície da proteína. Cada molécula de
29
MCP é formada por duas α-hélices localizadas próximas aos eixos icosaédricos
quíntuplos e várias folhas β próximas aos eixos duplos e triplos (NAITOW et al.,
2002).
Figura 4: Modelo em 3D da subunidade A do capsídeo de Saccharomyces cerevisae L-A (ScV-L-A). A
figura mostra o “trench” acessível a partir da superfície da partícula (outside) e o resíduo de His 154.
As extremidades N- e C-terminais estão voltadas para o interior do capsídeo (inside) (adaptado de
NAITOW et al., 2002).
As subunidades do capsídeo de ScV-L-A geram mRNAs sem o cap5’ pela
remoção enzimática dessa estrutura na presença do resíduo de His 154 presente na
MCP (BLANC, GOYER & SONENBERG, 1992). A estrutura para a MCP de ScV-L-A
revela uma “vala” (“trench”) estreita e profunda no sítio ativo e um resíduo de His
154 necessário para a reação de remoção do cap5’ (Figura 4). O “trench” é formado
por vários loops que abrem e fecham a estrutura por se encontrarem na superfície
da partícula. O mRNA celular pode, então, ser capturado por esses loops e
posicionados no “trench” para a reação ocorrer (NAITOW et al., 2002).
30
1.2.3 Protrusões virais
Análises de reconstrução de imagem em 3D mostraram que o capsídeo do
IMNV possui fibras complexas que se estendem a aproximadamente 80 Å dos eixos
quíntuplos do capsídeo (Figuras 3 e 5). Esses elementos mostraram menos
densidade e resolução do que o capsídeo, o que pode ser explicado pela sua
flexibilidade lateral e compreendem pelo menos três domínios morfológicos: knob,
mais externo; stalk, no meio e; foot mais interno e ancorado ao capsídeo. O
comprimento
total
de
cada
protrusão,
incluindo
o
domínio
foot,
é
de
aproximadamente 100 Å (Figura 5) (TANG et al., 2008).
Figura 5: Estrutura tridimensional prevista para o vírus da mionecrose infecciosa. À direita, um
detalhamento da estrutura da protrusão do capsídeo viral (adaptado de TANG et al., 2008).
Até o momento, a presença de protrusões ao longo do capsídeo viral é uma
característica exclusiva do IMNV quando comparado a outros membros da família
Totiviridae e, possivelmente, contribuem para os padrões de virulência e
patogenicidade específicos do IMNV uma vez que ele é considerado como único
membro da sua família a ser transmitido extracelularmente entre os organismos
31
hospedeiros. Outros membros da família Totiviridae estão associados com infecções
avirulentas, enquanto que o IMNV causa uma doença geralmente fatal em camarões
peneídos (LIGHTNER et al., 2004; POULOS et al., 2006; GHABRIAL, 2008; TANG
et al., 2008). Entretanto, é possível que o totivírus que infecta o salmão do Atlântico,
Piscine myocarditis virus (PMCV), também possua essas estruturas. O PMCV causa
uma doença fatal em seu hospedeiro e, assim como o IMNV, presume-se que sua
transmissão seja extracelular. Além disso, esse vírus possui sequências codificantes
extras em seu genoma que podem estar envolvidas nos mecanismos de entrada
celular (NIBERT & TAKAGI 2013). O IMNV foi o primeiro vírus da família Totiviridae
descoberto como sendo capaz de infectar um hospedeiro diferente de protozoários
ou fungos e, até o momento, ele é o único membro dessa família capaz de infectar
crustáceos.
Alguns estudos têm mostrado que as regiões que codificam protrusões
apresentam grande variabilidade genética em diferentes vírus, permitindo que eles
se adaptem a diferentes situações (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et
al., 2010; PROMKUNTOD et al., 2014). Já se sabe que proteínas semelhantes a
protrusões estão envolvidas na entrada de certos vírus, como os coronavírus, na
célula hospedeira, além de desempenhar um papel importante na determinação da
gama de hospedeiros (ENJUANES et al., 2006; PERLMAN & NETLAND 2009;
BELOUZARD et al., 2012).
O capsídeo adornado com protrusões do IMNV sugere um mecanismo
evolucionário simples que fornece um novo conjunto de funções capazes de
expandir os padrões de infectividade do vírus. A evolução do IMNV a partir de
totivírus mais simples pode ter incluído a aquisição de sequências codificantes para
as protrusões, o que permite a transmissão extracelular (TANG et al., 2008).
32
1.2.4 RNA Polimerase Dependente de RNA (RdRp)
A ORF2 do genoma do IMNV apresenta um domínio conservado
característico de RNA polimerases dependente de RNA. As RdRps desempenham
um papel central na replicação dos vírus de dsRNA. Apesar das altas taxas de
mutações que ocorrem em vírus de RNA, as RdRps são geralmente bastante
conservadas nas famílias virais, especialmente dentro de motivos funcionais, e são
bons alvos para estudos filogenéticos (O’REILLY & KAO, 1998). Análises
comparativas utilizando a região da RdRp do IMNV o caracterizam como um
membro da família Totiviridae, similar ao vírus que infecta o protozoário Giardia
lamblia (POULOS et al., 2006; NIBERT, 2007). Estudos sobre estrutura e função de
RdRps tem sido relatados para vários vírus como Rhinovírus (LOVE et al., 2004),
Picornavírus (KOK & MCMINN, 2009) e o vírus da Hepatite C (WAHEED, BHATTI &
ASHRAF, 2013). A primeira estrutura em cristal da RdRp foi resolvida para o
poliovírus podendo ser comparada com outras polimerases (Figura 6) (HANSEN,
LONG & SCHULTZ, 1997).
As estruturas das RNA polimerases (RNAPs) geralmente apresentam uma
arquitetura comum descrita como uma “right hand”, contendo os domínios “thumb”,
“fingers” e “palm” (Figura 6). O domínio “palm” parece catalisar a reação de
transferência do grupo fosforila durante o processo de replicação enquanto que o
domínio “fingers” está envolvido nas interações envolvendo os trifosfatos de
nucleosídeos e pareamento do template. O domínio “thumb” provavelmente
desempenha um papel na processividade e translocação da RNAP (STEITZ, 1999).
Em RdRps, o domínio “palm” apresenta quatro sequências-motivo encontradas em
todas as classes de RNAPs, denominadas A, B, C e D, e uma sequência-motivo
33
adicional E que é única de RdRps e transcriptases reversas (RTs) (Figura 6) (POCH
et al., 1989). Outras três sequências-motivo (F1, F2 e F3) também encontradas em
RdRps, parecem estar envolvidas na separação da dupla fita do RNA para a
transcrição (BRUENN, 2003). Os motivos A e C estão envolvidos na coordenação do
magnésio; o motivo A também pode desempenhar um papel na discriminação entre
ribose e desoxirribose, assim como o motivo B; o motivo D completa a estrutura do
domínio “palm”; e o motivo E está envolvido em interações hidrofóbicas com o
domínio “thumb” (O’REILLY & KAO, 1998).
Figura 6: Estrutura da RNA polimerase dependente de RNA do poliovírus. Os domínios “thumb”,
“fingers” e “palm” estão indicados. As sequências-motivo encontradas no domínio “palm” estão
destacadas nas seguintes cores: A em vermelho, B em verde, C em amarelo, D em roxo claro e E em
roxo escuro (adaptado de HANSEN, LONG & SCHULTZ, 1997).
34
1.3 VARIABILIDADE GENÉTICA EM VÍRUS
O estudo da variabilidade genética é uma abordagem interessante quando se
deseja compreender mais profundamente a biologia dos seres vivos. Os vírus de
RNA sofrem grande taxa de mutação principalmente devido a falta de atividade de
correção de erros da RNA polimerase. O conhecimento de que alterações em
regiões específicas do genoma de diferentes vírus influenciam em sua capacidade
de infecção e mecanismos de patogenicidade já é amplamente difundido. As
primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de
infecção, replicação e patogenicidade afetadas por alterações induzidas em seu
genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Hoje existem
inúmeros trabalhos que associam a variabilidade genética de diferentes vírus a sua
patogenicidade. Alguns exemplos clássicos em doenças humanas são a correlação
da variabilidade observada no gene NS5A do vírus causador da hepatite C e a
resistência do vírus ao interferon, a correlação entre polimorfismos no gene que
codifica a transcriptase reversa do HIV (Human Immunodeficiency Virus) e
alterações na propagação e resistência do vírus, e a presença de polimorfismos
associados à infectividade na ORF26 do herpesvírus causador do Sarcoma de
Kaposi (ENOMOTO et al., 1996., CHAYAMA et al., 1997; KUROSAKI et al., 1997;
ZONG et al., 2007; KEARNEY et al., 2008; BITTAR et al., 2010; PINHO et al., 2010).
Polimorfismos no genoma também podem afetar as propriedades dos vírus
por alterarem a estrutura secundária do RNA. Acredita-se que a estrutura secundária
de genomas virais, particularmente em regiões não traduzidas desempenha um
papel central no ciclo de vida viral, em particular nos processos de replicação e
tradução (CLYDE, BARRERA & HARRIS, 2008; KORAKA et al., 2009). Em um
35
estudo desenvolvido por McBridge & Panganiban (1996) relatou-se que estruturas
hairpin estão envolvidas no encapsulamento do vírus HIV-1. Foi visto que
perturbações em um único hairpin, seja por deleção ou substituição de bases, pode
ter um efeito parcial sobre o encapsulamento. Porém, quando dois hairpins são
afetados, os efeitos são mais significativos.
O estudo de variabilidade genética em vírus que acometem animais de
criação é fundamental para caracterização de cepas virulentas e desenvolvimento
de vacinas. Análises de variabilidade genética de proteínas estruturais de diferentes
linhagens do vírus causador da encefalite equina (Western equine encephalitis virus
- WEEV), uma doença que é problema de saúde pública nos Estados Unidos,
possibilitaram definir os principais aminoácidos responsáveis pelos mecanismos de
virulência deste vírus (NAGATA et al., 2006). O vírus da doença infecciosa da bursa
(IBDV), causador da doença de gumboro, uma das principais doenças para a
avicultura brasileira, pode ser classificado de acordo com sua antigenicidade e
patogenicidade pela região hipervariável do gene VP2, que codifica uma proteína do
capsídeo viral (LANA, BEISEL & SILVA, 1992). A diversidade genética de sete
isolados no vírus Sacbrood na China foi estudada e regiões hipervariáveis no gene
VP1 já foram sequenciadas e caracterizadas a fim de se obter informações sobre
epidemiologia e imunologia do vírus (MINGXIAO et al., 2013).
O estudo da variabilidade genética também é de suma importância para o
desenvolvimento de sistemas diagnósticos. Em vírus que acometem a carcinicultura,
foi demonstrado que os polimorfismos identificados na ORF94 do WSSV podem
afetar o resultado de alguns testes diagnósticos baseados na amplificação via PCR
(Polymerase Chain Reaction) ou na detecção de proteínas do vírus via anticorpos
(MUSTHAQ et al., 2006). Análises de sequências da ORF1 de YHV da região do
36
Indo-Pacífico permitem a diferenciação de pelo menos seis diferentes linhagens do
vírus,
sendo
que,
apenas
duas
dessas
linhagens
provocam
a
doença
(WIJEGOONAWARDANE et al., 2008).
Existe apenas um trabalho voltado para o estudo da variabilidade genética do
IMNV (NAIM, BROWN & NIBERT, 2014), publicado recentemente. Entretanto, até o
momento, não foram observados estudos que levem em consideração a
variabilidade genética do IMNV no desenvolvimento de métodos diagnósticos
capazes de identificar diferentes isolados do vírus.
1.4 SISTEMAS DE DETECÇÃO PARA O IMNV
Os crustáceos parecem não possuir imunidade adaptativa nem memória
imunológica e não existem drogas ou vacinas contra as doenças virais que
acometem camarões. O sistema de defesa dos camarões depende principalmente
da imunidade inata a qual é formada por defesas humorais e celulares (KURTZ,
2004; JIRAVANICHPAISAL, LEE & SÖDERHÄLL, 2006). O monitoramento e o
controle
da
disseminação
desenvolvimento
de
de
ferramentas
doenças
rápidas
na
e
carcinicultura
específicas
dependem
para
detecção
do
e
caracterização dos patógenos.
A Organização Mundial de Saúde Animal indica o diagnóstico do IMNV
através de técnicas moleculares. Já foram desenvolvidos sistemas de detecção do
IMNV por RT-PCR (Reverse Transcription Polymerase Chain Reaction) analisado
tanto da forma tradicional quanto em tempo real, que atingem o limite de detecção
mínimo de 10 cópias do vírus por microlitro de RNA total extraído (TANG et al.,
2005; POULOS et al., 2006; POULOS & LIGHTNER, 2006; ANDRADE et al., 2007;
37
LIU et al., 2013). Recentemente foram desenvolvidas outras ferramentas
promissoras para detecção do IMNV, como anticorpos monoclonais para detecção
de proteínas virais (KUNANOPPARAT et al., 2011; MELLO et al., 2011;
CHAIVISUTHANGKURA et al., 2013) e sistemas de detecção baseados em RTLAMP (Reverse Transcription Loop Mediated Isothermal Amplification) (ANDRADE &
LIGHTNER, 2009; PUTHAWIBOOL et al., 2009; ARUNRUT, SUEBSING &
KIATPATHOMCHAI, 2013). Além dessas ferramentas, métodos de imunização
baseados em RNA de interferência (RNAi) estão sendo desenvolvidos para o
monitoramento e controle do IMNV (LOY et al., 2012; LOY et al., 2013).
Apesar dos avanços recentes nos sistemas de detecção do patógeno, ainda
não existem métodos direcionados à identificação da variabilidade genética do
IMNV. O monitoramento em campo revela que em algumas amostras dadas como
positivas não se observa sintomas nos animais, e geralmente existem diferenças na
gradação dos sintomas e evolução da doença em diferentes regiões. Essas
diferenças podem estar associadas a variações ambientais e/ou a diferentes
variantes do vírus. O monitoramento e o controle de doenças virais que acometem a
carcinicultura dependem de ferramentas rápidas e precisas para detecção e
caracterização do patógeno.
O estudo do genoma de determinada espécie de vírus e a sua variabilidade
genética, implica em conhecer e comparar os genomas existentes na natureza e
suas principais proteínas, seja no nível de sequência nucleotídica ou aminoacídica,
seja no nível estrutural. Esse conhecimento permite identificar, em um primeiro
momento, quais são as regiões mais variáveis no genoma e quais são as
consequências dessas variações nas proteínas codificadas pelo vírus. A partir
38
desses dados é possível inferir como essas variações poderiam afetar a biologia do
vírus e desenvolver novos sistemas de detecção mais eficientes.
No presente trabalho, a variabilidade genética do IMNV foi estudada a partir
da sequência de quatro genomas completos. Com base nesses dados foi elaborado
um mapa com os sítios polimórficos existentes no genoma e possíveis influências
das regiões variáveis sob a estrutura das proteínas codificadas foram propostas.
Além disso, foram realizadas predições de estruturas secundárias e terciárias para
as proteínas. A partir desses resultados foi desenvolvido um sistema de detecção
baseado em PCR, capaz de diferenciar os isolados do IMNV estudados aqui a partir
da identificação de polimorfismos no genoma.
39
2 OBJETIVOS
Geral:
Estudar o genoma completo do IMNV e os possíveis produtos gênicos
codificados e desenvolver um sistema de detecção baseado em PCR que
permita diferenciar isolados do vírus com base na presença de polimorfismos.
Específicos:

Verificar as relações de parentesco entre membros da família Totiviridae
utilizando sequências já disponíveis no GenBank;

Identificar a incidência do IMNV em camarões coletados no Nordeste;

Sequenciar e montar o genoma completo de pelo menos dois isolados
diferentes do IMNV;

Comparar os genomas obtidos entre si e com genomas completos do
IMNV já depositados no GenBank;

Analisar a localização de sítios polimórficos e verificar se esses sítios
causam alterações em aminoácidos e/ou em suas características;

Identificar regiões variáveis e conservadas presentes no genoma do vírus;

Estudar in silico a composição de aminoácidos e as estruturas
secundárias das proteínas que compõem o genoma do IMNV;

Modelar in silico a estrutura terciária das proteínas RBP, MCP e RdRp;

Desenhar primers específicos com base nas regiões variáveis e
conservadas identificadas no genoma;

Desenvolver métodos de diagnósticos para diferenciar os isolados
utilizando a técnica de PCR.
40
3 MATERIAIS E MÉTODOS
3.1 ANÁLISE FILOGENÉTICA
As sequências de nucleotídeos e aminoácidos de representantes da família
Totiviridae foram obtidas a partir do GenBank (www.ncbi.nlm.nih.gov) e UniProt –
Universal Protein Resource (www.uniprot.org). As sequências foram alinhadas com o
auxílio das ferramentas TCOFFEE e MCOFFEE (NOTREDAME, HIGGINS &
HERINGA, 2000) usando parâmetros default, e manualmente editadas usando
Jalview versão 2.8 (WATERHOUSE et al., 2009). As Open Reading Frames (ORFs)
e domínios conservados de proteínas foram identificados através do ORF finder
(http://www.ncbi.nlm.nih.gov/projects/gorf/) e do Conserved Domains Database –
CDD (http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml), respectivamente. As
sequências de aminoácidos da RdRp foram então alinhadas no programa MAFFT
versão 6.85 (KATOH & TOH, 2010; KATOH & FRITH, 2012) com parâmetro L-INS-I
que avalia a consistência do alinhamento, gap opening penalty 1.53 e offset value
0.1, guiado por alinhamento estrutural da família de proteínas pfam02123, presente
no CDD (MARCHLER-BAUER et al., 2011). A sequência da RdRp de Micromonas
pusilla virus (família Reoviridae; número de acesso YP654545) foi usada como
outgroup devido sua alta proximidade e similaridade com a família Totiviridae. O
melhor modelo de substituição de aminoácidos foi estimado por análise de
verossimilhança usando o programa ProtTest versão 3.2 (ABASCAL, ZARDOYA &
POSADA, 2005). O cálculo dos dendogramas foi baseado em análise Bayesiana,
usando os programas MrBayes versão 3.2.1 (RONQUIST & HUELSENBECK, 2003;
RONQUIST et al., 2012), e BEAST versão 1.8 (DRUMMOND et al., 2012). Todos os
41
indels e sítios não informativos (missing data) no alinhamento foram tratados como
deleções parciais, com um corte de 75%, para permitir potenciais regiões ambíguas
nas topologias, resultado em 530 sítios de parcimônia informativos no dataset. A
inferência Bayesiana foi conduzida em três corridas (runs) independentes, com
modelos fixos LG ou WAG, taxas de distribuição gama entre os sítios e frequências
de aminoácidos fixas. Cada Cadeia de Markov foi iniciada com uma árvore aleatória
e rodada por 106 gerações, com dados amostrados a cada 100 gerações, e a árvore
consenso foi estimada usando um “burn in” de 1.000.000 árvores. A convergência
das corridas foi avaliada usando a ferramenta Tracer versão 1.5 (DRUMMOND &
RAMBAUT, 2007), a fim de avaliar estatisticamente a robustez da análise
Bayesiana. As árvores geradas pelos programas foram editadas no programa
FigTree versão 1.4.1 (DRUMMOND & RAMBAUT, 2007).
3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO
Amostras de camarão da espécie Litopenaeus vannamei possivelmente
infectadas com IMNV foram gentilmente cedidas por empresas do Nordeste do
Brasil. As amostras eram oriundas de diferentes regiões do litoral do Nordeste
brasileiro e foram coletadas em anos diferentes. A maioria das amostras
correspondia ao camarão intacto, apresentando ou não sintomas da doença. Outras
duas amostras correspondiam a um lisado de células de camarão, um conservado
de forma congelada e outro em etanol 70%. Essas duas últimas amostras foram
coletadas em 2009 no estado do Pernambuco/BR e em 2013 no estado do Rio
Grande do Norte/BR, respectivamente.
42
3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
Inicialmente, para a detecção dos vírus nas amostras de camarão, foram
utilizadas duas estratégias: (i) PCR-Nested, utilizando primers desenvolvidos por
Senapin et al. (2007), especificamente os pares de primers F13/R13 e F13N/R13N
e; (ii) o método de identificação tradicional que utiliza os primers desenvolvidos pela
World Organization for Animal Health (OIE). Após as análises iniciais, a identificação
dos vírus foi realizada empregando o par de primers F14/R14. As sequências dos
primers usados em cada análise estão listadas na Tabela 1.
As amostras de camarões, possivelmente infectadas foram analisadas como
descrito a seguir.
Tabela 1: Lista dos primers usados em cada análise para identificar o IMNV nas amostras de
camarões Litopenaeus vannamei.
Primer
Sequência (5’ → 3’)
F13
TTTATACACCGCAAGAATTGGCCAA
R13
AGATTTGGGAGATTGGGTCGTATCC
F13N
TGTTTATGCTTGGGATGGAA
R13N
TCGAAAGTTGTTGGCTGATG
4587F
CGACGCTGCTAACCATACAA
4914R
ACTCGGCTGTTCGATCAAGT
4725NF
GGCACATGCTCAGAGACA
4863NR
AGCGCTGAGTCCAGTCTTG
F14
GAGTACCATCAGGAGTGAGAATAAC
Referência
Senapin et al., 2007
OIE
Senapin et al., 2007
R14
GATGTATGTCCTCTACGTTAACCAA
43
3.3.1 Extração de RNA total
A extração de RNA total foi realizada utilizando o KIT NUCLEOSPIN®RNA II,
seguindo as instruções do fabricante. Aproximadamente, 50 µg de tecido foram
retirados do sexto segmento abdominal do camarão. Em seguida, o tecido foi
macerado, vortexado e submetido às etapas de centrifugação descritas no manual
do kit de extração. Para as amostras de lisados de células de camarão conservadas
congeladas ou em etanol 70%, foram utilizados 30 µl e 60 µl de amostra,
respectivamente.
3.3.2 RT-PCR
3.3.2.1 Síntese de cDNA
A síntese de cDNA foi realizada seguindo o protocolo da enzima
Transcriptase Reversa ImPromII™ (Promega®) para um volume final de 20 µl, com
algumas modificações. Em tubos de 1,5 ml, foram adicionados 6,6 µl de RNA total e
4 µl de primers (5 µM cada). Essa mistura foi incubada a 85 ºC em banho Maria por
5 minutos e, imediatamente em seguida, colocada em gelo por 5 minutos.
Posteriormente foram adicionados aos tubos 4 µl de Reaction Buffer 5X, 2,4 µl de
MgCl2 25 mM, 2 µl de dNTP mix 5 mM cada e 1 µl da enzima Transcriptase Reversa.
Em seguida, os tubos foram submetidos às seguintes etapas: (1) temperatura
ambiente (± 25 ºC) por 5 minutos, para anelar os primers; e (2) 50 ºC por 60 minutos
em banho Maria, para extensão das fitas de cDNA.
44
3.3.2.2 Reação em Cadeia da Polimerase (PCR)
A reação em cadeia da polimerase foi realizada de acordo com o protocolo da
Taq Biotools, com algumas modificações. As amplificações foram conduzidas em
volume final de 20 µl contendo 10,8 µl de água Milliq, 2 µl de Reaction Buffer 10X, 1
µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase (5
U/µl), 4 µl de cDNA e 1 µl de primer. Para a amostra conservada em etanol 70%, as
quantidades de água e cDNA foram 7,8 µl e 7 µl, respectivamente.
Os ciclos térmicos empregados nas análises variaram conforme os primers
usados:
(i) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 40 segundos, anelamento a 45 ºC por 40 segundos,
extensão a 72 ºC por 40 segundos, e extensão final a 72 ºC por cinco minutos. Na
reação nested, o ciclo correspondia a uma desnaturação inicial a 94 ºC por 5
minutos, seguido por 25 ciclos de desnaturação a 94 ºC por 45 segundos,
anelamento a 50 ºC por 45 segundos, extensão a 72 ºC por 30 segundos, e
extensão final a 72 ºC por cinco minutos (primers F13/R13 e F13N/R13N
desenvolvidos por Senapin et al., 2007).
(ii) Desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de
desnaturação a 95 ºC por 45 segundos, anelamento a 60 ºC por 45 segundos, e
extensão final a 60 ºC por sete minutos. Na reação nested, o ciclo correspondia a
uma desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de
desnaturação a 95 ºC por 30 segundos, anelamento a 65 ºC por 30 segundos,
extensão a 72 ºC por 30 segundos, e extensão final a 72 ºC por dois minutos
(primers desenvolvidos pela OIE).
45
(iii) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos,
extensão a 72 ºC por 45 segundos, e extensão final a 72 ºC por cinco minutos
(primers F14/R14 desenvolvidos por Senapin et al., 2007).
Os produtos da amplificação foram visualizados em gel de agarose 1%, na
presença de brometo de etídio. Os tamanhos dos fragmentos foram determinados
através de um marcador de peso molecular DNA Marker Hae III (Sigma) e
visualizados em transluminador UV.
3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL
Para a amplificação do genoma viral completo, as etapas de extração de RNA
total, síntese de cDNA e técnica de PCR procederam conforme descrito
anteriormente. O ciclo térmico empregado foi o mesmo daquele utilizado para os
primers F14/R14.
A estratégia de amplificação e os primers usados para amplificar o genoma
completo do vírus foram aqueles descritos no trabalho de Senapin et al. (2007). No
total, 15 regiões do genoma foram amplificadas por RT-PCR para produzir 13
fragmentos de 600 pb cada, 1 fragmento de 840 bp e 1 fragmento de 572 pb. Cada
fragmento amplificado tinha sua extremidade 3’ sobreposta com a extremidade 5’ do
fragmento adjacente. A estratégia de amplificação está mostrada na Figura 7 e a
lista das sequências de primers esta descrita na Tabela 2.
46
Figura 7: Estratégia empregada para amplificar o genoma completo do IMNV (adaptado de SENAPIN
et al., 2007).
Tabela 2: Lista de primers usados para amplificar o genoma completo do IMNV (SENAPIN et al.,
2007).
Região Nome do primer foward /Sequência
Nome do primer reverse/Sequência
1
F1/GGCAATTTCAACCTAATTCTAAAAC
R1/TGAAAAATAAGCTGTGCCCCATGTT
2
F2/AATACTACATCATCCCCGGGTAGAC
R2/GACTTTCTTCCCAAGATGGAGTCTC
3
F3/GAAGTTAAAGATGTAACACTTGCCT
R3/ATACTCCTTCTCCAAAGGGTGTACG
4
F4/GATCCAGTTCTAACTAGAGAAGATA
R4/TCCAGATACAATTACCATGCTGGTT
5
F5/GCAGCTTGGCTAAACAACAGACCAT
R5/ATTCAATCCACGAATTTGTCTTGGT
6
F6/CTTCGTGATAATGACTCTATTAGGG
R6/CTGTGGAACAGATTGTAAAGTAAGA
7
F7/ATAAATAATGGTGTTAATATATTTG
R7/ACTAATTGGCAGTGTTGTTTTCATT
8
F8/GTTGGTGTGGCCCTGCCAACTGTAA
R8/ACTACCTTGCATTGAACTCCACGAA
9
F9/GTTTGGTATTCAACAAGACGTATTT
R9/AACATTAATACAACTCTCATCATGA
10
F10/GAGACAGGCAATGTATTCAGACCAT
R10/CTCTTGCTGACTCGGCTGTTCGATC
11
F11/TCGGGTTTTATGAATGCCCGTTCCA
R11/TTGATAACTGTTTTGCAATTTCAAT
12
F12/TTGTACAAAACATTTGTATCTATAT
R12/CTTCGATGTTAGATGCCACAGCAAG
13
F13/TTTATACACCGCAAGAATTGGCCAA
R13/AGATTTGGGAGATTGGGTCGTATCC
14
F14/GAGTACCATCAGGAGTGAGAATAAC
R14/GATGTATGTCCTCTACGTTAACCAA
15
F15/AATATCTAGAATTGCCAAAACGACT
R15/CATGGCTGGCCACAAAACCCAACTG
Nested
F13N/TGTTTATGCTTGGGATGGAA
R13N/TCGAAAGTTGTTGGCTGATG
47
Os produtos de PCR foram enviados à empresa Hellixa para serem
purificados e submetidos ao sequenciamento usando a plataforma da Applied
Biosystems® 3500 Genetic Analyzer, de acordo com as especificações do
fabricante. As concentrações dos produtos da amplificação foram mensuradas
previamente a fim de se verificar se os mesmos estavam na concentração adequada
para o sequenciamento. Os fragmentos foram sequenciados através do método de
sequenciamento Sanger, utilizando os primers descritos na Tabela 2 na
concentração de 5 µM cada primer. A reação de sequenciamento ocorreu em ambas
às direções, foward e reverse, para cada região. As regiões do genoma foram
sequenciadas no mínimo duas vezes (forward + reverse) e no máximo seis vezes
até a obtenção de uma sequência confiável. As análises dos eletroferogramas e a
montagem dos genomas foram realizadas usando parâmetros pré-definidos no
programa Geneious versão 6.1.6 (Disponível em Biomatters) e inspeção visual
cuidadosa.
3.5 ANÁLISE DAS SEQUÊNCIAS
As sequências genômicas completas obtidas foram analisadas no Basic Local
Alignment Search Tool – BLAST (ALTSCHUL et al., 1997) para confirmar suas
identidades e encontrar outras sequências similares. As sequências de aminoácidos
foram obtidas através do servidor Expert Protein Analysis System – ExPASy
(http://ca.expasy.org/). Uma análise comparativa entre os genomas obtidos neste
estudo com outros 2 genomas completos do IMNV disponíveis no GenBank
(números de acesso AY570982.2 e EF061744.1) foi realizada usando o programa
Geneious. Posteriormente, as quatro sequências foram alinhadas no ClustalW
48
(LARKIN et al., 2007), com parâmetros default, usando o software Jalview versão
2.8 (WATERHOUSE et al., 2009) para identificação dos sítios polimórficos e regiões
conservadas. Diferenças no nível de similaridade entre as regiões genômicas foram
plotadas pelo programa SimPlot versão 3.5.1 (LOLE et al., 1999), com os seguintes
parâmetros: modelo de árvore Neighbor joining, bootstrap igual a 1000 e modelo de
distância Kimura (2-parameter). Adicionalmente, a fim de investigar a similaridade
entre os genomas, uma análise de agrupamento, utilizando o método de Neighbor
joining foi feita no software MEGA versão 6.06 (TAMURA et al., 2013), usando o
modelo de substituição nucleotídica de Tamura-Nei e 1000 repetições de bootstrap,
como teste de confiança na topologia. Para esta análise, além das sequências
completas obtidas no presente estudo, foram usadas as seguintes sequências
disponíveis
no
GenBank:
números
de
acesso
JN391187.1,
AB555544.1,
NC_013499.1, NC_014609.1, AY570982, EF061744.1.
3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS
A predição de regiões estruturadas e não estruturadas foi realizada através do
software Foldindex© que prediz se uma sequência de proteínas é intrinsecamente
desdobrada implementando o algorítimo de Uversky e colaboradores, o qual é
baseado na hidrofobicidade média dos resíduos e carga líquida das sequências
(PRILUSKY et al., 2005). Para a predição de coiled coils foi usado o programa Coils
(LUPAS, VAN DYKE & STOCK, 1991) com windows 14, 21 e 28. O programa
TMpred
(HOFMANN
&
STOFFEL,
1993)
foi
empregado
para
avaliar
a
hidrofobicidade e hidrofilicidade da proteína ao longo da sequência de aminoácidos,
e o software PredictProtein (ROST, YACHDAV & LIU, 2004) foi utilizado para
49
predizer estruturas em α-hélices e folhas β, assim como regiões da proteína
expostas ou não a solvente.
3.7 MODELAGEM PROTEICA
A predição de modelos estruturais foi realizada com auxílio dos programas ITASSER (servidor online) (ZHANG, 2008; ROY et al,. 2010) e Phyre2 (KELLEY &
STERNBERG, 2009). A metodologia do I-TASSER é baseada na predição por
homologia de estrutura e alinhamento por threading das sequências alvo com base
nas
estruturas
disponíveis
na
biblioteca
do
Protein
Data
Bank
–
PDB
(http://www.rcsb.org/pdb/home/home.do), complementando com simulações ab initio
para as cadeias laterais (ZHANG, 2007). O programa I-TASSER gera modelos
classificados pelo Z-Score, RMSD, densidade do cluster e, principalmente pelo Cscore. O C-score corresponde ao escore de confiança que estima a qualidade do
modelo gerado pelo I-TASSER cujo valor pode ser de -5 a 2 (quanto maior o valor
do C-score, maior será a confiança do modelo). Com relação ao programa Phyre2,
este realiza modelagem basicamente por homologia (KELLEY & STERNBERG,
2009).
Os modelos foram avaliados usando os softwares MOLPROBITY (CHEN et
al., 2010) e SWISS-MODEL (ARNOLD et al., 2006). Para a visualização dos
modelos, foram usados os softwares UFSC Chimera (PETTERSEN et al., 2004) e
PyMOL versão 1.5.0.4 (http://www.pymol.org/).
50
3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
Pares de primers foram desenhados com base em uma região conservada e
uma região variável do genoma. Todos os primers foram analisados nos programas
PrimerBlast (http://www.ncbi.nlm.nih.gov/tools/primer-blast/) para verificar o TM
(temperatura de melting) e anelamento inespecífico, e AutoDimer (VALLONE &
BUTLER, 2004) para verificar a formação de hairpins e dímeros de primers.
Um método de PCR convencional foi desenvolvido para identificar as duas
regiões escolhidas. Após a síntese de cDNA, foi realizada a PCR como descrito a
seguir: os primers (5 µM cada) foram usados em 20 µl de reação contendo 10,8 µl
de água Milliq, 2 µl de Reaction buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP
mix 5 mM cada, 0,4 µl de Taq polimerase 5 U/µl e 4 µl de cDNA. A reação foi
submetida à desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de 94
ºC por 30 segundos, 58 ºC por 45 segundos, 72 ºC por 45 segundos, e extensão
final a 72 ºC por 5 minutos. Os amplicons gerados foram de 200 pb para a região
conservada e 456 pb para a região variável. Os produtos da PCR foram analisados
em gel de agarose 1,5% na presença de brometo de etídio, e visualizados em
transluminador.
Uma análise de agrupamento utilizando o método de Neighbor joining foi
realizada usando a sequência de nucleotídeos do fragmento de 456 pb. O
dendograma foi calculado no programa MEGA 6.06, usando o modelo Tamura-Nei e
1000 replicações de Bootstrap.
51
3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples
Seis regiões no genoma (cada uma com 200 pb) foram selecionadas como
candidatas para o sistema de identificação de polimorfismos através da análise da
curva de melting de fita simples. Essas regiões foram submetidas à análise in silico
no programa RNAfold (http://rna.tbi.univie.ac.at) para predição da estruturas
secundárias de RNA e DNA, e nos softwares MELTSIM (BLAKE et al., 1999) e
RNAheat (HOFACKER et al., 1994) para a geração de curvas de melting de DNA fita
dupla e RNA fita simples, respectivamente. Os seis pares de primers (sequências
não mostradas) foram desenhados e analisados usando os programas PrimerBlast e
AutoDimer.
As análises in vitro procederam da seguinte maneira, em duas etapas:
(I)
Em um volume final de 20 µl foram adicionados 10,8 µl de água Milliq, 2 µl
de Reaction Buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM
cada, 0,4 µl de Taq polimerase (5 U/µl), 4 µl de cDNA e 1 µl de primer (5
µM cada). O protocolo de termociclagem compreendia um passo inicial a
94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30
segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45
segundos, e extensão final a 72 ºC por cinco minutos.
(II)
4 µl do produto da primeira reação foi utilizado como template em um
volume final de 20 µl contendo 10 µl de mix SYBR green, 1 µl de primer
foward (5 µM) e 5 µl de água Milliq. Essa reação foi submetida a uma
desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45
segundos, extensão a 72 ºC por 45 segundos, 30 ºC por 2 minutos, e
52
extensão final a 72 ºC por cinco minutos. Os parâmetros da curva de
dissociação foram padrões.
As curvas de melting in vitro foram visualizadas no software 7500 Fast Real-Time
PCR System versão 2.1.0 (Applied Biosystems®).
53
4 RESULTADOS
4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE
Proteínas RdRp foram analisadas a fim de estimar a relação filogenética do
IMNV dentro da família Totiviridae. Trinta sequências de aminoácidos da RdRp de
membros representativos da família Totiviridae (Tabelas Suplementares 1 e 2) foram
alinhadas, e as relações entre elas está descrito no dendograma da Figura 8. Oito
clados monofiléticos distintos podem ser observados no dendograma e esses grupos
foram nomeados seguindo a classificação de Liu et al. (2012). O grupo IMNV-like, o
qual compreende vírus que infectam artrópodes, GLV-like e ScV-like coincide com
os descritos previamente (LIU et al., 2012). Quatro novos grupos foram
estabelecidos: MoV-like, compreendendo vírus que infectam plantas e fungos, TVVlike e LRV-like, que abragem vírus que infectam protozoários parasitas humanos, e
GaRV-like, que compreende vírus de fungos. Para assegurar a eficiência da análise,
as relações entre os membros dos grupos TVV-like, LRV-like e GLV-like (Tabela
Suplementar 2) foram determinadas numa segunda análise filogenética (Figura
Suplementar 1). O vírus Zygosaccharomyces bailii (ZbV-Z) e dois outros vírus
relacionados isolados de plantas e fungos formaram o grupo ZbV-Z-like. Todos os
grupos observados estão de acordo com a classificação propostas pelo Comitê
Internacional de Taxonomia de Vírus (ICVT) (KING et al., 2012).
54
Figura 8: Análise filogenética de membros representativos da família Totiviridae. A árvore foi
calculada a partir do alinhamento da sequência de aminoácidos da RdRp de 30 membros
representativos da família Totiviridae, usando Inferência Bayesiana. As IDs das sequências estão
indicadas nas Tabelas Suplementares 1 e 2. Os números indicam a consistência topológica e a
confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de
acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV.
4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
Foram analisadas 31 amostras diferentes de camarão utilizando os métodos
descritos anteriormente. Algumas apresentavam sinais da doença, como opacidade
ou coloração avermelhada nos segmentos abdominais distais. Das 31 amostras
analisadas, apenas duas foram identificadas como positivas para o IMNV: o lisado
de células congelado e o conservado em etanol 70% (Tabela Suplementar 3).
55
4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS
Dois novos genomas de isolados diferentes do IMNV foram amplificados e
sequenciados no presente estudo. Os isolados foram nomeados IMNVgen1
(coletado em 2009 no estado de Pernambuco/BR) e IMNVgen2 (coletado em 2013
no estado do Rio Grande do Norte/BR). As sequências dos genomas completos
estão mostradas nas Figuras Suplementares 2 e 3.
A estratégia empregada para obtenção da sequência nucleotídica completa
de IMNVgen1 e IMNVgen2 foi aquela desenvolvida para o genoma proveniente da
Indonésia descrita por Senapin et al. (2007). Exceto pelos últimos 43 nucleotídeos
em um dos genomas, a qualidade das bases foi alta, em torno de 50 (> 20),
equivalente ao escore Phred (EWING & GREEN, 1998), indicando que a sequência
genômica foi confiável para os dois isolados.
4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS
A análise comparativa realizada com o auxílio da ferramenta BLAST mostrou
que as novas sequências obtidas no presente estudo correspondem ao vírus da
mionecrose infecciosa (99% de identidade). Os dois isolados apresentaram um
genoma de 7561 pb, consistente com o tamanho dos genomas do IMNV publicados
anteriormente para os isolados do Brasil (GenBank Nº de acesso AY570982.2) e
Indonésia (GenBank Nº de acesso EF061744.1). IMNVgen1 apresentou uma
composição de bases de 37,0% de A, 25,2% de T, 20,0% de G e 17,8% de C. O
conteúdo G/C e A/T do genoma foi calculado para ser 1,12% e 1,47%,
respectivamente. Já IMNVgen2 apresentou uma composição de bases de 36,8% de
56
A, 25,3% de T, 20,0% de G e 17,9% de C. O conteúdo G/C e A/T do genoma foi
calculado para ser 1,12% e 1,45%, respectivamente. Como mostrado na Tabela 3,
IMNVgen1 é muito similar a IMNVgen2 (99,42% de identidade), assim como é muito
parecido com os isolados do Brasil e Indonésia. Valores de identidade semelhantes
foram observados quando IMNVgen2 foi comparado com esses mesmos isolados
(Tabela 4).
Tabela 3: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen1 com outras
sequências disponíveis no GenBank e IMNVgen2.
GenBank No/
novo genoma
Local do isolado
(ano)
Identidade
genômica
(%)
Identidade de
nucleotídeos (%)
Identidade de
aminoácidos (%)
ORF1
ORF2
ORF1
ORF2
AY570982.2
Brasil (2003)
98,90
98,75
99,11
98,82
99,34
EF061744.1
Indonésia (2006)
98,66
98,48
98,99
98,45
99,34
IMNVgen2
Brasil (2013)
99,42
99,36
99,56
99,57
99,21
Tabela 4: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen2 com outras
sequências disponíveis no GenBank e IMNVgen1.
GenBank No/
novo genoma
Local do isolado
(ano)
Identidade
genômica
(%)
Identidade de
nucleotídeos (%)
Identidade de
aminoácidos (%)
ORF1
ORF2
ORF1
ORF2
AY570982.2
Brasil (2003)
98,90
98,75
99,11
98,82
99,21
EF061744.1
Indonésia (2006)
98,67
98,48
98,99
98,38
99,21
IMNVgen1
Brasil (2009)
99,42
99,36
99,56
99,57
99,21
57
As sequências codificantes de IMNVgen1 e IMNVgen2 estão organizadas
em duas ORFs, como esperado para um típico totivírus e de acordo com os
genomas já publicados (POULOS et al., 2006; SENAPIN et al., 2007). Em ambos, a
ORF1 apresentou 4.818 nucleotídeos, começando no nucleotídeo 136, e a ORF2
apresentou 2.250 nucleotídeos, começando no nucleotídeo 5.241, estando as ORFs
em diferentes frames. A sequência aminoacídica da ORF1 dos novos genomas foi
pelo menos 98,38% similar as sequências dos isolados do Brasil e Indonésia
(Tabela 4). Com relação à sequência aminoacídica da ORF2, IMNVgen1 mostrou
99,34% de similaridade com os genomas já publicados, enquanto que IMNVgen2
mostrou 99,21% de similaridade.
A análise de agrupamento por Neighbor joining usando os quatro genomas
completos dentro do grupo IMNV-like gerou um dendograma com dois grupos bem
definidos para o IMNV: um grupo composto pelos vírus sequenciados neste estudo e
outro compreendendo os genomas previamente descritos (Figura 9).
Figura 9: Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas completos do
IMNV. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o
modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa
MEGA 6.06. IMNV - Penaeid shrimp infectious myonecrosis virus; AsV - Armigeres subalbatus virus;
DmV - Drosophila melanogaster totivirus; TianV - Tianjin totivirus; ORV - Omono river virus.
58
4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS
A análise realizada no programa Simplot gerou um gráfico que proporcionou
uma visão geral da distribuição de sítios polimórficos (SPs) ao longo do genoma. Os
SPs foram verificados nas oito regiões previamente descritas para o genoma do
IMNV (POULOS et al., 2006; NIBERT, 2007): (1) 5’UTR, que compreende os
primeiros 135 nucleotídeos do genoma, (2) RBP, correspondente a região que
codifica uma provável proteína de ligação a RNA (nt 136 a 414), (3) Small Protein 1
(SP1) e (4) Small Protein 2 (SP2) (nt 415 a 1266 e nt 1267 a 2247,
respectivamente), regiões candidatas a codificarem as protrusões do IMNV, (5) MCP
(nt 2248 a 4953), que corresponde a região que codifica a proteína do capsídeo, (6)
região entre as ORFs (nt 4954 a 5240), (7) região que codifica a RdRp (nt 5241 a
7490) e (8) 3’UTR que compreende os últimos 71 nucleotídeos do genoma. Estas
regiões estão esquematizadas no topo da Figura 10. Observando as comparações
ilustradas na Figura 10 é possível identificar três regiões com baixo escore de
similaridade localizadas na primeira metade da ORF1, em todas as comparações. A
análise no Simplot também revelou que a região que codifica a ORF2 apresenta alta
similaridade quando comparada à ORF1. Os resultados também indicam que os
isolados descritos para o Brasil e Indonésia são mais similares entre si, assim como
IMNVgen1 e IMNVgen2, o que corrobora com o dendograma mostrado na Figura 9.
59
Figura 10: Representação esquemática do genoma do IMNV e análise de variabilidade. Os plots de
similaridade gerados no Simplot comparam IMNVgen1 e IMNVgen2 com os genomas disponíveis no
banco de dados. O eixo X representa a posição dos nucleotídeos e o eixo Y representa o escore de
similaridade. A região mais variável e o domínio conservado da RdRp estão destacados.
60
Os resultados obtidos no alinhamento das sequências nucleotídicas e
aminoacídicas mostrou a presença de 126 sítios polimórficos, dos quais 5 estão na
proteína de ligação a dsRNA (RBP), 40 nas regiões das Small Proteins (SP1 e SP2),
47 na proteína do capsídeo e 28 na RdRp. Desses 126 sítios polimórficos, 37
causam alteração em aminoácidos, estando 13 nas regiões de SP1 e SP2, 15 na
proteína do capsídeo e 7 na RdRp (Figura 11 e Tabela Suplementar 4). Levando em
consideração a região codificante do genoma, verificamos que, proporcionalmente, a
maior densidade de sítios polimórficos, inclusive aqueles que alteram aminoácidos,
se encontram nas regiões da SP1 e SP2 (~1 polimorfismo a cada 46 nt), seguido
pela proteína do capsídeo (~1 polimorfismo a cada 57 nt) e pela RdRp (~1
polimorfismo a cada 80 nt). Os polimorfismos encontrados na região da proteína de
ligação da dsRNA não alteram o quadro de leitura dos aminoácidos, constituindo
mutações silenciosas.
100%
13
100%
99%
3
15
1
7
21
5
32
2
27
99%
98%
286
98%
97%
97%
132
274
1806
2229
2674
69
96%
96%
5'UTR
RBP
Small
Proteins
MCP
Entre ORFs
RdRp
3'UTR
Sítios não polimórficos
Sítios polimórficos (total menos sítios não sinônimos)
Sítios polimórficos não sinônimos
Figura 11: Sítios polimórficos identificados no genoma do IMNV. O número total de sítios polimórficos
compreende os sítios polimórficos sinônimos e não sinônimos mostrados proporcionalmente em cada
região do genoma.
61
Com base nos resultados obtidos no Simplot e no alinhamento das quatro
sequências, foi possível mapear os sítios polimórficos ao longo do genoma e, assim
identificar quais regiões eram mais conservadas e quais eram mais variáveis. Os
dados indicam que as regiões previstas para codificarem a protrusão do vírus (SP1 e
SP2) variaram mais em relação às outras regiões, enquanto que a região da RdRp
apresentou-se mais conservada. Nesse sentido, podemos dizer que as proteínas
que são candidatas a formarem a protrusão do vírus são mais susceptíveis a
sofrerem mudanças do que as outras proteínas do IMNV e, provavelmente
apresentam uma região hipervariável.
4.6
ANÁLISE
DE
COMPOSIÇÃO
DE
AMINOÁCIDOS
E
PREDIÇÃO
DE
ESTRUTURA SECUNDÁRIA
Os primeiros 93 aminoácidos da ORF1 codificam uma proteína que
apresenta um domínio DSRM (double-strand RNA binding motif) conservado
envolvido na ligação a RNA. Para simplificar, toda a proteína foi chamada RBP (RNA
binding protein). As predições de estrutura secundária revelam que a RBP é
totalmente estruturada e possui alto conteúdo de α-hélices, mas nenhum coiled coil
(Figura 12 e Figura Suplementar 4A). Diferente das outras proteínas do IMNV, a
RBP não apresentou nenhum sítio polimórfico que causasse alteração na sequência
de aminoácidos.
62
Figura 12: Análise de composição de aminoácidos e predição de estrutura secundária para RBP. A
predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices
transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente.
O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β
(caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a
solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação
esquemática mostrando o domínio conservado DSRM (em cinza claro). O eixo X representa a
posição dos aminoácidos.
Proporcionalmente, as proteínas SP1 e SP2, candidatas a codificarem a
protrusão, apresentaram o maior número de sítios polimórficos, dos quais 13 podem
provocar mudança de aminoácidos. As análises de composição de aminoácidos e
predição de estrutura secundária indicam que SP1 possui características de uma
proteína estruturada apresentando uma região N-terminal hidrofóbica não exposta a
solvente e grande quantidade de folhas-β (Figura 13 e Fig. Suplementar 4B). Já SP2
63
mostrou-se uma proteína quase totalmente desestruturada, com alta quantidade de
aminoácidos carregados, alta hidrofilicidade e uma pequena região estruturada na
porção C-terminal. Além disso, a região desestruturada que apresentou o maior pico
coincidiu com uma região não exposta a solvente. SP2 também mostrou uma região
de coiled coil com um escore significante na porção N-terminal, que foi predito em
diferentes reading windows (Figura 13 e Figura Suplementar 4C).
Figura 13: Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e
SP2. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices
transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente.
O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β
(caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a
solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação
esquemática mostrando os sítios polimórficos não sinônimos (traços pretos) identificados nas
proteínas. O eixo X representa a posição dos aminoácidos.
64
A proteína principal do capsídeo (MCP) apresentou um número considerável
de sítios polimórficos, sendo superada apenas pela região das proteínas SP. De
acordo com o esperado para uma proteína globular, ela contém uma alta proporção
de aminoácidos neutros (31%) e hidrofóbicos (50,5%). Esta proteína, formada por
901 aminoácidos, apresentou alto grau de regiões estruturadas e duas regiões
desestruturadas mais evidentes na sua segunda metade. A região desestruturada
entre os aminoácidos 804 a 846 contém alto conteúdo de α-hélices predito pelos
programas Coils e PredictProtein (Figura 14 e Fig. Suplementar 4D). As análises in
silico também revelaram cinco picos hidrofóbicos preditos pelo TMPred. A
comparação entre os quatro genomas do IMNV mostrou que a região
correspondente a MCP possui 15 sítios onde ocorrem mudanças de aminoácidos.
Esses sítios estão distribuídos ao longo da proteína e alguns coincidem com os
picos hidrofóbicos.
Um mapa contendo todos os sítios polimórficos, bem como os aminoácidos
codificados, está mostrado na Tabela Suplementar 4. As mudanças de aminoácidos
nos sítios 2440, 3160, 3293, 3570, 3653, 3929, 4091 e 4504, localizados na MCP,
devem ser destacadas, pois ocorrem mudanças entre aminoácidos com diferentes
cargas, indicando que estes sítios poderiam afetar a estrutura secundária da
proteína em diferentes isolados virais.
65
Figura 14: Análise de composição de aminoácidos e predição de estrutura secundária para MCP. A
predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices
transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente.
O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β
(caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a
solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação
esquemática mostrando o core conservado da MCP (em cinza claro) e os sítios não sinônimos
identificados na proteína (traços pretos). O eixo X representa a posição dos aminoácidos.
66
A RNA polimerase dependente de RNA mostrou-se uma proteína muito
conservada entre os quatro isolados apresentando apenas sete sítios polimórficos
não-sinônimos. As análises in silico revelaram que a RdRp possui características de
uma proteína estruturada com pequenas regiões desestruturadas interpassadas,
lembrando uma proteína com domínios conectados por pontes móveis (Figura 15 e
Figura Suplementar 4E). Duas hélices hidrofóbicas preditas pelo TMPred estão
localizadas em domínios estruturados e provavelmente estão escondidas na
estrutura globular. A predição de estruturas secundárias revelou a existência de um
alto conteúdo de α-hélices e dois motivos coiled coil com alta probabilidade de
ocorrência compreendendo os aminoácidos 243 a 256 e 636 a 649. Em ambos os
motivos não foram detectadas mudanças de aminoácidos (Figura 15). A Figura 15
mostra que as sequências-motivo conservadas em RNA polimerases estão
localizadas em regiões estruturadas e, exceto pela sequência-motivo F1, todas
coincidem com a região do domínio conservado da RdRp.
Como mostrado na Tabela Suplementar 4, a mudança de aminoácidos nos
sítios 5299, 5520, 5784 e 6981, localizados na RdRp, devem ser destacados pois
ocorre mudança de aminoácidos com diferentes cargas, indicando que estes sítios
tem potencial para alterar a estrutura secundária da proteína.
67
Figura 15: Análise de composição de aminoácidos e predição de estrutura secundária para RdRp. A
predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices
transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente.
O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β
(caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a
solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação
esquemática mostrando o domínio conservado da RdRp (em cinza claro), os sítios não sinônimos
identificados na proteína (traços pretos) e as sequências-motivo conservadas em RdRps (traços
azuis). O eixo X representa a posição dos aminoácidos.
68
4.7 MODELAGEM DE PROTEÍNAS
As estruturas terciárias das proteínas RBP, MCP e RdRp potencialmente
codificadas pelo isolado da Indonésia foram preditas utilizando os programas ITASSER e Phyre2. Os valores para o escores e parâmetros de avaliação dos
modelos são mostrados na Tabela Suplementar 5. Não foi possível obter modelos
com escores de confiabilidade significantes para as proteínas SP1 e SP2. Os
modelos da MCP e RdRp também foram preditos para os três isolados do Brasil
(Figuras Suplementares 5 e 6). Não foram gerados modelos da RBP para os
isolados do Brasil devido à sequência de aminoácidos da proteína ser idêntica para
os quatro isolados.
O melhor modelo 3D da RBP apresentou um C-Score igual a -2,26 e uma
estrutura comum presente em estruturas já resolvidas para o domínio conservado
DSRM disponíveis no Protein Data Bank (PDB), as quais possuem duas α-hélices e
três folhas β (destacado em cinza claro na Figura 16 e na Figura Suplementar 7A).
Essas estruturas também correspondem parcialmente às estruturas secundárias
preditas pelo PredictProtein (Figura 12).
69
Figura 16: Modelo estrutural para a proteína RBP do IMNV gerado pelo I-TASSER. O domínio
conservado DSRM está destacado em cinza claro. (MolProbity score 4,03, Z-Score 0,627, C-score 2,26).
O modelo gerado no I-TASSER para o monômero da MCP apresentou um
C-Score igual a -2,27 e um formato semelhante ao dos monômeros de
Saccharomyces cerevisiae virus L-A (ScV-L-A) e Helminthosporium victoriae virus
190S (HvV190s), mas diferenças significativas em relação às estruturas secundárias
devido o alto conteúdo de α-hélices (Figura 17) (NAITOW et al., 2002; DUNN et al.,
2013). A Figura 17 mostra a localização do possível “trench” e um resíduo de His
107 identificado nesta estrutura. Um segundo modelo gerado no Phyre2 para a
MCP, baseado apenas em modelagem por threading, resultou em uma estrutura
composta por três α-hélices (Figura Suplementar 7B), compreendendo os
aminoácidos 518 a 590.
70
Figura 17: Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER. O core conservado da
MCP está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão
indicados em vermelho. (MolProbity score 3,47, Z-Score -6,341, C-score -2,27).
A modelagem por threading associada com simulações ab initio para a RdRp
gerou o modelo com o melhor C-Score (0,23) em relação aos modelos da RBP e
MCP. Apesar da ausência de estruturas β na estrutura, o formato da proteína foi
semelhante a uma “right hand”, como esperado para uma RNA polimerase. Os
domínios “thumb”, “fingers” e “palm” estão indicados na Figura 18, assim como as
sequências-motivo A, B, C, D, E, F1, F2 e F3 estão destacadas em cores diferentes.
O domínio conservado da RdRp também está evidenciado em cinza claro (Figura
18).
71
Figura 18: Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER. O domínio conservado da
RdRp está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão
indicados em vermelho. Os domínios “thumb”, “fingers”, e “palm” estão mostrados, assim como as
sequências-motivo conservadas em RdRps estão destacadas como segue: A – azul escuro; B – azul
claro; C – rosa; D – verde; E – amarelo; F1, F2 e F3 – laranja. (MolProbity score 3,96, Z-Score -5,14,
C-score 0,23).
4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
Primers flanqueando uma região variável e uma região conservada do
genoma do IMNV foram produzidos para detecção do vírus (Tabela 5). Os pares de
primers SP-F/SP-R e RdRp-F/RdRp-R foram desenhados para amplificar um
fragmento de 456 pb e 200 pb, respectivamente, e para possuírem temperaturas de
melting (TM) similares a fim de serem usados tanto em uma reação multiplex como
em reações separadas. Um par de primer (EF1α-F/ EF1α-R) também foi desenhado
72
para ser usado como controle positivo da reação e amplifica um fragmento de 600
pb presente no gene do fator de elongação-1α do camarão.
Tabela 5: Lista de primers empregados no sistema de identificação do IMNV.
Nome do primer Sequência (5’→3’)
TM (ºC)
SP-F
CATCAAGTGTACTCGGAAG
52,85
SP-R
CTTCTCTAGTTAGAACTGGATC
52,90
RdRp-F
ACGTAGAGGACATACATCC
53,05
RdRp-R
GATTGGTATTGTCTGATTTCTAC 53,02
EF1α-F
GCGCAAGAGCGACAACTATG
59,97
EF1α-R
ACATAGGCTTGCTGGGAACC
60,03
Um esquema mostrando o alinhamento de nucleotídeos referente aos
fragmentos de 456 pb e 200 pb, amplificados das regiões variável e conservada,
respectivamente, está mostrado na Figura 19. A figura também indica o número de
sítios polimórficos presente em cada região.
73
Figura 19: Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões
variável e conservada, respectivamente. Esses fragmentos foram empregados no sistema de
detecção do IMNV. Os sítios polimórficos de cada região estão mostrados em caixas.
Usando os primers SP-F/SP-R e RdRp-F/RdRp-R em duas reações de PCR
separadas foi possível detectar a presença do IMNV em duas amostras diferentes
de camarão como mostrado na Figura 20A. Embora esta seja uma análise
qualitativa, considerando a mesma quantidade de template e a intensidade das
bandas, é possível notar que a amostra 1 apresentou uma maior quantidade de
partículas do IMNV do que a amostra 2. A análise de agrupamento por Neighbor
joining utilizando o fragmento de 456 pb a partir dos quatro genomas do IMNV
reconstitui os mesmos grupos mostrados na Figura 9 (Figura 20B).
74
Figura 20: Sistema de detecção do IMNV. (A) Gel de agarose mostrando os resultados do sistema de
identificação do IMNV utilizando os novos marcadores para as regiões variável e conservada do
genoma. O sistema foi capaz de identificar a presença do IMNV em duas amostras diferentes do
camarão coletadas em diferentes locais do Brasil. 1 – marcador de peso molecular; 2 e 6 – controle
positivo (EF-1α); 3 e 7 – controle negativo; 4 e 8 – detecção usando os primers da região mais
variável; 5 e 9 – detecção usando primers da região conservada. Os asteriscos indicam as bandas de
456 pb e 200 pb esperadas. (B) Análise Neighbor joining baseado no fragmento de 456 pb da região
mais variável. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos,
usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no
programa MEGA 6.06.
4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples
Na tentativa de desenvolvermos um sistema de identificação de ácidos
nucleicos a partir da curva de desnaturação dos amplicons, seis regiões de 200 pb
foram selecionadas ao longo de todo o genoma do IMNV além do fragmento de 456
pb (Reg.Frag456) já apresentado no tópico anterior. Todas essas regiões foram
submetidas a 2 análises in silico: (1) predição de estrutura secundária de RNA e
DNA e (2) geração de curvas de melting a partir da desnaturação do DNA de fita
75
dupla e do RNA de fita simples. A abordagem de desnaturação de uma fita simples é
inédita, e possivelmente mais eficiente para determinar variações na sequência
primária que a desnaturação de uma fita dupla (OLIVEIRA et al., 2014). Após as
análises in silico algumas dessas regiões também foram utilizadas para testes
preliminares in vitro (Tabela 6).
Tabela 6: Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de
fita simples.
Região
Localização no genoma Teste in silico Teste in vitro
R1 (nt 468-667)
Small proteins
Sim
Não
R2 (nt 969-1168)
Small proteins
Sim
Sim
R3 (nt 1119-1318)
Small proteins
Sim
Sim
R4 (nt 1635-1834)
Small proteins
Sim
Não
R5 (nt 2413-2612)
MCP
Sim
Sim
R6 (nt 6823-7022)* RdRp
Sim
Sim
Reg.Frag456
Sim
Não
Small proteins
*A região R6 corresponde ao fragmento de 200 pb do par de primers RdRp-F/RdRp-R.
A partir da desnaturação das sequências apresentadas na Tabela 6,
esperávamos conseguir diferenciar os amplicons e discriminar os isolados
sequenciados neste estudo. As Figuras 21 e 22 mostram resultados preliminares
dos testes para as regiões R2 e R3, comparando os isolados IMNVgen1 e
IMNVgen2. Os resultados obtidos de predição de estrutura secundária de RNA e
DNA para a região R2 mostram estruturas bastante diferentes entre os isolados
(Figura 21A-D). Por outro lado, para a região R3, essas estruturas se apresentaram
mais semelhantes (Figura 22A-D). Para ambas as regiões, os resultados obtidos
para a curva de melting de fita simples in silico não corresponderam às curvas
geradas na análise in vitro, indicando que o método não foi eficiente na
diferenciação dos isolados e precisa ser melhorado (Figuras 21E-H e 22E-H).
76
Figura 21: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla
para a região R2. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária
utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de
DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita
simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de
fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.
77
Figura 22: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla
para a região R3. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária
utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de
DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita
simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de
fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.
78
Como mostrado na Figura 19, o fragmento de 456 pb foi capaz de diferenciar
os quatro isolados do IMNV após a etapa de sequenciamento. Os resultados in silico
de predição de estrutura secundária de RNA e curva de melting de fita simples
indicam que este fragmento é capaz de diferenciar os vírus sequenciados no
presente estudo daqueles já descritos (Figura 23). De fato, as estruturas
secundárias de RNA dos vírus do Brasil e Indonésia são mais semelhantes entre si
(Figura 23A e B), assim como as estruturas secundárias de RNA para IMNVgen1 e
IMNVgen2 (Figura 23C e D). A curva de melting de RNA fita simples realizada in
silico foi capaz de refletir a diferença entre as estruturas de RNA (Figura 23E).
Figura 23: Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in
silico para o fragmento de 456 pb. A predição de estrutura secundária de RNA foi realizada no
programa RNAfold e a curva de melting simples fita foi gerada no programa RNAheat. A – IMNV-BR;
B – IMNV-Ind; C – IMNVGen1; D – IMNVGen2; E – curva de melting de fita simples in silico.
79
5 DISCUSSÃO
O surgimento de doenças infecciosas que acometem animais de criação é um
dos principais problemas para a economia dos países produtores, causando
prejuízos financeiros significativos. Sendo assim, é necessário que esse problema
seja resolvido ou, pelo menos, minimizado empregando métodos de identificação e
controle eficientes para evitar e/ou combater essas doenças (LANA, BEISEL &
SILVA, 1992; NAGATA et al., 2006; MINGXIAO et al., 2013).
O desenvolvimento de métodos de identificação e controle eficazes requer
conhecimentos aprofundados em relação à biologia do patógeno. Em termos
moleculares, é necessário conhecer a sequência genômica do organismo, assim
como os produtos gênicos codificados pelo genoma (POULOS et al., 2006; SILVA et
al., 2014). Também é interessante estudar a filogenia e aspectos evolutivos do
organismo de interesse (POULOS et al., 2006; CORTEY et al., 2011; FRAGA et al.,
2012). A partir desses conhecimentos pode-se investigar a variabilidade genética
das diversas espécies, identificar regiões conservadas e variáveis nas sequências,
prever a estrutura tridimensional de proteínas importantes e, assim, inferir seus
mecanismos
de
infectividade,
replicação,
dentre
outros
mecanismos
e
características (NIBERT, 2007; TANG et al., 2008; CORTEY et al., 2011; APTESENGUPTA et al., 2012; NAIM, BROWN & NIBERT, 2014).
Um método molecular eficaz para detecção molecular é a Reação em Cadeia
da Polimerase (PCR). Esse sistema já é amplamente empregado na detecção de
agentes infecciosos e fornece um resultado confiável (POULOS & LIGHTNER, 2006;
SILVA et al., 2014). Além disso, quando realizada em tempo real, a PCR é capaz de
quantificar o DNA de maneira precisa e com maior reprodutibilidade (SILVA,
80
PINHEIRO & COIMBRA, 2011; WEIRATHER et al., 2011; BOTELHO-SOUZA et al.,
2014). Estudar o genoma, tanto no nível de nucleotídeos quanto no nível de
aminoácidos, bem como as proteínas codificadas, é importante na seleção de
regiões alvo para o desenho de primers (SEIBERT et al., 2010; LOY et al., 2013). A
produção dos primers é o principal passo no desenvolvimento de um sistema de
PCR confiável.
No presente trabalho, foi estudado o genoma, bem como os possíveis
produtos de expressão gênica codificados por ele, de quatro isolados distintos do
vírus causador da mionecrose infecciosa em camarões peneídeos, oriundos do
Brasil e Indonésia, a fim de desenvolver um método de PCR eficiente na
identificação e distinção desses isolados.
As duas amostras positivas identificadas no screening inicial para detecção de
novos isolados do IMNV em camarões Litopenaeus vannamei foram suficientes para
alcançar os objetivos do presente estudo. O fato de não termos conseguido
encontrar o IMNV em muitas amostras, em especial aquelas cujos camarões
estavam intactos, pode ser devido aos seguintes fatores: (i) os camarões realmente
não estavam infectados, já que as amostras foram obtidas de grandes fazendas que
tomam as devidas medidas profiláticas; (ii) a coleta das amostras pode ter sido
realizada em um período no qual as condições ambientais não favoreciam a
incidência do vírus ou; (iii) os métodos aplicados na identificação não foram
eficientes, pois encontramos que o primer F13 (Tabela 1) não funcionou devido
anelar em uma região onde existia um sítio polimórfico (nt 5.784).
A análise filogenética mostra que o grupo GLV-like compreende vírus do
gênero Giardiavirus e ScV-like compreende vírus do gênero Totivirus. O gênero
Victorivirus inclui dois grupos, MoV-like e GaRV-like. Os gêneros Leishmaniavirus e
81
Trichomonasvirus incluem os grupos LRV-like e TVV-like, respectivamente. O grupo
ZbV-Z-like foi anteriormente designado como um grupo primitivo, menos derivado,
parente distante dos totivírus e inclui partículas virais com organização genômica
distinta desta família. Uma nova família Amalgamaviridae foi proposta para
acomodar estes três vírus (LIU et al., 2012). O grupo IMNV-like aparece como o
grupo menos derivado próximo a GLV-like. De fato, no estudo filogenético realizado
por Poulos e colaboradores (2006), o IMNV foi agrupado com GLV, mas essa
análise não levou em consideração as sequências dos vírus do grupo IMNV-like. O
grupo IMNV-like não é classificado pela ICTV (KING et al., 2012). Assim, é
interessante notar que o IMNV provavelmente pertence a um táxon ainda não
descrito. Devido suas características peculiares, Tang e colaboradores (2008)
propuseram a criação de um novo gênero na família Totiviridae para acomodar o
IMNV. Nossos resultados indicam que o grupo IMNV-like poderia corresponder a
esse novo gênero.
As comparações entre os quatro isolados em nível de sequência genômica
completa, bem como sequências nucleotídicas e aminoacídicas das ORFs
mostradas nas Tabelas 3 e 4, indicam que IMNVgen1 e IMNVgen2 são mais
parecidos entre si do que com os genomas do Brasil e Indonésia, e que ambos são
mais semelhantes à sequência descrita para o Brasil. É esperado que a similaridade
entre os isolados coletados no Brasil seja alta, considerando que o IMNV foi
primeiramente identificado no Brasil e, posteriormente, atingiu outros locais do
mundo. Entretanto, a análise de agrupamento por Neighbor joining revelou a
formação de dois grupos distintos: IMNVgen1/IMNVgen2 e IMNV-BR/IMNV-IND
(Figura 9). É curioso e inesperado observar que o isolado do Brasil seja mais
relacionado ao isolado da Indonésia. Provavelmente, o genoma está sendo afetado
82
mais pela variação ao longo do tempo do que pela variação devido ao isolamento
geográfico, uma vez que os vírus sequenciados no presente estudo foram coletados
nos anos de 2009 e 2013, enquanto que os isolados do Brasil e da Indonésia foram
coletados em 2003 e 2006, respectivamente (POULOS et al., 2006; SENAPIN et al.,
2007). No entanto, mudanças decorrentes de isolamento geográfico são recorrentes
entre os vírus que acometem camarões, como ocorreu com o IMNV na dispersão do
Brasil para a Indonésia (SENAPIN et al., 2007). Isolados de WSSV, que é um vírus
de DNA, originários da China, Taiwan e Indonésia apresentaram até 13.000 pares
de bases divergentes (MARKS et al., 2004). Além disso, isolados diferentes de
WSSV da mesma região geográfica foram repostados na China (TAN et al., 2009).
Esta observação requer uma análise mais detalhada do genoma a fim de identificar
os sítios polimórficos e determinar as regiões que vem sofrendo mudanças e sua
correlação com motivos estruturais proteicos.
Mutações gênicas em vírus são bastante comuns, principalmente em vírus
que apresentam genoma de RNA, como o IMNV. A falta de atividade de correção de
erros da RNA polimerase contribui significativamente para o grande número de
mutações encontradas em vírus de RNA. Já é amplamente conhecido que a
capacidade de infecção e mecanismos de patogenicidade são influenciados pelas
alterações em regiões específicas do genoma de diferentes vírus. As primeiras
evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção,
replicação e patogenicidade afetadas por alterações induzidas em seu genoma de
RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Pudupakam et al. (2011),
viram que deleções em uma região hipervariável da ORF1 reduziam a eficiência da
replicação do vírus da hepatite E.
83
A proteína RBP apresentou uma estrutura semelhante àquelas já resolvidas e
disponíveis para o domínio conservado DSRM (Figura 16), o que reforça o
pressuposto de que os primeiros 93 aminoácidos da ORF1 codificam uma proteína
de ligação a dsRNA. Não foi identificado nesta proteína nenhum polimorfismo que
alterasse o quadro de leitura de aminoácidos. A função exata da RBP ainda não está
bem elucidada. Ela provavelmente desempenha um papel importante no
encapsulamento do vírus e modulação da imunidade inata após expressão em
células infectadas (TANG, et al., 2008). Sendo assim, podemos supor que sua
função requer que a proteína não sofra nenhuma variação na sequência
aminoacídica e/ou na sua estrutura proteica. A alta conservação intraespecífica
observada tanto na sequência de aminoácidos quanto na estrutura da proteína,
indica que as características da RBP estão sendo mantidas durante a evolução.
Devido à baixa variação na sequência de nucleotídeos, essa região se caracteriza
como uma boa região para estudos filogenéticos e desenhos de primers, assim
como pode ser considerada como um bom alvo para agentes terapêuticos. De fato,
foi observado que moléculas de RNA de interferência (RNAi) destinadas à RBP
fornecem uma proteção eficiente para os camarões desafiados com IMNV (LOY et
al., 2013).
O gráfico gerado no Simplot ilustrou a variabilidade em toda a sequência
genômica do IMNV e indicou a presença de três picos de menor escore de
similaridade na primeira metade da ORF1, região que coincide com aquela que
codifica as Small Proteins. Além disso, levando em consideração a região
codificante, a maior densidade de sítios polimórficos, inclusive aqueles que alteram a
sequência de aminoácidos, se encontra nesta região. Provavelmente a região que
codifica as Small proteins é uma região hipervariável presente no genoma do IMNV
84
que só pôde ser detectada quando as novas sequências, IMNVgen1 e IMNVgen2,
foram incluídas na comparação. Regiões hipervariáveis são definidas por
comparações intragenômicas uma vez que não existe um valor absoluto que
classifique uma região como hipervariável (GONZÁLEZ-CANDELAS & LÓPEZLABRADOR, 2013). Em alguns casos,
regiões hipervariáveis podem ser
identificadas usando o alinhamento de um pequeno número de sequências, como
observado na região hipervariável da proteína VP2 do vírus da Doença Infecciosa de
Gumboro (BAYLISS et al.,1990) ou na proteína VP1 do vírus Sacbrood (MINGXIAO
et
al.,
2013)
que
foram
identificadas
usando
três
e
sete
sequências,
respectivamente. Essas regiões geralmente são encontradas em proteínas
estruturais (TSAREV et al., 1992). Em alguns vírus, regiões hipervariáveis estão
associadas com infectividade viral e adaptação aos mecanismos do sistema imune
do hospedeiro (BAYLISS et al., 1990; CARPENTER et al., 1991; ANJUM et al.,
2013). Um ponto importante é que as Small Proteins codificadas por esta região são
candidatas a codificarem as protrusões do IMNV (TANG et al., 2008). Alguns
estudos tem mostrado que regiões hipervariáveis de diferentes vírus coincidem com
as regiões que codificam as protrusões virais e que essas sequências estão
envolvidas em vários mecanismos como a entrada do vírus na célula e neutralização
de anticorpos (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010;
PROMKUNTOD et al., 2014).
Tang e colaboradores (2008) identificaram a uma resolução a 8-0 Å, que o
capsídeo do IMNV possui protrusões com características de um complexo de fibras
e densidade e resolução menor do que a proteína do capsídeo, o que pode ser
explicado por sua flexibilidade lateral. A protrusão do IMNV compreende pelo menos
três domínios morfológicos: knob, stalk e foot. Esses mesmos autores propuseram
85
que a protrusão do IMNV pode ser formada por um trímero composto por três
moléculas de SP1 ou SP2. Nossos resultados de composição de aminoácidos e
predição de estrutura secundária indicam que SP1 é uma proteína dobrada
apresentando uma região N-terminal hidrofóbica não exposta a solvente (Figura 13).
SP1 provavelmente é uma proteína globular e seu sítio hidrofóbico deve se
encontrar no interior da estrutura. Sendo assim, ela possui características de um
domínio knob, consistente com sua forma globular e alto conteúdo de folhas-β. Por
outro lado, SP2 possui características de uma proteína fibrosa ou nativamente
desdobrada, que apresenta alta mobilidade e motivos ricos em coiled coil, que
possibilita sua interação com outras proteínas (MITRAKI et al., 1999; LANZA et al.,
2008). A forma desdobrada móvel, alto conteúdo de aminoácidos carregados e a
presença de coiled coil observados em SP2 (Figura 13) são características que se
enquadram no domínio stalk, como observado nas protrusões de adenovírus
(CHAPPELL et al., 2002). Nesse contexto, nossos dados apontam para uma nova
visão na qual a protrusão do IMNV pode ser formada por um heteromultímero
composto pelas proteínas SP1 e SP2 (Figura 24). Protrusões compostas por
diferentes proteínas já foram observadas em outros vírus como o bacteriófago PRD,
no qual a protrusão é formada pelas subunidades proteicas P5 e P2 (MERCKEL et
al., 2005), e o bunyavirus, no qual as glicoproteínas G1 e G2 formam a protrusão
viral (PERSSON & PETTEERSSON, 1991). A região estruturada localizada na
porção C-terminal da proteína SP2 pode ser o domínio foot que está ancorado ao
capsídeo (Figura 24).
86
Figura 24: Esquema proposto para a formação da protrusão do IMNV. A proteína SP1, que apresenta
uma forma dobrada, corresponderia ao domínio knob da protrusão; enquanto que a proteína SP2, a
qual se apresenta quase totalmente desestruturada, corresponderia ao domínio stalk. A região
estruturada presente na porção C-terminal de SP2 representaria do domínio foot que está ancorado
ao capsídeo.
O capsídeo é responsável por proteger o material genético e também está
envolvido no empacotamento viral e na especificidade para a adsorção, ou seja, o
capsídeo está diretamente relacionado com a interação vírus-hospedeiro. Além da
semelhança observada com outros monômeros (NAITOW et al., 2002; DUNN et al.,
2013), o modelo gerado para a MCP do IMNV também mostrou uma possível região
candidata a representar o “trench” como observado na MCP de ScV-L-A (NAITOW et
al., 2002). Neste “trench” também foi possível identificar um resíduo de His 107
(destacado em azul na Figura 17), sugerindo uma possível atividade enzimática de
remoção do cap5’ do mRNA para a MCP do IMNV. Existem poucos trabalhos
direcionados ao estudo da estrutura de proteínas de totivírus. Entretanto,
comparações de predição de estrutura secundária da MCP indicam a existência de
87
um core rico em α-hélice que é altamente conservado entre os totivírus e em
micovírus de RNA dupla fita (DUNN et al., 2013). O segundo modelo para a MCP
gerado no Phyre2 resultou em uma estrutura composta por três α-hélices (Figura
Suplementar 6B), compreendendo os aminoácidos 518 a 590, que pode
corresponder ao core rico em α-hélice conservado entre os totivírus.
A ORF2 que provavelmente codifica a RdRp, apresentou-se mais conservada
quando comparada a ORF1. O papel que a RdRp desempenha na replicação viral
exige que sua sequência nucleotídica não sofra muita variação. O modelo
tridimensional predito para a RdRp do IMNV foi semelhante a outros modelos já
resolvidos para RNA polimerases virais como a RdRp do poliovírus e a RNA
polimerase do bacteriófago T7 (Figura 18) (SOUSA et al., 1993; HANSEN, LONG &
SCHULTZ, 1997), que se caracteriza por um formato semelhante a uma “right hand”
e possui os domínios “thumb”, “fingers” e “palm”. É inesperado a ausência de
estruturas β no modelo da RdRp do IMNV, uma vez que essas estruturas são
comuns em outros modelos de RdRps já resolvidos (HANSEN, LONG & SCHULTZ,
1997; LOVE et al., 2004). No entanto, a ausência de folhas-β e alto conteúdo de αhélices corroboram com a predição feita pelo PredictProtein (Figura 15). Um
segundo modelo gerado no software Phyre2 mostrou a presença de algumas
estruturas β na RdRp do IMNV (Figura Suplementar 6C), mas somente 51% dos
resíduos modelados apresentaram confiança maior que 50%. Portanto, nossos
dados reforçam a hipótese de que a proteína codificada pela ORF2 trata-se
realmente de uma RNA polimerase dependente de RNA.
Em resumo, as proteínas envolvidas em interações com o RNA (RBP e RdRp)
são mais conservadas do que as proteínas estruturais, possivelmente devido à
função que cada tipo de proteína desempenha.
88
O estudo do genoma e dos possíveis produtos gênicos do IMNV possibilitou
compreender um pouco mais sobre a biologia do vírus e definir quais seriam as
principais proteínas alvo para o desenvolvimento de métodos de identificação e
controle eficazes. Tsarev et al., (1992) sugere que regiões hipervariáveis podem ser
utilizadas para caracterizar diferentes cepas virais mesmo que proximamente
relacionadas através de métodos moleculares e imunológicos, enquanto que as
sequências mais conservadas podem ser usadas no desenho de primers para
detecção do patógeno.
Levando em consideração a possível região hipervariável presente nas Small
Proteins e a região mais conservada da RdRp, foi desenvolvido um novo método
para o diagnóstico de diferentes isolados do IMNV. O sistema se mostrou eficiente
na identificação de duas amostras diferentes contaminadas pelo vírus. Uma das
principais vantagens deste novo sistema de detecção é que usando os primers SPF/SP-R, um fragmento de 456 pb que apresenta sítios polimórficos informativos é
amplificado, podendo ser sequenciado. Este fragmento corresponde a uma parte da
região que codifica as Small proteins e apresenta nove sítios polimórficos dos quais
três causam alteração na sequência de aminoácidos. Comparando essa região foi
possível diferenciar os quatro isolados do IMNV. A análise Neighbor joining usando o
fragmento de 456 pb foi capaz de reconstituir os mesmos dois grupos mostrados na
Figura 9. Esses resultados sugerem que esta pequena sequência possui
informações que podem representar o genoma completo do IMNV, sendo suficiente
para discriminar os quatro isolados estudados aqui. Todavia, a discriminação entre
os quatro isolados só é possível após o sequenciamento do fragmento de 456 pb. O
ideal seria um sistema que identificasse polimorfismos sem a necessidade de
sequenciar.
89
Métodos que utilizam esse princípio são aqueles baseados em HRMA (HighResolution Melting Analysis) (REED & WITTWER, 2004; ARVIA, CORCIOLI & AZZI,
2013). A HRMA é capaz de discriminar isolados de uma mesma espécie pela
identificação de polimorfismos de sítio único. Contudo, esses métodos requerem
equipamentos e reagentes mais sofisticados o que os torna mais onerosos. Nesse
contexto, uma tentativa
de desenvolver um sistema de identificação de
polimorfismos baseado na análise da curva de melting utilizando equipamentos e
reagentes mais acessíveis foi realizada.
Geralmente, as PCRs em tempo real geram curvas de melting a partir da
desnaturação do DNA dupla fita. No presente estudo foi proposto um método de
identificação de diferentes isolados do IMNV através da análise de curva de melting
a partir da desnaturação do DNA simples fita. O objetivo do método é distinguir
cepas diferentes com base na estrutura secundária do ácido nucleico que é refletida
em curvas de melting características para cada isolado. De fato, as diferentes
estruturas secundárias de RNA preditas refletiram em curvas de melting de fita
simples distintas, como observado na Figura 23, indicando que o princípio do
método é válido. Um estudo in silico recentemente desenvolvido em nosso
laboratório aborda o uso da curva de melting de fita simples na identificação de
diferentes variantes do totivírus que infecta Trichomonas vaginalis (OLIVEIRA et al.,
2014). Nossos resultados preliminares não foram os esperados, provavelmente
devido a uma falha na metodologia. Focamos as análises in vitro na desnaturação
do DNA e o IMNV é um vírus de RNA. As estruturas secundárias preditas para os
dois ácidos nucleicos (DNA e RNA) são diferentes e as curvas de melting de fita
simples geradas in silico e in vitro representam a desnaturação do RNA e DNA,
90
respectivamente (Figuras 21 e 22). Sendo assim, é necessário direcionar os
protocolos experimentais para a desnaturação do RNA de fita simples.
91
6 CONCLUSÃO
Dois novos genomas completos do IMNV foram sequenciados, caracterizados e
apresentaram 99% de identidade com outros dois genomas já descritos.
O estudo filogenético mostrou um novo grupo taxonômico, denominado IMNV-like,
que está mais próximo ao grupo GLV-like, mas ainda não é classificado pela ICVT.
O grupo IMNV-like possivelmente poderá abranger um gênero ainda não descrito
dentro da família Totiviridae.
A partir da comparação entre os quatro genomas foi possível gerar um mapa de
sítios polimórficos que abrange todo o genoma do IMNV. Este mapa possibilitou
identificar as regiões mais conservadas e mais variáveis do genoma.
O mapa de sítios polimórficos será essencial para posteriores estudos sobre a
biologia do IMNV, assim como para a concepção de novos marcadores moleculares
e desenvolvimento de terapias como aquelas baseadas em RNAi.
A proteína que compreende os primeiros 93 aminoácidos da ORF1 não apresentou
mutações que alterassem a sequência de aminoácidos. O modelo tridimensional
obtido para esta proteína foi semelhante a estruturas já resolvidas para o domínio
DSRM, o que reforça o pressuposto de que este produto gênico corresponde a uma
proteína de ligação a dsRNA.
92
A região que possivelmente codifica as protrusões do IMNV é a mais variável do
genoma, como observado em outros vírus de RNA. Esta região possivelmente
direciona a evolução do vírus e, provavelmente, é um fator determinante de sua
virulência.
A estrutura tridimensional da MCP do IMNV mostrou uma forma semelhante a outros
modelos de MCP já descritos e possibilitou inferir uma provável função enzimática
de remoção do cap5’ do mRNA para esta proteína.
A região que possivelmente codifica a RdRp do IMNV mostrou-se bastante
conservada e o modelo estrutural gerado para esta proteína correspondeu à
arquitetura típica de outras RNA polimerases, corroborando com o pressuposto de
que a ORF2 realmente codifica uma RdRp.
As regiões mais variáveis podem ser empregadas na caracterização de diferentes
cepas virais, enquanto que as regiões mais conservadas podem ser utilizadas no
desenho de primers para detectar o patógeno. A partir dos dados obtidos foi criado o
primeiro sistema capaz de diferenciar isolados do IMNV com base a presença de
polimorfismos.
Este sistema e os resultados mostrados aqui serão o ponto de partida para elucidar
a função das proteínas virais e sua correlação com a evolução do vírus, assim como
para a identificação de marcadores de virulência no IMNV.
93
REFERÊNCIAS
ABASCAL, F.; ZARDOYA, R.; POSADA, D. ProtTest: selection of best-fit models of
protein evolution. Bioinformatics, [S.l.], v. 21, p. 2104-5, 2005.
ALTSCHUL, S. F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein
database search programs. Nucleic Acids Research, [S.l.], v. 25, p. 3389-3402,
1997.
ANDRADE, T. P. D. et al. Real-time reverse transcription polymerase chain reaction
assay using TaqMan probe for detection and quantification of Infection Myonecrosis
Virus (IMNV). Aquaculture, Arizona – USA, v.264, p.9-15, 2007.
ANDRADE, T. P.; LIGHTNER, D. V. Development of a method for the mediated
isothermal amplification and nucleic acid lateral flow hybrid assay. Journal of Fish
Diseases, [S.l.], v. 32, p. 911-24, 2009.
ANJUM, S. et al. Additional Glycosylation Within a Specific Hypervariable Region of
Subtype 3a of Hepatitis C Virus Protects Against Virus Neutralization. The Journal
of Infectious Diseases, [S.l.], v. 208, p.1888-97, 2013.
APTE-SENGUPTA, S. et al. Base of the Measles Virus Fusion Trimer Head Receives
the Signal That Triggers Membrane Fusion. The Journal of Biological Chemistry,
[S.l.], v. 287, p. 33026-33035, 2012.
ARNOLD K. et al. The SWISS-MODEL Workspace: A web-based environment for
protein structure homology modelling. Bioinformatics, [S.l.], v. 22, p.195-201, 2006.
ARUNRUT, N.; SUEBSING, R.; KIATPATHOMCHAI, W. Rapid and sensitive
detection of shrimp infectious myonecrosis virus using a reverse transcription loopmediated isothermal amplification and visual colorogenic nanogold hybridization
probe assay. Journal of Virological Methods, [S.l.], v.193, p. 542-547, 2013.
BACHÉRE, E. Shrimp immunity and diseases control. Aquaculture, [S.l.], v.191, p.
3-11, 2000.
BAYLISS, C. D. et al. A comparison of the sequences of segment A of four
infectious bursal disease virus strains and identification of a variable region in
VP2. Journal of General Virology, [S.l.], v. 71, p. 1303-1312, 1990.
BEKAERT, M.; ROUSSET, J. P. An extended signal involved in eukaryotic -1
frameshifting operates through modification of the E site tRNA. Molecular Cell, [S.l.],
v.17, p. 61-68, 2005.
BEKAERT, M. et al. Towards a computational model for21 eukaryotic frameshifting
sites. Bioinformatics, [S.l.], v.19, p. 327-335, 2003.
BELOUZARD, S. et al. Mechanisms of Coronavirus Cell Entry Mediated by the Viral
Spike Protein. Viruses, [S.l.], v. 4, p. 1011-1033, 2012.
94
BIOMATTERS. Geneious. Copyright © 2005-2014 Biomatters Limited. Disponível
em: <http://www.geneious.com/>. Acesso em: 13 mar. 2014.
BITTAR, C. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype
3a and its relationship to therapy response. BMC Infectious Diseases, [S.l.], v. 23,
p.10-36, 2010.
BLAKE, R. D. et al. Statistical mechanical simulation of polymeric DNA melting with
MELTSIM. Bioinformatics, [S.l.], v. 15, p. 370-375, 1999.
BLANC, A.; GOYER, C.; SONENBERG, N. The coat protein of the yeast doublestranded RNA virus L-A attaches covalently to the cap structure of eukaryotic mRNA.
Molecular Cell, [S.l.], v. 12, p. 3390-3398, 1992.
CORTEY, M. et al. Genetic variability and phylogeny of Torque teno sus virus
1(TTSuV1) and 2 (TTSuV2) based on complete genomes. Veterinary Microbiology,
[s.l.], v.148, p.125-131, 2011.
BOTELHO-SOUZA, L. F. et al. Development of a reverse transcription quantitative
real-time PCR-based system for rapid detection and quantitation of hepatitis delta
virus in the western Amazon region of Brazil. Journal of Virological Methods, [S.l.],
v.197, p.19-24, 2014.
BRASIL. Ministério da Agricultura, Agropecuária e Abastecimento. Plataforma
tecnológica do camarão marinho cultivado. Brasília: MAPA, 2001.
BRUENN, J. A. A structural and primary sequence comparison of the viral RNAdependent RNA polymerases. Nucleic Acids Research, [S.l.], v. 31, p.1821-1829,
2003.
BURD, C. G.; DREYFUSS, G. Conserved structures and diversity of functions of
RNA-binding proteins. Science, [S.l.], v. 265, p. 615-21, 1994.
CARPENTER, S. et al. Identification of a Hypervariable Region in the Long Terminal
Repeat of Equine Infectious Anemia Virus. Journal of Virology, [S.l.], p.1605-1610,
1991.
CAVANAGH, D.; DAVIS, P. J.; MOCKETT, A. P. A. Amino acids within
hypervariable region 1 of avian coronavirus IBV (Massachusetts serotype) spike
glycoprotein are associated with neutralization epitopes. Virus Research, [S.l.],
v.11, p.141-150, 1988.
CHAIVISUTHANGKURA, P. et al. Simple and rapid detection of infectious
myonecrosis virus using an immunochromatographic strip test. Archives of
Virology, [S.l.], p. 1925-1930, 2013.
CHAPPELL, J. D. et al. Crystal structure of reovirus attachment protein sigma1
reveals evolutionary relationship to adenovirus fiber. EMBO Journal, [S.l.], v. 21, p.
1-11, 2002.
95
CHAYAMA, K. et al. Pretreatment virus load and multiple amino acid substitutions in
the interferon sensitivity determining region predict the outcome of interferon
treatment in patients with chronic genotype 1b hepatitis C virus infection.
Hepatology, [S.l.], v. 25, p. 745-749, 1997.
CHEN, V. B. et al. C. MolProbity: all-atom structure validation for macromolecular
crystallography. Acta Crystallographica, [S.l.], v. 66, p.12-21, 2010.
CLYDE, K.; BARRERA, J.; HARRIS, E. The capsid-coding region hairpin element
(cHP) is a critical determinant of dengue virus and West Nile virus RNA synthesis.
Virology, [S.l.], v. 379, p.314-323, 2008.
COWLEY, J. A. et al. Vertical transmission of gill-associated virus (GAV) in the black
tiger prawn Penaeus monodon. Diseases of Aquatic Organisms, [S.l.], v. 50, p.95104, 2002.
DINMAN, J. D.; ICHO, T.; WICKNER, R. B. A21 ribosomal frameshift in a doublestranded RNA virus of yeast forms a gag–pol fusion protein. Proceedings of the
National Academy of Sciences U S A, v. 88, p.174-178,1991.
DRUMMOND, A. J.; RAMBAUT, A. BEAST: Bayesian evolutionary analysis by
sampling trees. BMC evolutionary biology, [S.l.], v. 7, p. 214, 2007.
DRUMMOND, A. J. et al. Bayesian phylogenetics with BEAUti and the BEAST 1.7.
Molecular Biology and Evolution, [S.l.], v. 29, p. 1969-73, 2012.
DUNN, S. E. et al. Three-dimensional Structure of Victorivirus HvV190S Suggests
Coat Proteins in Most Totiviruses Share a Conserved Core. PLOS Pathogens, [S.l.],
v. 9, e1003225, 2013.
ENJUANES, L. et al. Biochemical aspects of coronavirus replication and virus-host
interaction. Annual Review Microbiology, [S.l.], v. 60, p.2 11-230, 2006.
ENOMOTO, N. et al. Mutations in the nonstructural protein 5A gene and response to
interferon in patients with chronic hepatitis C virus 1b infection. New England
Journal of Medicine, [S.l.], v. 334, p. 77-81, 1996.
EWING, B.; GREEN, P. Base-calling of automated sequencer traces using phred. II.
Error probabilities. Genome Research, [S.l.], v. 8, p.186-194, 1998.
FAO. The State of World Fisheries and Aquaculture 2008. Roma, 2008.
FEIJÓ, R. G. et al. Infectious myonecrosis vírus and White spot syndrome vírus coinfection in Pacific White shrimp (Litopenaeus vannamei) farmed in Brazil.
Aquaculture, [S.l.], v. 380-383, p.1-5, 2013.
FLEGEL, T. W. et al. Presence of multiple viruses in non-diseased, cultivated shrimp
at harvest. Aquaculture, [S.l.], v. 240, p.55-68, 2004.
96
FRAGA, J. et al. Genetic characterization of three Cuban Trichomonas vaginalis
virus. Phylogeny of Totiviridae family. Infection, Genetics and Evolution, [S.l.],
v.12, p.113-120, 2012.
GHABRIAL, S. Totiviruses. In: MAHY, B. W. J.; VAN REGENMORTEL M. H. V.
Encyclopedia of Virology. 3. ed. San Diego: Academic Press/Elsevier, 2008.
GONZÁLEZ-CANDELAS, F.; LÓPEZ-LABRADOR, F. X. Brenner's Encyclopedia of
Genetics. 2. ed. [S.l.: s.n], 2013.
HANSEN, J. L.; LONG, A. M.; SCHULTZ, S. C. Structure of the RNA-dependent RNA
polymerase of poliovirus. Structure, [S.l.], v. 5, p.1109-1122, 1997.
HOA, T. et al. Genotypic variations in tandem repeat DNA segments between
ribonucleotide reductase subunit genes of white spot syndrome virus (WSSV)
isolates from Vietnam, In: WALKER, P., LESTER, R., REANTASO, M. (Ed.).
Diseases in Asian Aquaculture V, Manila: 2005, p.395-403.
HOFACKER, I. L. et al. Fast Folding and Comparison of RNA Secondary Structures.
Monatshefte für Chemie, [S.l.], v. 125, p.167-188, 1994.
HOFMANN, K.; STOFFEL, W. TMbase - A database of membrane spanning proteins
segments. Biological Chemistry Hoppe-Seyler, [S.l.], v. 374, p.166, 1993.
HUANG, L. et al. Hepatitis C Virus Nonstructural Protein 5A (NS5A) Is an RNAbinding Protein. The Journal of Biological Chemistry, [S.l.], v. 280, p. 3641736428, 2005.
JACKS, T. et al. Characterization of ribosomal frameshifting in HIV-1 gag–pol
expression. Nature, [S.l.], v. 331, p. 280-283, 1988.
JIRAVANICHPAISAL, P.; LEE, B. L.; SÖDERHÄLL, K. Cell-mediated immunity in
arthropods: hematopoiesis, coagulation, melanization and opsonization.
Immunobiology, [S.l.], v. 211, p. 213-236, 2006.
KATOH, K.; TOH, H. Parallelization of the MAFFT multiple sequence alignment
program. Bioinformatics, [S.l.], v. 26, p.1899-900, 2010.
KATOH, K.; FRITH, M. C. Adding unaligned sequences into an existing alignment
using MAFFT and LAST. Bioinformatics, [S.l.], v. 28, p. 3144-3146, 2012.
KEARNEY, M. et al. Frequent polymorphism at drug resistance sites in HIV-1
protease and reverse transcriptase. AIDS, [S.l.], v. 22, p. 497-501, 2008.
KELLEY, L. A.; STERNBERG, M. J. E. Protein structure prediction on the Web: a
case study using the Phyre server. Nature Protocols, [S.l.], v. 4, p. 363-371, 2009.
KING, A. M. Q. et al. The most recent report of the ICTV: Virus taxonomy:
classification and nomenclature of viruses: Ninth Report of the International
Committee on Taxonomy of Viruses. San Diego: Elsevier Academic Press, 2012.
97
KOK, C. C.; MCMINN, P. C. Picornavirus RNA-dependent RNA polymerase. The
International Journal of Biochemistry & Cell Biology, [S.l.], v. 41, p. 498–502,
2009.
KORAKA, P. et al. RNA secondary structures in the proximal 3’UTR of Indonesian
Dengue 1 virus strains. Virus Research, [S.l.], v.142, p. 213-216, 2009.
KUNANOPPARAT, A. et al. Detection of infectious myonecrosis virus using
monoclonal antibody specific to N and C fragments of the capsid protein expressed
heterologously. Journal of Virological Methods, [S.l.], v.171, p.141-148, 2011.
KUROSAKI, M. et al. Analysis of genotypes and amino acid residues 2209 to 2248 of
the NS5A region of hepatitis C virus in relation to the response to interferon-beta
therapy. Hepatology, [S.l.], v. 25, p. 750-753, 1997.
KURTZ, J. Memory in the innate and adaptive immune systems. Microbes and
Infection, [S.l.], v. 6, p. 1410-7, 2004.
LAI, Y. et al. Viral Double-Strand RNA-Binding Proteins Can Enhance Innate Immune
Signaling by Toll-Like Receptor 3. PLoS ONE, [S.l.], v. 6, p.e25837, 2011.
LANA, D. P.; BEISEL, C. E.; SILVA, R. F. Genetic mechanisms of antigenic variation
in infectious bursal disease virus: analysis of a naturally occurring variant virus. Virus
Genes, [S.l.], v. 6, p. 247-59, 1992.
LANZA, D. C. F. et al. Human FEZ1 has characteristics of a natively unfolded protein
and dimerizes in solution. Proteins, [S.l.], v. 74, p. 104-121, 2008.
LARKIN, M. A. et al. Clustal W and Clustal X version 2.0. Bioinformatics, [S.l.], v.
23, p. 2947-2948, 2007.
LEE, D-K. et al. Heterogeneity in spike protein genes of porcine epidemic diarrhea
viruses isolated in Korea. Virus Research, [S.l.], v. 149, p.175-182, 2010.
LI, L.; WANG, A. L.; WANG, C. C. Structural analysis of the -1 ribosomal frameshift
elements in giardiavirus mRNA. Journal of Virology, [S.l.], v. 75, p. 10612-10622,
2001.
LIGHTNER, D. V. Virus diseases of farmed shrimp in the Western Hemisphere (the
Americas): A review. Journal of Invertebrate Pathology, [S.l.], v.106, p.110-130,
2011.
LIGHTNER, D. V.; PANTOJA, C. R. Infectious Myonecrosis (IMV): current status
report on the biology of etiological agent and development of diagnostic methods. In:
FEIRA NACIONAL DO CAMARÃO (FENACAM). Natal, Rio Grande do Norte, Anais
p. 22, 2004.
LIGHTNER, D. V. et al. Infectious myonecrosis: a new disease in Pacific White
shrimp. Global Aquaculture Advocate, [S.l.], v. 7, p. 85, 2004.
98
LIU, H. et al. Evolutionary genomics of mycovirus-related dsRNA viruses reveals
cross-family horizontal gene transfer and evolution of diverse viral lineages. BMC
Evolutionary Biology, [S.l.], v.12, p.91, 2012.
LIU, H.; SÖDERHÄLL, K.; JIRAVANICHPAISAL, P. Antiviral immunity in
crustaceans. Fish and Shellfish Immunology, [S.l.], v. 27, p. 79-88, 2009.
LIU, H-L. et al. A real-time PCR for the detection of infectious myonecrosis virus in
penaeid shrimp. Journal of Invertebrate Pathology, [S.l.], v. 113, p. 237-239, 2013.
LOLE, K. S. et al. Full-length human immunodeficiency virus type 1 genomes from
subtype C-infected seroconverters in India, with evidence of intersubtype
recombination. Journal of Virology, [S.l.], v. 73, p. 152-60, 1999.
LOTZ, J. M. Special topic review: Viruses, biosecurity and specific pathogen-free
stocks in shrimp aquaculture. Journal of Microbiology & Biotechnology, [S.l.],
v.13, p. 405-413, 1997.
LOTZ, J. M.; ANTON, L. S.; SOTO, M. A. Effect of chronic Taura syndrome virus
infection on salinity tolerance of Litopenaeus vannamei. Diseases of Aquatic
Organisms, [S.l.], v. 65, p. 75-78, 2005.
LOVE, R. A. et al. The Crystal Structure of the RNA-Dependent RNA Polymerase
from Human Rhinovirus: A Dual Function Target for Common Cold Antiviral Therapy.
Structure, v.12, p.1533–1544, 2004.
LOY, J. D. et al. Sequence-optimized and targeted double-stranded RNA as a
therapeutic antiviral treatment against infectious myonecrosis virus in Litopenaeus
vannamei. Diseases of Aquatic Organisms, [S.l], v.105, p. 57-64, 2013.
LOY, J. D. et al. dsRNA provides sequence-dependent protection against infectious
myonecrosis virus in Litopenaeus vannamei. Journal of General Virology, [S.l.],
v.93, p. 880–888, 2012.
LU, Y. et al. Infection of the yellow head baculo-like virus (YBV) in two species of
penaeid shrimp Penaeus stylirostris (Stimpson) and Penaeus vannamei (Boone).
Journal of Fish Diseases, [S.l.], v. 17, p. 649–656, 1994.
LUPAS, A.; VAN DYKE, M.; STOCK, J. Predicting Coiled Coils from Protein
Sequences. Science, [S.l.], v. 252, p.1162-1164, 1991.
MADRID, R. M. A crise econômica da carcinicultura. Panorama da Aquicultura,
[S.l.], v. 90, p. 22–29, 2005b.
MADRID, R. M. A Dança dos Preços na Carcinicultura Brasileira e Desafios de
Competitividade. Revista da ABCC, [S.l.], n. 7, p. 52-61, 2005a.
MADRID, R. M. Programa de apoio ao desenvolvimento do cultivo de camarão
marinho (Versão preliminar). Brasília: MAA, 1999.
99
MARCHLER-BAUER, A. et al. CDD: a Conserved Domain Database for the
functional annotation of proteins. Nucleic acids research, [S.l.], v. 39, p. D225-9,
2011.
MARKS, H. et al. Genetic variation among isolates of white spot syndrome virus.
Archives of Virology, [S.l.], v. 149, p. 673–697, 2004.
McBRIDGE, M. S.; PANGANIBAN, A.T. The Human Immunodeficiency Virus Type 1
Encapsidation Site Is a Multipartite RNA Element Composed of Functional Hairpin
Structures. Journal of Virology, [S.l.], v. 70, p. 2963-2973, 1996.
MELLO, M. V. et al. Purification of infectious myonecrosis virus (IMNV) in species of
marine shrimp Litopenaeus vannamei in the State of Ceará. Journal of Virological
Methods, [S.l.], v.177, p.10-14, 2011.
MERCKEL, M. C. et al. The Structure of the Bacteriophage PRD1 Spike Sheds Light
on the Evolution of Viral Capsid Architecture. Molecular Cell, [S.l.], v.18, p.161-170,
2005.
MINGXIAOA, M. et al. Genetic characterization of VP1 gene of seven Sacbrood
virus isolated from three provinces in northern China during the years 2008–
2012. Virus Research, [S.l.], v.176, p. 78-82, 2013.
MITRAKI, A. et al. Unfolding studies of human adenovirus type 2 fibre trimmers:
Evidence for a stable domain. European Journal of Biochemistry, [S.l.], v. 264, p.
599-606, 1999.
MOSS, S. M. Marine shrimp farming in the western hemisphere: past problems,
present solutions, and future visions. Reviews in Fisheries Science, [S.l.], v.10, p.
601-620, 2002.
MINISTÉRIO DA PESCA E AQUICULTURA. Produtores de camarão e MPA criam
agenda positiva para o desenvolvimento da carcinicultura nacional. Disponível
em: <http://www.mpa.gov.br/index.php/imprensa/noticias/2963-produtores-decamarao-e-mpa-criam-agenda-positiva-para-o-desenvolvimento-da-carciniculturanacional>. Acesso em: 18 jun. 2014.
MUSTHAQ, S. S. et al. Variability in the tandem repetitive DNA sequences of white
spot syndrome virus (WSSV) genome and suitability of VP28 gene to detect different
isolates of WSSV from India. Aquaculture, [S.l.], v. 256, p. 34-41, 2006.
NAGATA, L. P. et al. Infectivity variation and genetic diversity among strains of
Western equine encephalitis virus. Journal of General Virology, [S.l.], v. 87, p.
2353-61, 2006.
NAIM, S.; BROWN, J. K.; NIBERT, M. L. Genetic diversification of penaeid shrimp
infectious myonecrosis virus between Indonesia and Brazil. Virus Research, [S.l.],
v.189, p. 97-105, 2014.
100
NAITOW, H. et al. L-A virus at 3.4 Å resolution reveals particle architecture and
mRNA decapping mechanism. Nature Structural Biology, [S.l.], v. 9, p. 725-728,
2002.
NIBERT, M. L.; TAKAGI, Y. Fibers come and go: differences in cell-entry
components among related dsRNA viruses. Current Opinion in Virology, [S.l.],v.3,
p. 20-26, 2013.
NIBERT, M. L. ‘2A-like’ and ‘shifty heptamer’ motifs in penaeid shrimp infectious
myonecrosis virus, a monosegmented double-stranded RNA virus. Journal of
General Virology, [S.l.], v. 88, p.1315- 318, 2007.
NOTREDAME, C.; HIGGINS, D. G.; HERINGA, J. T-Coffee: A Novel Method for Fast
and Accurate Multiple Sequence Alignment. Journal of Molecular Biology, [S.l.], v.
302, p. 205-217, 2000.
NUNES, A. J. P.; MARTINS, P. C. C.; GESTEIRA, T. C. V. Carcinicultura ameaçada.
Revista Panorama da Aquicultura, [S.l.], v. 83, p. 37-51, 2004.
O’REILLY, E. K.; KAO, C. C. Analysis of RNA-Dependent RNA Polymerase Structure
and Function as Guided by Known Polymerase Structures and Computer Predictions
of Secondary Structure. Virology, [S.l.], v. 252, p. 287-303, 1998.
OFFICE INTERNATIONAL ESPIZOTICS. Infectious myonecrosis virus. In: Manual
of Diagnostic Tests for Aquatic Animals. Paris, France: Office International des
Epizooties, 2009. p. 96-104.
OLIVEIRA, R. A. C. et al. In silico single strand melting curve: A new approach to
identify nucleic acid polymorphisms in Totiviridae. BMC Bioinformatics, [S.I.], v.15,
p. 243, 2014.
ORMOND, J. G. P. A carcinicultura brasileira. Rio de Janeiro: BNDES, n.19, p.91118, 2004.
OVERSTREET, R. M. et al. Susceptibility to TSV of some penaeid shrimp native to
the Gulf of Mexico and southeast Atlantic Ocean. Journal of Invertebrate
Pathology, [S.l.], v. 69, p.165-176, 1997.
PENG, S. E. et al. The transition from pre-patent to patent infection of white spot
syndrome virus (WSSV) in Penaeus monodon triggered by pereiopod excision. Fish
Pathology, [S.l.], v.33, p.395-400, 1998.
PERLMAN, S.; NETLAND, J. Coronaviruses post-SARS: Update on replication and
pathogenesis. Nature Reviews Microbiology, [S.l.], v. 7, p. 439-450, 2009.
PERSSON, R.; PETTEERSSON, R. F. Formation and intracellular transport of a
heterodimeric viral spike protein complex. The Journal of Cell Biology, [S.l.], v.112,
p. 257-266, 1991.
101
PETTERSEN, E. F. et al. UCSF Chimera - a visualization system for exploratory
research and analysis. Journal of Computational Chemistry, [S.l.], v. 25, p.16051612, 2004.
PINHEIRO, A. C. A. S. et al. Epidemiological status of Taura syndrome and
Infectious myonecrosis viruses in Penaeus vannamei reared in Pernambuco (Brazil).
Aquaculture, [S.l], v. 262, p.17-22, 2007.
PINHO, J. R. R. et al. Genetic diversity of NS5A protein from hepatitis C virus
genotype 3a and its relationship to therapy response. BMC Infectious Diseases,
[S.l], v.10, p. 36, 2010.
POCH, O. et al. Identification of four conserved motifs among the RNA-dependent
polymerase encoding elements. The EMBO Journal, [S.l.], v. 8, p. 3867-3874, 1989.
PORTELA, A.; DIGARD, P. The influenza virus nucleoprotein: a multifunctional RNAbinding protein pivotal to virus replication. Journal of General Virology, [S.l.], v.83,
p.723-734, 2002.
POULOS, B. T.; LIGHTNER, D. V. Detection of infectious myonecrosis virus (IMNV)
of penaeid shrimp by reverse-transcriptase polymerase chain reaction (RT-PCR).
Diseases of Aquatic Organisms, [S.l.], v. 73, p. 69-72, 2006.
POULOS, B. T. et al. Purification and characterization of infectious myonecrosis virus
of penaeid shrimp. Journal of General Virology, [S.l], v. 87, p.987-996, 2006.
PRILUSKY, J. et al. FoldIndex©: a simple tool to predict whether a given protein
sequence is intrinsically unfolded. Bioinformatics, v. 21, p. 3435–3438, 2005.
PROMKUNTOD, N. et al. Mapping of the receptor-binding domain and amino acids
critical for attachment in the spike protein of avian coronavirus infectious bronchitis
virus. Virology, [S.l.], v. 448, p. 26-32, 2014.
PUDUPAKAM, R. S. et al. Mutational Analysis of the Hypervariable Region of
Hepatitis E Virus Reveals Its Involvement in the Efficiency of Viral RNA Replication.
Journal of Virology, [S.l.], v. 85, p.10031-10040, 2011.
PUTHAWIBOOL, T. et al. Detection of shrimp infectious myonecrosis virus by
reverse transcription loop-mediated isothermal amplification combined with a lateral
flow dipstick. Journal of Virological Methods, [S.l.], v.156, p. 27-31, 2009.
QAAD 2006 - Quarterly Aquatic Animal Disease Report (Asia and Pacific Region),
NACA: Bangkok, Thailand. 2006/2, April-June 2006. Não entendi
REED, G. H.; WITTWER, C. T. Sensitivity and Specificity of Single-Nucleotide
Polymorphism Scanning by High-Resolution Melting Analysis. Clinical Chemistry,
[S.l.], v.50, p.1748-1754, 2004.
ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n.3,
p. 6, 2005a.
102
ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n. 4,
p. 4, 2005b.
RONQUIST, F.; HUELSENBECK, J. P. MrBayes 3: Bayesian phylogenetic inference
under mixed models. Bioinformatics, [S.l.], v.19, p.1572-4, 2003.
RONQUIST, F. et al MrBayes 3.2: efficient Bayesian phylogenetic inference and
model choice across a large model space. Systematic biology, [S.l.], v. 61, p.53942, 2012.
ROST, B.; YACHDAV, G.; LIU, J. The PredictProtein server. Nucleic Acids
Research, [S.l.], v. 32, p. 321-326, 2004.
ROY, A.; KUCUKURAL, A.; ZHANG, Y. I-TASSER: a unified platform for automated
protein structure and function prediction. Nature Protocols, [S.l.], v.5, p.725-738,
2010.
SANCHEZ-MARTINEZ, J. G. et al. White spot syndrome virus in cultured shrimp: a
review. Journal of Aquaculture Research, [S.l.], v. 38, p.1339-1354, 2007.
SANO, T. et al. Identification of multiple structural domains regulating viroid
pathogenicity Proceedings of the National Academy of Sciences USA, [S.l.], v.89,
p.10104-10108, 1992.
SEIBERT, C. H. et al. Detection of major capsid protein of infectious myonecrosis
virus in shrimps using monoclonal antibodies. Journal of Virological Methods,
[S.l.], v. 169, p.169-175, 2010.
SENAPIN, S. et al. Outbreaks of infectious myonecrosis virus (IMNV) in Indonesia
confirmed by genome sequencing and use of an alternative RT-PCR detection
method. Aquaculture, [S.l.], v. 266, p. 32-38, 2007.
SILVA, D. C. D. et al. Infectious hypodermal and hematopoietic necrosis virus from
Brazil: Sequencing, comparative analysis and PCR detection. Virus Research, [S.l.],
v. 189, p.136-146, 2014.
SILVA, S. M. B. C.; PINHEIRO, A. C. A. S.; COIMBRA, M. R. M. Quantitation of
infectious myonecrosis virus in different tissues of naturally infected Pacific white
shrimp, Litopenaeus vannamei, using real time PCR with SYBR Green chemistry.
Journal of Virological Methods, [S.l.], v.177, p.197-201, 2011.
SOUSA, R. et al. Crystal structure of bacteriophage T7 RNA polymerase at 3.3 Å
resolution. Nature, [S.l.], v. 364, p. 593-599, 1993.
STEITZ, T. A. DNA Polymerases: Structural Diversity and Common Mechanisms.
The Journal of Biological Chemistry, [S.l.], v. 274, p. 17395-17398, 1999.
103
TABLER, M.; SFINGER, H. L. Infectivity studies on different potato spindle tuber
viroid (PSTV) RNAs synthesized in vitro with the SP6 transcription system. The
EMBO Journal, [S.l.], v. 4, p. 2191-2199, 1985.
TAMURA, K. et al. MEGA6: Molecular Evolutionary Genetics Analysis Version 6.0.
Molecular Biology and Evolution, [S.l.], v. 30, p. 2725-2729, 2013.
TAN, Y. et al. Molecular detection of three shrimp viruses and genetic variation of
white spot syndrome virus in Hainan Province, China, in 2007. Journal of Fish
Diseases, [S.l.], v. 32, p. 777-784, 2009.
TANG, J. et al. Infectious myonecrosis virus has a totivirus-like, 120-subunit capsid,
but with fiber complexes at the fivefold axes. PNAS, [S.l.], v.105, n.4 5, p.17.52617.531, 2008.
TANG, K. F. J.; LIGHTNER, D. V. Quantification of white spot syndrome virus DNA
through a competitive polymerase chain reaction. Aquaculture, [S.l.], v.189, p.11-21,
2000.
TANG, K. F. J. et al. V. In situ hybridization demonstrates that Litopenaeus
vannamei, L. stylirostris and Penaeus monodon are susceptible to experimental
infection with infectious myonecrosis virus (IMNV). Diseases Aquatic Organisms,
[S.l.], v. 63, p. 261-265, 2005.
TSAREV, S. A. et al. Characterization of a prototype strain of hepatitis E virus.
Proceedings of the National Academy of Sciences, [S.l.], v. 89, p. 559-563, 1992.
TSAI, P-L. et al. Cellular RNA Binding Proteins NS1-BP and hnRNP K Regulate
Influenza A Virus RNA Splicing. PLOS Pathogens, [S.l.], v. 9, p.1003460, 2013.
VALLONE, P. M.; BUTLER, J. M. AutoDimer: a screening tool for primer-dimer and
hairpin structures. BioTechniques, [S.l.], v. 37, p. 226-231, 2004.
WAHEED, Y.; BHATTI, A.; ASHRAF, M. RNA dependent RNA polymerase of HCV: A
potential target for the development of antiviral drugs. Infection, Genetics and
Evolution, [S.l.], v.14, p. 247–257, 2013.
WANG, A. L. et al. Giardiavirus double-stranded RNA genome encodes a capsid
polypeptide and a gag–pol-like fusion protein by a translational frameshift.
Proceedings of the National Academy of Sciences USA, [S.l.], v. 90, p. 8595–
8599, 1993.
WATERHOUSE, A. M. et al. Jalview Version 2 - a multiple sequence alignment editor
and analysis workbench. Bioinformatics, [S.l.], v. 25, p. 1189-1191, 2009.
WEIRATHER, J. L. et al. Serial Quantitative PCR Assay for Detection, Species
Discrimination, and Quantification of Leishmania spp. in Human Samples. Journal of
Clinical Microbiology, [S.l.], v. 49, p. 3892-3904, 2011.
104
WIJEGOONAWARDANE, P. K. et al. Genetic diversity in the yellow head nidovirus
complex. Virology, [S.l.], v. 380, p. 213-25, 2008.
ZHANG, Y. I-TASSER server for protein 3D structure prediction. BMC
Bioinformatics, [S.l.], v. 9, p. 40, 2008.
ZHANG, Y. Template-based modeling and free modeling by I-TASSER in CASP7.
Proteins, [S.l.], v. 69, p.108-117, 2007.
ZONG, J. C. et al. Evaluation of global clustering patterns and Strain variation over
and extended ORF26 gene locus from Kaposi’ Sarcoma herpesvirus. J Clin Virol.,
[S.l.], v. 40, p.19-25, 2007.
105
APÊNDICE
106
Tabela Suplementar 1: Nome e números de acesso das sequências dos totivírus usados neste estudo
agrupados de acordo com a análise filogenética.
Nome do vírus
Nº de acesso
Abreviação
CCC42235.1
YP_004089630.1
YP_001109580.1
NP_619670.2
YP_024728.1
NP_898833
AAS68036.1
YP_122352.1
BeauV
TcV-1
BotryV
HvV-190S
ChalElV
HmV1-17
ThielaV
MoV-1
MoV-like
Beauveria bassiana RNA virus 1
Tolypocladium cylindrosporum virus 1
Botryotinia fuckeliana totivirus 1
Helminthosporium victoriae virus 190S
Chalara elegans RNA virus 1
Helicobasidium mompa totivirus 1-17
Thielaviopsis basicola dsRNA virus 1
Magnaporthe orzyae virus 1
IMNV-like
Penaeid shrimp infectious myonecrosis virus
AAT67231.2
Tianjin totivirus
AFE02920.1
Omono river virus
BAJ21511.1
Drosophila melanogaster totivirus SW-2009a
YP_003289293.1
Armigeres subalbatus virus SaX06-AK20
YP_003934934.1
GLV-like
Piscine myocarditis virus AL V-708
YP_004581250.1
Giardia canis virus from China (2883-5981)*
DQ238861.1
Giardia lamblia virus (2880-5978)*
NC_003555.1
ZbV-like
Blueberry latent virus isolate AR (936-3332)*
HM029248.1
Southern tomato virus isolate Mexico-1(1039-3327)* EF442780.1
Zygosaccharomyces bailii virus Z
NP_624325.1
ScV-like
Ustilago maydis virus H1 (735-6002)*
NC_003823.1
Saccharomyces cerevisiae virus L-BC (La)
NP_042581.1
Saccharomyces cerevisiae virus L-A
NP_620495.1
Black raspberry virus F
YP_001497151.1
Tuber aestivum virus 1
ADQ54106.1
GaRV-like
Sphaeropsis sapinea RNA virus 2
AAD11603.1
Coniothyrium minitans RNA virus
YP_392467.1
Epichloe festucae virus 1
CAK02788.1
Gremmeniella abietina RNA virus L2
AAT48885.1
Outras sequências
Eimeria brunetti RNA virus 1
NP_108651.1
IMNV
TianV
ORV
DmV-SW-2009ª
AsV-SaX06-AK20
PMV-AL V-708
GCV
GLV2
BLV
STV
ZbV-Z
UmV-H1
ScV L-BC
ScV L-A
BRV-F
TaV-1
SphaeroV
CmRV
EpiFesV
GaRV-L2
EbRV-1
*O número de acesso corresponde à sequência de nucleotídeos do genoma completo. Números entre
parênteses correspondem ao primeiro e último nucleotídeo da sequência que codifica a RdRp.
107
Tabela Suplementar 2: Nome e números de acesso das sequências dos Trichomonasvirus,
Leishmaniavirus e Giardiavirus usados neste estudo agrupados de acordo com a análise filogenética.
Nome do vírus
Nº de acesso
Abreviação
AED99796.1
AED99794.1
AED99798.1
TVV4-1
TVV4-OC3
TVV4-OC5
AED99800.1
AED99804.1
AED99802.1
NP_659390.1
TVV3-UR1
TVV3-OC5
TVV3-OC3
Trichomonasvirus_3
AED99808.1
AED99806.1
AED99810.1
NP_624323.2
AET81014.1
AET81016.1
TVV2-OC3
TVV2-UR1
TVV2-OC5
Trichomonasvirus_II
TVV2-C76
TVV2-C351
NP_620730.2
AET81012.1
AED99814.1
AED99818.1
AED99816.1
AED99812.1
AED99820.1
Trichomonasvirus_I
TVV1-C344
TVV1-UH9
TVV1-OC4
TVV1-OC3
TVV1-UR1
TVV1-OC5
NP_043465.1
NP_619653.1
NP_041191.1
LRV 2-1
LRV 1-4
LRV 1-1
ABB36743.1
AAM77694.1
NP_620070.1
GCV
GLV1
GLV2
TVV4
Trichomonas vaginalis virus 4 strain TVV4-1
Trichomonas vaginalis virus 4 strain TVV4-OC3
Trichomonas vaginalis virus 4 strain TVV4-OC5
TVV3
Trichomonas vaginalis virus 3 strain TVV3-UR1
Trichomonas vaginalis virus 3 strain TVV3-OC5
Trichomonas vaginalis virus 3 strain TVV3-OC3
Trichomonas vaginalis virus 3
TVV2
Trichomonas vaginalis virus 2 strain TVV2-OC3
Trichomonas vaginalis virus 2 strain TVV2-UR1
Trichomonas vaginalis virus 2 strain TVV2-OC5
Trichomonas vaginalis virus II
Trichomonas vaginalis virus 2 isolate C76
Trichomonas vaginalis virus 2 isolate C351
TVV1
Trichomonas vaginalis virus
Trichomonas vaginalis virus 1 isolate C344
Trichomonas vaginalis virus 1 strain TVV1-UH9
Trichomonas vaginalis virus 1 strain TVV1-OC4
Trichomonas vaginalis virus 1 strain TVV1-OC3
Trichomonas vaginalis virus 1 strain TVV1-UR1
Trichomonas vaginalis virus 1 strain TVV1-OC5
LRV-like
Leishmania RNA virus 2 - 1
Leishmania RNA virus 1 - 4
Leishmania RNA virus 1 - 1
GLV-like
Giardia canis virus from China
Giardia lamblia virus
Giardia lamblia virus
108
Tabela Suplementar 3: Identificação do IMNV em amostras de camarão marinho Litopenaeus vannamei.
Amostra
Procedência
Data da
coleta
Data PCR
Data
eletroforese
Resultado
Resultado
nested
V13/L1246
CBV15/L1247
LOTE CB 1242-1 150UP
V13/L1246
CBV15/L1247
LOTE CB 1242-1 19 150/UP
B6A/Lote: 06
CB V1/LOTE 1256
V06/L1235
V05/L1238 CB
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
02/09/2011
04/09/2011
27/08/2011
02/09/2011
04/09/2011
27/08/2011
01/09/2011
13/10/2011
02/09/2011
02/09/2011
09/11/2012
09/11/2012
09/11/2012
19/11/2013
19/11/2013
19/11/2013
20/11/2012
20/11/2012
20/11/2012
20/11/2012
14/11/2012
14/11/2012
14/11/2012
20/11/2012
20/11/2012
20/11/2012
21/11/2012
21/11/2012
21/11/2012
21/11/2012
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
CBV16 - PLS (CBV11 R2-7 14353)
P/S Aquatec Lote CBV18 R2-1
14.383
Camanor
02/09/2011
20/11/2012
21/11/2012
Negativo
Negativo
Camanor
SEM DATA
20/11/2012
21/11/2012
Negativo
Negativo
B6A/Lote: 06
Camanor
01/09/2011
04/12/2012
04/12/2012
-
-
V06/L1235
Camanor
02/09/2011
04/12/2012
04/12/2012
-
-
CB V1/LOTE 1256
Camanor
13/10/2011
04/12/2012
04/12/2012
-
-
B6A/Lote: 06
Camanor
01/09/2011
06/12/2012
06/12/2012
-
-
V06/L1235
Camanor
02/09/2011
06/12/2012
06/12/2012
-
-
CB V1/LOTE 1256
CB V09/Lote: 1239
Camanor
Camanor
13/10/2011
12/09/2011
06/12/2012
06/12/2012
06/12/2012
06/12/2012
-
-
Observações
Primers F13/R13 e F13N/R13N /
Camarão morto
Primers F13/R13 e F13N/R13N
Primers F13/R13 e F13N/R13N
Primers OIE
Primers OIE
Primers OIE
Primers F13/R13 e F13N/R13N
Primers F13/R13 e F13N/R13N
Primers F13/R13 e F13N/R13N
Primers F13/R13 e F13N/R13N
Primers F13/R13 e F13N/R13N /
Larvas
Primers F13/R13 e F13N/R13N /
Larvas
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Utilização do Primer 13 / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
109
V7-L1257 CB
Camanor
07/11/2011
06/12/2012
06/12/2012
-
-
CB BV1/1250
Camanor
20/10/2011
06/12/2012
06/12/2012
-
-
B6A/Lote: 06
Camanor
01/09/2011
10/12/2012
10/12/2012
-
-
V06/L1235
Camanor
02/09/2011
10/12/2012
10/12/2012
-
-
CB V1/LOTE 1256
Camanor
13/10/2011
10/12/2012
10/12/2012
-
-
CB V09/Lote: 1239
Camanor
12/09/2011
10/12/2012
10/12/2012
-
-
V7-L1257 CB
Camanor
07/11/2011
10/12/2012
10/12/2012
-
-
CB BV1/1250
Camanor
20/10/2011
10/12/2012
10/12/2012
-
-
B6A/Lote: 06
Camanor
01/09/2011
12/12/2012
12/12/2012
-
-
V06/L1235
Camanor
02/09/2011
12/12/2012
12/12/2012
-
-
CB V1/LOTE 1256
B6A/Lote:06
V06/L1235
CBV1/Lote: 1256
Camanor
Camanor
Camanor
Camanor
13/10/2011
01/09/2011
02/09/2011
13/10/2011
12/12/2012
05/03/2013
05/03/2013
07/03/2013
12/12/2012
05/03/2013
05/03/2013
08/03/2013
Negativo
Negativo
Negativo
-
Lote CB 1242-1 150/UP
V05/L1238-CB
CB V15/L1247
BV01/Lote 1250
B8 L1261
BV1 3 dias após ingerir camarão do
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
27/08/2011
02/09/2011
04/09/2011
06/09/2011
07/11/2011
23/10/2011
07/03/2013
07/03/2013
12/03/2013
12/03/2013
14/03/2013
14/03/2013
08/03/2013
08/03/2013
12/03/2013
12/03/2013
15/03/2013
15/03/2013
Negativo
Negativo
Negativo
Negativo
Negativo
-
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N/ PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primers F13/R13 e F13N / PCR
não funcionou
Primer F14/R14
Primer F14/R14
Primer F14/R14
Primer F14/R14 / Controle + não
funcionou
Primer F14/R14
Primer F14/R14
Primer F14/R14
Primer F14/R14
Primer F14/R14
110
V1
V12 L1258 CB
Camarões do Darlio
Camanor
-
16/11/2011
-
14/03/2013
21/03/2013
15/03/2013
21/03/2013
Negativo
Negativo
-
CB 1244-1
V5 Lote: 1265 CB
B6A/Lote:06
V06/L1235
CBV1/Lote: 1256
Camarões do Darlio
V13/L1246
Siri
Camarões V03
CB V20/L1252
BV1 após ingerir camarão do V1, 1º
dia
Intensivo B6A Lote 06
BV1 4 dias após ingerir camarão do
V1
Camarão de Allan
Aquário 2/ morreu 3º
Aquário 1/ morreu 2º
Amostra lisado de células
congelado
Amostra lisado de células etanol
70%
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
Camanor
26/08/2011
19/11/2011
01/09/2011
02/09/2011
13/10/2011
02/09/2011
09/11/2011
12/09/2011
21/03/2013
21/03/2013
26/03/2013
26/03/2013
26/03/2013
26/03/2013
26/03/2013
26/03/2013
26/03/2013
26/03/2013
21/03/2013
21/03/2013
27/03/2013
27/03/2013
27/03/2013
27/03/2013
27/03/2013
27/03/2013
03/04/2013
03/04/2013
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Primer F14/R14
Primer F14/R14
Primer F14/R14/ Controle + não
funcionou
Primer F14/R14
Primers OIE
Primers OIE
Primers OIE
Primers OIE
Primers OIE / Camarão morto
Primers OIE / C+ não funcionou
Primers OIE
Primers OIE
Camanor
Camanor
21/10/2011
05/09/2011
26/03/2013
26/03/2013
03/04/2013
04/04/2013
Negativo
Negativo
Negativo
Negativo
Primers OIE
Primers OIE
Camanor
Camanor
Prof. Fabiana
Prof. Fabiana
24/10/2011
-
26/03/2013
26/03/2013
10/04/2013
10/04/2013
04/04/2013
04/04/2013
11/04/2013
11/04/2013
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Negativo
Primers OIE
Primers OIE
Primers OIE e primer F14/R14
Primers OIE e primer F14/R14
Genearch
Concepto
Azul
2005
15/01/2013
15/01/2013
Positivo
-
Primer F14/R14
2011
13/06/2013
13/06/2013
Positivo
-
Primer F14/R14
111
:
Figura Suplementar 1: Análise filogenética de membros representativos dos grupos TVV-like, LRV-like
e GLV-like. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de
usando Inferência Bayesiana. As IDs das sequências estão indicadas na tabela suplementare 2. Os
números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos
identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os
gêneros de acordo com a ICTV.
112
Genoma completo IMNVgen1
ggcaatttcaacctaattctaaaactgttaccaacaatttctgaactacagaagaggcat
attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa
aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaagcctaaa
M A I N E L A V K V G K K P K
tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc
Y T S T K T G A D H I P S W T V L V E F
gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct
A G F S E A A T C D T V K N A K M I A A
tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt
Y K L V K R F C K W D P T Y I E I S D C
atgctgccacctccagaccttacatcgtgcggggatgttgagagtaatcctggacctatc
M L P P P D L T S C G D V E S N P G P I
atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc
I H S V A F A R T G S V W T P A T F T F
aatactacatcatccccgggtagactgcaagtacaaatgtcatccagcgacaatagatat
N T T S S P G R L Q V Q M S S S D N R Y
gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca
G F N S V L L A A G G T T W G T A Y F S
gaacgctggaacagtgattttggattacagccagatctaactataactgtaacaccacaa
E R W N S D F G L Q P D L T I T V T P Q
ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag
L T G E E L G S I Y F D A V E T T N A E
gaagctatagaagcaacaattataaatactactccaattgatgtaatggtagacacaaca
E A I E A T I I N T T P I D V M V D T T
gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta
A G P V P I E G D F K P T N E T P T W V
agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca
S N T K P I D V A T P K T R D Y A N R S
gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat
V L T P Q L I T K M K D H V Y A L Q K D
gaagttgaagatgtaacacttgcctcactcgattttggtttaaatccatcaagtgtactc
E V E D V T L A S L D F G L N P S S V L
ggaagatggttgaaatggctaactggcatagatatgagactccatcttgggaagaaagtt
G R W L K W L T G I D M R L H L G K K V
acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt
T N H K V R M F V Q K T R F P L K T A I
gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa
E E L N N G T V P L R L R R D V R Y I E
aagccattcgataaagaggaacataccaacatactgttatctggtgatgttgaggaaaac
113
K P F D K E E H T N I L L S G D V E E N
cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg
P G P E G M E Q V S I T P E Q L Q M I L
gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag
A M Q K S P P K P K I K E L S E R E I Q
ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt
L R L Q G N E A T R R H Q R F K G E P I
gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg
D P V L T R E D I I R K H N Q Q N G I L
ccctatgaaaaagaacagccggtggtggtaaataacgtacaccctttggagaaggagtat
P Y E K E Q P V V V N N V H P L E K E Y
tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctaacgtatatacatgac
S I E K E G M V W D E E Q F L T Y I H D
aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc
K S S S N D H Y A C I Y N V V T H N R F
ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaccagaggaa
G V I E M P E D P L E M I D H Y E P E E
gaaccaaaaacaaaacctaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc
E P K T K P K T K S G N K R E L N D E T
ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa
F Y R K K K T K T T K E P K T Q E Q K K
attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta
I D H D N M F S R L L R R L D K P Q I V
gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa
A A W L N N R P S R K L V E K L A D S K
ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga
F G I G W Q A K E E Y T T S M V I V S G
tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac
Y I N C E P L P L I V D K L L S V D N N
tatgacatgtggcaacagactgacaagtattttgacaatttgatcacactgtgtaaccgc
Y D M W Q Q T D K Y F D N L I T L C N R
gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac
V S D V T Y T S A Q L C R D A S I L N N
aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat
K K M H V E N G N I V S M E N Q S E I D
agtcaaactaaattcttttcactgttagaagatgataacaaacttccaattgtagatgag
S Q T K F F S L L E D D N K L P I V D E
ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat
L R V L A D M T A Q R S N V N T A G N H
cttcgtgataatgactctattagggccgacgctgttctagctaacaatacagtacgtaac
L R D N D S I R A D A V L A N N T V R N
aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat
N C Q I P I P V T T L I P R Q I R G L N
ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt
114
G A L V N Q Q L R L Q G I E T H I T D S
tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct
Y I S K A E P S D Y S K Q L S E M V N A
caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat
Q K T S T W R A N N I A S Q G W D M F D
actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca
T V Q L N T N I S Q K D L S M D T A L T
aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca
K L M L L Y Q L T T Q N L P A T Q L P S
agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt
S I Y S A F D S R T Q P T L Q D G I W G
ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt
I N N G V N I F G E Q C G G L A A P V F
ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag
P F S G G T G E I T F H L T L Q S V P Q
gaatttcaagaatcggcaattttcgtaccagcaactgcactacaagctgcaaaagagggt
E F Q E S A I F V P A T A L Q A A K E G
gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca
A R T L A M Y V L M F A E W P F G M Y T
aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac
K T K Q T T D N A G N N Q A D Q I F I H
tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa
S E S T V H I P G Q K Q M H I V L P R K
gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtgactcaacca
V N M V N P T T I A E A N A R V V T Q P
acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct
T Y G T V A A G A G V A N G N I N V A A
attggtgtggccctgccaactgtaaatttgactgactatcttgtatcgtgggcaaccgat
I G V A L P T V N L T D Y L V S W A T D
ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt
F T L G D I K Q L V E R M K T T L P I S
cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta
R D L M A A R Q N A M L L S T L F P P L
attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact
I Q S N V A S D T N E V A G T A G A Y T
gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagcagatata
A C L A N L G I P E T L T V N W G A D I
aatgttcagccattatatcagctacttgaaacggacatcacagcccataatcggtacgta
N V Q P L Y Q L L E T D I T A H N R Y V
ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga
L N L F K R E E V V A G A Y E F G W L G
cacatggccagttatatgatgggactccttctaacaatgaatatatcatcagtgtttaac
H M A S Y M M G L L L T M N I S S V F N
gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac
115
V W Y S T R R I S T K A W D T A Y D S N
atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt
I Q A Y Q D M H Y Q M F S W S S M Q G S
attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc
I A P A M V D E I L H N L C G Q M F G F
agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga
S L P L R Q V L F N A L P I T F S S F G
agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt
S W M L P R V S D G F Q T V R Y Y D A G
ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg
P P A I N A K R D G E V P V S M I D A W
acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga
T Y K F T E K L P K S F L P W P M P E G
aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat
K D S T M G Y D P E K E P A L I D N S N
gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta
E T G N V F R P F M A R N G N N S N Y L
ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt
P T N Y T I D V S Q N G H D E S C I N V
gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac
D L F N N V A G V T L T N Y D G T A T N
gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctattaatgcaaat
A N V V P T G S Y I K Q R A M P I N A N
gcggtacgaccaactgaaacactcgacgctgctaaccatacaaaaccttttgctattgaa
A V R P T E T L D A A N H T K P F A I E
ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg
G G R L V Y L G G T I A N T T N V V N A
atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa
M Q R K Q R L S K P A F K W A H A Q R Q
cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag
R V Y D S S R P G M D A I T K L C A R K
tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct
S G F M N A R S T A M M A P K T G L S A
gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag
V I D Q A P N T S Q D L I E Q P S Q Q E
gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata
V M D M Q A T A T V gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg
catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg
ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct
atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc
116
gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt
M D E I R N Y T H L D Y I F
gtacaaaacatttgtatctatatgttagtatttggaatagacacagttaaacactttaga
V Q N I C I Y M L V F G I D T V K H F R
caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc
Q I G L F N E R N E F I E I A K Q L S T
aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct
K G K R F V D D V D N M K Q K V C E I A
actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtggac
T I V G Y M D P N V D K I D V M E E V D
tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt
S L A A E G N E H G I D R D N W N D L F
acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat
T K T C K E V M T W Y K G H E F I S F D
gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat
D Y I K E G M W L T S G S S S I G K V H
tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt
W T K D G E N G K F K A R K N M L L Q I
tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt
Y T P Q E L A D I V Y A W D G K L H S R
gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca
V F I K N E M S K L R L A V A S N I E A
tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga
Y I H E S Y M L F L Y G H G F K E Y F G
gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa
V T L D E K P D Q Q H Q R E I E M I E K
ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca
L Q A G Y F G L P F D Y A S F D H Q P T
actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct
T F E V K T M V R R V G E I V V S Q V P
aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa
K N Y Y Y Q T Q L L V N K I V N A Y D K
agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga
S Y L S G N I K N T K F E N I K V K G G
gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca
V P S G V R I T S L L G N M W N A I I T
aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg
K I A I N N V I G I I G Y D P I S Q I S
ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga
L R G D D V A I L S K D P A A L Y L L R
ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa
L S Y A A I N A I G K D S K L G I S P K
gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga
117
V C E F L R N E I S V T G V R G W T C R
ggaataggtggtataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat
G I G G I S Q R K P W N P Q P W S P N D
gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt
E V E T N A S N I S L L E R R A G I E L
caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa
Q Q L H H I N K V K W S R H V R Q S Y K
tatctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta
Y L E L P K R L G G F G I Y R F Q G W L
cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca
P N G K L P L A K K P L V N V E D I H P
agccaagagctgtttttgcctttaagtgaacaacagaaaaagatcttagcacaggttgaa
S Q E L F L P L S E Q Q K K I L A Q V E
atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa
M T N K M Q T D D I P G T Q K L F S K E
tggatacagaaagtgcgtacaaaaaagatcatatggagtagaaatcagacaataccaatc
W I Q K V R T K K I I W S R N Q T I P I
catacggatcacacagtacgcataccaagatgggacgagaaaatcaaattcccaaggtat
H T D H T V R I P R W D E K I K F P R Y
aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag
K S E Y I L N N K I N L T M E Q V L R Q
tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta
Y N L L K E V E R Y D K D L K V P K L L
gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa
D I L D K W F P V Q S S K I K T Y E S Q
ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca
G F H R T D A I N L A V G E I P T E P A
gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt
V K I N P I L I N F V K L H L E R Q G I
agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca
R H Q R G R N R I A K F I Y Q K T K Q A
gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca
E N M I L Q S S L Q Q M Y R Y ataaagaaacttcgagtttcctataacacattcccagttgggtttgggggccagccatg
Figura Suplementar 2: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen1. Os
aminoácidos codificados estão mostrados abaixo da sequêcia de nucleotídeos.
118
IMNVgen2 complete genome
ggcaatttcaacctaattctaaaactgttaccaacaatttcagaactacagaagaggcat
attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa
aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaaacctaaa
M A I N E L A V K V G K K P K
tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc
Y T S T K T G A D H I P S W T V L V E F
gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct
A G F S E A A T C D T V K N A K M I A A
tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt
Y K L V K R F C K W D P T Y I E I S D C
atgctgccacctccagatcttacatcgtgcggggatgttgagagtaatcctggacctatc
M L P P P D L T S C G D V E S N P G P I
atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc
I H S V A F A R T G S V W T P A T F T F
aatactacatcatccccaggtagactgcaagtacaaatgtcatccagcgacaatagatat
N T T S S P G R L Q V Q M S S S D N R Y
gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca
G F N S V L L A A G G T T W G T A Y F S
gaacgctggaacagtgactttggattacagccagatctaactataactgtaacaccacaa
E R W N S D F G L Q P D L T I T V T P Q
ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag
L T G E E L G S I Y F D A V E T T N A E
gaagctatagaggcaacaattataaatactactccaattgatgtaatggtagacacaaca
E A I E A T I I N T T P I D V M V D T T
gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta
A G P V P I E G D F K P T N E T P T W V
agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca
S N T K P I D V A T P K T R D Y A N R S
gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat
V L T P Q L I T K M K D H V Y A L Q K D
gaagttgaagatgtaacacttgcctcactcgattttggcttaaatccatcaagtgtactc
E V E D V T L A S L D F G L N P S S V L
ggaagatggttgaaatggttaactggcatagacatgagactccatcttgggaagaaagtt
G R W L K W L T G I D M R L H L G K K V
acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt
T N H K V R M F V Q K T R F P L K T A I
gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa
E E L N N G T V P L R L R R D V R Y I E
aagccattcgataaagaggaacataccgacatactgttatctggtgacgttgaggaaaac
119
K P F D K E E H T D I L L S G D V E E N
cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg
P G P E G M E Q V S I T P E Q L Q M I L
gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag
A M Q K S P P K P K I K E L S E R E I Q
ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt
L R L Q G N E A T R R H Q R F K G E P I
gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg
D P V L T R E D I I R K H N Q Q N G I L
ccttatgaaaaagaacagccggtagtggtaaataacgtacaccctttggagaaggagtat
P Y E K E Q P V V V N N V H P L E K E Y
tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctgacgtatatacatgac
S I E K E G M V W D E E Q F L T Y I H D
aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc
K S S S N D H Y A C I Y N V V T H N R F
ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaacaggggaa
G V I E M P E D P L E M I D H Y E T G E
gaatcaaaaacaaaacccaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc
E S K T K P K T K S G N K R E L N D E T
ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa
F Y R K K K T K T T K E P K T Q E Q K K
attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta
I D H D N M F S R L L R R L D K P Q I V
gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa
A A W L N N R P S R K L V E K L A D S K
ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga
F G I G W Q A K E E Y T T S M V I V S G
tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac
Y I N C E P L P L I V D K L L S V D N N
tatgacatgtggcaacagaccgacaagtattttgacaatttgatcacactgtgtaaccgc
Y D M W Q Q T D K Y F D N L I T L C N R
gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac
V S D V T Y T S A Q L C R D A S I L N N
aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat
K K M H V E N G N I V S M E N Q S E I D
agtcaaactaaattcttttcactattagaagatgataacaaacttccaattgtagatgag
S Q T K F F S L L E D D N K L P I V D E
ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat
L R V L A D M T A Q R S N V N T A G N H
cttcgtgataatgactctattagggccgacgctgttctatctaacaatacagtacgtaat
L R D N D S I R A D A V L S N N T V R N
aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat
N C Q I P I P V T T L I P R Q I R G L N
ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt
120
G A L V N Q Q L R L Q G I E T H I T D S
tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct
Y I S K A E P S D Y S K Q L S E M V N A
caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat
Q K T S T W R A N N I A S Q G W D M F D
actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca
T V Q L N T N I S Q K D L S M D T A L T
aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca
K L M L L Y Q L T T Q N L P A T Q L P S
agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt
S I Y S A F D S R T Q P T L Q D G I W G
ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt
I N N G V N I F G E Q C G G L A A P V F
ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag
P F S G G T G E I T F H L T L Q S V P Q
gaatttcaagaatcagcaattttcgtaccagcaactgcactacaagctgcaaaagagggc
E F Q E S A I F V P A T A L Q A A K E G
gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca
A R T L A M Y V L M F A E W P F G M Y T
aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac
K T K Q T T D N A G N N Q A D Q I F I H
tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa
S E S T V H I P G Q K Q M H I V L P R K
gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtaactcaacca
V N M V N P T T I A E A N A R V V T Q P
acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct
T Y G T V A A G A G V A N G N I N V A A
attggtgtggccctgccaactgtaaatttgactgactaccttgtatcgtgggcaaccgat
I G V A L P T V N L T D Y L V S W A T D
ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt
F T L G D I K Q L V E R M K T T L P I S
cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta
R D L M A A R Q N A M L L S T L F P P L
attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact
I Q S N V A S D T N E V A G T A G A Y T
gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagtagatata
A C L A N L G I P E T L T V N W G V D I
aatgttcagccattgtatcagctacttgaaacggatatcacagcccataatcggtacgta
N V Q P L Y Q L L E T D I T A H N R Y V
ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga
L N L F K R E E V V A G A Y E F G W L G
cacatggccagttatatgatgggacttcttctaacaatgaatatatcatcagtgtttaac
H M A S Y M M G L L L T M N I S S V F N
gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac
121
V W Y S T R R I S T K A W D T A Y D S N
atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt
I Q A Y Q D M H Y Q M F S W S S M Q G S
attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc
I A P A M V D E I L H N L C G Q M F G F
agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga
S L P L R Q V L F N A L P I T F S S F G
agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt
S W M L P R V S D G F Q T V R Y Y D A G
ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg
P P A I N A K R D G E V P V S M I D A W
acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga
T Y K F T E K L P K S F L P W P M P E G
aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat
K D S T M G Y D P E K E P A L I D N S N
gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta
E T G N V F R P F M A R N G N N S N Y L
ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt
P T N Y T I D V S Q N G H D E S C I N V
gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac
D L F N N V A G V T L T N Y D G T A T N
gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctatcaatgcaaat
A N V V P T G S Y I K Q R A M P I N A N
gcggtacgaccaactgaaacactcgacgctgcaaaccatacaaaaccttttgctattgaa
A V R P T E T L D A A N H T K P F A I E
ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg
G G R L V Y L G G T I A N T T N V V N A
atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa
M Q R K Q R L S K P A F K W A H A Q R Q
cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag
R V Y D S S R P G M D A I T K L C A R K
tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct
S G F M N A R S T A M M A P K T G L S A
gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag
V I D Q A P N T S Q D L I E Q P S Q Q E
gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata
V M D M Q A T A T V gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg
catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg
ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct
atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc
122
gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt
M D E I R N Y T H L D Y I F
gtacaaaacatttgtacctatatgttagtatttggaatagacacagttaaacactttaga
V Q N I C T Y M L V F G I D T V K H F R
caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc
Q I G L F N E R N E F I E I A K Q L S T
aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct
K G K R F V D D V D N M K Q K V C E I A
actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtcaac
T I V G Y M D P N V D K I D V M E E V N
tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt
S L A A E G N E H G I D R D N W N D L F
acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat
T K T C K E V M T W Y K G H E F I S F D
gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat
D Y I K E G M W L T S G S S S I G K V H
tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt
W T K D G E N G K F K A R K N M L L Q I
tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt
Y T P Q E L A D I V Y A W D G K L H S R
gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca
V F I K N E M S K L R L A V A S N I E A
tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga
Y I H E S Y M L F L Y G H G F K E Y F G
gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa
V T L D E K P D Q Q H Q R E I E M I E K
ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca
L Q A G Y F G L P F D Y A S F D H Q P T
actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct
T F E V K T M V R R V G E I V V S Q V P
aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa
K N Y Y Y Q T Q L L V N K I V N A Y D K
agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga
S Y L S G N I K N T K F E N I K V K G G
gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca
V P S G V R I T S L L G N M W N A I I T
aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg
K I A I N N V I G I I G Y D P I S Q I S
ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga
L R G D D V A I L S K D P A A L Y L L R
ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa
L S Y A A I N A I G K D S K L G I S P K
gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga
123
V C E F L R N E I S V T G V R G W T C R
ggaataggtggcataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat
G I G G I S Q R K P W N P Q P W S P N D
gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt
E V E T N A S N I S L L E R R A G I E L
caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa
Q Q L H H I N K V K W S R H V R Q S Y K
tacctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta
Y L E L P K R L G G F G I Y R F Q G W L
cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca
P N G K L P L A K K P L V N V E D I H P
agccaagagctgtttttgcctttaagtgaacaacagagaaagatcttagcacaggtcgaa
S Q E L F L P L S E Q Q R K I L A Q V E
atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa
M T N K M Q T D D I P G T Q K L F S K E
tggatacagaaagtgcgtgcaaaaaagatcatatggagtagaaatcagacaataccaatc
W I Q K V R A K K I I W S R N Q T I P I
catactgatcacacagcacgcataccaagatgggacgagaaaatcaaattcccaaggtat
H T D H T A R I P R W D E K I K F P R Y
aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag
K S E Y I L N N K I N L T M E Q V L R Q
tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta
Y N L L K E V E R Y D K D L K V P K L L
gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa
D I L D K W F P V Q S S K I K T Y E S Q
ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca
G F H R T D A I N L A V G E I P T E P A
gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt
V K I N P I L I N F V K L H L E R Q G I
agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca
R H Q R G R N R I A K F I Y Q K T K Q A
gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca
E N M I L Q S S L Q Q M Y R Y Ataaagaaacttcgagtttcctataacacattcccagttgggttttggggccagccatg
Figura Suplementar 3: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen2. Os
aminoácidos codificados estão mostrados abaixo da sequência de nucleotídeos.
124
Tabela suplementar 4: Identificação dos sítios polimórficos (SP) no genoma do IMNV. A tabela indica
a posição do SP e se esse SP causa alteração na sequência de aminoácidos. Em destaque (cinza)
os SP que causam alteração na sequência de aminoácidos.
Posição
NT
Brasil Indonésia IMNVgen1 IMNVgen2
Mudança de
AA
Característica do
AA
-
-
Não
Lys – polar básico
Não
Ser – polar neutro
Não
Leu – apolar
Não
Asp – polar ácido
Não
Asp – polar ácido
Não
Ser – polar neutro
Não
Pro – apolar
Sim
Phe – apolar
Leu – apolar
Não
Asn – polar neutro
Não
Gly – apolar
Sim
Gln – polar neutro
Glu – polar ácido
Não
Arg – polar básico
Não
His – polar básico
5’UTR
1
2
3
42
105
112
T
C
A
T
T
G
T
C
G
A
C
G
RBP
4
174
5
219
6
309
7
378
8
396
9
429
10
498
11
544
12
549
13
570
14
601
15
606
16
618
G
AAG
Lys
C
AGC
Ser
A
TTA
Leu
C
GAC
Asp
C
GAC
Asp
G
AAG
Lys
C
AGC
Ser
A
TTA
Leu
C
GAC
Asp
C
GAC
Asp
C
AGC
Ser
G
CCG
Pro
T
TTC
Phe
T
AAT
Asn
T
GGT
Gly
C
CAA
Gln
T
CGT
Arg
C
CAC
C
AGC
Ser
G
CCG
Pro
C
CTC
Leu
T
AAT
Asn
T
GGT
Gly
C
CAA
Gln
T
CGT
Arg
C
CAC
G
A
AAG
AAA
Lys
Lys
T
T
AGT
AGT
Ser
Ser
G
G
TTG
TTG
Leu
Leu
C
T
GAC
GAT
Asp
Asp
T
T
GAT
GAT
Asp
Asp
Small Protein 1 (SP1)
T
T
AGT
AGT
Ser
Ser
G
A
CCG
CCA
Pro
Pro
T
T
TTC
TTC
Phe
Phe
C
C
AAC
AAC
Asn
Asn
C
C
GGC
GGC
Gly
Gly
G
G
GAA
GAA
Glu
Glu
C
C
CGC
CGC
Arg
Arg
T
C
CAT
CAC
125
17
702
18
732
19
890
20
916
21
967
22
996
23
999
24
1039
25
1053
26
1080
27
1169
28
1206
29
1228
30
1230
31
1248
32
1263
His
T
GTT
Val
G
GAG
Glu
T
GTA
Val
C
CTG
Leu
A
AAA
Lys
His
T
GTT
Val
G
GAG
Glu
C
GCA
Ala
T
TTG
Leu
A
AAA
Lys
His
C
GTC
Val
A
GAA
Glu
C
GCA
Ala
T
TTG
Leu
G
GAA
Glu
His
C
GTC
Val
G
GAG
Glu
C
GCA
Ala
T
TTG
Leu
G
GAA
Glu
C
TTC
Phe
C
GGC
Gly
T
TTA
Leu
C
GAC
Asp
C
GTC
Val
G
CGT
Arg
C
TTC
Phe
C
GGC
Gly
T
TTA
Leu
C
GAC
Asp
C
GTC
Val
A
CAT
His
T
TTT
Phe
T
GGT
Gly
C
CTA
Leu
T
GAT
Asp
T
GTT
Val
T
CTT
Leu
T
TTT
Phe
C
GGC
Gly
T
TTA
Leu
C
GAC
Asp
T
GTT
Val
T
CTT
Leu
G
CCG
Pro
G
GAT
Asp
T
GAT
Asp
T
GAT
Asp
C
CCC
G
CCG
Pro
G
GAT
Asp
T
GAT
Asp
C
GAC
Asp
T
CCT
A
CCA
Pro
A
AAC
Asn
C
AAC
Asn
T
GAT
Asp
T
CCT
A
CCA
Pro
G
GAC
Asp
C
GAC
Asp
C
GAC
Asp
T
CCT
Não
Val – apolar
Não
Glu – polar ácido
Sim
Val – apolar
Ala – apolar
Não
Leu – apolar
Sim
Lys – polar básico
Glu – polar ácido
Não
Phe – apolar
Não
Gly – apolar
Não
Leu – apolar
Não
Asp – polar ácido
Não
Val – apolar
Sim
Arg – polar básico
His – polar básico
Não
Leu – apolar
Pro – apolar
Sim
Asp – polar ácido
Asn – polar neutro
Sim
Não
Asp – polar ácido
Não
Pro – apolar
126
Pro
33
1503
34
1504
35
1524
36
1603
37
1605
38
1683
39
1687
40
1715
41
1732
42
1736
43
1744
44
1758
45
1779
46
2058
47
2121
48
2134
T
CCT
Pro
G
GAT
Asp
A
GTA
Val
T
TTG
Leu
G
TTG
Leu
T
GGT
Gly
C
CTT
Leu
T
ATG
Met
C
CCA
Pro
G
GGG
Gly
C
CCA
Pro
T
CCT
Pro
A
AAA
Lys
A
CCA
Pro
T
ACT
Thr
G
GAC
Asp
Pro
Pro
Pro
Small Protein 2 (SP2)
T
C
T
CCT
CCC
CCT
Pro
Pro
Pro
G
T
T
GAT
TAT
TAT
Asp
Tyr
Tyr
A
G
A
GTA
GTG
GTA
Val
Val
Val
T
C
C
TTG
CTA
CTA
Leu
Leu
Leu
G
A
G
TTG
CTA
TTG
Leu
Leu
Leu
T
C
C
GGT
GGC
GGC
Gly
Gly
Gly
C
A
A
CTT
ATT
ATT
Leu
Ile
Ile
C
T
T
ACG
ATG
ATG
Thr
Met
Met
C
C
A
CCA
CCA
ACA
Pro
Pro
Thr
G
A
G
GGG
GAG
GGG
Gly
Glu
Gly
C
C
T
CCA
CCA
TCA
Pro
Pro
Ser
T
T
C
CCT
CCT
CCC
Pro
Pro
Pro
G
A
A
AAG
AAA
AAA
Lys
Lys
Lys
A
G
G
CCA
CCG
CCG
Pro
Pro
Pro
T
T
C
ACT
ACT
ACC
Thr
Thr
Thr
A
G
G
AAC
GAC
GAC
Asn
Asp
Asp
Proteína Principal do Capsídeo (MCP)
Não
Pro – apolar
Sim
Asp – polar ácido
Tyr – polar neutro
Não
Val – apolar
Leu – apolar
Não
Não
Gly – apolar
Sim
Leu – apolar
Ile – apolar
Sim
Met – apolar
Thr – polar neutro
Sim
Pro – apolar
Thr – polar neutro
Sim
Gly – apolar
Glu – polar ácido
Sim
Pro – apolar
Ser – polar neutro
Não
Pro – apolar
Não
Lys – polar básico
Não
Pro – apolar
Não
Thr – polar neutro
Sim
Asp – polar ácido
Asn – polar neutro
127
49
2304
50
2440
51
2460
52
2525
53
2727
54
2733
55
2856
56
2894
57
2928
58
3015
59
3060
60
3160
61
3291
62
3293
63
3361
64
3373
65
3399
G
CTG
Leu
G
GCT
Ala
C
AAC
Asn
T
GTA
Val
A
TCA
Ser
A
AAA
Lys
T
CCT
Pro
T
GTT
Val
C
GCC
Ala
A
TCA
Ser
T
GGT
Gly
T
TCA
Ser
A
GTA
Val
T
ATT
Ile
G
GTT
Val
C
CTG
Leu
T
TAT
Tyr
G
CTG
Leu
G
GCT
Ala
C
AAC
Asn
T
GTA
Val
G
TCG
Ser
A
AAA
Lys
C
CCC
Pro
C
GCT
Ala
C
GCC
Ala
A
TCA
Ser
T
GGT
Gly
T
TCA
Ser
A
GTA
Val
T
ATT
Ile
G
GTT
Val
T
TTG
Leu
T
TAT
Tyr
G
CTG
Leu
G
GCT
Ala
C
AAC
Asn
C
GCA
Ala
A
TCA
Ser
G
AAG
Lys
T
CCT
Pro
T
GTT
Val
T
GCT
Ala
G
TCG
Ser
T
GGT
Gly
G
GCA
Ala
G
GTG
Val
C
ACT
Thr
A
ATT
Ile
C
CTG
Leu
T
TAT
Tyr
A
CTA
Leu
T
TCT
Ser
T
AAT
Asn
C
GCA
Ala
A
TCA
Ser
G
AAG
Lys
T
CCT
Pro
T
GTT
Val
T
GCT
Ala
A
TCA
Ser
C
GGC
Gly
G
GCA
Ala
A
GTA
Val
C
ACT
Thr
A
ATT
Ile
C
CTG
Leu
C
TAC
Tyr
Não
Leu - apolar
Sim
Ala – apolar
Ser – polar polar
Não
Asn – polar neutro
Sim
Val – apolar
Ala – apolar
Não
Ser – polar neutro
Não
Lys – polar básico
Não
Pro – apolar
Sim
Val – apolar
Ala – apolar
Não
Ala – apolar
Não
Ser – polar neutro
Não
Gly – apolar
Sim
Ser – polar neutro
Ala – apolar
Não
Val – apolar
Sim
Ile – apolar
Thr – polar neutro
Sim
Val – apolar
Ile - apolar
Não
Leu – apolar
Não
Tyr – polar neutro
128
66
3408
67
3487
68
3570
69
3577
70
3653
71
3675
72
3696
73
3708
74
3732
75
3748
76
3807
77
3929
78
3966
79
4017
80
4091
71
4135
82
4136
C
TCC
Ser
T
TTG
Leu
G
AAG
Lys
C
CCA
Pro
T
GTA
Val
G
TTG
Leu
C
GAC
Asp
C
CAC
His
C
TTC
Phe
G
GTA
Val
C
CTC
Leu
A
CAA
Gln
A
GCA
Ala
G
GGG
Gly
T
TTG
Leu
G
GTA
Val
T
GTA
Val
C
TCC
Ser
T
TTG
Leu
G
AAG
Lys
C
CCA
Pro
A
GAA
Glu
G
TTG
Leu
C
GAC
Asp
C
CAC
His
T
TTT
Phe
A
ATA
Ile
C
CTC
Leu
G
CGA
Arg
A
GCA
Ala
G
GGG
Gly
C
TCG
Ser
A
ATA
Ile
T
ATA
Ile
G
TCG
Ser
C
CTG
Leu
T
AAT
Asn
G
GCA
Ala
C
GCA
Ala
A
TTA
Leu
C
GAC
Asp
T
CAT
His
C
TTC
Phe
G
GTA
Val
C
CTC
Leu
A
CAA
Gln
G
GCG
Ala
C
GGC
Gly
T
TTG
Leu
G
GCA
Ala
C
GCA
Ala
G
TCG
Ser
C
CTG
Leu
T
AAT
Asn
G
GCA
Ala
T
GTA
Val
G
TTG
Leu
T
GAT
Asp
T
CAT
His
C
TTC
Phe
G
GTA
Val
T
CTT
Leu
A
CAA
Gln
G
GCG
Ala
C
GGC
Gly
T
TTG
Leu
G
GCA
Ala
C
GCA
Ala
Não
Ser – polar neutro
Não
Leu – apolar
Sim
Lys – polar básico
Asn – polar neutro
Sim
Pro – apolar
Ala – apolar
Sim
Não
Val – apolar
Glu – polar ácido
Ala – apolar
Leu – apolar
Não
Asp – polar ácido
Não
His – polar básico
Não
Phe – apolar
Sim
Val – apolar
Ile – apolar
Não
Leu – apolar
Sim
Gln – polar neutro
Arg – polar básico
Não
Ala – apolar
Não
Gly – apolar
Sim
Leu – apolar
Ser – polar neutro
Sim
Val – apolar
Ile – apolar
Ala – apolar
129
83
4148
T
GTC
Val
T
TTT
Phe
T
TCT
Ser
G
TTG
Leu
T
GAT
Asp
G
GAC
Asp
T
TAT
Tyr
C
ATC
Ile
T
GCT
Ala
A
GCA
Ala
G
CAG
Gln
G
CCG
Pro
G
CAG
Gln
84
4347
85
4371
86
4380
87
4422
88
4504
89
4527
90
4551
91
4593
92
4680
93
4686
94
4710
95
4905
96
5093
T
97
5299
98
5393
99
5489
T
ATC
Ile
G
CAG
Gln
T
AAT
Asn
T
GTC
Val
T
TTT
Phe
T
TCT
Ser
G
TTG
Leu
C
GAC
Asp
G
GAC
Asp
C
TAC
Tyr
C
ATC
Ile
T
GCT
Ala
A
GCA
Ala
A
CAA
Gln
A
CCA
Pro
A
CAA
Gln
C
C
Sim
GCC
GCC
Ala
Ala
C
C
Não
TTC
TTC
Phe
Phe
C
C
Não
TCC
TCC
Ser
Ser
A
A
Não
TTA
TTA
Leu
Leu
T
T
Não
GAT
GAT
Asp
Asp
A
A
Sim
AAC
AAC
Asn
Asn
C
C
Não
TAC
TAC
Tyr
Tyr
T
C
Não
ATT
ATC
Ile
Ile
T
A
Não
GCT
GCA
Ala
Ala
G
G
Não
GCG
GCG
Ala
Ala
G
G
Não
CAG
CAG
Gln
Gln
G
G
Não
CCG
CCG
Pro
Pro
G
G
Não
CAG
CAG
Gln
Gln
Região entre as ORFs
C
T
T
RNA Polimerase Dependente de RNA (RdRp)
T
T
C
Sim
ATC
ATC
ACT
Ile
Ile
Thr
G
A
A
Não
CAG
CAA
CAA
Gln
Gln
Gln
T
C
C
Não
AAT
AAC
AAC
Asn
Asn
Asn
Val – apolar
Ala – apolar
Phe – apolar
Ser – polar neutro
Leu – apolar
Asp – polar ácido
Asp – polar ácido
Asn – polar neutro
Tyr – polar neutro
Ile – apolar
Ala – apolar
Ala – apolar
Gln – polar neutro
Pro – apolar
Gln – polar neutro
Ile – apolar
Thr – polar neutro
Gln – polar neutro
Asn – polar neutro
130
100
5519
101
5520
102
5528
103
5784
104
5825
105
6212
106
6266
107
6278
108
6554
109
6698
110
6725
111
6770
112
6812
113
6815
114
6880
115
6899
116
6981
C
GTC
Val
A
AAC
Asn
C
CTC
Leu
A
AAC
Asn
C
GTC
Val
A
ACA
Thr
G
ACG
Thr
T
GGT
Gly
C
GGC
Gly
G
TCG
Ser
T
TAT
Tyr
C
TTC
Phe
G
AAG
Lys
C
CCC
Pro
A
AAA
Lys
T
GTT
Val
G
GCA
Ala
C
GTC
Val
A
AAC
Asn
C
CTC
Leu
A
AAC
Asn
A
GTA
Val
A
ACA
Thr
G
ACG
Thr
T
GGT
Gly
C
GGC
Gly
G
TCG
Ser
T
TAT
Tyr
T
TTT
Phe
G
AAG
Lys
C
CCC
Pro
A
AAA
Lys
T
GTT
Val
G
GCA
Ala
G
GTG
Val
G
GAC
Asp
T
CTT
Leu
G
GAC
Asp
C
GTC
Val
T
ACT
Thr
A
ACA
Thr
A
GGA
Gly
T
GGT
Gly
A
TCA
Ser
T
TAT
Tyr
C
TTC
Phe
A
AAA
Lys
T
CCT
Pro
A
AAA
Lys
T
GTT
Val
A
ACA
Thr
C
GTC
Val
A
AAC
Asn
T
CTT
Leu
G
GAC
Asp
C
GTC
Val
T
ACT
Thr
A
ACA
Thr
A
GGA
Gly
C
GGC
Gly
A
TCA
Ser
C
TAC
Tyr
C
TTC
Phe
A
AAA
Lys
T
CCT
Pro
G
AGA
Arg
C
GTG
Val
G
GCA
Ala
Não
Val – apolar
Sim
Asn – polar neutro
Asp – polar ácido
Não
Leu – apolar
Sim
Asn – polar neutro
Asp – polar ácido
Não
Val – apolar
Não
Thr – polar neutro
Não
Thr – polar neutro
Não
Gly – apolar
Não
Gly – apolar
Não
Ser – polar neutro
Não
Tyr – polar neutro
Não
Phe – apolar
Não
Lys – polar básico
Não
Pro – apolar
Sim
Lys – polar básico
Arg – polar básico
Não
Val – apolar
Sim
Ala – apolar
Thr – polar neutro
131
117
7028
118
7039
119
7043
120
7152
121
7289
122
7355
123
7359
124
7405
T
ACT
Thr
T
GTA
Val
T
CGT
Arg
C
CTA
Leu
C
AAC
Asn
C
GTC
Val
T
TTA
Leu
A
AAG
Lys
T
ACT
Thr
T
GTA
Val
T
CGT
Arg
C
CTA
Leu
T
AAT
Asn
C
GTC
Val
T
TTA
Leu
A
AAG
Lys
G
ACG
Thr
T
GTA
Val
C
CGC
Arg
T
TTA
Leu
C
AAC
Asn
T
GTT
Val
C
CTA
Leu
G
AGG
Arg
T
ACT
Thr
C
GCA
Ala
C
CGC
Arg
T
TTA
Leu
C
AAC
Asn
T
GTT
Val
C
CTA
Leu
G
AGG
Arg
Não
Thr – polar neutro
Sim
Val – apolar
Ala – apolar
Não
Arg – polar básico
Não
Leu – apolar
Não
Asn – polar neutro
Não
Val – apolar
Não
Leu – apolar
Sim
Lys – polar básico
Arg – polar básico
3’UTR
125
7548
T
T
G
T
-
-
126
7550
T
T
G
G
-
-
132
A
B
C
D
E
Figura Suplementar 4: Predição de regiões estruturadas e desestruturadas para as proteínas do IMNV. A
análise realizada no Foldindex mostra a sequência de aminoácidos estruturada (verde) e desestruturada
(vermelho) das proteínas do IMNV. A – RBP; B – SP1; C – SP2; D – MCP; E – RdRp.
133
Tabela Suplementar 5: Avaliação dos modelos tridimensionais das proteínas RBP, MCP e RdRp.
Parâmetros
Scores
RBP
MCP
RdRp
MOLPROBITY
Clashscore
180,73
83,5
178,98
Rotâmeros de cadeias laterais desfavoráveis
7,59%
2,09%
6,98%
Ramachandram desfavorável
4,40%
15,31%
4,15%
Ramachandram favorável
84,71%
70,17%
87,42%
Desvio do carbono β
9,09%
8,26%
11,51%
Ligações de comprimentos ruins
0%
1,40%
0,03%
Ligações de ângulos ruins
2,94%
6,33%
3,54%
MolProbity Score
4,03
3,47
3,96
SWISS-MODEL
Z-Score
0,627
-6,341
-5,14
QMEANscore6
-1,01
0,189
0,298
I-TASSER
C-score
-2,26
-2,27
0,23
TM-score esperado
0,45 ± 0,14
0,45 ± 0,14
0,74 ± 0,11
RMSD esperado
8,6 ± 4,5
14,4 ± 3,7
7,7 ± 4,3
Números de decoys
5380
498
465
Densidade de cluster
0,0949
0,1220
0,3755
134
A
B
C
Figura Suplementar 5: Predição de estrutura terciária para a Proteína Principal do Capsídeo do IMNV. Os
modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (-1,25); B –
IMNVgen1 (-1,22); C – IMNVgen2 (-1,13). Os C-scores estão indicados entre parênteses.
135
A
B
C
Figura Suplementar 6: Predição de estrutura terciária para a RNA Polimerase Dependente de RNA do
IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR
(0,23); B – IMNVgen1 (-0,16); C – IMNVgen2 (-0,69). Os C-scores estão indicados entre parênteses.
136
A
B
C
Figura Suplementar 7: Predição de estrutura terciária usando modelagem por threading no
programa Phyre2 para a proteínas do isolado da Indonésia. A – RBP; B – MCP; C – RdRp.
Download