UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS BIOLÓGICAS DEPARTAMENTO DE BIOQUÍMICA MÁRCIA DANIELLE DE ARAÚJO DANTAS ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS NATAL 2014 MÁRCIA DANIELLE DE ARAÚJO DANTAS ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica. Orientador: Professor Dr. Daniel Carlos Ferreira Lanza NATAL 2014 MÁRCIA DANIELLE DE ARAÚJO DANTAS ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica. Aprovado em: 01/08/2014 BANCA EXAMINADORA ___________________________________________________ Prof. Dr. Daniel Carlos Ferreira Lanza Departamento de Bioquímica - UFRN Orientador ____________________________________________________ Prof. Dr. Leonardo Lima Pepino de Macedo Pesquisador da EMBRAPA - Recursos Genéticos e Biotecnologia Examinador externo ____________________________________________________ Prof. Dr. João Paulo Matos Santos Lima Departamento de Bioquímica – UFRN Examinador interno Dedico esta obra À minha querida avó Maria da Luz Santos, que agora está descansando ao lado do Senhor, mas que, com certeza, continua olhando por mim. Obrigado por toda dedicação, amor e carinho. Guardarei a senhora para sempre em meu coração. AGRADECIMENTOS Agradeço a todos que direta ou indiretamente participaram da realização deste trabalho, em especial agradeço: A Deus, pai de infinito amor e bondade, pela sua presença constante em minha vida, me abençoando e iluminando meus caminhos. Aos meus pais, Maria do Socorro de Araújo Dantas e Luis de Vasconcelos Dantas, por todo amor, carinho e dedicação. Vocês são os principais responsáveis pela pessoa que sou hoje e por todas as minhas conquistas. Ao meu namorado, Pedro Henrique Sales da Costa, por todo amor, amizade e companheirismo e por sempre estar ao meu lado me apoiando em todos os momentos. Ao Programa de Pós-Graduação em Bioquímica, Departamento de Bioquímica da Universidade Federal do Rio Grande do Norte (UFRN) pelos conhecimentos adquiridos na área. Aos amigos do Laboratório de Biologia Molecular Aplicada – Laplic, Raffael, Allan, Douglas, Jéssica e Natália, pela amizade e pelos momentos de descontração durante os trabalhos. Em especial agradeço a Raffael por toda ajuda com as análises de Bioinformática. Ao professor Dr. João Paulo Matos Santos Lima e seus alunos Diego e Ricardo pela ajuda durante o desenvolvimento deste trabalho. Ao pessoal do Laboratório de Imunogenética pela disponibilidade de equipamentos extremamente necessários para a realização deste trabalho. À professora Drª Suely Ferreira Chavante pelo incentivo e apoio em ingressar na pós-graduação. Às empresas Camanor, Concepto Azul e Genearch pela doação das amostras de camarão sem as quais não seria possível a realização deste trabalho. Aos colegas da minha turma de pós-graduação por compartilhar comigo tantos momentos de alegria e desespero durante esses anos de estudo. Aos meus grandes amigos da Biologia pelos quatros anos de companheirismo e amizade. Em especial às amigas Sinara Carla, Larissa Maria e Larissa Bahia. Vocês tornaram os meus momentos mais felizes durante a graduação. À CAPES pelo fornecimento da bolsa de pesquisa e à FAPERN pelo auxílio financeiro ao projeto de pesquisa. E claro, o meu muito obrigada ao meu querido orientador Professor Dr. Daniel Carlos Ferreira Lanza pela sua orientação, paciência, profissionalismo e compromisso com seus orientandos. Obrigada pela sua atuação direta na ampliação dos meus conhecimentos. O senhor, com certeza, é um exemplo de pessoa e de profissional. O cientista não é o homem que fornece as verdadeiras respostas, é quem faz as verdadeiras perguntas. Claude Lévi-Strauss RESUMO A carcinicultura é uma das atividades que mais contribui para o crescimento da aquicultura mundial. Entretanto, esta atividade vem sofrendo perdas econômicas significativas devido ao surgimento de doenças virais como a Mionecrose Infecciosa (IMN). A IMN já está disseminada em toda região Nordeste do Brasil e vem causando sérios danos à carcinicultura na Indonésia. O principal sintoma da doença é a mionecrose, que consiste na necrose dos músculos estriados do abdômen e do cefalotórax do camarão. A IMN é causada pelo vírus da mionecrose infecciosa (IMNV), um vírus não envelopado que apresenta protrusões ao longo de seu capsídeo. O genoma viral é formado por uma única molécula de RNA dupla fita e possui duas Open Reading Frames (ORFs). A ORF1 codifica a proteína principal do capsídeo (MCP) e uma possível proteína de ligação a RNA (RBP). A ORF2 codifica uma provável RNA polimerase dependente de RNA (RdRp) e classifica o IMNV dentro da família Totiviridae. Assim, o objetivo desse estudo foi estudar o genoma completo do IMNV e as proteínas codificadas no intuito de desenvolver um sistema que identificasse diferentes isolados do vírus com base na presença de polimorfismos. A relação filogenética entre alguns totivírus foi investigada e mostrou um novo grupo para o IMNV dentro da família Totiviridae. Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos genomas foram mais semelhantes entre si do que com aqueles já descritos. Regiões variáveis e conservadas do genoma foram identificadas através de gráficos de similaridade e alinhamentos utilizando as quatro sequências do IMNV. Esta análise possibilitou o mapeamento de sítios polimórficos e revelou que a região mais variável do genoma se encontra na primeira metade da ORF1 e coincide com as regiões que possivelmente codificam a protrusão viral, enquanto que as regiões mais estáveis se encontraram em domínios conservados de proteínas que interagem com o RNA. Além disso, estruturas secundárias foram preditas para todas as proteínas empregando diversos softwares e modelos estruturais proteicos foram calculados usando modelagens por threading e simulações ab initio. A partir dessas análises foi possível observar que as proteínas do IMNV possuem motivos e formas similares às proteínas de outros totivírus, e novas possíveis funções proteicas foram propostas. O estudo do genoma e das proteínas foi essencial para o desenvolvimento de um sistema de detecção baseado em PCR capaz de discriminar os quatro isolados do IMNV com base na presença de sítios polimórficos. Palavras-chave: IMNV Brasil. Sítios polimórficos. Região variável. Domínios conservados. Modelagem proteica. RNA. ABSTRACT Shrimp farming is one of the activities that contribute most to the growth of global aquaculture. However, this business has undergone significant economic losses due to the onset of viral diseases such as Infectious Myonecrosis (IMN). The IMN is already widespread throughout Northeastern Brazil and has caused serious damage to shrimp farming in Indonesia. The main symptom of disease is myonecrosis, which consists of necrosis of striated muscles of the abdomen and cephalothorax of shrimp. The IMN is caused by infectious myonecrosis virus (IMNV), a non-enveloped virus which has protrusions along its capsid. The viral genome consists of a single molecule of double-stranded RNA and has two Open Reading Frames (ORFs). The ORF1 encodes the major capsid protein (MCP) and a potential RNA binding protein (RBP). ORF2 encodes a probable RNA-dependent RNA polymerase (RdRp) and classifies IMNV in Totiviridae family. Thus, the objective of this research was study the IMNV complete genome and encoded proteins in order to develop a system differentiate virus isolates based on polymorphisms presence. The phylogenetic relationship among some totivirus was investigated and showed a new group to IMNV within Totiviridae family. Two new genomes were sequenced, analyzed and compared to two other genomes already deposited in GenBank. The new genomes were more similar to each other than those already described. Conserved and variable regions of the genome were identified through similarity graphs and alignments using the four IMNV sequences. This analyze allowed mapping of polymorphic sites and revealed that the most variable region of the genome is in the first half of ORF1, which coincides with the regions that possibly encode the viral protrusion, while the most stable regions of the genome were found in conserved domains of proteins that interact with RNA. Moreover, secondary structures were predicted for all proteins using various softwares and protein structural models were calculated using threading and ab initio modeling approaches. From these analyses was possible to observe that the IMNV proteins have motifs and shapes similar to proteins of other totiviruses and new possible protein functions have been proposed. The genome and proteins study was essential for development of a PCR-based detection system able to discriminate the four IMNV isolates based on the presence of polymorphic sites. Keywords: IMNV Brazil. Polymorphic sites. Variable region. Conserved domains. Protein modeling. RNA. LISTA DE FIGURAS Figura 1 - Camarões Litopenaeus vannamei infectados com o vírus da mionecrose infecciosa....................................................................................................................22 Figura 2 - Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs não sobrepostas.........................................................................................................25 Figura 3 - Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å...........28 Figura 4 - Modelo em 3D da subunidade A do capsídeo de Saccharomyces cerevisae L-A (ScV-L-A).............................................................................................29 Figura 5 - Estrutura tridimensional prevista para o vírus da mionecrose infecciosa....................................................................................................................30 Figura 6 - Estrutura da RNA polimerase dependente de RNA do poliovírus.............33 Figura 7 - Estratégia empregada para amplificar o genoma completo do IMNV.......46 Figura 8 - Análise filogenética de membros representativos da família Totiviridae...................................................................................................................54 Figura 9 - Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas completos do IMNV....................................................................................................57 Figura 10 - Representação esquemática do genoma do IMNV e análise de variabilidade...............................................................................................................59 Figura 11 - Sítios polimórficos identificados no genoma do IMNV.............................60 Figura 12 - Análise de composição de aminoácidos e predição de estrutura secundária para RBP.................................................................................................62 Figura 13 - Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e SP2.......................................................................................63 Figura 14 - Análise de composição de aminoácidos e predição de estrutura secundária para MCP.................................................................................................65 Figura 15 - Análise de composição de aminoácidos e predição de estrutura secundária para RdRp................................................................................................67 Figura 16 - Modelo estrutural para a proteína RBP do IMNV gerado pelo ITASSER.....................................................................................................................69 Figura 17 - Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER.............70 Figura 18 - Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER...........71 Figura 19 - Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões variável e conservada, respectivamente.................................73 Figura 20 - Sistema de detecção do IMNV.................................................................74 Figura 21 - Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R2...............................................................................76 Figura 22 - Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R3...............................................................................77 Figura 23 - Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in silico para o fragmento de 456 pb..............................................78 Figura 24 - Esquema proposto para a formação da protrusão do IMNV...................86 Figura Suplementar 1 - Análise filogenética de membros representativos dos grupos TVV-like, LRV-like e GLV-like...................................................................................111 Figura Suplementar 2 - Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen1........................................................................................112 Figura Suplementar 3 - Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen2........................................................................................118 Figura Suplementar 4 - Predição de regiões estruturadas e desestruturadas para as proteínas do IMNV....................................................................................................132 Figura Suplementar 5 - Predição de estrutura terciária para a Proteína Principal do Capsídeo do IMNV...................................................................................................134 Figura Suplementar 6 - Predição de estrutura terciária para a RNA Polimerase Dependente de RNA do IMNV.................................................................................135 Figura Suplementar 7 - Predição de estrutura terciária usando modelagem por threading no programa Phyre2 para as proteínas do isolado da Indonésia.............136 LISTA DE TABELAS Tabela 1 - Lista dos primers usados em cada análise para identificar o IMNV nas amostras de camarões Litopenaeus vannamei..........................................................42 Tabela 2 - Lista de primers usados para amplificar o genoma completo do IMNV....46 Tabela 3 - Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2...............56 Tabela 4 - Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1...............56 Tabela 5 - Lista de primers empregados no sistema de identificação do IMNV........72 Tabela 6 - Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de fita simples.................................................................................75 Tabela Suplementar 1 - Nome e números de acesso das sequências dos totivírus usados neste estudo agrupados de acordo com a análise filogenética...............................................................................................................106 Tabela Suplementar 2 - Nome e números de acesso das sequências dos Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados de acordo com a análise filogenética.......................................................................107 Tabela Suplementar 3 - Identificação do IMNV em amostras de camarão marinho Litopenaeus vannamei.............................................................................................108 Tabela Suplementar 4 - Identificação dos sítios polimórficos (SP) no genoma do IMNV.........................................................................................................................124 Tabela Suplementar 5 - Avaliação dos modelos tridimensionais das proteínas RBP, MCP e RdRp............................................................................................................133 LISTA DE ABREVIATURAS / SIGLAS Aa Aminoácidos ABCC Associação Brasileira dos Criadores de Camarão BLAST CDD Basic Local Alignment Search Tool Conserved Domains Database cDNA DNA complementar DNA Ácido desoxirribonucleico dNTP Deoxinucleotídeos trifosfatados DSRM Double-strand RNA binding motif dsRNA RNA dupla fita EMPARN ExPASy Empresa Brasileira de Pesquisa Agropecuária do RN Expert Protein Analysis System ha hectare HIV Human immunodeficiency virus HRMA High-Resolution Melting Analysis IBDV Vírus da doença infecciosa da Bursa ICTV Comitê Internacional de Taxonomia de Vírus IHHNV IMN IMNV Infectious hypodermal and haematopoietic virus Infectious Myonecrosis Infectious myonecrosis virus kDa Kilodaltons Kg Quilogramas LOS Limphoid organ spheroids MCP Proteína Principal do Capsídeo ml mililitros mM milimolar µg µl microgramas microlitros µM micromolar NCBI nt National Center for Biotechnology Information Nucleotídeo OIE World Organization for Animal Health ORF Open Reading Frame PCR Polymerase Chain Reaction PDB Protein Data Bank PMCV Piscine myocarditis virus pmol Picomole RBP Proteína de ligação a RNA RdRp RNA polimerase dependente de RNA RMSD Root-mean-square deviation RNA Ácido Ribonucleico RNAi RNA de interferência RNAP RT RNA polimerase Transcriptase reversa RT-LAMP RT-PCR SP Reverse Transcription Loop Mediated Isothermal Amplification Reverse Transcription Polymerase Chain Reaction Sítio polimórfico SP1 Small Protein 1 SP2 Small Protein 2 TLR3 receptor Toll-like 3 TM Temperatura de melting TSV Taura syndrome virus U Unidade UniProt Universal Protein Resource WEEV Western equine encephalitis virus WSSV White spot syndrome virus YHV Yellow head virus SUMÁRIO 1 INTRODUÇÃO 19 1.1 MIONECROSE INFECCIOSA 20 1.2 VÍRUS DA MIONECROSE INFECCIOSA 23 1.2.1 Proteína de ligação a RNA (RBP) 26 1.2.2 Proteína Principal do Capsídeo (MCP) 27 1.2.3 Protrusões virais 30 1.2.4 RNA Polimerase Dependente de RNA (RdRp) 32 1.3 VARIABILIDADE GENÉTICA EM VÍRUS 34 1.4 SISTEMAS DE DETECÇÃO PARA O IMNV 36 2 OBJETIVOS 39 3 MATERIAIS E MÉTODOS 40 3.1 ANÁLISE FILOGENÉTICA 40 3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO 41 3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES AMOSTRAS DE CAMARÃO 42 3.3.1 Extração de RNA total 43 3.3.2 RT-PCR 43 3.3.2.1 Síntese de cDNA 43 3.3.2.2 Reação em Cadeia da Polimerase (PCR) 44 3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL 45 3.5 ANÁLISE DAS SEQUÊNCIAS 47 3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS 48 3.7 MODELAGEM PROTEICA 49 3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 50 3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 50 3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 51 4 RESULTADOS 53 4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE 53 4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES AMOSTRAS DE CAMARÃO 54 4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS 55 4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS 55 4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS 58 4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE ESTRUTURA SECUNDÁRIA 61 4.7 MODELAGEM DE PROTEÍNAS 68 4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 71 4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 71 4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 74 5 DISCUSSÃO 79 6 CONCLUSÃO 91 REFERÊNCIAS 93 APÊNDICE 105 19 1 INTRODUÇÃO Durante a década de 80, os avanços na produção de camarão proporcionaram um rápido crescimento na carcinicultura (LOTZ, 1997). A produção de crustáceos foi a atividade que mais cresceu na aquicultura mundial nos últimos anos, atingindo 4,5 milhões de toneladas e US$ 17,95 bilhões de dólares em 2006. No mesmo ano a produção de camarão cultivado correspondeu a 17% do valor total dos produtos pesqueiros internacionalmente negociados (FAO, 2008). No Brasil, as pesquisas com camarão começaram na década de 70 com o Projeto Camarão da Empresa Brasileira de Pesquisa Agropecuária do Rio Grande do Norte S/A EMPARN (BRASIL, 2001). Várias espécies de camarão nativas (Farfantepenaeus subtilis, F. brasiliensis, F. paulensis e Litopenaeus schmitti) foram consideradas como opções de cultivo, porém vários fatores relacionados à produção tornaram estas espécies inviáveis comercialmente (MADRID, 1999). Apenas em meados da década de 80, com a introdução do camarão branco do Pacífico, Litopenaeus vannamei, a carcinicultura brasileira se consolidou (BRASIL, 2001). Entre os anos de 1996 e 2002, a produção de camarão passou de 2.880 toneladas para mais de 60 mil toneladas e a produtividade, de 900 kg/ha/ano para 5.458 kg/ha/ano (ORMOND, 2004), tonando o Brasil o país líder do hemisfério ocidental, com 90.190 toneladas, e líder mundial em produtividade, com 6.084 kg/ha/ano, no ano de 2003 (ROCHA, 2005a). Segundo dados da Associação Brasileira dos Criadores de Camarão (ABCC), a produção brasileira de camarão deve ser da ordem de 100.000 toneladas em 2014. Em 2013, a produção alcançou 85.000 toneladas e foi destinada basicamente ao mercado interno, com algumas exportações para países como Vietnã e França. 20 Os principais produtores são os estados do Ceará e do Rio Grande do Norte. Existem quase 2.000 produtores no Brasil, a maioria com pequenos cultivos. Atualmente os maiores produtores mundiais de camarão são China, Vietnã, Tailândia, Indonésia, Índia e Equador. O Equador produziu 300.000 toneladas de camarão em 2013 e obteve US$ 1,67 bilhão com a exportação de 215.000 toneladas do produto (Disponível em MPA - Ministério da Pesca e Aquicultura). Apesar desse crescimento na produtividade, os carcinicultores têm sofrido perdas econômicas significativas nas últimas décadas devido a problemas ambientais relacionados às práticas de cultivo e às doenças virais (MOSS, 2002). Dentre as doenças virais que acometem a carcinicultura mundial, destacam-se aquelas causadas pelo vírus da Mancha Branca (WSSV – White spot syndrome virus), vírus da Cabeça Amarela (YHV – Yellow head virus), vírus da Taura (TSV – Taura syndrome virus), vírus da Necrose Hipodermal e Hematopoiética Infecciosa (IHHNV – Infectious hypodermal and haematopoietic virus) e o vírus da Mionecrose Infecciosa (IMNV – Infectious myonecrosis virus) (LOTZ, 1997; LIU et al., 2009). 1.1 MIONECROSE INFECCIOSA A Mionecrose Infecciosa (Infectious Myonecrosis - IMN) é uma das doenças de maior impacto na carcinicultura da região Nordeste do Brasil. A IMN foi identificada pela primeira vez em 2002 em cultivos de camarão da espécie Litopenaeus vannamei no estado do Piauí e no ano seguinte foi detectada nos estados do Ceará e Rio Grande do Norte (LIGHTNER et al., 2004; LIGHTNER & PANTOJA, 2004). Hoje a doença já está disseminada em toda região Nordeste do Brasil e vem causando sérios danos à carcinicultura na Indonésia (NUNES, 21 MARTINS & GESTEIRA, 2004; ANDRADE et al., 2007; SENAPIN et al., 2007; LIGHTNER, 2011). Devido à importância econômica cada vez maior do L. vannamei na região Ásia-Pacífico e ao consequente aumento do transporte dessa espécie entre fronteiras, em janeiro de 2006 a IMN foi adicionada à lista Quartely Aquatic Animal Disease Report com o propósito de aumentar a vigilância e sua detecção (QAAD, 2006). De acordo com a Associação Brasileira dos Produtores de Camarão, a produção de camarão, no período em que a doença surgiu no Brasil (2002-2005), foi de 150.000 toneladas a menos que o total esperado. Embora essa redução também seja atribuída a variações no cambio e à ação antidumping dos Estados Unidos, estima-se que 60 a 70% das perdas foram causadas por ação da IMN, causando prejuízos próximos a 400 milhões de dólares naquele período (MADRID, 2005a, b; ROCHA, 2005a, b; ANDRADE et al., 2007). O principal sintoma da IMN é a mionecrose, que consiste na necrose dos músculos estriados do abdômen e do cefalotórax do camarão. Os segmentos abdominais podem apresentar opacidade focal ou multifocal (Figura 1A) que progride do último segmento para o restante do corpo do animal e, em estágios mais avançados, músculos e apêndices podem exibir coloração avermelhada (Figura 1B) (LIGHTNER et al., 2004; NUNES, MARTINS & GESTEIRA, 2004; POULOS et al., 2006). Além desses sintomas, os camarões também podem apresentar redução no consumo de alimentos, nado desorientado e amolecimento do exoesqueleto (NUNES, MARTINS & GESTEIRA, 2004). Análises histológicas dos músculos esqueléticos de camarões infectados revelam necrose muscular coagulativa, infiltração hemocítica, fibrose e aparecimento de esferoides do órgão linfoide (Limphoid organ spheroids - LOS). Os locais comuns para LOS incluem o 22 hemoceloma nas brânquias, coração próximo à glândula antenal e cordão nervoso ventral (TANG et al., 2005). Figura 1: Camarões Litopenaeus vannamei infectados com o vírus da mionecrose infecciosa. (A) O camarão acima mostra sinais de necrose, evidenciada pela opacidade do sexto segmento abdominal (fase aguda); abaixo se encontra o camarão sadio, sem sinais de infecção (adaptado de POULOS et al., 2006). (B) O camarão apresenta pigmentação avermelhada nos últimos segmentos abdominais – seta (fase crônica) (adaptado de NUNES, MARTINS & GESTEIRA, 2004). Nos últimos anos, as características de infecção da doença parecem ter mudado nos camarões cultivados na região nordeste do Brasil. Os camarões cultivados nas estações de baixa precipitação podem ser positivos para a doença em testes de detecção e não exibir os sintomas histopatológicos da infecção ou apresentarem sintomas brandos e baixas taxas de mortalidade (FEIJÓ et al., 2013; LANZA D. C. F, dados não publicados). Variações nas características da doença podem ocorrer por várias razões, incluindo condições ambientais, técnicas de cultivo, contagem viral, co-infecção ou por variações interespecíficas no genoma do agente etiológico (BACHERE, 2000). O agente etiológico da IMN foi purificado e caracterizado pela primeira vez no ano de 2006 por Poulos e colaboradores e é denominado de vírus da mionecrose infecciosa (IMNV). 23 1.2 VÍRUS DA MIONECROSE INFECCIOSA Quando comparado a outros vírus que infectam camarão o IMNV apresenta sintomas mais brandos que os vírus da Taura (Taura syndrome virus - TSV), e que os vírus causadores da Mancha Branca (White spot syndrome virus - WSSV) e da Cabeça Amarela (Yellow head virus - YHV). Animais desafiados pelos vírus TSV, WSSV e YHV, em condições de laboratório, apresentam 100% de mortalidade acumulada 10 dias após desafio enquanto os animais desafiados com IMNV só atingem taxas semelhantes 52 dias após o desafio (LU et al., 1994; OVERSTREET et al., 1997; TANG & LIGHTNER, 2000; TANG et al., 2005). A maioria dos vírus patogênicos que acometem camarões pode causar infecções persistentes, mas em baixo nível. Em decorrência disso, geralmente, o cultivo dos camarões infectados por IMNV não é interrompido, permitindo o estabelecimento do vírus em animais saudáveis e gerando grandes prejuízos advindos de gastos com alimentação e manejo. Geralmente as doenças virais surgem como resultado de um aumento na contagem viral em decorrência de várias formas de estresse ambiental ou fisiológico (PENG et al., 1998; COWLEY et al., 2002; LOTZ, ANTON & SOTO, 2005; SANCHEZ-MARTINEZ et al., 2007). Um camarão pode ser infectado simultaneamente ou sequencialmente por múltiplos vírus e/ou por diferentes linhagens de um mesmo vírus (FLEGEL et al., 2004; HOA et al., 2005). Um levantamento epidemiológico para monitoramento de TSV e IMNV em fazendas do estado de Pernambuco mostrou que a incidência de TSV é baixa, mas nove das onze propriedades analisadas apresentaram camarões infectados com IMNV (PINHEIRO et al., 2007). Quatro espécies de camarão já foram identificadas como 24 susceptíveis ao IMNV: L. vannamei, de maior interesse comercial no Brasil, e as espécies L. stylirostris, Farfantepenaeus subtilis e Penaeus monodon (LIGHTNER et al., 2004; TANG et al., 2005). O IMNV é um vírus não envelopado, com simetria icosaédrica e 40 nm de diâmetro. A partícula também possui protrusões em seu capsídeo que provavelmente estão envolvidas na transmissão extracelular e patogenicidade viral (POULOS et al., 2006; TANG et al., 2008). O genoma viral é formado por uma única molécula de RNA dupla fita contendo 7.561 pares de bases e apresenta duas ORFs (Open Reading Frames) em diferentes frames: A ORF1 no frame 1 (nucleotídeos 136 a 4.953) e a ORF2 no frame 3 (nucleotídeos 5.241 a 7.490). A ORF1 codifica uma proteína de 1.605 aa (179 kDa) que provavelmente é clivada, gerando a proteína principal do capsídeo (MCP) e uma proteína que compartilha motivos de uma proteína de ligação a dsRNA (RBP). Além disso, duas outras proteínas menores (Small Proteins), de 32 kDa e 38 kDa, foram visualizadas em gel desnaturante e parecem corresponder às protrusões que estariam envolvidas na entrada do vírus na célula, incluindo a ligação ao receptor e/ou penetração na membrana. A ORF2 (nucleotídeos 5241 a 7490) codifica uma proteína de 749 aa (85 kDa) que contém domínios característicos de uma RNA polimerase dependente de RNA (RdRp) e classificam o IMNV como sendo um membro da família Totiviridae. Estas ORFs aparentemente não se sobrepõem, existindo um espaço de 287 nucleotídeos entre elas (Figura 2) (POULOS et al., 2006; TANG et al., 2008). 25 Figura 2: Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs não sobrepostas. 1 – Proteína de ligação ao dsRNA (10 kDa); 2 – Protrusão? (31 kDa); 3 – Protrusão? (36 kDa); 4 – Proteína principal do capsídeo (99 kDa); 5 – RNA polimerase dependente de RNA (85 kDa) (adaptado de POULOS et al., 2006; NIBERT, 2007). Posteriores análises na sequência genômica revelaram a presença de dois motivos 2A-like (GDVESNPGP e GDVEENPGP) na ORF1 do IMNV precedendo a proteína do capsídeo. Os nonapeptídeos GDVESNPGP e GDVEENPGP abrangem os aminoácidos 86-94 e 370-378, respectivamente. A presença desses dois motivos reforça o pressuposto de que a ORF1 é uma poliproteína que posteriormente é clivada gerando fragmentos consecutivos de 93, 284 e 1.228 aa. Esse último fragmento provavelmente também é clivado gerando a MCP (901 aa) e outro fragmento de 327 aa. O fragmento de 93 aa possivelmente corresponde à proteína de ligação a dsRNA (RBP) e os fragmentos de 284 e 327 aa corresponderiam às proteínas de 32kDa e 38 kDa, respectivamente, vistas em gel desnaturante (NIBERT, 2007). É provável que, em alguns vírus, as duas ORFs estejam sobrepostas em 199 nucleotídeos, sendo traduzidas conjuntamente e gerando uma proteína de 1.734 aminoácidos (196 kDa) que seria, posteriormente, clivada. Isso é possível se ocorrer frameshift ribossomal -1 na região de sobreposição das ORFs (NIBERT, 2007). O 26 frameshifti ribossomal -1 é frequentemente associado a um motivo “shifty heptamer”, XXXYYYZ, onde X é A, C, G ou U, Y é A ou U, e Z é A, C ou U (BEKAERT et al., 2003; JACKS et al., 1988). A sequência GGGUUUU, que se qualifica como um “shifty heptamer” foi encontrada na região de sobreposição das ORFs do IMNV (NIBERT, 2007). Além disso, imediatamente antes dessa sequência se encontra o dinucleotídeo UC que pode favorecer o frameshifting ribossomal -1 (BEKAERT & ROUSSET, 2005). Esta estratégia de codificação é semelhante aos vírus que infectam Giardia lamblia (WANG et al., 1993; LI, WANG & WANG, 2001) e Saccharomyces cerevisae (DINMAN, ICHO & WICKNER, 1991). 1.2.1 Proteína de ligação a RNA (RBP) O primeiro produto codificado pela ORF1 (93 aa) apresenta uma região de 60 aminoácidos na extremidade N-terminal que compartilha um domínio conservado de ligação a dsRNA (DSRM) (POULOS et al., 2006). Esses domínios são encontrados em uma variedade de proteínas de ligação a RNA, apresentando diferentes estruturas e funções (BURD & DREYFUSS, 1994). Devido à natureza de seu genoma, os vírus de RNA precisam utilizar muitas RBPs (LI & NAGY, 2011). O vírus da influenza possui uma nucleoproteína de ligação a RNA (NP) cuja função primária é a encapsidação do genoma viral para fins de transcrição, replicação e empacotamento. Essa proteína pode interagir com uma grande variedade de moléculas virais ou da célula do hospedeiro, incluindo o próprio RNA, RNA polimerases dependentes de RNA e a proteína da matriz viral (PORTELA & DIGARD, 2002). Também foi visto que as proteínas NS1-BP e hnRNP K do vírus da Influenza A podem estar envolvidas no processo de splicing do RNA. No vírus da 27 Hepatite C, a RBP NS5A pode desempenhar um papel significante na regulação da passagem do processo de tradução para replicação do genoma, recrutamento das polimerases e helicases para o RNA viral e aumento nas processividades das mesmas (HUANG et al., 2005). Além do seu papel nos processos de replicação e transcrição, as RBPs virais também parecem aumentar a resposta imune inata iniciada pelo receptor Toll-like 3 (TLR3) (LAI et al., 2011). 1.2.2 Proteína Principal do Capsídeo (MCP) A MCP do IMNV compreende os aminoácidos 705-1.605 (901 aa), possuindo uma massa predita de 99 kDa e sequência N terminal IVSMENQSEID (POULOS et al., 2006). A estrutura tridimensional do capsídeo do IMNV foi elucidada em 2008 por Tang e colaboradores (Figura 3). Análises de crio-microscopia eletrônica de transmissão (cryo-TEM) e reconstrução de imagem 3D revelam que o IMNV tem um capsídeo formado por 120 subunidades organizado como um arranjo T=2 e apresenta-se como uma estrutura dobrada em forma pentamérica na qual possui um complexo de fibras de natureza proteica (Figura 3A). Assim como observado para o capsídeo de outros totivirus, existem 60 cópias quimicamente idênticas de cada subunidade, denominadas A e B. As subunidades A formam clusters pentaméricos em torno de cada um dos 12 eixos quíntuplos, e as subunidades B formam clusters triméricos em torno dos 20 eixos triplos. Além disso, cinco subunidades B se encontram em torno de cada pentâmero A formando um decâmero compacto centrado em cada eixo quíntuplo. As interações entre os decâmeros podem ocorrer, principalmente, de duas formas: (i) duas subunidades A de decâmeros adjacentes participam de contatos assimétricos através de cada eixo icosaédrico duplo, e (ii) 28 três subunidades B de decâmeros adjacentes participam de interações assimétricas em torno de cada eixo triplo (Figura 3B). Todos os contatos entre as subunidades A e B são assimétricos. Essas unidades assimétricas são formadas pelo dímero MCPA/B, totalizando 60 unidades diméricas formando o capsídeo. Com relação ao RNA dupla fita encontrado dentro do capsídeo, este parece se organizar de forma helicoidal, de maneira bastante simétrica (Figura 3A) (TANG et al., 2008). A B Figura 3: Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å. (A) Secção central com valores de densidade codificados em escala de cinza (quanto mais escuro, mais denso). Os eixos de simetria estão indicados no quadrante superior direito. (B) Visão da superfície do IMNV mostrando a simetria icosaédrica do capsídeo e as subunidades A (azul e ciano) e B (vermelho, rosa e laranja) (adaptado de TANG et al., 2008). Dados estruturais de alta resolução sobre as proteínas do capsídeo de vírus da família Totiviridae são escassos. Somente uma estrutura em cristal disponível foi resolvida, para a MCP do vírus que infecta Saccharomyces cerevisae L-A (ScV-L-A) (Figura 4) (NAITOW et al., 2002). Como observado no capsídeo do IMNV e de outros totivírus, o capsídeo do ScV-L-A é formado a partir de 60 cópias de pseudo capsômeros, cada um composto de duas moléculas de MCP que possuem sequências de aminoácidos idênticas mas suas estruturas terciárias são diferentes, principalmente nos resíduos localizados na superfície da proteína. Cada molécula de 29 MCP é formada por duas α-hélices localizadas próximas aos eixos icosaédricos quíntuplos e várias folhas β próximas aos eixos duplos e triplos (NAITOW et al., 2002). Figura 4: Modelo em 3D da subunidade A do capsídeo de Saccharomyces cerevisae L-A (ScV-L-A). A figura mostra o “trench” acessível a partir da superfície da partícula (outside) e o resíduo de His 154. As extremidades N- e C-terminais estão voltadas para o interior do capsídeo (inside) (adaptado de NAITOW et al., 2002). As subunidades do capsídeo de ScV-L-A geram mRNAs sem o cap5’ pela remoção enzimática dessa estrutura na presença do resíduo de His 154 presente na MCP (BLANC, GOYER & SONENBERG, 1992). A estrutura para a MCP de ScV-L-A revela uma “vala” (“trench”) estreita e profunda no sítio ativo e um resíduo de His 154 necessário para a reação de remoção do cap5’ (Figura 4). O “trench” é formado por vários loops que abrem e fecham a estrutura por se encontrarem na superfície da partícula. O mRNA celular pode, então, ser capturado por esses loops e posicionados no “trench” para a reação ocorrer (NAITOW et al., 2002). 30 1.2.3 Protrusões virais Análises de reconstrução de imagem em 3D mostraram que o capsídeo do IMNV possui fibras complexas que se estendem a aproximadamente 80 Å dos eixos quíntuplos do capsídeo (Figuras 3 e 5). Esses elementos mostraram menos densidade e resolução do que o capsídeo, o que pode ser explicado pela sua flexibilidade lateral e compreendem pelo menos três domínios morfológicos: knob, mais externo; stalk, no meio e; foot mais interno e ancorado ao capsídeo. O comprimento total de cada protrusão, incluindo o domínio foot, é de aproximadamente 100 Å (Figura 5) (TANG et al., 2008). Figura 5: Estrutura tridimensional prevista para o vírus da mionecrose infecciosa. À direita, um detalhamento da estrutura da protrusão do capsídeo viral (adaptado de TANG et al., 2008). Até o momento, a presença de protrusões ao longo do capsídeo viral é uma característica exclusiva do IMNV quando comparado a outros membros da família Totiviridae e, possivelmente, contribuem para os padrões de virulência e patogenicidade específicos do IMNV uma vez que ele é considerado como único membro da sua família a ser transmitido extracelularmente entre os organismos 31 hospedeiros. Outros membros da família Totiviridae estão associados com infecções avirulentas, enquanto que o IMNV causa uma doença geralmente fatal em camarões peneídos (LIGHTNER et al., 2004; POULOS et al., 2006; GHABRIAL, 2008; TANG et al., 2008). Entretanto, é possível que o totivírus que infecta o salmão do Atlântico, Piscine myocarditis virus (PMCV), também possua essas estruturas. O PMCV causa uma doença fatal em seu hospedeiro e, assim como o IMNV, presume-se que sua transmissão seja extracelular. Além disso, esse vírus possui sequências codificantes extras em seu genoma que podem estar envolvidas nos mecanismos de entrada celular (NIBERT & TAKAGI 2013). O IMNV foi o primeiro vírus da família Totiviridae descoberto como sendo capaz de infectar um hospedeiro diferente de protozoários ou fungos e, até o momento, ele é o único membro dessa família capaz de infectar crustáceos. Alguns estudos têm mostrado que as regiões que codificam protrusões apresentam grande variabilidade genética em diferentes vírus, permitindo que eles se adaptem a diferentes situações (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010; PROMKUNTOD et al., 2014). Já se sabe que proteínas semelhantes a protrusões estão envolvidas na entrada de certos vírus, como os coronavírus, na célula hospedeira, além de desempenhar um papel importante na determinação da gama de hospedeiros (ENJUANES et al., 2006; PERLMAN & NETLAND 2009; BELOUZARD et al., 2012). O capsídeo adornado com protrusões do IMNV sugere um mecanismo evolucionário simples que fornece um novo conjunto de funções capazes de expandir os padrões de infectividade do vírus. A evolução do IMNV a partir de totivírus mais simples pode ter incluído a aquisição de sequências codificantes para as protrusões, o que permite a transmissão extracelular (TANG et al., 2008). 32 1.2.4 RNA Polimerase Dependente de RNA (RdRp) A ORF2 do genoma do IMNV apresenta um domínio conservado característico de RNA polimerases dependente de RNA. As RdRps desempenham um papel central na replicação dos vírus de dsRNA. Apesar das altas taxas de mutações que ocorrem em vírus de RNA, as RdRps são geralmente bastante conservadas nas famílias virais, especialmente dentro de motivos funcionais, e são bons alvos para estudos filogenéticos (O’REILLY & KAO, 1998). Análises comparativas utilizando a região da RdRp do IMNV o caracterizam como um membro da família Totiviridae, similar ao vírus que infecta o protozoário Giardia lamblia (POULOS et al., 2006; NIBERT, 2007). Estudos sobre estrutura e função de RdRps tem sido relatados para vários vírus como Rhinovírus (LOVE et al., 2004), Picornavírus (KOK & MCMINN, 2009) e o vírus da Hepatite C (WAHEED, BHATTI & ASHRAF, 2013). A primeira estrutura em cristal da RdRp foi resolvida para o poliovírus podendo ser comparada com outras polimerases (Figura 6) (HANSEN, LONG & SCHULTZ, 1997). As estruturas das RNA polimerases (RNAPs) geralmente apresentam uma arquitetura comum descrita como uma “right hand”, contendo os domínios “thumb”, “fingers” e “palm” (Figura 6). O domínio “palm” parece catalisar a reação de transferência do grupo fosforila durante o processo de replicação enquanto que o domínio “fingers” está envolvido nas interações envolvendo os trifosfatos de nucleosídeos e pareamento do template. O domínio “thumb” provavelmente desempenha um papel na processividade e translocação da RNAP (STEITZ, 1999). Em RdRps, o domínio “palm” apresenta quatro sequências-motivo encontradas em todas as classes de RNAPs, denominadas A, B, C e D, e uma sequência-motivo 33 adicional E que é única de RdRps e transcriptases reversas (RTs) (Figura 6) (POCH et al., 1989). Outras três sequências-motivo (F1, F2 e F3) também encontradas em RdRps, parecem estar envolvidas na separação da dupla fita do RNA para a transcrição (BRUENN, 2003). Os motivos A e C estão envolvidos na coordenação do magnésio; o motivo A também pode desempenhar um papel na discriminação entre ribose e desoxirribose, assim como o motivo B; o motivo D completa a estrutura do domínio “palm”; e o motivo E está envolvido em interações hidrofóbicas com o domínio “thumb” (O’REILLY & KAO, 1998). Figura 6: Estrutura da RNA polimerase dependente de RNA do poliovírus. Os domínios “thumb”, “fingers” e “palm” estão indicados. As sequências-motivo encontradas no domínio “palm” estão destacadas nas seguintes cores: A em vermelho, B em verde, C em amarelo, D em roxo claro e E em roxo escuro (adaptado de HANSEN, LONG & SCHULTZ, 1997). 34 1.3 VARIABILIDADE GENÉTICA EM VÍRUS O estudo da variabilidade genética é uma abordagem interessante quando se deseja compreender mais profundamente a biologia dos seres vivos. Os vírus de RNA sofrem grande taxa de mutação principalmente devido a falta de atividade de correção de erros da RNA polimerase. O conhecimento de que alterações em regiões específicas do genoma de diferentes vírus influenciam em sua capacidade de infecção e mecanismos de patogenicidade já é amplamente difundido. As primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção, replicação e patogenicidade afetadas por alterações induzidas em seu genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Hoje existem inúmeros trabalhos que associam a variabilidade genética de diferentes vírus a sua patogenicidade. Alguns exemplos clássicos em doenças humanas são a correlação da variabilidade observada no gene NS5A do vírus causador da hepatite C e a resistência do vírus ao interferon, a correlação entre polimorfismos no gene que codifica a transcriptase reversa do HIV (Human Immunodeficiency Virus) e alterações na propagação e resistência do vírus, e a presença de polimorfismos associados à infectividade na ORF26 do herpesvírus causador do Sarcoma de Kaposi (ENOMOTO et al., 1996., CHAYAMA et al., 1997; KUROSAKI et al., 1997; ZONG et al., 2007; KEARNEY et al., 2008; BITTAR et al., 2010; PINHO et al., 2010). Polimorfismos no genoma também podem afetar as propriedades dos vírus por alterarem a estrutura secundária do RNA. Acredita-se que a estrutura secundária de genomas virais, particularmente em regiões não traduzidas desempenha um papel central no ciclo de vida viral, em particular nos processos de replicação e tradução (CLYDE, BARRERA & HARRIS, 2008; KORAKA et al., 2009). Em um 35 estudo desenvolvido por McBridge & Panganiban (1996) relatou-se que estruturas hairpin estão envolvidas no encapsulamento do vírus HIV-1. Foi visto que perturbações em um único hairpin, seja por deleção ou substituição de bases, pode ter um efeito parcial sobre o encapsulamento. Porém, quando dois hairpins são afetados, os efeitos são mais significativos. O estudo de variabilidade genética em vírus que acometem animais de criação é fundamental para caracterização de cepas virulentas e desenvolvimento de vacinas. Análises de variabilidade genética de proteínas estruturais de diferentes linhagens do vírus causador da encefalite equina (Western equine encephalitis virus - WEEV), uma doença que é problema de saúde pública nos Estados Unidos, possibilitaram definir os principais aminoácidos responsáveis pelos mecanismos de virulência deste vírus (NAGATA et al., 2006). O vírus da doença infecciosa da bursa (IBDV), causador da doença de gumboro, uma das principais doenças para a avicultura brasileira, pode ser classificado de acordo com sua antigenicidade e patogenicidade pela região hipervariável do gene VP2, que codifica uma proteína do capsídeo viral (LANA, BEISEL & SILVA, 1992). A diversidade genética de sete isolados no vírus Sacbrood na China foi estudada e regiões hipervariáveis no gene VP1 já foram sequenciadas e caracterizadas a fim de se obter informações sobre epidemiologia e imunologia do vírus (MINGXIAO et al., 2013). O estudo da variabilidade genética também é de suma importância para o desenvolvimento de sistemas diagnósticos. Em vírus que acometem a carcinicultura, foi demonstrado que os polimorfismos identificados na ORF94 do WSSV podem afetar o resultado de alguns testes diagnósticos baseados na amplificação via PCR (Polymerase Chain Reaction) ou na detecção de proteínas do vírus via anticorpos (MUSTHAQ et al., 2006). Análises de sequências da ORF1 de YHV da região do 36 Indo-Pacífico permitem a diferenciação de pelo menos seis diferentes linhagens do vírus, sendo que, apenas duas dessas linhagens provocam a doença (WIJEGOONAWARDANE et al., 2008). Existe apenas um trabalho voltado para o estudo da variabilidade genética do IMNV (NAIM, BROWN & NIBERT, 2014), publicado recentemente. Entretanto, até o momento, não foram observados estudos que levem em consideração a variabilidade genética do IMNV no desenvolvimento de métodos diagnósticos capazes de identificar diferentes isolados do vírus. 1.4 SISTEMAS DE DETECÇÃO PARA O IMNV Os crustáceos parecem não possuir imunidade adaptativa nem memória imunológica e não existem drogas ou vacinas contra as doenças virais que acometem camarões. O sistema de defesa dos camarões depende principalmente da imunidade inata a qual é formada por defesas humorais e celulares (KURTZ, 2004; JIRAVANICHPAISAL, LEE & SÖDERHÄLL, 2006). O monitoramento e o controle da disseminação desenvolvimento de de ferramentas doenças rápidas na e carcinicultura específicas dependem para detecção do e caracterização dos patógenos. A Organização Mundial de Saúde Animal indica o diagnóstico do IMNV através de técnicas moleculares. Já foram desenvolvidos sistemas de detecção do IMNV por RT-PCR (Reverse Transcription Polymerase Chain Reaction) analisado tanto da forma tradicional quanto em tempo real, que atingem o limite de detecção mínimo de 10 cópias do vírus por microlitro de RNA total extraído (TANG et al., 2005; POULOS et al., 2006; POULOS & LIGHTNER, 2006; ANDRADE et al., 2007; 37 LIU et al., 2013). Recentemente foram desenvolvidas outras ferramentas promissoras para detecção do IMNV, como anticorpos monoclonais para detecção de proteínas virais (KUNANOPPARAT et al., 2011; MELLO et al., 2011; CHAIVISUTHANGKURA et al., 2013) e sistemas de detecção baseados em RTLAMP (Reverse Transcription Loop Mediated Isothermal Amplification) (ANDRADE & LIGHTNER, 2009; PUTHAWIBOOL et al., 2009; ARUNRUT, SUEBSING & KIATPATHOMCHAI, 2013). Além dessas ferramentas, métodos de imunização baseados em RNA de interferência (RNAi) estão sendo desenvolvidos para o monitoramento e controle do IMNV (LOY et al., 2012; LOY et al., 2013). Apesar dos avanços recentes nos sistemas de detecção do patógeno, ainda não existem métodos direcionados à identificação da variabilidade genética do IMNV. O monitoramento em campo revela que em algumas amostras dadas como positivas não se observa sintomas nos animais, e geralmente existem diferenças na gradação dos sintomas e evolução da doença em diferentes regiões. Essas diferenças podem estar associadas a variações ambientais e/ou a diferentes variantes do vírus. O monitoramento e o controle de doenças virais que acometem a carcinicultura dependem de ferramentas rápidas e precisas para detecção e caracterização do patógeno. O estudo do genoma de determinada espécie de vírus e a sua variabilidade genética, implica em conhecer e comparar os genomas existentes na natureza e suas principais proteínas, seja no nível de sequência nucleotídica ou aminoacídica, seja no nível estrutural. Esse conhecimento permite identificar, em um primeiro momento, quais são as regiões mais variáveis no genoma e quais são as consequências dessas variações nas proteínas codificadas pelo vírus. A partir 38 desses dados é possível inferir como essas variações poderiam afetar a biologia do vírus e desenvolver novos sistemas de detecção mais eficientes. No presente trabalho, a variabilidade genética do IMNV foi estudada a partir da sequência de quatro genomas completos. Com base nesses dados foi elaborado um mapa com os sítios polimórficos existentes no genoma e possíveis influências das regiões variáveis sob a estrutura das proteínas codificadas foram propostas. Além disso, foram realizadas predições de estruturas secundárias e terciárias para as proteínas. A partir desses resultados foi desenvolvido um sistema de detecção baseado em PCR, capaz de diferenciar os isolados do IMNV estudados aqui a partir da identificação de polimorfismos no genoma. 39 2 OBJETIVOS Geral: Estudar o genoma completo do IMNV e os possíveis produtos gênicos codificados e desenvolver um sistema de detecção baseado em PCR que permita diferenciar isolados do vírus com base na presença de polimorfismos. Específicos: Verificar as relações de parentesco entre membros da família Totiviridae utilizando sequências já disponíveis no GenBank; Identificar a incidência do IMNV em camarões coletados no Nordeste; Sequenciar e montar o genoma completo de pelo menos dois isolados diferentes do IMNV; Comparar os genomas obtidos entre si e com genomas completos do IMNV já depositados no GenBank; Analisar a localização de sítios polimórficos e verificar se esses sítios causam alterações em aminoácidos e/ou em suas características; Identificar regiões variáveis e conservadas presentes no genoma do vírus; Estudar in silico a composição de aminoácidos e as estruturas secundárias das proteínas que compõem o genoma do IMNV; Modelar in silico a estrutura terciária das proteínas RBP, MCP e RdRp; Desenhar primers específicos com base nas regiões variáveis e conservadas identificadas no genoma; Desenvolver métodos de diagnósticos para diferenciar os isolados utilizando a técnica de PCR. 40 3 MATERIAIS E MÉTODOS 3.1 ANÁLISE FILOGENÉTICA As sequências de nucleotídeos e aminoácidos de representantes da família Totiviridae foram obtidas a partir do GenBank (www.ncbi.nlm.nih.gov) e UniProt – Universal Protein Resource (www.uniprot.org). As sequências foram alinhadas com o auxílio das ferramentas TCOFFEE e MCOFFEE (NOTREDAME, HIGGINS & HERINGA, 2000) usando parâmetros default, e manualmente editadas usando Jalview versão 2.8 (WATERHOUSE et al., 2009). As Open Reading Frames (ORFs) e domínios conservados de proteínas foram identificados através do ORF finder (http://www.ncbi.nlm.nih.gov/projects/gorf/) e do Conserved Domains Database – CDD (http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml), respectivamente. As sequências de aminoácidos da RdRp foram então alinhadas no programa MAFFT versão 6.85 (KATOH & TOH, 2010; KATOH & FRITH, 2012) com parâmetro L-INS-I que avalia a consistência do alinhamento, gap opening penalty 1.53 e offset value 0.1, guiado por alinhamento estrutural da família de proteínas pfam02123, presente no CDD (MARCHLER-BAUER et al., 2011). A sequência da RdRp de Micromonas pusilla virus (família Reoviridae; número de acesso YP654545) foi usada como outgroup devido sua alta proximidade e similaridade com a família Totiviridae. O melhor modelo de substituição de aminoácidos foi estimado por análise de verossimilhança usando o programa ProtTest versão 3.2 (ABASCAL, ZARDOYA & POSADA, 2005). O cálculo dos dendogramas foi baseado em análise Bayesiana, usando os programas MrBayes versão 3.2.1 (RONQUIST & HUELSENBECK, 2003; RONQUIST et al., 2012), e BEAST versão 1.8 (DRUMMOND et al., 2012). Todos os 41 indels e sítios não informativos (missing data) no alinhamento foram tratados como deleções parciais, com um corte de 75%, para permitir potenciais regiões ambíguas nas topologias, resultado em 530 sítios de parcimônia informativos no dataset. A inferência Bayesiana foi conduzida em três corridas (runs) independentes, com modelos fixos LG ou WAG, taxas de distribuição gama entre os sítios e frequências de aminoácidos fixas. Cada Cadeia de Markov foi iniciada com uma árvore aleatória e rodada por 106 gerações, com dados amostrados a cada 100 gerações, e a árvore consenso foi estimada usando um “burn in” de 1.000.000 árvores. A convergência das corridas foi avaliada usando a ferramenta Tracer versão 1.5 (DRUMMOND & RAMBAUT, 2007), a fim de avaliar estatisticamente a robustez da análise Bayesiana. As árvores geradas pelos programas foram editadas no programa FigTree versão 1.4.1 (DRUMMOND & RAMBAUT, 2007). 3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO Amostras de camarão da espécie Litopenaeus vannamei possivelmente infectadas com IMNV foram gentilmente cedidas por empresas do Nordeste do Brasil. As amostras eram oriundas de diferentes regiões do litoral do Nordeste brasileiro e foram coletadas em anos diferentes. A maioria das amostras correspondia ao camarão intacto, apresentando ou não sintomas da doença. Outras duas amostras correspondiam a um lisado de células de camarão, um conservado de forma congelada e outro em etanol 70%. Essas duas últimas amostras foram coletadas em 2009 no estado do Pernambuco/BR e em 2013 no estado do Rio Grande do Norte/BR, respectivamente. 42 3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES AMOSTRAS DE CAMARÃO Inicialmente, para a detecção dos vírus nas amostras de camarão, foram utilizadas duas estratégias: (i) PCR-Nested, utilizando primers desenvolvidos por Senapin et al. (2007), especificamente os pares de primers F13/R13 e F13N/R13N e; (ii) o método de identificação tradicional que utiliza os primers desenvolvidos pela World Organization for Animal Health (OIE). Após as análises iniciais, a identificação dos vírus foi realizada empregando o par de primers F14/R14. As sequências dos primers usados em cada análise estão listadas na Tabela 1. As amostras de camarões, possivelmente infectadas foram analisadas como descrito a seguir. Tabela 1: Lista dos primers usados em cada análise para identificar o IMNV nas amostras de camarões Litopenaeus vannamei. Primer Sequência (5’ → 3’) F13 TTTATACACCGCAAGAATTGGCCAA R13 AGATTTGGGAGATTGGGTCGTATCC F13N TGTTTATGCTTGGGATGGAA R13N TCGAAAGTTGTTGGCTGATG 4587F CGACGCTGCTAACCATACAA 4914R ACTCGGCTGTTCGATCAAGT 4725NF GGCACATGCTCAGAGACA 4863NR AGCGCTGAGTCCAGTCTTG F14 GAGTACCATCAGGAGTGAGAATAAC Referência Senapin et al., 2007 OIE Senapin et al., 2007 R14 GATGTATGTCCTCTACGTTAACCAA 43 3.3.1 Extração de RNA total A extração de RNA total foi realizada utilizando o KIT NUCLEOSPIN®RNA II, seguindo as instruções do fabricante. Aproximadamente, 50 µg de tecido foram retirados do sexto segmento abdominal do camarão. Em seguida, o tecido foi macerado, vortexado e submetido às etapas de centrifugação descritas no manual do kit de extração. Para as amostras de lisados de células de camarão conservadas congeladas ou em etanol 70%, foram utilizados 30 µl e 60 µl de amostra, respectivamente. 3.3.2 RT-PCR 3.3.2.1 Síntese de cDNA A síntese de cDNA foi realizada seguindo o protocolo da enzima Transcriptase Reversa ImPromII™ (Promega®) para um volume final de 20 µl, com algumas modificações. Em tubos de 1,5 ml, foram adicionados 6,6 µl de RNA total e 4 µl de primers (5 µM cada). Essa mistura foi incubada a 85 ºC em banho Maria por 5 minutos e, imediatamente em seguida, colocada em gelo por 5 minutos. Posteriormente foram adicionados aos tubos 4 µl de Reaction Buffer 5X, 2,4 µl de MgCl2 25 mM, 2 µl de dNTP mix 5 mM cada e 1 µl da enzima Transcriptase Reversa. Em seguida, os tubos foram submetidos às seguintes etapas: (1) temperatura ambiente (± 25 ºC) por 5 minutos, para anelar os primers; e (2) 50 ºC por 60 minutos em banho Maria, para extensão das fitas de cDNA. 44 3.3.2.2 Reação em Cadeia da Polimerase (PCR) A reação em cadeia da polimerase foi realizada de acordo com o protocolo da Taq Biotools, com algumas modificações. As amplificações foram conduzidas em volume final de 20 µl contendo 10,8 µl de água Milliq, 2 µl de Reaction Buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase (5 U/µl), 4 µl de cDNA e 1 µl de primer. Para a amostra conservada em etanol 70%, as quantidades de água e cDNA foram 7,8 µl e 7 µl, respectivamente. Os ciclos térmicos empregados nas análises variaram conforme os primers usados: (i) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 40 segundos, anelamento a 45 ºC por 40 segundos, extensão a 72 ºC por 40 segundos, e extensão final a 72 ºC por cinco minutos. Na reação nested, o ciclo correspondia a uma desnaturação inicial a 94 ºC por 5 minutos, seguido por 25 ciclos de desnaturação a 94 ºC por 45 segundos, anelamento a 50 ºC por 45 segundos, extensão a 72 ºC por 30 segundos, e extensão final a 72 ºC por cinco minutos (primers F13/R13 e F13N/R13N desenvolvidos por Senapin et al., 2007). (ii) Desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de desnaturação a 95 ºC por 45 segundos, anelamento a 60 ºC por 45 segundos, e extensão final a 60 ºC por sete minutos. Na reação nested, o ciclo correspondia a uma desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de desnaturação a 95 ºC por 30 segundos, anelamento a 65 ºC por 30 segundos, extensão a 72 ºC por 30 segundos, e extensão final a 72 ºC por dois minutos (primers desenvolvidos pela OIE). 45 (iii) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45 segundos, e extensão final a 72 ºC por cinco minutos (primers F14/R14 desenvolvidos por Senapin et al., 2007). Os produtos da amplificação foram visualizados em gel de agarose 1%, na presença de brometo de etídio. Os tamanhos dos fragmentos foram determinados através de um marcador de peso molecular DNA Marker Hae III (Sigma) e visualizados em transluminador UV. 3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL Para a amplificação do genoma viral completo, as etapas de extração de RNA total, síntese de cDNA e técnica de PCR procederam conforme descrito anteriormente. O ciclo térmico empregado foi o mesmo daquele utilizado para os primers F14/R14. A estratégia de amplificação e os primers usados para amplificar o genoma completo do vírus foram aqueles descritos no trabalho de Senapin et al. (2007). No total, 15 regiões do genoma foram amplificadas por RT-PCR para produzir 13 fragmentos de 600 pb cada, 1 fragmento de 840 bp e 1 fragmento de 572 pb. Cada fragmento amplificado tinha sua extremidade 3’ sobreposta com a extremidade 5’ do fragmento adjacente. A estratégia de amplificação está mostrada na Figura 7 e a lista das sequências de primers esta descrita na Tabela 2. 46 Figura 7: Estratégia empregada para amplificar o genoma completo do IMNV (adaptado de SENAPIN et al., 2007). Tabela 2: Lista de primers usados para amplificar o genoma completo do IMNV (SENAPIN et al., 2007). Região Nome do primer foward /Sequência Nome do primer reverse/Sequência 1 F1/GGCAATTTCAACCTAATTCTAAAAC R1/TGAAAAATAAGCTGTGCCCCATGTT 2 F2/AATACTACATCATCCCCGGGTAGAC R2/GACTTTCTTCCCAAGATGGAGTCTC 3 F3/GAAGTTAAAGATGTAACACTTGCCT R3/ATACTCCTTCTCCAAAGGGTGTACG 4 F4/GATCCAGTTCTAACTAGAGAAGATA R4/TCCAGATACAATTACCATGCTGGTT 5 F5/GCAGCTTGGCTAAACAACAGACCAT R5/ATTCAATCCACGAATTTGTCTTGGT 6 F6/CTTCGTGATAATGACTCTATTAGGG R6/CTGTGGAACAGATTGTAAAGTAAGA 7 F7/ATAAATAATGGTGTTAATATATTTG R7/ACTAATTGGCAGTGTTGTTTTCATT 8 F8/GTTGGTGTGGCCCTGCCAACTGTAA R8/ACTACCTTGCATTGAACTCCACGAA 9 F9/GTTTGGTATTCAACAAGACGTATTT R9/AACATTAATACAACTCTCATCATGA 10 F10/GAGACAGGCAATGTATTCAGACCAT R10/CTCTTGCTGACTCGGCTGTTCGATC 11 F11/TCGGGTTTTATGAATGCCCGTTCCA R11/TTGATAACTGTTTTGCAATTTCAAT 12 F12/TTGTACAAAACATTTGTATCTATAT R12/CTTCGATGTTAGATGCCACAGCAAG 13 F13/TTTATACACCGCAAGAATTGGCCAA R13/AGATTTGGGAGATTGGGTCGTATCC 14 F14/GAGTACCATCAGGAGTGAGAATAAC R14/GATGTATGTCCTCTACGTTAACCAA 15 F15/AATATCTAGAATTGCCAAAACGACT R15/CATGGCTGGCCACAAAACCCAACTG Nested F13N/TGTTTATGCTTGGGATGGAA R13N/TCGAAAGTTGTTGGCTGATG 47 Os produtos de PCR foram enviados à empresa Hellixa para serem purificados e submetidos ao sequenciamento usando a plataforma da Applied Biosystems® 3500 Genetic Analyzer, de acordo com as especificações do fabricante. As concentrações dos produtos da amplificação foram mensuradas previamente a fim de se verificar se os mesmos estavam na concentração adequada para o sequenciamento. Os fragmentos foram sequenciados através do método de sequenciamento Sanger, utilizando os primers descritos na Tabela 2 na concentração de 5 µM cada primer. A reação de sequenciamento ocorreu em ambas às direções, foward e reverse, para cada região. As regiões do genoma foram sequenciadas no mínimo duas vezes (forward + reverse) e no máximo seis vezes até a obtenção de uma sequência confiável. As análises dos eletroferogramas e a montagem dos genomas foram realizadas usando parâmetros pré-definidos no programa Geneious versão 6.1.6 (Disponível em Biomatters) e inspeção visual cuidadosa. 3.5 ANÁLISE DAS SEQUÊNCIAS As sequências genômicas completas obtidas foram analisadas no Basic Local Alignment Search Tool – BLAST (ALTSCHUL et al., 1997) para confirmar suas identidades e encontrar outras sequências similares. As sequências de aminoácidos foram obtidas através do servidor Expert Protein Analysis System – ExPASy (http://ca.expasy.org/). Uma análise comparativa entre os genomas obtidos neste estudo com outros 2 genomas completos do IMNV disponíveis no GenBank (números de acesso AY570982.2 e EF061744.1) foi realizada usando o programa Geneious. Posteriormente, as quatro sequências foram alinhadas no ClustalW 48 (LARKIN et al., 2007), com parâmetros default, usando o software Jalview versão 2.8 (WATERHOUSE et al., 2009) para identificação dos sítios polimórficos e regiões conservadas. Diferenças no nível de similaridade entre as regiões genômicas foram plotadas pelo programa SimPlot versão 3.5.1 (LOLE et al., 1999), com os seguintes parâmetros: modelo de árvore Neighbor joining, bootstrap igual a 1000 e modelo de distância Kimura (2-parameter). Adicionalmente, a fim de investigar a similaridade entre os genomas, uma análise de agrupamento, utilizando o método de Neighbor joining foi feita no software MEGA versão 6.06 (TAMURA et al., 2013), usando o modelo de substituição nucleotídica de Tamura-Nei e 1000 repetições de bootstrap, como teste de confiança na topologia. Para esta análise, além das sequências completas obtidas no presente estudo, foram usadas as seguintes sequências disponíveis no GenBank: números de acesso JN391187.1, AB555544.1, NC_013499.1, NC_014609.1, AY570982, EF061744.1. 3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS A predição de regiões estruturadas e não estruturadas foi realizada através do software Foldindex© que prediz se uma sequência de proteínas é intrinsecamente desdobrada implementando o algorítimo de Uversky e colaboradores, o qual é baseado na hidrofobicidade média dos resíduos e carga líquida das sequências (PRILUSKY et al., 2005). Para a predição de coiled coils foi usado o programa Coils (LUPAS, VAN DYKE & STOCK, 1991) com windows 14, 21 e 28. O programa TMpred (HOFMANN & STOFFEL, 1993) foi empregado para avaliar a hidrofobicidade e hidrofilicidade da proteína ao longo da sequência de aminoácidos, e o software PredictProtein (ROST, YACHDAV & LIU, 2004) foi utilizado para 49 predizer estruturas em α-hélices e folhas β, assim como regiões da proteína expostas ou não a solvente. 3.7 MODELAGEM PROTEICA A predição de modelos estruturais foi realizada com auxílio dos programas ITASSER (servidor online) (ZHANG, 2008; ROY et al,. 2010) e Phyre2 (KELLEY & STERNBERG, 2009). A metodologia do I-TASSER é baseada na predição por homologia de estrutura e alinhamento por threading das sequências alvo com base nas estruturas disponíveis na biblioteca do Protein Data Bank – PDB (http://www.rcsb.org/pdb/home/home.do), complementando com simulações ab initio para as cadeias laterais (ZHANG, 2007). O programa I-TASSER gera modelos classificados pelo Z-Score, RMSD, densidade do cluster e, principalmente pelo Cscore. O C-score corresponde ao escore de confiança que estima a qualidade do modelo gerado pelo I-TASSER cujo valor pode ser de -5 a 2 (quanto maior o valor do C-score, maior será a confiança do modelo). Com relação ao programa Phyre2, este realiza modelagem basicamente por homologia (KELLEY & STERNBERG, 2009). Os modelos foram avaliados usando os softwares MOLPROBITY (CHEN et al., 2010) e SWISS-MODEL (ARNOLD et al., 2006). Para a visualização dos modelos, foram usados os softwares UFSC Chimera (PETTERSEN et al., 2004) e PyMOL versão 1.5.0.4 (http://www.pymol.org/). 50 3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas Pares de primers foram desenhados com base em uma região conservada e uma região variável do genoma. Todos os primers foram analisados nos programas PrimerBlast (http://www.ncbi.nlm.nih.gov/tools/primer-blast/) para verificar o TM (temperatura de melting) e anelamento inespecífico, e AutoDimer (VALLONE & BUTLER, 2004) para verificar a formação de hairpins e dímeros de primers. Um método de PCR convencional foi desenvolvido para identificar as duas regiões escolhidas. Após a síntese de cDNA, foi realizada a PCR como descrito a seguir: os primers (5 µM cada) foram usados em 20 µl de reação contendo 10,8 µl de água Milliq, 2 µl de Reaction buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase 5 U/µl e 4 µl de cDNA. A reação foi submetida à desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de 94 ºC por 30 segundos, 58 ºC por 45 segundos, 72 ºC por 45 segundos, e extensão final a 72 ºC por 5 minutos. Os amplicons gerados foram de 200 pb para a região conservada e 456 pb para a região variável. Os produtos da PCR foram analisados em gel de agarose 1,5% na presença de brometo de etídio, e visualizados em transluminador. Uma análise de agrupamento utilizando o método de Neighbor joining foi realizada usando a sequência de nucleotídeos do fragmento de 456 pb. O dendograma foi calculado no programa MEGA 6.06, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. 51 3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples Seis regiões no genoma (cada uma com 200 pb) foram selecionadas como candidatas para o sistema de identificação de polimorfismos através da análise da curva de melting de fita simples. Essas regiões foram submetidas à análise in silico no programa RNAfold (http://rna.tbi.univie.ac.at) para predição da estruturas secundárias de RNA e DNA, e nos softwares MELTSIM (BLAKE et al., 1999) e RNAheat (HOFACKER et al., 1994) para a geração de curvas de melting de DNA fita dupla e RNA fita simples, respectivamente. Os seis pares de primers (sequências não mostradas) foram desenhados e analisados usando os programas PrimerBlast e AutoDimer. As análises in vitro procederam da seguinte maneira, em duas etapas: (I) Em um volume final de 20 µl foram adicionados 10,8 µl de água Milliq, 2 µl de Reaction Buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase (5 U/µl), 4 µl de cDNA e 1 µl de primer (5 µM cada). O protocolo de termociclagem compreendia um passo inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45 segundos, e extensão final a 72 ºC por cinco minutos. (II) 4 µl do produto da primeira reação foi utilizado como template em um volume final de 20 µl contendo 10 µl de mix SYBR green, 1 µl de primer foward (5 µM) e 5 µl de água Milliq. Essa reação foi submetida a uma desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45 segundos, 30 ºC por 2 minutos, e 52 extensão final a 72 ºC por cinco minutos. Os parâmetros da curva de dissociação foram padrões. As curvas de melting in vitro foram visualizadas no software 7500 Fast Real-Time PCR System versão 2.1.0 (Applied Biosystems®). 53 4 RESULTADOS 4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE Proteínas RdRp foram analisadas a fim de estimar a relação filogenética do IMNV dentro da família Totiviridae. Trinta sequências de aminoácidos da RdRp de membros representativos da família Totiviridae (Tabelas Suplementares 1 e 2) foram alinhadas, e as relações entre elas está descrito no dendograma da Figura 8. Oito clados monofiléticos distintos podem ser observados no dendograma e esses grupos foram nomeados seguindo a classificação de Liu et al. (2012). O grupo IMNV-like, o qual compreende vírus que infectam artrópodes, GLV-like e ScV-like coincide com os descritos previamente (LIU et al., 2012). Quatro novos grupos foram estabelecidos: MoV-like, compreendendo vírus que infectam plantas e fungos, TVVlike e LRV-like, que abragem vírus que infectam protozoários parasitas humanos, e GaRV-like, que compreende vírus de fungos. Para assegurar a eficiência da análise, as relações entre os membros dos grupos TVV-like, LRV-like e GLV-like (Tabela Suplementar 2) foram determinadas numa segunda análise filogenética (Figura Suplementar 1). O vírus Zygosaccharomyces bailii (ZbV-Z) e dois outros vírus relacionados isolados de plantas e fungos formaram o grupo ZbV-Z-like. Todos os grupos observados estão de acordo com a classificação propostas pelo Comitê Internacional de Taxonomia de Vírus (ICVT) (KING et al., 2012). 54 Figura 8: Análise filogenética de membros representativos da família Totiviridae. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de 30 membros representativos da família Totiviridae, usando Inferência Bayesiana. As IDs das sequências estão indicadas nas Tabelas Suplementares 1 e 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV. 4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES AMOSTRAS DE CAMARÃO Foram analisadas 31 amostras diferentes de camarão utilizando os métodos descritos anteriormente. Algumas apresentavam sinais da doença, como opacidade ou coloração avermelhada nos segmentos abdominais distais. Das 31 amostras analisadas, apenas duas foram identificadas como positivas para o IMNV: o lisado de células congelado e o conservado em etanol 70% (Tabela Suplementar 3). 55 4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS Dois novos genomas de isolados diferentes do IMNV foram amplificados e sequenciados no presente estudo. Os isolados foram nomeados IMNVgen1 (coletado em 2009 no estado de Pernambuco/BR) e IMNVgen2 (coletado em 2013 no estado do Rio Grande do Norte/BR). As sequências dos genomas completos estão mostradas nas Figuras Suplementares 2 e 3. A estratégia empregada para obtenção da sequência nucleotídica completa de IMNVgen1 e IMNVgen2 foi aquela desenvolvida para o genoma proveniente da Indonésia descrita por Senapin et al. (2007). Exceto pelos últimos 43 nucleotídeos em um dos genomas, a qualidade das bases foi alta, em torno de 50 (> 20), equivalente ao escore Phred (EWING & GREEN, 1998), indicando que a sequência genômica foi confiável para os dois isolados. 4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS A análise comparativa realizada com o auxílio da ferramenta BLAST mostrou que as novas sequências obtidas no presente estudo correspondem ao vírus da mionecrose infecciosa (99% de identidade). Os dois isolados apresentaram um genoma de 7561 pb, consistente com o tamanho dos genomas do IMNV publicados anteriormente para os isolados do Brasil (GenBank Nº de acesso AY570982.2) e Indonésia (GenBank Nº de acesso EF061744.1). IMNVgen1 apresentou uma composição de bases de 37,0% de A, 25,2% de T, 20,0% de G e 17,8% de C. O conteúdo G/C e A/T do genoma foi calculado para ser 1,12% e 1,47%, respectivamente. Já IMNVgen2 apresentou uma composição de bases de 36,8% de 56 A, 25,3% de T, 20,0% de G e 17,9% de C. O conteúdo G/C e A/T do genoma foi calculado para ser 1,12% e 1,45%, respectivamente. Como mostrado na Tabela 3, IMNVgen1 é muito similar a IMNVgen2 (99,42% de identidade), assim como é muito parecido com os isolados do Brasil e Indonésia. Valores de identidade semelhantes foram observados quando IMNVgen2 foi comparado com esses mesmos isolados (Tabela 4). Tabela 3: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2. GenBank No/ novo genoma Local do isolado (ano) Identidade genômica (%) Identidade de nucleotídeos (%) Identidade de aminoácidos (%) ORF1 ORF2 ORF1 ORF2 AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,34 EF061744.1 Indonésia (2006) 98,66 98,48 98,99 98,45 99,34 IMNVgen2 Brasil (2013) 99,42 99,36 99,56 99,57 99,21 Tabela 4: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1. GenBank No/ novo genoma Local do isolado (ano) Identidade genômica (%) Identidade de nucleotídeos (%) Identidade de aminoácidos (%) ORF1 ORF2 ORF1 ORF2 AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,21 EF061744.1 Indonésia (2006) 98,67 98,48 98,99 98,38 99,21 IMNVgen1 Brasil (2009) 99,42 99,36 99,56 99,57 99,21 57 As sequências codificantes de IMNVgen1 e IMNVgen2 estão organizadas em duas ORFs, como esperado para um típico totivírus e de acordo com os genomas já publicados (POULOS et al., 2006; SENAPIN et al., 2007). Em ambos, a ORF1 apresentou 4.818 nucleotídeos, começando no nucleotídeo 136, e a ORF2 apresentou 2.250 nucleotídeos, começando no nucleotídeo 5.241, estando as ORFs em diferentes frames. A sequência aminoacídica da ORF1 dos novos genomas foi pelo menos 98,38% similar as sequências dos isolados do Brasil e Indonésia (Tabela 4). Com relação à sequência aminoacídica da ORF2, IMNVgen1 mostrou 99,34% de similaridade com os genomas já publicados, enquanto que IMNVgen2 mostrou 99,21% de similaridade. A análise de agrupamento por Neighbor joining usando os quatro genomas completos dentro do grupo IMNV-like gerou um dendograma com dois grupos bem definidos para o IMNV: um grupo composto pelos vírus sequenciados neste estudo e outro compreendendo os genomas previamente descritos (Figura 9). Figura 9: Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas completos do IMNV. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06. IMNV - Penaeid shrimp infectious myonecrosis virus; AsV - Armigeres subalbatus virus; DmV - Drosophila melanogaster totivirus; TianV - Tianjin totivirus; ORV - Omono river virus. 58 4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS A análise realizada no programa Simplot gerou um gráfico que proporcionou uma visão geral da distribuição de sítios polimórficos (SPs) ao longo do genoma. Os SPs foram verificados nas oito regiões previamente descritas para o genoma do IMNV (POULOS et al., 2006; NIBERT, 2007): (1) 5’UTR, que compreende os primeiros 135 nucleotídeos do genoma, (2) RBP, correspondente a região que codifica uma provável proteína de ligação a RNA (nt 136 a 414), (3) Small Protein 1 (SP1) e (4) Small Protein 2 (SP2) (nt 415 a 1266 e nt 1267 a 2247, respectivamente), regiões candidatas a codificarem as protrusões do IMNV, (5) MCP (nt 2248 a 4953), que corresponde a região que codifica a proteína do capsídeo, (6) região entre as ORFs (nt 4954 a 5240), (7) região que codifica a RdRp (nt 5241 a 7490) e (8) 3’UTR que compreende os últimos 71 nucleotídeos do genoma. Estas regiões estão esquematizadas no topo da Figura 10. Observando as comparações ilustradas na Figura 10 é possível identificar três regiões com baixo escore de similaridade localizadas na primeira metade da ORF1, em todas as comparações. A análise no Simplot também revelou que a região que codifica a ORF2 apresenta alta similaridade quando comparada à ORF1. Os resultados também indicam que os isolados descritos para o Brasil e Indonésia são mais similares entre si, assim como IMNVgen1 e IMNVgen2, o que corrobora com o dendograma mostrado na Figura 9. 59 Figura 10: Representação esquemática do genoma do IMNV e análise de variabilidade. Os plots de similaridade gerados no Simplot comparam IMNVgen1 e IMNVgen2 com os genomas disponíveis no banco de dados. O eixo X representa a posição dos nucleotídeos e o eixo Y representa o escore de similaridade. A região mais variável e o domínio conservado da RdRp estão destacados. 60 Os resultados obtidos no alinhamento das sequências nucleotídicas e aminoacídicas mostrou a presença de 126 sítios polimórficos, dos quais 5 estão na proteína de ligação a dsRNA (RBP), 40 nas regiões das Small Proteins (SP1 e SP2), 47 na proteína do capsídeo e 28 na RdRp. Desses 126 sítios polimórficos, 37 causam alteração em aminoácidos, estando 13 nas regiões de SP1 e SP2, 15 na proteína do capsídeo e 7 na RdRp (Figura 11 e Tabela Suplementar 4). Levando em consideração a região codificante do genoma, verificamos que, proporcionalmente, a maior densidade de sítios polimórficos, inclusive aqueles que alteram aminoácidos, se encontram nas regiões da SP1 e SP2 (~1 polimorfismo a cada 46 nt), seguido pela proteína do capsídeo (~1 polimorfismo a cada 57 nt) e pela RdRp (~1 polimorfismo a cada 80 nt). Os polimorfismos encontrados na região da proteína de ligação da dsRNA não alteram o quadro de leitura dos aminoácidos, constituindo mutações silenciosas. 100% 13 100% 99% 3 15 1 7 21 5 32 2 27 99% 98% 286 98% 97% 97% 132 274 1806 2229 2674 69 96% 96% 5'UTR RBP Small Proteins MCP Entre ORFs RdRp 3'UTR Sítios não polimórficos Sítios polimórficos (total menos sítios não sinônimos) Sítios polimórficos não sinônimos Figura 11: Sítios polimórficos identificados no genoma do IMNV. O número total de sítios polimórficos compreende os sítios polimórficos sinônimos e não sinônimos mostrados proporcionalmente em cada região do genoma. 61 Com base nos resultados obtidos no Simplot e no alinhamento das quatro sequências, foi possível mapear os sítios polimórficos ao longo do genoma e, assim identificar quais regiões eram mais conservadas e quais eram mais variáveis. Os dados indicam que as regiões previstas para codificarem a protrusão do vírus (SP1 e SP2) variaram mais em relação às outras regiões, enquanto que a região da RdRp apresentou-se mais conservada. Nesse sentido, podemos dizer que as proteínas que são candidatas a formarem a protrusão do vírus são mais susceptíveis a sofrerem mudanças do que as outras proteínas do IMNV e, provavelmente apresentam uma região hipervariável. 4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE ESTRUTURA SECUNDÁRIA Os primeiros 93 aminoácidos da ORF1 codificam uma proteína que apresenta um domínio DSRM (double-strand RNA binding motif) conservado envolvido na ligação a RNA. Para simplificar, toda a proteína foi chamada RBP (RNA binding protein). As predições de estrutura secundária revelam que a RBP é totalmente estruturada e possui alto conteúdo de α-hélices, mas nenhum coiled coil (Figura 12 e Figura Suplementar 4A). Diferente das outras proteínas do IMNV, a RBP não apresentou nenhum sítio polimórfico que causasse alteração na sequência de aminoácidos. 62 Figura 12: Análise de composição de aminoácidos e predição de estrutura secundária para RBP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado DSRM (em cinza claro). O eixo X representa a posição dos aminoácidos. Proporcionalmente, as proteínas SP1 e SP2, candidatas a codificarem a protrusão, apresentaram o maior número de sítios polimórficos, dos quais 13 podem provocar mudança de aminoácidos. As análises de composição de aminoácidos e predição de estrutura secundária indicam que SP1 possui características de uma proteína estruturada apresentando uma região N-terminal hidrofóbica não exposta a solvente e grande quantidade de folhas-β (Figura 13 e Fig. Suplementar 4B). Já SP2 63 mostrou-se uma proteína quase totalmente desestruturada, com alta quantidade de aminoácidos carregados, alta hidrofilicidade e uma pequena região estruturada na porção C-terminal. Além disso, a região desestruturada que apresentou o maior pico coincidiu com uma região não exposta a solvente. SP2 também mostrou uma região de coiled coil com um escore significante na porção N-terminal, que foi predito em diferentes reading windows (Figura 13 e Figura Suplementar 4C). Figura 13: Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e SP2. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando os sítios polimórficos não sinônimos (traços pretos) identificados nas proteínas. O eixo X representa a posição dos aminoácidos. 64 A proteína principal do capsídeo (MCP) apresentou um número considerável de sítios polimórficos, sendo superada apenas pela região das proteínas SP. De acordo com o esperado para uma proteína globular, ela contém uma alta proporção de aminoácidos neutros (31%) e hidrofóbicos (50,5%). Esta proteína, formada por 901 aminoácidos, apresentou alto grau de regiões estruturadas e duas regiões desestruturadas mais evidentes na sua segunda metade. A região desestruturada entre os aminoácidos 804 a 846 contém alto conteúdo de α-hélices predito pelos programas Coils e PredictProtein (Figura 14 e Fig. Suplementar 4D). As análises in silico também revelaram cinco picos hidrofóbicos preditos pelo TMPred. A comparação entre os quatro genomas do IMNV mostrou que a região correspondente a MCP possui 15 sítios onde ocorrem mudanças de aminoácidos. Esses sítios estão distribuídos ao longo da proteína e alguns coincidem com os picos hidrofóbicos. Um mapa contendo todos os sítios polimórficos, bem como os aminoácidos codificados, está mostrado na Tabela Suplementar 4. As mudanças de aminoácidos nos sítios 2440, 3160, 3293, 3570, 3653, 3929, 4091 e 4504, localizados na MCP, devem ser destacadas, pois ocorrem mudanças entre aminoácidos com diferentes cargas, indicando que estes sítios poderiam afetar a estrutura secundária da proteína em diferentes isolados virais. 65 Figura 14: Análise de composição de aminoácidos e predição de estrutura secundária para MCP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o core conservado da MCP (em cinza claro) e os sítios não sinônimos identificados na proteína (traços pretos). O eixo X representa a posição dos aminoácidos. 66 A RNA polimerase dependente de RNA mostrou-se uma proteína muito conservada entre os quatro isolados apresentando apenas sete sítios polimórficos não-sinônimos. As análises in silico revelaram que a RdRp possui características de uma proteína estruturada com pequenas regiões desestruturadas interpassadas, lembrando uma proteína com domínios conectados por pontes móveis (Figura 15 e Figura Suplementar 4E). Duas hélices hidrofóbicas preditas pelo TMPred estão localizadas em domínios estruturados e provavelmente estão escondidas na estrutura globular. A predição de estruturas secundárias revelou a existência de um alto conteúdo de α-hélices e dois motivos coiled coil com alta probabilidade de ocorrência compreendendo os aminoácidos 243 a 256 e 636 a 649. Em ambos os motivos não foram detectadas mudanças de aminoácidos (Figura 15). A Figura 15 mostra que as sequências-motivo conservadas em RNA polimerases estão localizadas em regiões estruturadas e, exceto pela sequência-motivo F1, todas coincidem com a região do domínio conservado da RdRp. Como mostrado na Tabela Suplementar 4, a mudança de aminoácidos nos sítios 5299, 5520, 5784 e 6981, localizados na RdRp, devem ser destacados pois ocorre mudança de aminoácidos com diferentes cargas, indicando que estes sítios tem potencial para alterar a estrutura secundária da proteína. 67 Figura 15: Análise de composição de aminoácidos e predição de estrutura secundária para RdRp. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado da RdRp (em cinza claro), os sítios não sinônimos identificados na proteína (traços pretos) e as sequências-motivo conservadas em RdRps (traços azuis). O eixo X representa a posição dos aminoácidos. 68 4.7 MODELAGEM DE PROTEÍNAS As estruturas terciárias das proteínas RBP, MCP e RdRp potencialmente codificadas pelo isolado da Indonésia foram preditas utilizando os programas ITASSER e Phyre2. Os valores para o escores e parâmetros de avaliação dos modelos são mostrados na Tabela Suplementar 5. Não foi possível obter modelos com escores de confiabilidade significantes para as proteínas SP1 e SP2. Os modelos da MCP e RdRp também foram preditos para os três isolados do Brasil (Figuras Suplementares 5 e 6). Não foram gerados modelos da RBP para os isolados do Brasil devido à sequência de aminoácidos da proteína ser idêntica para os quatro isolados. O melhor modelo 3D da RBP apresentou um C-Score igual a -2,26 e uma estrutura comum presente em estruturas já resolvidas para o domínio conservado DSRM disponíveis no Protein Data Bank (PDB), as quais possuem duas α-hélices e três folhas β (destacado em cinza claro na Figura 16 e na Figura Suplementar 7A). Essas estruturas também correspondem parcialmente às estruturas secundárias preditas pelo PredictProtein (Figura 12). 69 Figura 16: Modelo estrutural para a proteína RBP do IMNV gerado pelo I-TASSER. O domínio conservado DSRM está destacado em cinza claro. (MolProbity score 4,03, Z-Score 0,627, C-score 2,26). O modelo gerado no I-TASSER para o monômero da MCP apresentou um C-Score igual a -2,27 e um formato semelhante ao dos monômeros de Saccharomyces cerevisiae virus L-A (ScV-L-A) e Helminthosporium victoriae virus 190S (HvV190s), mas diferenças significativas em relação às estruturas secundárias devido o alto conteúdo de α-hélices (Figura 17) (NAITOW et al., 2002; DUNN et al., 2013). A Figura 17 mostra a localização do possível “trench” e um resíduo de His 107 identificado nesta estrutura. Um segundo modelo gerado no Phyre2 para a MCP, baseado apenas em modelagem por threading, resultou em uma estrutura composta por três α-hélices (Figura Suplementar 7B), compreendendo os aminoácidos 518 a 590. 70 Figura 17: Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER. O core conservado da MCP está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. (MolProbity score 3,47, Z-Score -6,341, C-score -2,27). A modelagem por threading associada com simulações ab initio para a RdRp gerou o modelo com o melhor C-Score (0,23) em relação aos modelos da RBP e MCP. Apesar da ausência de estruturas β na estrutura, o formato da proteína foi semelhante a uma “right hand”, como esperado para uma RNA polimerase. Os domínios “thumb”, “fingers” e “palm” estão indicados na Figura 18, assim como as sequências-motivo A, B, C, D, E, F1, F2 e F3 estão destacadas em cores diferentes. O domínio conservado da RdRp também está evidenciado em cinza claro (Figura 18). 71 Figura 18: Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER. O domínio conservado da RdRp está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. Os domínios “thumb”, “fingers”, e “palm” estão mostrados, assim como as sequências-motivo conservadas em RdRps estão destacadas como segue: A – azul escuro; B – azul claro; C – rosa; D – verde; E – amarelo; F1, F2 e F3 – laranja. (MolProbity score 3,96, Z-Score -5,14, C-score 0,23). 4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas Primers flanqueando uma região variável e uma região conservada do genoma do IMNV foram produzidos para detecção do vírus (Tabela 5). Os pares de primers SP-F/SP-R e RdRp-F/RdRp-R foram desenhados para amplificar um fragmento de 456 pb e 200 pb, respectivamente, e para possuírem temperaturas de melting (TM) similares a fim de serem usados tanto em uma reação multiplex como em reações separadas. Um par de primer (EF1α-F/ EF1α-R) também foi desenhado 72 para ser usado como controle positivo da reação e amplifica um fragmento de 600 pb presente no gene do fator de elongação-1α do camarão. Tabela 5: Lista de primers empregados no sistema de identificação do IMNV. Nome do primer Sequência (5’→3’) TM (ºC) SP-F CATCAAGTGTACTCGGAAG 52,85 SP-R CTTCTCTAGTTAGAACTGGATC 52,90 RdRp-F ACGTAGAGGACATACATCC 53,05 RdRp-R GATTGGTATTGTCTGATTTCTAC 53,02 EF1α-F GCGCAAGAGCGACAACTATG 59,97 EF1α-R ACATAGGCTTGCTGGGAACC 60,03 Um esquema mostrando o alinhamento de nucleotídeos referente aos fragmentos de 456 pb e 200 pb, amplificados das regiões variável e conservada, respectivamente, está mostrado na Figura 19. A figura também indica o número de sítios polimórficos presente em cada região. 73 Figura 19: Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões variável e conservada, respectivamente. Esses fragmentos foram empregados no sistema de detecção do IMNV. Os sítios polimórficos de cada região estão mostrados em caixas. Usando os primers SP-F/SP-R e RdRp-F/RdRp-R em duas reações de PCR separadas foi possível detectar a presença do IMNV em duas amostras diferentes de camarão como mostrado na Figura 20A. Embora esta seja uma análise qualitativa, considerando a mesma quantidade de template e a intensidade das bandas, é possível notar que a amostra 1 apresentou uma maior quantidade de partículas do IMNV do que a amostra 2. A análise de agrupamento por Neighbor joining utilizando o fragmento de 456 pb a partir dos quatro genomas do IMNV reconstitui os mesmos grupos mostrados na Figura 9 (Figura 20B). 74 Figura 20: Sistema de detecção do IMNV. (A) Gel de agarose mostrando os resultados do sistema de identificação do IMNV utilizando os novos marcadores para as regiões variável e conservada do genoma. O sistema foi capaz de identificar a presença do IMNV em duas amostras diferentes do camarão coletadas em diferentes locais do Brasil. 1 – marcador de peso molecular; 2 e 6 – controle positivo (EF-1α); 3 e 7 – controle negativo; 4 e 8 – detecção usando os primers da região mais variável; 5 e 9 – detecção usando primers da região conservada. Os asteriscos indicam as bandas de 456 pb e 200 pb esperadas. (B) Análise Neighbor joining baseado no fragmento de 456 pb da região mais variável. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06. 4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples Na tentativa de desenvolvermos um sistema de identificação de ácidos nucleicos a partir da curva de desnaturação dos amplicons, seis regiões de 200 pb foram selecionadas ao longo de todo o genoma do IMNV além do fragmento de 456 pb (Reg.Frag456) já apresentado no tópico anterior. Todas essas regiões foram submetidas a 2 análises in silico: (1) predição de estrutura secundária de RNA e DNA e (2) geração de curvas de melting a partir da desnaturação do DNA de fita 75 dupla e do RNA de fita simples. A abordagem de desnaturação de uma fita simples é inédita, e possivelmente mais eficiente para determinar variações na sequência primária que a desnaturação de uma fita dupla (OLIVEIRA et al., 2014). Após as análises in silico algumas dessas regiões também foram utilizadas para testes preliminares in vitro (Tabela 6). Tabela 6: Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de fita simples. Região Localização no genoma Teste in silico Teste in vitro R1 (nt 468-667) Small proteins Sim Não R2 (nt 969-1168) Small proteins Sim Sim R3 (nt 1119-1318) Small proteins Sim Sim R4 (nt 1635-1834) Small proteins Sim Não R5 (nt 2413-2612) MCP Sim Sim R6 (nt 6823-7022)* RdRp Sim Sim Reg.Frag456 Sim Não Small proteins *A região R6 corresponde ao fragmento de 200 pb do par de primers RdRp-F/RdRp-R. A partir da desnaturação das sequências apresentadas na Tabela 6, esperávamos conseguir diferenciar os amplicons e discriminar os isolados sequenciados neste estudo. As Figuras 21 e 22 mostram resultados preliminares dos testes para as regiões R2 e R3, comparando os isolados IMNVgen1 e IMNVgen2. Os resultados obtidos de predição de estrutura secundária de RNA e DNA para a região R2 mostram estruturas bastante diferentes entre os isolados (Figura 21A-D). Por outro lado, para a região R3, essas estruturas se apresentaram mais semelhantes (Figura 22A-D). Para ambas as regiões, os resultados obtidos para a curva de melting de fita simples in silico não corresponderam às curvas geradas na análise in vitro, indicando que o método não foi eficiente na diferenciação dos isolados e precisa ser melhorado (Figuras 21E-H e 22E-H). 76 Figura 21: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R2. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul. 77 Figura 22: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R3. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul. 78 Como mostrado na Figura 19, o fragmento de 456 pb foi capaz de diferenciar os quatro isolados do IMNV após a etapa de sequenciamento. Os resultados in silico de predição de estrutura secundária de RNA e curva de melting de fita simples indicam que este fragmento é capaz de diferenciar os vírus sequenciados no presente estudo daqueles já descritos (Figura 23). De fato, as estruturas secundárias de RNA dos vírus do Brasil e Indonésia são mais semelhantes entre si (Figura 23A e B), assim como as estruturas secundárias de RNA para IMNVgen1 e IMNVgen2 (Figura 23C e D). A curva de melting de RNA fita simples realizada in silico foi capaz de refletir a diferença entre as estruturas de RNA (Figura 23E). Figura 23: Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in silico para o fragmento de 456 pb. A predição de estrutura secundária de RNA foi realizada no programa RNAfold e a curva de melting simples fita foi gerada no programa RNAheat. A – IMNV-BR; B – IMNV-Ind; C – IMNVGen1; D – IMNVGen2; E – curva de melting de fita simples in silico. 79 5 DISCUSSÃO O surgimento de doenças infecciosas que acometem animais de criação é um dos principais problemas para a economia dos países produtores, causando prejuízos financeiros significativos. Sendo assim, é necessário que esse problema seja resolvido ou, pelo menos, minimizado empregando métodos de identificação e controle eficientes para evitar e/ou combater essas doenças (LANA, BEISEL & SILVA, 1992; NAGATA et al., 2006; MINGXIAO et al., 2013). O desenvolvimento de métodos de identificação e controle eficazes requer conhecimentos aprofundados em relação à biologia do patógeno. Em termos moleculares, é necessário conhecer a sequência genômica do organismo, assim como os produtos gênicos codificados pelo genoma (POULOS et al., 2006; SILVA et al., 2014). Também é interessante estudar a filogenia e aspectos evolutivos do organismo de interesse (POULOS et al., 2006; CORTEY et al., 2011; FRAGA et al., 2012). A partir desses conhecimentos pode-se investigar a variabilidade genética das diversas espécies, identificar regiões conservadas e variáveis nas sequências, prever a estrutura tridimensional de proteínas importantes e, assim, inferir seus mecanismos de infectividade, replicação, dentre outros mecanismos e características (NIBERT, 2007; TANG et al., 2008; CORTEY et al., 2011; APTESENGUPTA et al., 2012; NAIM, BROWN & NIBERT, 2014). Um método molecular eficaz para detecção molecular é a Reação em Cadeia da Polimerase (PCR). Esse sistema já é amplamente empregado na detecção de agentes infecciosos e fornece um resultado confiável (POULOS & LIGHTNER, 2006; SILVA et al., 2014). Além disso, quando realizada em tempo real, a PCR é capaz de quantificar o DNA de maneira precisa e com maior reprodutibilidade (SILVA, 80 PINHEIRO & COIMBRA, 2011; WEIRATHER et al., 2011; BOTELHO-SOUZA et al., 2014). Estudar o genoma, tanto no nível de nucleotídeos quanto no nível de aminoácidos, bem como as proteínas codificadas, é importante na seleção de regiões alvo para o desenho de primers (SEIBERT et al., 2010; LOY et al., 2013). A produção dos primers é o principal passo no desenvolvimento de um sistema de PCR confiável. No presente trabalho, foi estudado o genoma, bem como os possíveis produtos de expressão gênica codificados por ele, de quatro isolados distintos do vírus causador da mionecrose infecciosa em camarões peneídeos, oriundos do Brasil e Indonésia, a fim de desenvolver um método de PCR eficiente na identificação e distinção desses isolados. As duas amostras positivas identificadas no screening inicial para detecção de novos isolados do IMNV em camarões Litopenaeus vannamei foram suficientes para alcançar os objetivos do presente estudo. O fato de não termos conseguido encontrar o IMNV em muitas amostras, em especial aquelas cujos camarões estavam intactos, pode ser devido aos seguintes fatores: (i) os camarões realmente não estavam infectados, já que as amostras foram obtidas de grandes fazendas que tomam as devidas medidas profiláticas; (ii) a coleta das amostras pode ter sido realizada em um período no qual as condições ambientais não favoreciam a incidência do vírus ou; (iii) os métodos aplicados na identificação não foram eficientes, pois encontramos que o primer F13 (Tabela 1) não funcionou devido anelar em uma região onde existia um sítio polimórfico (nt 5.784). A análise filogenética mostra que o grupo GLV-like compreende vírus do gênero Giardiavirus e ScV-like compreende vírus do gênero Totivirus. O gênero Victorivirus inclui dois grupos, MoV-like e GaRV-like. Os gêneros Leishmaniavirus e 81 Trichomonasvirus incluem os grupos LRV-like e TVV-like, respectivamente. O grupo ZbV-Z-like foi anteriormente designado como um grupo primitivo, menos derivado, parente distante dos totivírus e inclui partículas virais com organização genômica distinta desta família. Uma nova família Amalgamaviridae foi proposta para acomodar estes três vírus (LIU et al., 2012). O grupo IMNV-like aparece como o grupo menos derivado próximo a GLV-like. De fato, no estudo filogenético realizado por Poulos e colaboradores (2006), o IMNV foi agrupado com GLV, mas essa análise não levou em consideração as sequências dos vírus do grupo IMNV-like. O grupo IMNV-like não é classificado pela ICTV (KING et al., 2012). Assim, é interessante notar que o IMNV provavelmente pertence a um táxon ainda não descrito. Devido suas características peculiares, Tang e colaboradores (2008) propuseram a criação de um novo gênero na família Totiviridae para acomodar o IMNV. Nossos resultados indicam que o grupo IMNV-like poderia corresponder a esse novo gênero. As comparações entre os quatro isolados em nível de sequência genômica completa, bem como sequências nucleotídicas e aminoacídicas das ORFs mostradas nas Tabelas 3 e 4, indicam que IMNVgen1 e IMNVgen2 são mais parecidos entre si do que com os genomas do Brasil e Indonésia, e que ambos são mais semelhantes à sequência descrita para o Brasil. É esperado que a similaridade entre os isolados coletados no Brasil seja alta, considerando que o IMNV foi primeiramente identificado no Brasil e, posteriormente, atingiu outros locais do mundo. Entretanto, a análise de agrupamento por Neighbor joining revelou a formação de dois grupos distintos: IMNVgen1/IMNVgen2 e IMNV-BR/IMNV-IND (Figura 9). É curioso e inesperado observar que o isolado do Brasil seja mais relacionado ao isolado da Indonésia. Provavelmente, o genoma está sendo afetado 82 mais pela variação ao longo do tempo do que pela variação devido ao isolamento geográfico, uma vez que os vírus sequenciados no presente estudo foram coletados nos anos de 2009 e 2013, enquanto que os isolados do Brasil e da Indonésia foram coletados em 2003 e 2006, respectivamente (POULOS et al., 2006; SENAPIN et al., 2007). No entanto, mudanças decorrentes de isolamento geográfico são recorrentes entre os vírus que acometem camarões, como ocorreu com o IMNV na dispersão do Brasil para a Indonésia (SENAPIN et al., 2007). Isolados de WSSV, que é um vírus de DNA, originários da China, Taiwan e Indonésia apresentaram até 13.000 pares de bases divergentes (MARKS et al., 2004). Além disso, isolados diferentes de WSSV da mesma região geográfica foram repostados na China (TAN et al., 2009). Esta observação requer uma análise mais detalhada do genoma a fim de identificar os sítios polimórficos e determinar as regiões que vem sofrendo mudanças e sua correlação com motivos estruturais proteicos. Mutações gênicas em vírus são bastante comuns, principalmente em vírus que apresentam genoma de RNA, como o IMNV. A falta de atividade de correção de erros da RNA polimerase contribui significativamente para o grande número de mutações encontradas em vírus de RNA. Já é amplamente conhecido que a capacidade de infecção e mecanismos de patogenicidade são influenciados pelas alterações em regiões específicas do genoma de diferentes vírus. As primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção, replicação e patogenicidade afetadas por alterações induzidas em seu genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Pudupakam et al. (2011), viram que deleções em uma região hipervariável da ORF1 reduziam a eficiência da replicação do vírus da hepatite E. 83 A proteína RBP apresentou uma estrutura semelhante àquelas já resolvidas e disponíveis para o domínio conservado DSRM (Figura 16), o que reforça o pressuposto de que os primeiros 93 aminoácidos da ORF1 codificam uma proteína de ligação a dsRNA. Não foi identificado nesta proteína nenhum polimorfismo que alterasse o quadro de leitura de aminoácidos. A função exata da RBP ainda não está bem elucidada. Ela provavelmente desempenha um papel importante no encapsulamento do vírus e modulação da imunidade inata após expressão em células infectadas (TANG, et al., 2008). Sendo assim, podemos supor que sua função requer que a proteína não sofra nenhuma variação na sequência aminoacídica e/ou na sua estrutura proteica. A alta conservação intraespecífica observada tanto na sequência de aminoácidos quanto na estrutura da proteína, indica que as características da RBP estão sendo mantidas durante a evolução. Devido à baixa variação na sequência de nucleotídeos, essa região se caracteriza como uma boa região para estudos filogenéticos e desenhos de primers, assim como pode ser considerada como um bom alvo para agentes terapêuticos. De fato, foi observado que moléculas de RNA de interferência (RNAi) destinadas à RBP fornecem uma proteção eficiente para os camarões desafiados com IMNV (LOY et al., 2013). O gráfico gerado no Simplot ilustrou a variabilidade em toda a sequência genômica do IMNV e indicou a presença de três picos de menor escore de similaridade na primeira metade da ORF1, região que coincide com aquela que codifica as Small Proteins. Além disso, levando em consideração a região codificante, a maior densidade de sítios polimórficos, inclusive aqueles que alteram a sequência de aminoácidos, se encontra nesta região. Provavelmente a região que codifica as Small proteins é uma região hipervariável presente no genoma do IMNV 84 que só pôde ser detectada quando as novas sequências, IMNVgen1 e IMNVgen2, foram incluídas na comparação. Regiões hipervariáveis são definidas por comparações intragenômicas uma vez que não existe um valor absoluto que classifique uma região como hipervariável (GONZÁLEZ-CANDELAS & LÓPEZLABRADOR, 2013). Em alguns casos, regiões hipervariáveis podem ser identificadas usando o alinhamento de um pequeno número de sequências, como observado na região hipervariável da proteína VP2 do vírus da Doença Infecciosa de Gumboro (BAYLISS et al.,1990) ou na proteína VP1 do vírus Sacbrood (MINGXIAO et al., 2013) que foram identificadas usando três e sete sequências, respectivamente. Essas regiões geralmente são encontradas em proteínas estruturais (TSAREV et al., 1992). Em alguns vírus, regiões hipervariáveis estão associadas com infectividade viral e adaptação aos mecanismos do sistema imune do hospedeiro (BAYLISS et al., 1990; CARPENTER et al., 1991; ANJUM et al., 2013). Um ponto importante é que as Small Proteins codificadas por esta região são candidatas a codificarem as protrusões do IMNV (TANG et al., 2008). Alguns estudos tem mostrado que regiões hipervariáveis de diferentes vírus coincidem com as regiões que codificam as protrusões virais e que essas sequências estão envolvidas em vários mecanismos como a entrada do vírus na célula e neutralização de anticorpos (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010; PROMKUNTOD et al., 2014). Tang e colaboradores (2008) identificaram a uma resolução a 8-0 Å, que o capsídeo do IMNV possui protrusões com características de um complexo de fibras e densidade e resolução menor do que a proteína do capsídeo, o que pode ser explicado por sua flexibilidade lateral. A protrusão do IMNV compreende pelo menos três domínios morfológicos: knob, stalk e foot. Esses mesmos autores propuseram 85 que a protrusão do IMNV pode ser formada por um trímero composto por três moléculas de SP1 ou SP2. Nossos resultados de composição de aminoácidos e predição de estrutura secundária indicam que SP1 é uma proteína dobrada apresentando uma região N-terminal hidrofóbica não exposta a solvente (Figura 13). SP1 provavelmente é uma proteína globular e seu sítio hidrofóbico deve se encontrar no interior da estrutura. Sendo assim, ela possui características de um domínio knob, consistente com sua forma globular e alto conteúdo de folhas-β. Por outro lado, SP2 possui características de uma proteína fibrosa ou nativamente desdobrada, que apresenta alta mobilidade e motivos ricos em coiled coil, que possibilita sua interação com outras proteínas (MITRAKI et al., 1999; LANZA et al., 2008). A forma desdobrada móvel, alto conteúdo de aminoácidos carregados e a presença de coiled coil observados em SP2 (Figura 13) são características que se enquadram no domínio stalk, como observado nas protrusões de adenovírus (CHAPPELL et al., 2002). Nesse contexto, nossos dados apontam para uma nova visão na qual a protrusão do IMNV pode ser formada por um heteromultímero composto pelas proteínas SP1 e SP2 (Figura 24). Protrusões compostas por diferentes proteínas já foram observadas em outros vírus como o bacteriófago PRD, no qual a protrusão é formada pelas subunidades proteicas P5 e P2 (MERCKEL et al., 2005), e o bunyavirus, no qual as glicoproteínas G1 e G2 formam a protrusão viral (PERSSON & PETTEERSSON, 1991). A região estruturada localizada na porção C-terminal da proteína SP2 pode ser o domínio foot que está ancorado ao capsídeo (Figura 24). 86 Figura 24: Esquema proposto para a formação da protrusão do IMNV. A proteína SP1, que apresenta uma forma dobrada, corresponderia ao domínio knob da protrusão; enquanto que a proteína SP2, a qual se apresenta quase totalmente desestruturada, corresponderia ao domínio stalk. A região estruturada presente na porção C-terminal de SP2 representaria do domínio foot que está ancorado ao capsídeo. O capsídeo é responsável por proteger o material genético e também está envolvido no empacotamento viral e na especificidade para a adsorção, ou seja, o capsídeo está diretamente relacionado com a interação vírus-hospedeiro. Além da semelhança observada com outros monômeros (NAITOW et al., 2002; DUNN et al., 2013), o modelo gerado para a MCP do IMNV também mostrou uma possível região candidata a representar o “trench” como observado na MCP de ScV-L-A (NAITOW et al., 2002). Neste “trench” também foi possível identificar um resíduo de His 107 (destacado em azul na Figura 17), sugerindo uma possível atividade enzimática de remoção do cap5’ do mRNA para a MCP do IMNV. Existem poucos trabalhos direcionados ao estudo da estrutura de proteínas de totivírus. Entretanto, comparações de predição de estrutura secundária da MCP indicam a existência de 87 um core rico em α-hélice que é altamente conservado entre os totivírus e em micovírus de RNA dupla fita (DUNN et al., 2013). O segundo modelo para a MCP gerado no Phyre2 resultou em uma estrutura composta por três α-hélices (Figura Suplementar 6B), compreendendo os aminoácidos 518 a 590, que pode corresponder ao core rico em α-hélice conservado entre os totivírus. A ORF2 que provavelmente codifica a RdRp, apresentou-se mais conservada quando comparada a ORF1. O papel que a RdRp desempenha na replicação viral exige que sua sequência nucleotídica não sofra muita variação. O modelo tridimensional predito para a RdRp do IMNV foi semelhante a outros modelos já resolvidos para RNA polimerases virais como a RdRp do poliovírus e a RNA polimerase do bacteriófago T7 (Figura 18) (SOUSA et al., 1993; HANSEN, LONG & SCHULTZ, 1997), que se caracteriza por um formato semelhante a uma “right hand” e possui os domínios “thumb”, “fingers” e “palm”. É inesperado a ausência de estruturas β no modelo da RdRp do IMNV, uma vez que essas estruturas são comuns em outros modelos de RdRps já resolvidos (HANSEN, LONG & SCHULTZ, 1997; LOVE et al., 2004). No entanto, a ausência de folhas-β e alto conteúdo de αhélices corroboram com a predição feita pelo PredictProtein (Figura 15). Um segundo modelo gerado no software Phyre2 mostrou a presença de algumas estruturas β na RdRp do IMNV (Figura Suplementar 6C), mas somente 51% dos resíduos modelados apresentaram confiança maior que 50%. Portanto, nossos dados reforçam a hipótese de que a proteína codificada pela ORF2 trata-se realmente de uma RNA polimerase dependente de RNA. Em resumo, as proteínas envolvidas em interações com o RNA (RBP e RdRp) são mais conservadas do que as proteínas estruturais, possivelmente devido à função que cada tipo de proteína desempenha. 88 O estudo do genoma e dos possíveis produtos gênicos do IMNV possibilitou compreender um pouco mais sobre a biologia do vírus e definir quais seriam as principais proteínas alvo para o desenvolvimento de métodos de identificação e controle eficazes. Tsarev et al., (1992) sugere que regiões hipervariáveis podem ser utilizadas para caracterizar diferentes cepas virais mesmo que proximamente relacionadas através de métodos moleculares e imunológicos, enquanto que as sequências mais conservadas podem ser usadas no desenho de primers para detecção do patógeno. Levando em consideração a possível região hipervariável presente nas Small Proteins e a região mais conservada da RdRp, foi desenvolvido um novo método para o diagnóstico de diferentes isolados do IMNV. O sistema se mostrou eficiente na identificação de duas amostras diferentes contaminadas pelo vírus. Uma das principais vantagens deste novo sistema de detecção é que usando os primers SPF/SP-R, um fragmento de 456 pb que apresenta sítios polimórficos informativos é amplificado, podendo ser sequenciado. Este fragmento corresponde a uma parte da região que codifica as Small proteins e apresenta nove sítios polimórficos dos quais três causam alteração na sequência de aminoácidos. Comparando essa região foi possível diferenciar os quatro isolados do IMNV. A análise Neighbor joining usando o fragmento de 456 pb foi capaz de reconstituir os mesmos dois grupos mostrados na Figura 9. Esses resultados sugerem que esta pequena sequência possui informações que podem representar o genoma completo do IMNV, sendo suficiente para discriminar os quatro isolados estudados aqui. Todavia, a discriminação entre os quatro isolados só é possível após o sequenciamento do fragmento de 456 pb. O ideal seria um sistema que identificasse polimorfismos sem a necessidade de sequenciar. 89 Métodos que utilizam esse princípio são aqueles baseados em HRMA (HighResolution Melting Analysis) (REED & WITTWER, 2004; ARVIA, CORCIOLI & AZZI, 2013). A HRMA é capaz de discriminar isolados de uma mesma espécie pela identificação de polimorfismos de sítio único. Contudo, esses métodos requerem equipamentos e reagentes mais sofisticados o que os torna mais onerosos. Nesse contexto, uma tentativa de desenvolver um sistema de identificação de polimorfismos baseado na análise da curva de melting utilizando equipamentos e reagentes mais acessíveis foi realizada. Geralmente, as PCRs em tempo real geram curvas de melting a partir da desnaturação do DNA dupla fita. No presente estudo foi proposto um método de identificação de diferentes isolados do IMNV através da análise de curva de melting a partir da desnaturação do DNA simples fita. O objetivo do método é distinguir cepas diferentes com base na estrutura secundária do ácido nucleico que é refletida em curvas de melting características para cada isolado. De fato, as diferentes estruturas secundárias de RNA preditas refletiram em curvas de melting de fita simples distintas, como observado na Figura 23, indicando que o princípio do método é válido. Um estudo in silico recentemente desenvolvido em nosso laboratório aborda o uso da curva de melting de fita simples na identificação de diferentes variantes do totivírus que infecta Trichomonas vaginalis (OLIVEIRA et al., 2014). Nossos resultados preliminares não foram os esperados, provavelmente devido a uma falha na metodologia. Focamos as análises in vitro na desnaturação do DNA e o IMNV é um vírus de RNA. As estruturas secundárias preditas para os dois ácidos nucleicos (DNA e RNA) são diferentes e as curvas de melting de fita simples geradas in silico e in vitro representam a desnaturação do RNA e DNA, 90 respectivamente (Figuras 21 e 22). Sendo assim, é necessário direcionar os protocolos experimentais para a desnaturação do RNA de fita simples. 91 6 CONCLUSÃO Dois novos genomas completos do IMNV foram sequenciados, caracterizados e apresentaram 99% de identidade com outros dois genomas já descritos. O estudo filogenético mostrou um novo grupo taxonômico, denominado IMNV-like, que está mais próximo ao grupo GLV-like, mas ainda não é classificado pela ICVT. O grupo IMNV-like possivelmente poderá abranger um gênero ainda não descrito dentro da família Totiviridae. A partir da comparação entre os quatro genomas foi possível gerar um mapa de sítios polimórficos que abrange todo o genoma do IMNV. Este mapa possibilitou identificar as regiões mais conservadas e mais variáveis do genoma. O mapa de sítios polimórficos será essencial para posteriores estudos sobre a biologia do IMNV, assim como para a concepção de novos marcadores moleculares e desenvolvimento de terapias como aquelas baseadas em RNAi. A proteína que compreende os primeiros 93 aminoácidos da ORF1 não apresentou mutações que alterassem a sequência de aminoácidos. O modelo tridimensional obtido para esta proteína foi semelhante a estruturas já resolvidas para o domínio DSRM, o que reforça o pressuposto de que este produto gênico corresponde a uma proteína de ligação a dsRNA. 92 A região que possivelmente codifica as protrusões do IMNV é a mais variável do genoma, como observado em outros vírus de RNA. Esta região possivelmente direciona a evolução do vírus e, provavelmente, é um fator determinante de sua virulência. A estrutura tridimensional da MCP do IMNV mostrou uma forma semelhante a outros modelos de MCP já descritos e possibilitou inferir uma provável função enzimática de remoção do cap5’ do mRNA para esta proteína. A região que possivelmente codifica a RdRp do IMNV mostrou-se bastante conservada e o modelo estrutural gerado para esta proteína correspondeu à arquitetura típica de outras RNA polimerases, corroborando com o pressuposto de que a ORF2 realmente codifica uma RdRp. As regiões mais variáveis podem ser empregadas na caracterização de diferentes cepas virais, enquanto que as regiões mais conservadas podem ser utilizadas no desenho de primers para detectar o patógeno. A partir dos dados obtidos foi criado o primeiro sistema capaz de diferenciar isolados do IMNV com base a presença de polimorfismos. Este sistema e os resultados mostrados aqui serão o ponto de partida para elucidar a função das proteínas virais e sua correlação com a evolução do vírus, assim como para a identificação de marcadores de virulência no IMNV. 93 REFERÊNCIAS ABASCAL, F.; ZARDOYA, R.; POSADA, D. ProtTest: selection of best-fit models of protein evolution. Bioinformatics, [S.l.], v. 21, p. 2104-5, 2005. ALTSCHUL, S. F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, [S.l.], v. 25, p. 3389-3402, 1997. ANDRADE, T. P. D. et al. Real-time reverse transcription polymerase chain reaction assay using TaqMan probe for detection and quantification of Infection Myonecrosis Virus (IMNV). Aquaculture, Arizona – USA, v.264, p.9-15, 2007. ANDRADE, T. P.; LIGHTNER, D. V. Development of a method for the mediated isothermal amplification and nucleic acid lateral flow hybrid assay. Journal of Fish Diseases, [S.l.], v. 32, p. 911-24, 2009. ANJUM, S. et al. Additional Glycosylation Within a Specific Hypervariable Region of Subtype 3a of Hepatitis C Virus Protects Against Virus Neutralization. The Journal of Infectious Diseases, [S.l.], v. 208, p.1888-97, 2013. APTE-SENGUPTA, S. et al. Base of the Measles Virus Fusion Trimer Head Receives the Signal That Triggers Membrane Fusion. The Journal of Biological Chemistry, [S.l.], v. 287, p. 33026-33035, 2012. ARNOLD K. et al. The SWISS-MODEL Workspace: A web-based environment for protein structure homology modelling. Bioinformatics, [S.l.], v. 22, p.195-201, 2006. ARUNRUT, N.; SUEBSING, R.; KIATPATHOMCHAI, W. Rapid and sensitive detection of shrimp infectious myonecrosis virus using a reverse transcription loopmediated isothermal amplification and visual colorogenic nanogold hybridization probe assay. Journal of Virological Methods, [S.l.], v.193, p. 542-547, 2013. BACHÉRE, E. Shrimp immunity and diseases control. Aquaculture, [S.l.], v.191, p. 3-11, 2000. BAYLISS, C. D. et al. A comparison of the sequences of segment A of four infectious bursal disease virus strains and identification of a variable region in VP2. Journal of General Virology, [S.l.], v. 71, p. 1303-1312, 1990. BEKAERT, M.; ROUSSET, J. P. An extended signal involved in eukaryotic -1 frameshifting operates through modification of the E site tRNA. Molecular Cell, [S.l.], v.17, p. 61-68, 2005. BEKAERT, M. et al. Towards a computational model for21 eukaryotic frameshifting sites. Bioinformatics, [S.l.], v.19, p. 327-335, 2003. BELOUZARD, S. et al. Mechanisms of Coronavirus Cell Entry Mediated by the Viral Spike Protein. Viruses, [S.l.], v. 4, p. 1011-1033, 2012. 94 BIOMATTERS. Geneious. Copyright © 2005-2014 Biomatters Limited. Disponível em: <http://www.geneious.com/>. Acesso em: 13 mar. 2014. BITTAR, C. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l.], v. 23, p.10-36, 2010. BLAKE, R. D. et al. Statistical mechanical simulation of polymeric DNA melting with MELTSIM. Bioinformatics, [S.l.], v. 15, p. 370-375, 1999. BLANC, A.; GOYER, C.; SONENBERG, N. The coat protein of the yeast doublestranded RNA virus L-A attaches covalently to the cap structure of eukaryotic mRNA. Molecular Cell, [S.l.], v. 12, p. 3390-3398, 1992. CORTEY, M. et al. Genetic variability and phylogeny of Torque teno sus virus 1(TTSuV1) and 2 (TTSuV2) based on complete genomes. Veterinary Microbiology, [s.l.], v.148, p.125-131, 2011. BOTELHO-SOUZA, L. F. et al. Development of a reverse transcription quantitative real-time PCR-based system for rapid detection and quantitation of hepatitis delta virus in the western Amazon region of Brazil. Journal of Virological Methods, [S.l.], v.197, p.19-24, 2014. BRASIL. Ministério da Agricultura, Agropecuária e Abastecimento. Plataforma tecnológica do camarão marinho cultivado. Brasília: MAPA, 2001. BRUENN, J. A. A structural and primary sequence comparison of the viral RNAdependent RNA polymerases. Nucleic Acids Research, [S.l.], v. 31, p.1821-1829, 2003. BURD, C. G.; DREYFUSS, G. Conserved structures and diversity of functions of RNA-binding proteins. Science, [S.l.], v. 265, p. 615-21, 1994. CARPENTER, S. et al. Identification of a Hypervariable Region in the Long Terminal Repeat of Equine Infectious Anemia Virus. Journal of Virology, [S.l.], p.1605-1610, 1991. CAVANAGH, D.; DAVIS, P. J.; MOCKETT, A. P. A. Amino acids within hypervariable region 1 of avian coronavirus IBV (Massachusetts serotype) spike glycoprotein are associated with neutralization epitopes. Virus Research, [S.l.], v.11, p.141-150, 1988. CHAIVISUTHANGKURA, P. et al. Simple and rapid detection of infectious myonecrosis virus using an immunochromatographic strip test. Archives of Virology, [S.l.], p. 1925-1930, 2013. CHAPPELL, J. D. et al. Crystal structure of reovirus attachment protein sigma1 reveals evolutionary relationship to adenovirus fiber. EMBO Journal, [S.l.], v. 21, p. 1-11, 2002. 95 CHAYAMA, K. et al. Pretreatment virus load and multiple amino acid substitutions in the interferon sensitivity determining region predict the outcome of interferon treatment in patients with chronic genotype 1b hepatitis C virus infection. Hepatology, [S.l.], v. 25, p. 745-749, 1997. CHEN, V. B. et al. C. MolProbity: all-atom structure validation for macromolecular crystallography. Acta Crystallographica, [S.l.], v. 66, p.12-21, 2010. CLYDE, K.; BARRERA, J.; HARRIS, E. The capsid-coding region hairpin element (cHP) is a critical determinant of dengue virus and West Nile virus RNA synthesis. Virology, [S.l.], v. 379, p.314-323, 2008. COWLEY, J. A. et al. Vertical transmission of gill-associated virus (GAV) in the black tiger prawn Penaeus monodon. Diseases of Aquatic Organisms, [S.l.], v. 50, p.95104, 2002. DINMAN, J. D.; ICHO, T.; WICKNER, R. B. A21 ribosomal frameshift in a doublestranded RNA virus of yeast forms a gag–pol fusion protein. Proceedings of the National Academy of Sciences U S A, v. 88, p.174-178,1991. DRUMMOND, A. J.; RAMBAUT, A. BEAST: Bayesian evolutionary analysis by sampling trees. BMC evolutionary biology, [S.l.], v. 7, p. 214, 2007. DRUMMOND, A. J. et al. Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, [S.l.], v. 29, p. 1969-73, 2012. DUNN, S. E. et al. Three-dimensional Structure of Victorivirus HvV190S Suggests Coat Proteins in Most Totiviruses Share a Conserved Core. PLOS Pathogens, [S.l.], v. 9, e1003225, 2013. ENJUANES, L. et al. Biochemical aspects of coronavirus replication and virus-host interaction. Annual Review Microbiology, [S.l.], v. 60, p.2 11-230, 2006. ENOMOTO, N. et al. Mutations in the nonstructural protein 5A gene and response to interferon in patients with chronic hepatitis C virus 1b infection. New England Journal of Medicine, [S.l.], v. 334, p. 77-81, 1996. EWING, B.; GREEN, P. Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Research, [S.l.], v. 8, p.186-194, 1998. FAO. The State of World Fisheries and Aquaculture 2008. Roma, 2008. FEIJÓ, R. G. et al. Infectious myonecrosis vírus and White spot syndrome vírus coinfection in Pacific White shrimp (Litopenaeus vannamei) farmed in Brazil. Aquaculture, [S.l.], v. 380-383, p.1-5, 2013. FLEGEL, T. W. et al. Presence of multiple viruses in non-diseased, cultivated shrimp at harvest. Aquaculture, [S.l.], v. 240, p.55-68, 2004. 96 FRAGA, J. et al. Genetic characterization of three Cuban Trichomonas vaginalis virus. Phylogeny of Totiviridae family. Infection, Genetics and Evolution, [S.l.], v.12, p.113-120, 2012. GHABRIAL, S. Totiviruses. In: MAHY, B. W. J.; VAN REGENMORTEL M. H. V. Encyclopedia of Virology. 3. ed. San Diego: Academic Press/Elsevier, 2008. GONZÁLEZ-CANDELAS, F.; LÓPEZ-LABRADOR, F. X. Brenner's Encyclopedia of Genetics. 2. ed. [S.l.: s.n], 2013. HANSEN, J. L.; LONG, A. M.; SCHULTZ, S. C. Structure of the RNA-dependent RNA polymerase of poliovirus. Structure, [S.l.], v. 5, p.1109-1122, 1997. HOA, T. et al. Genotypic variations in tandem repeat DNA segments between ribonucleotide reductase subunit genes of white spot syndrome virus (WSSV) isolates from Vietnam, In: WALKER, P., LESTER, R., REANTASO, M. (Ed.). Diseases in Asian Aquaculture V, Manila: 2005, p.395-403. HOFACKER, I. L. et al. Fast Folding and Comparison of RNA Secondary Structures. Monatshefte für Chemie, [S.l.], v. 125, p.167-188, 1994. HOFMANN, K.; STOFFEL, W. TMbase - A database of membrane spanning proteins segments. Biological Chemistry Hoppe-Seyler, [S.l.], v. 374, p.166, 1993. HUANG, L. et al. Hepatitis C Virus Nonstructural Protein 5A (NS5A) Is an RNAbinding Protein. The Journal of Biological Chemistry, [S.l.], v. 280, p. 3641736428, 2005. JACKS, T. et al. Characterization of ribosomal frameshifting in HIV-1 gag–pol expression. Nature, [S.l.], v. 331, p. 280-283, 1988. JIRAVANICHPAISAL, P.; LEE, B. L.; SÖDERHÄLL, K. Cell-mediated immunity in arthropods: hematopoiesis, coagulation, melanization and opsonization. Immunobiology, [S.l.], v. 211, p. 213-236, 2006. KATOH, K.; TOH, H. Parallelization of the MAFFT multiple sequence alignment program. Bioinformatics, [S.l.], v. 26, p.1899-900, 2010. KATOH, K.; FRITH, M. C. Adding unaligned sequences into an existing alignment using MAFFT and LAST. Bioinformatics, [S.l.], v. 28, p. 3144-3146, 2012. KEARNEY, M. et al. Frequent polymorphism at drug resistance sites in HIV-1 protease and reverse transcriptase. AIDS, [S.l.], v. 22, p. 497-501, 2008. KELLEY, L. A.; STERNBERG, M. J. E. Protein structure prediction on the Web: a case study using the Phyre server. Nature Protocols, [S.l.], v. 4, p. 363-371, 2009. KING, A. M. Q. et al. The most recent report of the ICTV: Virus taxonomy: classification and nomenclature of viruses: Ninth Report of the International Committee on Taxonomy of Viruses. San Diego: Elsevier Academic Press, 2012. 97 KOK, C. C.; MCMINN, P. C. Picornavirus RNA-dependent RNA polymerase. The International Journal of Biochemistry & Cell Biology, [S.l.], v. 41, p. 498–502, 2009. KORAKA, P. et al. RNA secondary structures in the proximal 3’UTR of Indonesian Dengue 1 virus strains. Virus Research, [S.l.], v.142, p. 213-216, 2009. KUNANOPPARAT, A. et al. Detection of infectious myonecrosis virus using monoclonal antibody specific to N and C fragments of the capsid protein expressed heterologously. Journal of Virological Methods, [S.l.], v.171, p.141-148, 2011. KUROSAKI, M. et al. Analysis of genotypes and amino acid residues 2209 to 2248 of the NS5A region of hepatitis C virus in relation to the response to interferon-beta therapy. Hepatology, [S.l.], v. 25, p. 750-753, 1997. KURTZ, J. Memory in the innate and adaptive immune systems. Microbes and Infection, [S.l.], v. 6, p. 1410-7, 2004. LAI, Y. et al. Viral Double-Strand RNA-Binding Proteins Can Enhance Innate Immune Signaling by Toll-Like Receptor 3. PLoS ONE, [S.l.], v. 6, p.e25837, 2011. LANA, D. P.; BEISEL, C. E.; SILVA, R. F. Genetic mechanisms of antigenic variation in infectious bursal disease virus: analysis of a naturally occurring variant virus. Virus Genes, [S.l.], v. 6, p. 247-59, 1992. LANZA, D. C. F. et al. Human FEZ1 has characteristics of a natively unfolded protein and dimerizes in solution. Proteins, [S.l.], v. 74, p. 104-121, 2008. LARKIN, M. A. et al. Clustal W and Clustal X version 2.0. Bioinformatics, [S.l.], v. 23, p. 2947-2948, 2007. LEE, D-K. et al. Heterogeneity in spike protein genes of porcine epidemic diarrhea viruses isolated in Korea. Virus Research, [S.l.], v. 149, p.175-182, 2010. LI, L.; WANG, A. L.; WANG, C. C. Structural analysis of the -1 ribosomal frameshift elements in giardiavirus mRNA. Journal of Virology, [S.l.], v. 75, p. 10612-10622, 2001. LIGHTNER, D. V. Virus diseases of farmed shrimp in the Western Hemisphere (the Americas): A review. Journal of Invertebrate Pathology, [S.l.], v.106, p.110-130, 2011. LIGHTNER, D. V.; PANTOJA, C. R. Infectious Myonecrosis (IMV): current status report on the biology of etiological agent and development of diagnostic methods. In: FEIRA NACIONAL DO CAMARÃO (FENACAM). Natal, Rio Grande do Norte, Anais p. 22, 2004. LIGHTNER, D. V. et al. Infectious myonecrosis: a new disease in Pacific White shrimp. Global Aquaculture Advocate, [S.l.], v. 7, p. 85, 2004. 98 LIU, H. et al. Evolutionary genomics of mycovirus-related dsRNA viruses reveals cross-family horizontal gene transfer and evolution of diverse viral lineages. BMC Evolutionary Biology, [S.l.], v.12, p.91, 2012. LIU, H.; SÖDERHÄLL, K.; JIRAVANICHPAISAL, P. Antiviral immunity in crustaceans. Fish and Shellfish Immunology, [S.l.], v. 27, p. 79-88, 2009. LIU, H-L. et al. A real-time PCR for the detection of infectious myonecrosis virus in penaeid shrimp. Journal of Invertebrate Pathology, [S.l.], v. 113, p. 237-239, 2013. LOLE, K. S. et al. Full-length human immunodeficiency virus type 1 genomes from subtype C-infected seroconverters in India, with evidence of intersubtype recombination. Journal of Virology, [S.l.], v. 73, p. 152-60, 1999. LOTZ, J. M. Special topic review: Viruses, biosecurity and specific pathogen-free stocks in shrimp aquaculture. Journal of Microbiology & Biotechnology, [S.l.], v.13, p. 405-413, 1997. LOTZ, J. M.; ANTON, L. S.; SOTO, M. A. Effect of chronic Taura syndrome virus infection on salinity tolerance of Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l.], v. 65, p. 75-78, 2005. LOVE, R. A. et al. The Crystal Structure of the RNA-Dependent RNA Polymerase from Human Rhinovirus: A Dual Function Target for Common Cold Antiviral Therapy. Structure, v.12, p.1533–1544, 2004. LOY, J. D. et al. Sequence-optimized and targeted double-stranded RNA as a therapeutic antiviral treatment against infectious myonecrosis virus in Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l], v.105, p. 57-64, 2013. LOY, J. D. et al. dsRNA provides sequence-dependent protection against infectious myonecrosis virus in Litopenaeus vannamei. Journal of General Virology, [S.l.], v.93, p. 880–888, 2012. LU, Y. et al. Infection of the yellow head baculo-like virus (YBV) in two species of penaeid shrimp Penaeus stylirostris (Stimpson) and Penaeus vannamei (Boone). Journal of Fish Diseases, [S.l.], v. 17, p. 649–656, 1994. LUPAS, A.; VAN DYKE, M.; STOCK, J. Predicting Coiled Coils from Protein Sequences. Science, [S.l.], v. 252, p.1162-1164, 1991. MADRID, R. M. A crise econômica da carcinicultura. Panorama da Aquicultura, [S.l.], v. 90, p. 22–29, 2005b. MADRID, R. M. A Dança dos Preços na Carcinicultura Brasileira e Desafios de Competitividade. Revista da ABCC, [S.l.], n. 7, p. 52-61, 2005a. MADRID, R. M. Programa de apoio ao desenvolvimento do cultivo de camarão marinho (Versão preliminar). Brasília: MAA, 1999. 99 MARCHLER-BAUER, A. et al. CDD: a Conserved Domain Database for the functional annotation of proteins. Nucleic acids research, [S.l.], v. 39, p. D225-9, 2011. MARKS, H. et al. Genetic variation among isolates of white spot syndrome virus. Archives of Virology, [S.l.], v. 149, p. 673–697, 2004. McBRIDGE, M. S.; PANGANIBAN, A.T. The Human Immunodeficiency Virus Type 1 Encapsidation Site Is a Multipartite RNA Element Composed of Functional Hairpin Structures. Journal of Virology, [S.l.], v. 70, p. 2963-2973, 1996. MELLO, M. V. et al. Purification of infectious myonecrosis virus (IMNV) in species of marine shrimp Litopenaeus vannamei in the State of Ceará. Journal of Virological Methods, [S.l.], v.177, p.10-14, 2011. MERCKEL, M. C. et al. The Structure of the Bacteriophage PRD1 Spike Sheds Light on the Evolution of Viral Capsid Architecture. Molecular Cell, [S.l.], v.18, p.161-170, 2005. MINGXIAOA, M. et al. Genetic characterization of VP1 gene of seven Sacbrood virus isolated from three provinces in northern China during the years 2008– 2012. Virus Research, [S.l.], v.176, p. 78-82, 2013. MITRAKI, A. et al. Unfolding studies of human adenovirus type 2 fibre trimmers: Evidence for a stable domain. European Journal of Biochemistry, [S.l.], v. 264, p. 599-606, 1999. MOSS, S. M. Marine shrimp farming in the western hemisphere: past problems, present solutions, and future visions. Reviews in Fisheries Science, [S.l.], v.10, p. 601-620, 2002. MINISTÉRIO DA PESCA E AQUICULTURA. Produtores de camarão e MPA criam agenda positiva para o desenvolvimento da carcinicultura nacional. Disponível em: <http://www.mpa.gov.br/index.php/imprensa/noticias/2963-produtores-decamarao-e-mpa-criam-agenda-positiva-para-o-desenvolvimento-da-carciniculturanacional>. Acesso em: 18 jun. 2014. MUSTHAQ, S. S. et al. Variability in the tandem repetitive DNA sequences of white spot syndrome virus (WSSV) genome and suitability of VP28 gene to detect different isolates of WSSV from India. Aquaculture, [S.l.], v. 256, p. 34-41, 2006. NAGATA, L. P. et al. Infectivity variation and genetic diversity among strains of Western equine encephalitis virus. Journal of General Virology, [S.l.], v. 87, p. 2353-61, 2006. NAIM, S.; BROWN, J. K.; NIBERT, M. L. Genetic diversification of penaeid shrimp infectious myonecrosis virus between Indonesia and Brazil. Virus Research, [S.l.], v.189, p. 97-105, 2014. 100 NAITOW, H. et al. L-A virus at 3.4 Å resolution reveals particle architecture and mRNA decapping mechanism. Nature Structural Biology, [S.l.], v. 9, p. 725-728, 2002. NIBERT, M. L.; TAKAGI, Y. Fibers come and go: differences in cell-entry components among related dsRNA viruses. Current Opinion in Virology, [S.l.],v.3, p. 20-26, 2013. NIBERT, M. L. ‘2A-like’ and ‘shifty heptamer’ motifs in penaeid shrimp infectious myonecrosis virus, a monosegmented double-stranded RNA virus. Journal of General Virology, [S.l.], v. 88, p.1315- 318, 2007. NOTREDAME, C.; HIGGINS, D. G.; HERINGA, J. T-Coffee: A Novel Method for Fast and Accurate Multiple Sequence Alignment. Journal of Molecular Biology, [S.l.], v. 302, p. 205-217, 2000. NUNES, A. J. P.; MARTINS, P. C. C.; GESTEIRA, T. C. V. Carcinicultura ameaçada. Revista Panorama da Aquicultura, [S.l.], v. 83, p. 37-51, 2004. O’REILLY, E. K.; KAO, C. C. Analysis of RNA-Dependent RNA Polymerase Structure and Function as Guided by Known Polymerase Structures and Computer Predictions of Secondary Structure. Virology, [S.l.], v. 252, p. 287-303, 1998. OFFICE INTERNATIONAL ESPIZOTICS. Infectious myonecrosis virus. In: Manual of Diagnostic Tests for Aquatic Animals. Paris, France: Office International des Epizooties, 2009. p. 96-104. OLIVEIRA, R. A. C. et al. In silico single strand melting curve: A new approach to identify nucleic acid polymorphisms in Totiviridae. BMC Bioinformatics, [S.I.], v.15, p. 243, 2014. ORMOND, J. G. P. A carcinicultura brasileira. Rio de Janeiro: BNDES, n.19, p.91118, 2004. OVERSTREET, R. M. et al. Susceptibility to TSV of some penaeid shrimp native to the Gulf of Mexico and southeast Atlantic Ocean. Journal of Invertebrate Pathology, [S.l.], v. 69, p.165-176, 1997. PENG, S. E. et al. The transition from pre-patent to patent infection of white spot syndrome virus (WSSV) in Penaeus monodon triggered by pereiopod excision. Fish Pathology, [S.l.], v.33, p.395-400, 1998. PERLMAN, S.; NETLAND, J. Coronaviruses post-SARS: Update on replication and pathogenesis. Nature Reviews Microbiology, [S.l.], v. 7, p. 439-450, 2009. PERSSON, R.; PETTEERSSON, R. F. Formation and intracellular transport of a heterodimeric viral spike protein complex. The Journal of Cell Biology, [S.l.], v.112, p. 257-266, 1991. 101 PETTERSEN, E. F. et al. UCSF Chimera - a visualization system for exploratory research and analysis. Journal of Computational Chemistry, [S.l.], v. 25, p.16051612, 2004. PINHEIRO, A. C. A. S. et al. Epidemiological status of Taura syndrome and Infectious myonecrosis viruses in Penaeus vannamei reared in Pernambuco (Brazil). Aquaculture, [S.l], v. 262, p.17-22, 2007. PINHO, J. R. R. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l], v.10, p. 36, 2010. POCH, O. et al. Identification of four conserved motifs among the RNA-dependent polymerase encoding elements. The EMBO Journal, [S.l.], v. 8, p. 3867-3874, 1989. PORTELA, A.; DIGARD, P. The influenza virus nucleoprotein: a multifunctional RNAbinding protein pivotal to virus replication. Journal of General Virology, [S.l.], v.83, p.723-734, 2002. POULOS, B. T.; LIGHTNER, D. V. Detection of infectious myonecrosis virus (IMNV) of penaeid shrimp by reverse-transcriptase polymerase chain reaction (RT-PCR). Diseases of Aquatic Organisms, [S.l.], v. 73, p. 69-72, 2006. POULOS, B. T. et al. Purification and characterization of infectious myonecrosis virus of penaeid shrimp. Journal of General Virology, [S.l], v. 87, p.987-996, 2006. PRILUSKY, J. et al. FoldIndex©: a simple tool to predict whether a given protein sequence is intrinsically unfolded. Bioinformatics, v. 21, p. 3435–3438, 2005. PROMKUNTOD, N. et al. Mapping of the receptor-binding domain and amino acids critical for attachment in the spike protein of avian coronavirus infectious bronchitis virus. Virology, [S.l.], v. 448, p. 26-32, 2014. PUDUPAKAM, R. S. et al. Mutational Analysis of the Hypervariable Region of Hepatitis E Virus Reveals Its Involvement in the Efficiency of Viral RNA Replication. Journal of Virology, [S.l.], v. 85, p.10031-10040, 2011. PUTHAWIBOOL, T. et al. Detection of shrimp infectious myonecrosis virus by reverse transcription loop-mediated isothermal amplification combined with a lateral flow dipstick. Journal of Virological Methods, [S.l.], v.156, p. 27-31, 2009. QAAD 2006 - Quarterly Aquatic Animal Disease Report (Asia and Pacific Region), NACA: Bangkok, Thailand. 2006/2, April-June 2006. Não entendi REED, G. H.; WITTWER, C. T. Sensitivity and Specificity of Single-Nucleotide Polymorphism Scanning by High-Resolution Melting Analysis. Clinical Chemistry, [S.l.], v.50, p.1748-1754, 2004. ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n.3, p. 6, 2005a. 102 ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n. 4, p. 4, 2005b. RONQUIST, F.; HUELSENBECK, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, [S.l.], v.19, p.1572-4, 2003. RONQUIST, F. et al MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Systematic biology, [S.l.], v. 61, p.53942, 2012. ROST, B.; YACHDAV, G.; LIU, J. The PredictProtein server. Nucleic Acids Research, [S.l.], v. 32, p. 321-326, 2004. ROY, A.; KUCUKURAL, A.; ZHANG, Y. I-TASSER: a unified platform for automated protein structure and function prediction. Nature Protocols, [S.l.], v.5, p.725-738, 2010. SANCHEZ-MARTINEZ, J. G. et al. White spot syndrome virus in cultured shrimp: a review. Journal of Aquaculture Research, [S.l.], v. 38, p.1339-1354, 2007. SANO, T. et al. Identification of multiple structural domains regulating viroid pathogenicity Proceedings of the National Academy of Sciences USA, [S.l.], v.89, p.10104-10108, 1992. SEIBERT, C. H. et al. Detection of major capsid protein of infectious myonecrosis virus in shrimps using monoclonal antibodies. Journal of Virological Methods, [S.l.], v. 169, p.169-175, 2010. SENAPIN, S. et al. Outbreaks of infectious myonecrosis virus (IMNV) in Indonesia confirmed by genome sequencing and use of an alternative RT-PCR detection method. Aquaculture, [S.l.], v. 266, p. 32-38, 2007. SILVA, D. C. D. et al. Infectious hypodermal and hematopoietic necrosis virus from Brazil: Sequencing, comparative analysis and PCR detection. Virus Research, [S.l.], v. 189, p.136-146, 2014. SILVA, S. M. B. C.; PINHEIRO, A. C. A. S.; COIMBRA, M. R. M. Quantitation of infectious myonecrosis virus in different tissues of naturally infected Pacific white shrimp, Litopenaeus vannamei, using real time PCR with SYBR Green chemistry. Journal of Virological Methods, [S.l.], v.177, p.197-201, 2011. SOUSA, R. et al. Crystal structure of bacteriophage T7 RNA polymerase at 3.3 Å resolution. Nature, [S.l.], v. 364, p. 593-599, 1993. STEITZ, T. A. DNA Polymerases: Structural Diversity and Common Mechanisms. The Journal of Biological Chemistry, [S.l.], v. 274, p. 17395-17398, 1999. 103 TABLER, M.; SFINGER, H. L. Infectivity studies on different potato spindle tuber viroid (PSTV) RNAs synthesized in vitro with the SP6 transcription system. The EMBO Journal, [S.l.], v. 4, p. 2191-2199, 1985. TAMURA, K. et al. MEGA6: Molecular Evolutionary Genetics Analysis Version 6.0. Molecular Biology and Evolution, [S.l.], v. 30, p. 2725-2729, 2013. TAN, Y. et al. Molecular detection of three shrimp viruses and genetic variation of white spot syndrome virus in Hainan Province, China, in 2007. Journal of Fish Diseases, [S.l.], v. 32, p. 777-784, 2009. TANG, J. et al. Infectious myonecrosis virus has a totivirus-like, 120-subunit capsid, but with fiber complexes at the fivefold axes. PNAS, [S.l.], v.105, n.4 5, p.17.52617.531, 2008. TANG, K. F. J.; LIGHTNER, D. V. Quantification of white spot syndrome virus DNA through a competitive polymerase chain reaction. Aquaculture, [S.l.], v.189, p.11-21, 2000. TANG, K. F. J. et al. V. In situ hybridization demonstrates that Litopenaeus vannamei, L. stylirostris and Penaeus monodon are susceptible to experimental infection with infectious myonecrosis virus (IMNV). Diseases Aquatic Organisms, [S.l.], v. 63, p. 261-265, 2005. TSAREV, S. A. et al. Characterization of a prototype strain of hepatitis E virus. Proceedings of the National Academy of Sciences, [S.l.], v. 89, p. 559-563, 1992. TSAI, P-L. et al. Cellular RNA Binding Proteins NS1-BP and hnRNP K Regulate Influenza A Virus RNA Splicing. PLOS Pathogens, [S.l.], v. 9, p.1003460, 2013. VALLONE, P. M.; BUTLER, J. M. AutoDimer: a screening tool for primer-dimer and hairpin structures. BioTechniques, [S.l.], v. 37, p. 226-231, 2004. WAHEED, Y.; BHATTI, A.; ASHRAF, M. RNA dependent RNA polymerase of HCV: A potential target for the development of antiviral drugs. Infection, Genetics and Evolution, [S.l.], v.14, p. 247–257, 2013. WANG, A. L. et al. Giardiavirus double-stranded RNA genome encodes a capsid polypeptide and a gag–pol-like fusion protein by a translational frameshift. Proceedings of the National Academy of Sciences USA, [S.l.], v. 90, p. 8595– 8599, 1993. WATERHOUSE, A. M. et al. Jalview Version 2 - a multiple sequence alignment editor and analysis workbench. Bioinformatics, [S.l.], v. 25, p. 1189-1191, 2009. WEIRATHER, J. L. et al. Serial Quantitative PCR Assay for Detection, Species Discrimination, and Quantification of Leishmania spp. in Human Samples. Journal of Clinical Microbiology, [S.l.], v. 49, p. 3892-3904, 2011. 104 WIJEGOONAWARDANE, P. K. et al. Genetic diversity in the yellow head nidovirus complex. Virology, [S.l.], v. 380, p. 213-25, 2008. ZHANG, Y. I-TASSER server for protein 3D structure prediction. BMC Bioinformatics, [S.l.], v. 9, p. 40, 2008. ZHANG, Y. Template-based modeling and free modeling by I-TASSER in CASP7. Proteins, [S.l.], v. 69, p.108-117, 2007. ZONG, J. C. et al. Evaluation of global clustering patterns and Strain variation over and extended ORF26 gene locus from Kaposi’ Sarcoma herpesvirus. J Clin Virol., [S.l.], v. 40, p.19-25, 2007. 105 APÊNDICE 106 Tabela Suplementar 1: Nome e números de acesso das sequências dos totivírus usados neste estudo agrupados de acordo com a análise filogenética. Nome do vírus Nº de acesso Abreviação CCC42235.1 YP_004089630.1 YP_001109580.1 NP_619670.2 YP_024728.1 NP_898833 AAS68036.1 YP_122352.1 BeauV TcV-1 BotryV HvV-190S ChalElV HmV1-17 ThielaV MoV-1 MoV-like Beauveria bassiana RNA virus 1 Tolypocladium cylindrosporum virus 1 Botryotinia fuckeliana totivirus 1 Helminthosporium victoriae virus 190S Chalara elegans RNA virus 1 Helicobasidium mompa totivirus 1-17 Thielaviopsis basicola dsRNA virus 1 Magnaporthe orzyae virus 1 IMNV-like Penaeid shrimp infectious myonecrosis virus AAT67231.2 Tianjin totivirus AFE02920.1 Omono river virus BAJ21511.1 Drosophila melanogaster totivirus SW-2009a YP_003289293.1 Armigeres subalbatus virus SaX06-AK20 YP_003934934.1 GLV-like Piscine myocarditis virus AL V-708 YP_004581250.1 Giardia canis virus from China (2883-5981)* DQ238861.1 Giardia lamblia virus (2880-5978)* NC_003555.1 ZbV-like Blueberry latent virus isolate AR (936-3332)* HM029248.1 Southern tomato virus isolate Mexico-1(1039-3327)* EF442780.1 Zygosaccharomyces bailii virus Z NP_624325.1 ScV-like Ustilago maydis virus H1 (735-6002)* NC_003823.1 Saccharomyces cerevisiae virus L-BC (La) NP_042581.1 Saccharomyces cerevisiae virus L-A NP_620495.1 Black raspberry virus F YP_001497151.1 Tuber aestivum virus 1 ADQ54106.1 GaRV-like Sphaeropsis sapinea RNA virus 2 AAD11603.1 Coniothyrium minitans RNA virus YP_392467.1 Epichloe festucae virus 1 CAK02788.1 Gremmeniella abietina RNA virus L2 AAT48885.1 Outras sequências Eimeria brunetti RNA virus 1 NP_108651.1 IMNV TianV ORV DmV-SW-2009ª AsV-SaX06-AK20 PMV-AL V-708 GCV GLV2 BLV STV ZbV-Z UmV-H1 ScV L-BC ScV L-A BRV-F TaV-1 SphaeroV CmRV EpiFesV GaRV-L2 EbRV-1 *O número de acesso corresponde à sequência de nucleotídeos do genoma completo. Números entre parênteses correspondem ao primeiro e último nucleotídeo da sequência que codifica a RdRp. 107 Tabela Suplementar 2: Nome e números de acesso das sequências dos Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados de acordo com a análise filogenética. Nome do vírus Nº de acesso Abreviação AED99796.1 AED99794.1 AED99798.1 TVV4-1 TVV4-OC3 TVV4-OC5 AED99800.1 AED99804.1 AED99802.1 NP_659390.1 TVV3-UR1 TVV3-OC5 TVV3-OC3 Trichomonasvirus_3 AED99808.1 AED99806.1 AED99810.1 NP_624323.2 AET81014.1 AET81016.1 TVV2-OC3 TVV2-UR1 TVV2-OC5 Trichomonasvirus_II TVV2-C76 TVV2-C351 NP_620730.2 AET81012.1 AED99814.1 AED99818.1 AED99816.1 AED99812.1 AED99820.1 Trichomonasvirus_I TVV1-C344 TVV1-UH9 TVV1-OC4 TVV1-OC3 TVV1-UR1 TVV1-OC5 NP_043465.1 NP_619653.1 NP_041191.1 LRV 2-1 LRV 1-4 LRV 1-1 ABB36743.1 AAM77694.1 NP_620070.1 GCV GLV1 GLV2 TVV4 Trichomonas vaginalis virus 4 strain TVV4-1 Trichomonas vaginalis virus 4 strain TVV4-OC3 Trichomonas vaginalis virus 4 strain TVV4-OC5 TVV3 Trichomonas vaginalis virus 3 strain TVV3-UR1 Trichomonas vaginalis virus 3 strain TVV3-OC5 Trichomonas vaginalis virus 3 strain TVV3-OC3 Trichomonas vaginalis virus 3 TVV2 Trichomonas vaginalis virus 2 strain TVV2-OC3 Trichomonas vaginalis virus 2 strain TVV2-UR1 Trichomonas vaginalis virus 2 strain TVV2-OC5 Trichomonas vaginalis virus II Trichomonas vaginalis virus 2 isolate C76 Trichomonas vaginalis virus 2 isolate C351 TVV1 Trichomonas vaginalis virus Trichomonas vaginalis virus 1 isolate C344 Trichomonas vaginalis virus 1 strain TVV1-UH9 Trichomonas vaginalis virus 1 strain TVV1-OC4 Trichomonas vaginalis virus 1 strain TVV1-OC3 Trichomonas vaginalis virus 1 strain TVV1-UR1 Trichomonas vaginalis virus 1 strain TVV1-OC5 LRV-like Leishmania RNA virus 2 - 1 Leishmania RNA virus 1 - 4 Leishmania RNA virus 1 - 1 GLV-like Giardia canis virus from China Giardia lamblia virus Giardia lamblia virus 108 Tabela Suplementar 3: Identificação do IMNV em amostras de camarão marinho Litopenaeus vannamei. Amostra Procedência Data da coleta Data PCR Data eletroforese Resultado Resultado nested V13/L1246 CBV15/L1247 LOTE CB 1242-1 150UP V13/L1246 CBV15/L1247 LOTE CB 1242-1 19 150/UP B6A/Lote: 06 CB V1/LOTE 1256 V06/L1235 V05/L1238 CB Camanor Camanor Camanor Camanor Camanor Camanor Camanor Camanor Camanor Camanor 02/09/2011 04/09/2011 27/08/2011 02/09/2011 04/09/2011 27/08/2011 01/09/2011 13/10/2011 02/09/2011 02/09/2011 09/11/2012 09/11/2012 09/11/2012 19/11/2013 19/11/2013 19/11/2013 20/11/2012 20/11/2012 20/11/2012 20/11/2012 14/11/2012 14/11/2012 14/11/2012 20/11/2012 20/11/2012 20/11/2012 21/11/2012 21/11/2012 21/11/2012 21/11/2012 Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo CBV16 - PLS (CBV11 R2-7 14353) P/S Aquatec Lote CBV18 R2-1 14.383 Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Camanor SEM DATA 20/11/2012 21/11/2012 Negativo Negativo B6A/Lote: 06 Camanor 01/09/2011 04/12/2012 04/12/2012 - - V06/L1235 Camanor 02/09/2011 04/12/2012 04/12/2012 - - CB V1/LOTE 1256 Camanor 13/10/2011 04/12/2012 04/12/2012 - - B6A/Lote: 06 Camanor 01/09/2011 06/12/2012 06/12/2012 - - V06/L1235 Camanor 02/09/2011 06/12/2012 06/12/2012 - - CB V1/LOTE 1256 CB V09/Lote: 1239 Camanor Camanor 13/10/2011 12/09/2011 06/12/2012 06/12/2012 06/12/2012 06/12/2012 - - Observações Primers F13/R13 e F13N/R13N / Camarão morto Primers F13/R13 e F13N/R13N Primers F13/R13 e F13N/R13N Primers OIE Primers OIE Primers OIE Primers F13/R13 e F13N/R13N Primers F13/R13 e F13N/R13N Primers F13/R13 e F13N/R13N Primers F13/R13 e F13N/R13N Primers F13/R13 e F13N/R13N / Larvas Primers F13/R13 e F13N/R13N / Larvas Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Utilização do Primer 13 / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR 109 V7-L1257 CB Camanor 07/11/2011 06/12/2012 06/12/2012 - - CB BV1/1250 Camanor 20/10/2011 06/12/2012 06/12/2012 - - B6A/Lote: 06 Camanor 01/09/2011 10/12/2012 10/12/2012 - - V06/L1235 Camanor 02/09/2011 10/12/2012 10/12/2012 - - CB V1/LOTE 1256 Camanor 13/10/2011 10/12/2012 10/12/2012 - - CB V09/Lote: 1239 Camanor 12/09/2011 10/12/2012 10/12/2012 - - V7-L1257 CB Camanor 07/11/2011 10/12/2012 10/12/2012 - - CB BV1/1250 Camanor 20/10/2011 10/12/2012 10/12/2012 - - B6A/Lote: 06 Camanor 01/09/2011 12/12/2012 12/12/2012 - - V06/L1235 Camanor 02/09/2011 12/12/2012 12/12/2012 - - CB V1/LOTE 1256 B6A/Lote:06 V06/L1235 CBV1/Lote: 1256 Camanor Camanor Camanor Camanor 13/10/2011 01/09/2011 02/09/2011 13/10/2011 12/12/2012 05/03/2013 05/03/2013 07/03/2013 12/12/2012 05/03/2013 05/03/2013 08/03/2013 Negativo Negativo Negativo - Lote CB 1242-1 150/UP V05/L1238-CB CB V15/L1247 BV01/Lote 1250 B8 L1261 BV1 3 dias após ingerir camarão do Camanor Camanor Camanor Camanor Camanor Camanor 27/08/2011 02/09/2011 04/09/2011 06/09/2011 07/11/2011 23/10/2011 07/03/2013 07/03/2013 12/03/2013 12/03/2013 14/03/2013 14/03/2013 08/03/2013 08/03/2013 12/03/2013 12/03/2013 15/03/2013 15/03/2013 Negativo Negativo Negativo Negativo Negativo - não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N/ PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primers F13/R13 e F13N / PCR não funcionou Primer F14/R14 Primer F14/R14 Primer F14/R14 Primer F14/R14 / Controle + não funcionou Primer F14/R14 Primer F14/R14 Primer F14/R14 Primer F14/R14 Primer F14/R14 110 V1 V12 L1258 CB Camarões do Darlio Camanor - 16/11/2011 - 14/03/2013 21/03/2013 15/03/2013 21/03/2013 Negativo Negativo - CB 1244-1 V5 Lote: 1265 CB B6A/Lote:06 V06/L1235 CBV1/Lote: 1256 Camarões do Darlio V13/L1246 Siri Camarões V03 CB V20/L1252 BV1 após ingerir camarão do V1, 1º dia Intensivo B6A Lote 06 BV1 4 dias após ingerir camarão do V1 Camarão de Allan Aquário 2/ morreu 3º Aquário 1/ morreu 2º Amostra lisado de células congelado Amostra lisado de células etanol 70% Camanor Camanor Camanor Camanor Camanor Camanor Camanor Camanor Camanor 26/08/2011 19/11/2011 01/09/2011 02/09/2011 13/10/2011 02/09/2011 09/11/2011 12/09/2011 21/03/2013 21/03/2013 26/03/2013 26/03/2013 26/03/2013 26/03/2013 26/03/2013 26/03/2013 26/03/2013 26/03/2013 21/03/2013 21/03/2013 27/03/2013 27/03/2013 27/03/2013 27/03/2013 27/03/2013 27/03/2013 03/04/2013 03/04/2013 Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Primer F14/R14 Primer F14/R14 Primer F14/R14/ Controle + não funcionou Primer F14/R14 Primers OIE Primers OIE Primers OIE Primers OIE Primers OIE / Camarão morto Primers OIE / C+ não funcionou Primers OIE Primers OIE Camanor Camanor 21/10/2011 05/09/2011 26/03/2013 26/03/2013 03/04/2013 04/04/2013 Negativo Negativo Negativo Negativo Primers OIE Primers OIE Camanor Camanor Prof. Fabiana Prof. Fabiana 24/10/2011 - 26/03/2013 26/03/2013 10/04/2013 10/04/2013 04/04/2013 04/04/2013 11/04/2013 11/04/2013 Negativo Negativo Negativo Negativo Negativo Negativo Negativo Negativo Primers OIE Primers OIE Primers OIE e primer F14/R14 Primers OIE e primer F14/R14 Genearch Concepto Azul 2005 15/01/2013 15/01/2013 Positivo - Primer F14/R14 2011 13/06/2013 13/06/2013 Positivo - Primer F14/R14 111 : Figura Suplementar 1: Análise filogenética de membros representativos dos grupos TVV-like, LRV-like e GLV-like. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de usando Inferência Bayesiana. As IDs das sequências estão indicadas na tabela suplementare 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV. 112 Genoma completo IMNVgen1 ggcaatttcaacctaattctaaaactgttaccaacaatttctgaactacagaagaggcat attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaagcctaaa M A I N E L A V K V G K K P K tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc Y T S T K T G A D H I P S W T V L V E F gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct A G F S E A A T C D T V K N A K M I A A tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt Y K L V K R F C K W D P T Y I E I S D C atgctgccacctccagaccttacatcgtgcggggatgttgagagtaatcctggacctatc M L P P P D L T S C G D V E S N P G P I atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc I H S V A F A R T G S V W T P A T F T F aatactacatcatccccgggtagactgcaagtacaaatgtcatccagcgacaatagatat N T T S S P G R L Q V Q M S S S D N R Y gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca G F N S V L L A A G G T T W G T A Y F S gaacgctggaacagtgattttggattacagccagatctaactataactgtaacaccacaa E R W N S D F G L Q P D L T I T V T P Q ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag L T G E E L G S I Y F D A V E T T N A E gaagctatagaagcaacaattataaatactactccaattgatgtaatggtagacacaaca E A I E A T I I N T T P I D V M V D T T gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta A G P V P I E G D F K P T N E T P T W V agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca S N T K P I D V A T P K T R D Y A N R S gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat V L T P Q L I T K M K D H V Y A L Q K D gaagttgaagatgtaacacttgcctcactcgattttggtttaaatccatcaagtgtactc E V E D V T L A S L D F G L N P S S V L ggaagatggttgaaatggctaactggcatagatatgagactccatcttgggaagaaagtt G R W L K W L T G I D M R L H L G K K V acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt T N H K V R M F V Q K T R F P L K T A I gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa E E L N N G T V P L R L R R D V R Y I E aagccattcgataaagaggaacataccaacatactgttatctggtgatgttgaggaaaac 113 K P F D K E E H T N I L L S G D V E E N cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg P G P E G M E Q V S I T P E Q L Q M I L gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag A M Q K S P P K P K I K E L S E R E I Q ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt L R L Q G N E A T R R H Q R F K G E P I gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg D P V L T R E D I I R K H N Q Q N G I L ccctatgaaaaagaacagccggtggtggtaaataacgtacaccctttggagaaggagtat P Y E K E Q P V V V N N V H P L E K E Y tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctaacgtatatacatgac S I E K E G M V W D E E Q F L T Y I H D aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc K S S S N D H Y A C I Y N V V T H N R F ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaccagaggaa G V I E M P E D P L E M I D H Y E P E E gaaccaaaaacaaaacctaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc E P K T K P K T K S G N K R E L N D E T ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa F Y R K K K T K T T K E P K T Q E Q K K attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta I D H D N M F S R L L R R L D K P Q I V gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa A A W L N N R P S R K L V E K L A D S K ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga F G I G W Q A K E E Y T T S M V I V S G tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac Y I N C E P L P L I V D K L L S V D N N tatgacatgtggcaacagactgacaagtattttgacaatttgatcacactgtgtaaccgc Y D M W Q Q T D K Y F D N L I T L C N R gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac V S D V T Y T S A Q L C R D A S I L N N aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat K K M H V E N G N I V S M E N Q S E I D agtcaaactaaattcttttcactgttagaagatgataacaaacttccaattgtagatgag S Q T K F F S L L E D D N K L P I V D E ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat L R V L A D M T A Q R S N V N T A G N H cttcgtgataatgactctattagggccgacgctgttctagctaacaatacagtacgtaac L R D N D S I R A D A V L A N N T V R N aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat N C Q I P I P V T T L I P R Q I R G L N ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt 114 G A L V N Q Q L R L Q G I E T H I T D S tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct Y I S K A E P S D Y S K Q L S E M V N A caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat Q K T S T W R A N N I A S Q G W D M F D actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca T V Q L N T N I S Q K D L S M D T A L T aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca K L M L L Y Q L T T Q N L P A T Q L P S agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt S I Y S A F D S R T Q P T L Q D G I W G ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt I N N G V N I F G E Q C G G L A A P V F ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag P F S G G T G E I T F H L T L Q S V P Q gaatttcaagaatcggcaattttcgtaccagcaactgcactacaagctgcaaaagagggt E F Q E S A I F V P A T A L Q A A K E G gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca A R T L A M Y V L M F A E W P F G M Y T aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac K T K Q T T D N A G N N Q A D Q I F I H tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa S E S T V H I P G Q K Q M H I V L P R K gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtgactcaacca V N M V N P T T I A E A N A R V V T Q P acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct T Y G T V A A G A G V A N G N I N V A A attggtgtggccctgccaactgtaaatttgactgactatcttgtatcgtgggcaaccgat I G V A L P T V N L T D Y L V S W A T D ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt F T L G D I K Q L V E R M K T T L P I S cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta R D L M A A R Q N A M L L S T L F P P L attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact I Q S N V A S D T N E V A G T A G A Y T gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagcagatata A C L A N L G I P E T L T V N W G A D I aatgttcagccattatatcagctacttgaaacggacatcacagcccataatcggtacgta N V Q P L Y Q L L E T D I T A H N R Y V ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga L N L F K R E E V V A G A Y E F G W L G cacatggccagttatatgatgggactccttctaacaatgaatatatcatcagtgtttaac H M A S Y M M G L L L T M N I S S V F N gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac 115 V W Y S T R R I S T K A W D T A Y D S N atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt I Q A Y Q D M H Y Q M F S W S S M Q G S attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc I A P A M V D E I L H N L C G Q M F G F agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga S L P L R Q V L F N A L P I T F S S F G agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt S W M L P R V S D G F Q T V R Y Y D A G ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg P P A I N A K R D G E V P V S M I D A W acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga T Y K F T E K L P K S F L P W P M P E G aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat K D S T M G Y D P E K E P A L I D N S N gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta E T G N V F R P F M A R N G N N S N Y L ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt P T N Y T I D V S Q N G H D E S C I N V gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac D L F N N V A G V T L T N Y D G T A T N gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctattaatgcaaat A N V V P T G S Y I K Q R A M P I N A N gcggtacgaccaactgaaacactcgacgctgctaaccatacaaaaccttttgctattgaa A V R P T E T L D A A N H T K P F A I E ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg G G R L V Y L G G T I A N T T N V V N A atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa M Q R K Q R L S K P A F K W A H A Q R Q cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag R V Y D S S R P G M D A I T K L C A R K tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct S G F M N A R S T A M M A P K T G L S A gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag V I D Q A P N T S Q D L I E Q P S Q Q E gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata V M D M Q A T A T V gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc 116 gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt M D E I R N Y T H L D Y I F gtacaaaacatttgtatctatatgttagtatttggaatagacacagttaaacactttaga V Q N I C I Y M L V F G I D T V K H F R caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc Q I G L F N E R N E F I E I A K Q L S T aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct K G K R F V D D V D N M K Q K V C E I A actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtggac T I V G Y M D P N V D K I D V M E E V D tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt S L A A E G N E H G I D R D N W N D L F acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat T K T C K E V M T W Y K G H E F I S F D gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat D Y I K E G M W L T S G S S S I G K V H tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt W T K D G E N G K F K A R K N M L L Q I tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt Y T P Q E L A D I V Y A W D G K L H S R gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca V F I K N E M S K L R L A V A S N I E A tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga Y I H E S Y M L F L Y G H G F K E Y F G gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa V T L D E K P D Q Q H Q R E I E M I E K ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca L Q A G Y F G L P F D Y A S F D H Q P T actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct T F E V K T M V R R V G E I V V S Q V P aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa K N Y Y Y Q T Q L L V N K I V N A Y D K agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga S Y L S G N I K N T K F E N I K V K G G gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca V P S G V R I T S L L G N M W N A I I T aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg K I A I N N V I G I I G Y D P I S Q I S ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga L R G D D V A I L S K D P A A L Y L L R ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa L S Y A A I N A I G K D S K L G I S P K gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga 117 V C E F L R N E I S V T G V R G W T C R ggaataggtggtataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat G I G G I S Q R K P W N P Q P W S P N D gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt E V E T N A S N I S L L E R R A G I E L caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa Q Q L H H I N K V K W S R H V R Q S Y K tatctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta Y L E L P K R L G G F G I Y R F Q G W L cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca P N G K L P L A K K P L V N V E D I H P agccaagagctgtttttgcctttaagtgaacaacagaaaaagatcttagcacaggttgaa S Q E L F L P L S E Q Q K K I L A Q V E atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa M T N K M Q T D D I P G T Q K L F S K E tggatacagaaagtgcgtacaaaaaagatcatatggagtagaaatcagacaataccaatc W I Q K V R T K K I I W S R N Q T I P I catacggatcacacagtacgcataccaagatgggacgagaaaatcaaattcccaaggtat H T D H T V R I P R W D E K I K F P R Y aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag K S E Y I L N N K I N L T M E Q V L R Q tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta Y N L L K E V E R Y D K D L K V P K L L gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa D I L D K W F P V Q S S K I K T Y E S Q ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca G F H R T D A I N L A V G E I P T E P A gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt V K I N P I L I N F V K L H L E R Q G I agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca R H Q R G R N R I A K F I Y Q K T K Q A gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca E N M I L Q S S L Q Q M Y R Y ataaagaaacttcgagtttcctataacacattcccagttgggtttgggggccagccatg Figura Suplementar 2: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen1. Os aminoácidos codificados estão mostrados abaixo da sequêcia de nucleotídeos. 118 IMNVgen2 complete genome ggcaatttcaacctaattctaaaactgttaccaacaatttcagaactacagaagaggcat attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaaacctaaa M A I N E L A V K V G K K P K tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc Y T S T K T G A D H I P S W T V L V E F gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct A G F S E A A T C D T V K N A K M I A A tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt Y K L V K R F C K W D P T Y I E I S D C atgctgccacctccagatcttacatcgtgcggggatgttgagagtaatcctggacctatc M L P P P D L T S C G D V E S N P G P I atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc I H S V A F A R T G S V W T P A T F T F aatactacatcatccccaggtagactgcaagtacaaatgtcatccagcgacaatagatat N T T S S P G R L Q V Q M S S S D N R Y gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca G F N S V L L A A G G T T W G T A Y F S gaacgctggaacagtgactttggattacagccagatctaactataactgtaacaccacaa E R W N S D F G L Q P D L T I T V T P Q ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag L T G E E L G S I Y F D A V E T T N A E gaagctatagaggcaacaattataaatactactccaattgatgtaatggtagacacaaca E A I E A T I I N T T P I D V M V D T T gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta A G P V P I E G D F K P T N E T P T W V agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca S N T K P I D V A T P K T R D Y A N R S gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat V L T P Q L I T K M K D H V Y A L Q K D gaagttgaagatgtaacacttgcctcactcgattttggcttaaatccatcaagtgtactc E V E D V T L A S L D F G L N P S S V L ggaagatggttgaaatggttaactggcatagacatgagactccatcttgggaagaaagtt G R W L K W L T G I D M R L H L G K K V acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt T N H K V R M F V Q K T R F P L K T A I gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa E E L N N G T V P L R L R R D V R Y I E aagccattcgataaagaggaacataccgacatactgttatctggtgacgttgaggaaaac 119 K P F D K E E H T D I L L S G D V E E N cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg P G P E G M E Q V S I T P E Q L Q M I L gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag A M Q K S P P K P K I K E L S E R E I Q ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt L R L Q G N E A T R R H Q R F K G E P I gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg D P V L T R E D I I R K H N Q Q N G I L ccttatgaaaaagaacagccggtagtggtaaataacgtacaccctttggagaaggagtat P Y E K E Q P V V V N N V H P L E K E Y tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctgacgtatatacatgac S I E K E G M V W D E E Q F L T Y I H D aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc K S S S N D H Y A C I Y N V V T H N R F ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaacaggggaa G V I E M P E D P L E M I D H Y E T G E gaatcaaaaacaaaacccaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc E S K T K P K T K S G N K R E L N D E T ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa F Y R K K K T K T T K E P K T Q E Q K K attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta I D H D N M F S R L L R R L D K P Q I V gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa A A W L N N R P S R K L V E K L A D S K ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga F G I G W Q A K E E Y T T S M V I V S G tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac Y I N C E P L P L I V D K L L S V D N N tatgacatgtggcaacagaccgacaagtattttgacaatttgatcacactgtgtaaccgc Y D M W Q Q T D K Y F D N L I T L C N R gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac V S D V T Y T S A Q L C R D A S I L N N aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat K K M H V E N G N I V S M E N Q S E I D agtcaaactaaattcttttcactattagaagatgataacaaacttccaattgtagatgag S Q T K F F S L L E D D N K L P I V D E ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat L R V L A D M T A Q R S N V N T A G N H cttcgtgataatgactctattagggccgacgctgttctatctaacaatacagtacgtaat L R D N D S I R A D A V L S N N T V R N aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat N C Q I P I P V T T L I P R Q I R G L N ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt 120 G A L V N Q Q L R L Q G I E T H I T D S tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct Y I S K A E P S D Y S K Q L S E M V N A caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat Q K T S T W R A N N I A S Q G W D M F D actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca T V Q L N T N I S Q K D L S M D T A L T aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca K L M L L Y Q L T T Q N L P A T Q L P S agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt S I Y S A F D S R T Q P T L Q D G I W G ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt I N N G V N I F G E Q C G G L A A P V F ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag P F S G G T G E I T F H L T L Q S V P Q gaatttcaagaatcagcaattttcgtaccagcaactgcactacaagctgcaaaagagggc E F Q E S A I F V P A T A L Q A A K E G gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca A R T L A M Y V L M F A E W P F G M Y T aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac K T K Q T T D N A G N N Q A D Q I F I H tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa S E S T V H I P G Q K Q M H I V L P R K gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtaactcaacca V N M V N P T T I A E A N A R V V T Q P acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct T Y G T V A A G A G V A N G N I N V A A attggtgtggccctgccaactgtaaatttgactgactaccttgtatcgtgggcaaccgat I G V A L P T V N L T D Y L V S W A T D ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt F T L G D I K Q L V E R M K T T L P I S cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta R D L M A A R Q N A M L L S T L F P P L attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact I Q S N V A S D T N E V A G T A G A Y T gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagtagatata A C L A N L G I P E T L T V N W G V D I aatgttcagccattgtatcagctacttgaaacggatatcacagcccataatcggtacgta N V Q P L Y Q L L E T D I T A H N R Y V ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga L N L F K R E E V V A G A Y E F G W L G cacatggccagttatatgatgggacttcttctaacaatgaatatatcatcagtgtttaac H M A S Y M M G L L L T M N I S S V F N gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac 121 V W Y S T R R I S T K A W D T A Y D S N atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt I Q A Y Q D M H Y Q M F S W S S M Q G S attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc I A P A M V D E I L H N L C G Q M F G F agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga S L P L R Q V L F N A L P I T F S S F G agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt S W M L P R V S D G F Q T V R Y Y D A G ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg P P A I N A K R D G E V P V S M I D A W acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga T Y K F T E K L P K S F L P W P M P E G aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat K D S T M G Y D P E K E P A L I D N S N gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta E T G N V F R P F M A R N G N N S N Y L ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt P T N Y T I D V S Q N G H D E S C I N V gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac D L F N N V A G V T L T N Y D G T A T N gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctatcaatgcaaat A N V V P T G S Y I K Q R A M P I N A N gcggtacgaccaactgaaacactcgacgctgcaaaccatacaaaaccttttgctattgaa A V R P T E T L D A A N H T K P F A I E ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg G G R L V Y L G G T I A N T T N V V N A atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa M Q R K Q R L S K P A F K W A H A Q R Q cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag R V Y D S S R P G M D A I T K L C A R K tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct S G F M N A R S T A M M A P K T G L S A gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag V I D Q A P N T S Q D L I E Q P S Q Q E gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata V M D M Q A T A T V gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc 122 gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt M D E I R N Y T H L D Y I F gtacaaaacatttgtacctatatgttagtatttggaatagacacagttaaacactttaga V Q N I C T Y M L V F G I D T V K H F R caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc Q I G L F N E R N E F I E I A K Q L S T aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct K G K R F V D D V D N M K Q K V C E I A actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtcaac T I V G Y M D P N V D K I D V M E E V N tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt S L A A E G N E H G I D R D N W N D L F acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat T K T C K E V M T W Y K G H E F I S F D gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat D Y I K E G M W L T S G S S S I G K V H tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt W T K D G E N G K F K A R K N M L L Q I tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt Y T P Q E L A D I V Y A W D G K L H S R gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca V F I K N E M S K L R L A V A S N I E A tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga Y I H E S Y M L F L Y G H G F K E Y F G gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa V T L D E K P D Q Q H Q R E I E M I E K ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca L Q A G Y F G L P F D Y A S F D H Q P T actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct T F E V K T M V R R V G E I V V S Q V P aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa K N Y Y Y Q T Q L L V N K I V N A Y D K agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga S Y L S G N I K N T K F E N I K V K G G gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca V P S G V R I T S L L G N M W N A I I T aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg K I A I N N V I G I I G Y D P I S Q I S ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga L R G D D V A I L S K D P A A L Y L L R ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa L S Y A A I N A I G K D S K L G I S P K gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga 123 V C E F L R N E I S V T G V R G W T C R ggaataggtggcataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat G I G G I S Q R K P W N P Q P W S P N D gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt E V E T N A S N I S L L E R R A G I E L caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa Q Q L H H I N K V K W S R H V R Q S Y K tacctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta Y L E L P K R L G G F G I Y R F Q G W L cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca P N G K L P L A K K P L V N V E D I H P agccaagagctgtttttgcctttaagtgaacaacagagaaagatcttagcacaggtcgaa S Q E L F L P L S E Q Q R K I L A Q V E atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa M T N K M Q T D D I P G T Q K L F S K E tggatacagaaagtgcgtgcaaaaaagatcatatggagtagaaatcagacaataccaatc W I Q K V R A K K I I W S R N Q T I P I catactgatcacacagcacgcataccaagatgggacgagaaaatcaaattcccaaggtat H T D H T A R I P R W D E K I K F P R Y aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag K S E Y I L N N K I N L T M E Q V L R Q tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta Y N L L K E V E R Y D K D L K V P K L L gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa D I L D K W F P V Q S S K I K T Y E S Q ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca G F H R T D A I N L A V G E I P T E P A gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt V K I N P I L I N F V K L H L E R Q G I agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca R H Q R G R N R I A K F I Y Q K T K Q A gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca E N M I L Q S S L Q Q M Y R Y Ataaagaaacttcgagtttcctataacacattcccagttgggttttggggccagccatg Figura Suplementar 3: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen2. Os aminoácidos codificados estão mostrados abaixo da sequência de nucleotídeos. 124 Tabela suplementar 4: Identificação dos sítios polimórficos (SP) no genoma do IMNV. A tabela indica a posição do SP e se esse SP causa alteração na sequência de aminoácidos. Em destaque (cinza) os SP que causam alteração na sequência de aminoácidos. Posição NT Brasil Indonésia IMNVgen1 IMNVgen2 Mudança de AA Característica do AA - - Não Lys – polar básico Não Ser – polar neutro Não Leu – apolar Não Asp – polar ácido Não Asp – polar ácido Não Ser – polar neutro Não Pro – apolar Sim Phe – apolar Leu – apolar Não Asn – polar neutro Não Gly – apolar Sim Gln – polar neutro Glu – polar ácido Não Arg – polar básico Não His – polar básico 5’UTR 1 2 3 42 105 112 T C A T T G T C G A C G RBP 4 174 5 219 6 309 7 378 8 396 9 429 10 498 11 544 12 549 13 570 14 601 15 606 16 618 G AAG Lys C AGC Ser A TTA Leu C GAC Asp C GAC Asp G AAG Lys C AGC Ser A TTA Leu C GAC Asp C GAC Asp C AGC Ser G CCG Pro T TTC Phe T AAT Asn T GGT Gly C CAA Gln T CGT Arg C CAC C AGC Ser G CCG Pro C CTC Leu T AAT Asn T GGT Gly C CAA Gln T CGT Arg C CAC G A AAG AAA Lys Lys T T AGT AGT Ser Ser G G TTG TTG Leu Leu C T GAC GAT Asp Asp T T GAT GAT Asp Asp Small Protein 1 (SP1) T T AGT AGT Ser Ser G A CCG CCA Pro Pro T T TTC TTC Phe Phe C C AAC AAC Asn Asn C C GGC GGC Gly Gly G G GAA GAA Glu Glu C C CGC CGC Arg Arg T C CAT CAC 125 17 702 18 732 19 890 20 916 21 967 22 996 23 999 24 1039 25 1053 26 1080 27 1169 28 1206 29 1228 30 1230 31 1248 32 1263 His T GTT Val G GAG Glu T GTA Val C CTG Leu A AAA Lys His T GTT Val G GAG Glu C GCA Ala T TTG Leu A AAA Lys His C GTC Val A GAA Glu C GCA Ala T TTG Leu G GAA Glu His C GTC Val G GAG Glu C GCA Ala T TTG Leu G GAA Glu C TTC Phe C GGC Gly T TTA Leu C GAC Asp C GTC Val G CGT Arg C TTC Phe C GGC Gly T TTA Leu C GAC Asp C GTC Val A CAT His T TTT Phe T GGT Gly C CTA Leu T GAT Asp T GTT Val T CTT Leu T TTT Phe C GGC Gly T TTA Leu C GAC Asp T GTT Val T CTT Leu G CCG Pro G GAT Asp T GAT Asp T GAT Asp C CCC G CCG Pro G GAT Asp T GAT Asp C GAC Asp T CCT A CCA Pro A AAC Asn C AAC Asn T GAT Asp T CCT A CCA Pro G GAC Asp C GAC Asp C GAC Asp T CCT Não Val – apolar Não Glu – polar ácido Sim Val – apolar Ala – apolar Não Leu – apolar Sim Lys – polar básico Glu – polar ácido Não Phe – apolar Não Gly – apolar Não Leu – apolar Não Asp – polar ácido Não Val – apolar Sim Arg – polar básico His – polar básico Não Leu – apolar Pro – apolar Sim Asp – polar ácido Asn – polar neutro Sim Não Asp – polar ácido Não Pro – apolar 126 Pro 33 1503 34 1504 35 1524 36 1603 37 1605 38 1683 39 1687 40 1715 41 1732 42 1736 43 1744 44 1758 45 1779 46 2058 47 2121 48 2134 T CCT Pro G GAT Asp A GTA Val T TTG Leu G TTG Leu T GGT Gly C CTT Leu T ATG Met C CCA Pro G GGG Gly C CCA Pro T CCT Pro A AAA Lys A CCA Pro T ACT Thr G GAC Asp Pro Pro Pro Small Protein 2 (SP2) T C T CCT CCC CCT Pro Pro Pro G T T GAT TAT TAT Asp Tyr Tyr A G A GTA GTG GTA Val Val Val T C C TTG CTA CTA Leu Leu Leu G A G TTG CTA TTG Leu Leu Leu T C C GGT GGC GGC Gly Gly Gly C A A CTT ATT ATT Leu Ile Ile C T T ACG ATG ATG Thr Met Met C C A CCA CCA ACA Pro Pro Thr G A G GGG GAG GGG Gly Glu Gly C C T CCA CCA TCA Pro Pro Ser T T C CCT CCT CCC Pro Pro Pro G A A AAG AAA AAA Lys Lys Lys A G G CCA CCG CCG Pro Pro Pro T T C ACT ACT ACC Thr Thr Thr A G G AAC GAC GAC Asn Asp Asp Proteína Principal do Capsídeo (MCP) Não Pro – apolar Sim Asp – polar ácido Tyr – polar neutro Não Val – apolar Leu – apolar Não Não Gly – apolar Sim Leu – apolar Ile – apolar Sim Met – apolar Thr – polar neutro Sim Pro – apolar Thr – polar neutro Sim Gly – apolar Glu – polar ácido Sim Pro – apolar Ser – polar neutro Não Pro – apolar Não Lys – polar básico Não Pro – apolar Não Thr – polar neutro Sim Asp – polar ácido Asn – polar neutro 127 49 2304 50 2440 51 2460 52 2525 53 2727 54 2733 55 2856 56 2894 57 2928 58 3015 59 3060 60 3160 61 3291 62 3293 63 3361 64 3373 65 3399 G CTG Leu G GCT Ala C AAC Asn T GTA Val A TCA Ser A AAA Lys T CCT Pro T GTT Val C GCC Ala A TCA Ser T GGT Gly T TCA Ser A GTA Val T ATT Ile G GTT Val C CTG Leu T TAT Tyr G CTG Leu G GCT Ala C AAC Asn T GTA Val G TCG Ser A AAA Lys C CCC Pro C GCT Ala C GCC Ala A TCA Ser T GGT Gly T TCA Ser A GTA Val T ATT Ile G GTT Val T TTG Leu T TAT Tyr G CTG Leu G GCT Ala C AAC Asn C GCA Ala A TCA Ser G AAG Lys T CCT Pro T GTT Val T GCT Ala G TCG Ser T GGT Gly G GCA Ala G GTG Val C ACT Thr A ATT Ile C CTG Leu T TAT Tyr A CTA Leu T TCT Ser T AAT Asn C GCA Ala A TCA Ser G AAG Lys T CCT Pro T GTT Val T GCT Ala A TCA Ser C GGC Gly G GCA Ala A GTA Val C ACT Thr A ATT Ile C CTG Leu C TAC Tyr Não Leu - apolar Sim Ala – apolar Ser – polar polar Não Asn – polar neutro Sim Val – apolar Ala – apolar Não Ser – polar neutro Não Lys – polar básico Não Pro – apolar Sim Val – apolar Ala – apolar Não Ala – apolar Não Ser – polar neutro Não Gly – apolar Sim Ser – polar neutro Ala – apolar Não Val – apolar Sim Ile – apolar Thr – polar neutro Sim Val – apolar Ile - apolar Não Leu – apolar Não Tyr – polar neutro 128 66 3408 67 3487 68 3570 69 3577 70 3653 71 3675 72 3696 73 3708 74 3732 75 3748 76 3807 77 3929 78 3966 79 4017 80 4091 71 4135 82 4136 C TCC Ser T TTG Leu G AAG Lys C CCA Pro T GTA Val G TTG Leu C GAC Asp C CAC His C TTC Phe G GTA Val C CTC Leu A CAA Gln A GCA Ala G GGG Gly T TTG Leu G GTA Val T GTA Val C TCC Ser T TTG Leu G AAG Lys C CCA Pro A GAA Glu G TTG Leu C GAC Asp C CAC His T TTT Phe A ATA Ile C CTC Leu G CGA Arg A GCA Ala G GGG Gly C TCG Ser A ATA Ile T ATA Ile G TCG Ser C CTG Leu T AAT Asn G GCA Ala C GCA Ala A TTA Leu C GAC Asp T CAT His C TTC Phe G GTA Val C CTC Leu A CAA Gln G GCG Ala C GGC Gly T TTG Leu G GCA Ala C GCA Ala G TCG Ser C CTG Leu T AAT Asn G GCA Ala T GTA Val G TTG Leu T GAT Asp T CAT His C TTC Phe G GTA Val T CTT Leu A CAA Gln G GCG Ala C GGC Gly T TTG Leu G GCA Ala C GCA Ala Não Ser – polar neutro Não Leu – apolar Sim Lys – polar básico Asn – polar neutro Sim Pro – apolar Ala – apolar Sim Não Val – apolar Glu – polar ácido Ala – apolar Leu – apolar Não Asp – polar ácido Não His – polar básico Não Phe – apolar Sim Val – apolar Ile – apolar Não Leu – apolar Sim Gln – polar neutro Arg – polar básico Não Ala – apolar Não Gly – apolar Sim Leu – apolar Ser – polar neutro Sim Val – apolar Ile – apolar Ala – apolar 129 83 4148 T GTC Val T TTT Phe T TCT Ser G TTG Leu T GAT Asp G GAC Asp T TAT Tyr C ATC Ile T GCT Ala A GCA Ala G CAG Gln G CCG Pro G CAG Gln 84 4347 85 4371 86 4380 87 4422 88 4504 89 4527 90 4551 91 4593 92 4680 93 4686 94 4710 95 4905 96 5093 T 97 5299 98 5393 99 5489 T ATC Ile G CAG Gln T AAT Asn T GTC Val T TTT Phe T TCT Ser G TTG Leu C GAC Asp G GAC Asp C TAC Tyr C ATC Ile T GCT Ala A GCA Ala A CAA Gln A CCA Pro A CAA Gln C C Sim GCC GCC Ala Ala C C Não TTC TTC Phe Phe C C Não TCC TCC Ser Ser A A Não TTA TTA Leu Leu T T Não GAT GAT Asp Asp A A Sim AAC AAC Asn Asn C C Não TAC TAC Tyr Tyr T C Não ATT ATC Ile Ile T A Não GCT GCA Ala Ala G G Não GCG GCG Ala Ala G G Não CAG CAG Gln Gln G G Não CCG CCG Pro Pro G G Não CAG CAG Gln Gln Região entre as ORFs C T T RNA Polimerase Dependente de RNA (RdRp) T T C Sim ATC ATC ACT Ile Ile Thr G A A Não CAG CAA CAA Gln Gln Gln T C C Não AAT AAC AAC Asn Asn Asn Val – apolar Ala – apolar Phe – apolar Ser – polar neutro Leu – apolar Asp – polar ácido Asp – polar ácido Asn – polar neutro Tyr – polar neutro Ile – apolar Ala – apolar Ala – apolar Gln – polar neutro Pro – apolar Gln – polar neutro Ile – apolar Thr – polar neutro Gln – polar neutro Asn – polar neutro 130 100 5519 101 5520 102 5528 103 5784 104 5825 105 6212 106 6266 107 6278 108 6554 109 6698 110 6725 111 6770 112 6812 113 6815 114 6880 115 6899 116 6981 C GTC Val A AAC Asn C CTC Leu A AAC Asn C GTC Val A ACA Thr G ACG Thr T GGT Gly C GGC Gly G TCG Ser T TAT Tyr C TTC Phe G AAG Lys C CCC Pro A AAA Lys T GTT Val G GCA Ala C GTC Val A AAC Asn C CTC Leu A AAC Asn A GTA Val A ACA Thr G ACG Thr T GGT Gly C GGC Gly G TCG Ser T TAT Tyr T TTT Phe G AAG Lys C CCC Pro A AAA Lys T GTT Val G GCA Ala G GTG Val G GAC Asp T CTT Leu G GAC Asp C GTC Val T ACT Thr A ACA Thr A GGA Gly T GGT Gly A TCA Ser T TAT Tyr C TTC Phe A AAA Lys T CCT Pro A AAA Lys T GTT Val A ACA Thr C GTC Val A AAC Asn T CTT Leu G GAC Asp C GTC Val T ACT Thr A ACA Thr A GGA Gly C GGC Gly A TCA Ser C TAC Tyr C TTC Phe A AAA Lys T CCT Pro G AGA Arg C GTG Val G GCA Ala Não Val – apolar Sim Asn – polar neutro Asp – polar ácido Não Leu – apolar Sim Asn – polar neutro Asp – polar ácido Não Val – apolar Não Thr – polar neutro Não Thr – polar neutro Não Gly – apolar Não Gly – apolar Não Ser – polar neutro Não Tyr – polar neutro Não Phe – apolar Não Lys – polar básico Não Pro – apolar Sim Lys – polar básico Arg – polar básico Não Val – apolar Sim Ala – apolar Thr – polar neutro 131 117 7028 118 7039 119 7043 120 7152 121 7289 122 7355 123 7359 124 7405 T ACT Thr T GTA Val T CGT Arg C CTA Leu C AAC Asn C GTC Val T TTA Leu A AAG Lys T ACT Thr T GTA Val T CGT Arg C CTA Leu T AAT Asn C GTC Val T TTA Leu A AAG Lys G ACG Thr T GTA Val C CGC Arg T TTA Leu C AAC Asn T GTT Val C CTA Leu G AGG Arg T ACT Thr C GCA Ala C CGC Arg T TTA Leu C AAC Asn T GTT Val C CTA Leu G AGG Arg Não Thr – polar neutro Sim Val – apolar Ala – apolar Não Arg – polar básico Não Leu – apolar Não Asn – polar neutro Não Val – apolar Não Leu – apolar Sim Lys – polar básico Arg – polar básico 3’UTR 125 7548 T T G T - - 126 7550 T T G G - - 132 A B C D E Figura Suplementar 4: Predição de regiões estruturadas e desestruturadas para as proteínas do IMNV. A análise realizada no Foldindex mostra a sequência de aminoácidos estruturada (verde) e desestruturada (vermelho) das proteínas do IMNV. A – RBP; B – SP1; C – SP2; D – MCP; E – RdRp. 133 Tabela Suplementar 5: Avaliação dos modelos tridimensionais das proteínas RBP, MCP e RdRp. Parâmetros Scores RBP MCP RdRp MOLPROBITY Clashscore 180,73 83,5 178,98 Rotâmeros de cadeias laterais desfavoráveis 7,59% 2,09% 6,98% Ramachandram desfavorável 4,40% 15,31% 4,15% Ramachandram favorável 84,71% 70,17% 87,42% Desvio do carbono β 9,09% 8,26% 11,51% Ligações de comprimentos ruins 0% 1,40% 0,03% Ligações de ângulos ruins 2,94% 6,33% 3,54% MolProbity Score 4,03 3,47 3,96 SWISS-MODEL Z-Score 0,627 -6,341 -5,14 QMEANscore6 -1,01 0,189 0,298 I-TASSER C-score -2,26 -2,27 0,23 TM-score esperado 0,45 ± 0,14 0,45 ± 0,14 0,74 ± 0,11 RMSD esperado 8,6 ± 4,5 14,4 ± 3,7 7,7 ± 4,3 Números de decoys 5380 498 465 Densidade de cluster 0,0949 0,1220 0,3755 134 A B C Figura Suplementar 5: Predição de estrutura terciária para a Proteína Principal do Capsídeo do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (-1,25); B – IMNVgen1 (-1,22); C – IMNVgen2 (-1,13). Os C-scores estão indicados entre parênteses. 135 A B C Figura Suplementar 6: Predição de estrutura terciária para a RNA Polimerase Dependente de RNA do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (0,23); B – IMNVgen1 (-0,16); C – IMNVgen2 (-0,69). Os C-scores estão indicados entre parênteses. 136 A B C Figura Suplementar 7: Predição de estrutura terciária usando modelagem por threading no programa Phyre2 para a proteínas do isolado da Indonésia. A – RBP; B – MCP; C – RdRp.