Tutorial Blast Web Blast 1. Faça o download dos arquivos TnH.fasta e MxH.fasta do endereço http://www.coccidia.usp.br/disciplinas/IBI5032/files/ 2. Entre em um servidor Blast (http://www.ncbi.nlm.nih.gov/blast/) 3. Tente fazer um Blast 2 sequences (Blastn) da seqüência TnH.fasta contra ela mesma usando parâmetros default a. Por que a identidade não é 100%? b. Tente conseguir 100% de identidade mudando os parâmetros. O que você concluiu? 4. Tente fazer um Blast 2 sequences (Blastn) da seqüência TnH contra MxH usando parâmetros default a. O que você observou quanto ao alinhamento? Foi obtido um alinhamento global ou local para alguns blocos? b. Como você faria para tentar encontrar um alinhamento ao longo das duas seqüências inteiras? 5. Faça uma busca de similaridade da seqüência TnH.fasta contra a base de dados nr usando Blastn e parâmetros default. O que você observou? 6. Repita a busca com Blastx. O que você observou agora? Quantos genes foram encontrados? 7. Repita a busca usando apenas a metade 3’ da seqüência TnH.fasta. O que você observou? Como você explica esse resultado inesperado? Blast local em linha de comando Vamos aprender a baixar uma base de dados customizada e formatá-la para uso com Blast local em linha de comando. Para isso, vamos obter todas as seqüências nucleotídicas e protéicas de mitocôndrias do grupo dos protozoários Alveolata. 1. Entre no site http://www.ncbi.nlm.nih.gov/ e tecle TaxBrowser. 2. Digite Apicomplexa no formulário de busca e aperte ENTER 3. Clique no link de Apicomplexa. Uma tabela com o número de seqüências nucleotídicas e protéicas, entre outras, deverá aparecer do lado direito. 4. Clique no link de nucleotídicas (ou de protéicas se for o caso). 5. Quantas seqüências estão disponíveis? 6. Vamos restringir agora apenas para seqüências mitocondriais. Para isso, clique em Limits. 7. Selecione em Gene location o item mitochondrion. 8. Clique no botão Go. Quantas seqüências estão disponíveis agora? 9. Vamos agora formatar a saída para o formato multifasta e salvar a base em um arquivo. Para isso, selecione FASTA ao lado do botão Display e selecione File ao lado do botão Send to. Responda OK à pergunta e entre com o nome do arquivo: mito_nt (DNA) ou mito_prot (proteínas). 10. Digite more nome_do_arquivo na linha de commando do UNIX. O que você observa? 11. Agora vamos formatar essa base de maneira que o Blast possa usá-la. 12. Para DNA: digite formatdb –o T –p F –i mito_nt 13. Para proteínas: digite formatdb –o T –p T –i mito_prot 14. As bases de dados estão prontas para uso. Vamos usar a seqüência TnH.fasta como “query” em duas buscas, usando como bases de dados mito_nt (DNA) ou mito_prot (proteínas): blastall –p blastn –v5 –b5 –d mito_nt –i TnH.fasta –o saida_nt & ou blastall –p blastx –v5 –b5 –d mito_prot –i TnH.fasta –o saida_prot & 15. Ao final da busca entre nos arquivos gerados e olhe os resultados. 16. Faça também uma busca de similaridade entre as duas seqüências TnH.fasta e MxH.fasta: bl2seq –p blastn –i TnH.fasta –j MxH.fasta -o saida_bl2seq &