Tutorial Blast

Propaganda
Tutorial Blast
Web Blast
1. Faça o download dos arquivos TnH.fasta e MxH.fasta do endereço
http://www.coccidia.usp.br/disciplinas/IBI5032/files/
2. Entre em um servidor Blast (http://www.ncbi.nlm.nih.gov/blast/)
3. Tente fazer um Blast 2 sequences (Blastn) da seqüência TnH.fasta contra ela
mesma usando parâmetros default
a. Por que a identidade não é 100%?
b. Tente conseguir 100% de identidade mudando os parâmetros. O que
você concluiu?
4. Tente fazer um Blast 2 sequences (Blastn) da seqüência TnH contra MxH
usando parâmetros default
a. O que você observou quanto ao alinhamento? Foi obtido um alinhamento
global ou local para alguns blocos?
b. Como você faria para tentar encontrar um alinhamento ao longo das duas
seqüências inteiras?
5. Faça uma busca de similaridade da seqüência TnH.fasta contra a base de dados
nr usando Blastn e parâmetros default. O que você observou?
6. Repita a busca com Blastx. O que você observou agora? Quantos genes foram
encontrados?
7. Repita a busca usando apenas a metade 3’ da seqüência TnH.fasta. O que você
observou? Como você explica esse resultado inesperado?
Blast local em linha de comando
Vamos aprender a baixar uma base de dados customizada e formatá-la para uso
com Blast local em linha de comando. Para isso, vamos obter todas as seqüências
nucleotídicas e protéicas de mitocôndrias do grupo dos protozoários Alveolata.
1. Entre no site http://www.ncbi.nlm.nih.gov/ e tecle TaxBrowser.
2. Digite Apicomplexa no formulário de busca e aperte ENTER
3. Clique no link de Apicomplexa. Uma tabela com o número de seqüências
nucleotídicas e protéicas, entre outras, deverá aparecer do lado direito.
4. Clique no link de nucleotídicas (ou de protéicas se for o caso).
5. Quantas seqüências estão disponíveis?
6. Vamos restringir agora apenas para seqüências mitocondriais. Para isso, clique
em Limits.
7. Selecione em Gene location o item mitochondrion.
8. Clique no botão Go. Quantas seqüências estão disponíveis agora?
9. Vamos agora formatar a saída para o formato multifasta e salvar a base em um
arquivo. Para isso, selecione FASTA ao lado do botão Display e selecione File
ao lado do botão Send to. Responda OK à pergunta e entre com o nome do
arquivo: mito_nt (DNA) ou mito_prot (proteínas).
10. Digite more nome_do_arquivo na linha de commando do UNIX. O que você
observa?
11. Agora vamos formatar essa base de maneira que o Blast possa usá-la.
12. Para DNA: digite formatdb –o T –p F –i mito_nt
13. Para proteínas: digite formatdb –o T –p T –i mito_prot
14. As bases de dados estão prontas para uso. Vamos usar a seqüência TnH.fasta
como “query” em duas buscas, usando como bases de dados mito_nt (DNA) ou
mito_prot (proteínas):
blastall –p blastn –v5 –b5 –d mito_nt –i TnH.fasta –o saida_nt &
ou
blastall –p blastx –v5 –b5 –d mito_prot –i TnH.fasta –o saida_prot &
15. Ao final da busca entre nos arquivos gerados e olhe os resultados.
16. Faça também uma busca de similaridade entre as duas seqüências TnH.fasta e
MxH.fasta:
bl2seq –p blastn –i TnH.fasta –j MxH.fasta -o saida_bl2seq &
Download