Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias

Propaganda
Rearranjo de Genomas:
Uma Coletânea de Artigos
Zanoni Dias
Orientador:
João Meidanis
Roteiro
•
Introdução
•
A Coletânea de Artigos
–
Parte I: Primeiros Trabalhos
–
Parte II: Contribuições Originais
•
Conclusões
•
Apêndice
Introdução
Exemplo de problema de distância de rearranjo
envolvendo os eventos de reversão e transposição:
852741936
 8 7 4 5 2 1 9 3 6
1 25 47 8 936
1 25 4 36 7 8 9
1 2 3 4 5 6 7 8 9

Introdução
•
Reversões:
– Com Orientações dos Genes Desconhecidas:
• Caprara (1999) provou que esta versão do
problema é NP-Completo.
• Berman, Hannenhalli e Karpinski (2002):
algoritmo de aproximação com fator 1.375.
– Com Orientações dos Genes Conhecidas:
• Hannenhalli e Pevzner (1999): primeiro
algoritmo polinomial – O(n4).
Introdução
•
Transposições:
– Bafna e Pevzner (1995): algoritmo de
aproximação com fator 1.5 – O(n2).
– Abordagens alternativas:
• Christie (1998): fator 1.5 – O(n4).
• Walter, Dias e Meidanis (2000): fator 2.25
– Problema permanece em aberto.
– O(n2).
A Coletânea de Artigos
Parte I: Primeiros Trabalhos
•
Reversal distance of signed circular chromosomes
•
Transposition distance between a permutation and
its reverse
•
Reversal and transposition distance of linear
chromosomes
•
A lower bound on the reversal and transposition
diameter
A Coletânea de Artigos
Parte II: Contribuições Originais
•
An alternative algebraic formalism for genome
rearrangements
•
The genome distance problem by fusion, fission,
and transposition is easy
•
The genome rearrangement distance problem with
arbitrary weights
•
Sorting by prefix transpositions
Reversal Distance of
Signed Circular Chromosomes
•
Determinamos a distância de reversão de dois
genomas circulares quando se conhece as
orientações dos genes.
•
Primeiro algoritmo polinomial para o problema,
baseado no algoritmo quadrático proposto por
Kaplan, Shamir e Tarjan (1997) para o problema
da distância de reversão de genomas lineares.
•
Calculamos o diâmetro de reversão tanto para
genomas lineares quanto para circulares.
Reversal Distance of
Signed Circular Chromosomes
•
•
•
Corrigimos uma conjectura sobre o diâmetro de
reversão para cromossomos lineares apresentada
por Kececioglu e Sankoff (1994).
Resultados apresentados em Brasília, no XXIV
Seminário Integrado de Software e Hardware
(SEMISH'97), em agosto de 1997.
Este trabalho foi expandido e depositado como
relatório técnico no Instituto de Computação da
Unicamp sob o número IC-00-23, em dezembro
de 2000.
Transposition Distance Between
a Permutation and its Reverse
•
Resolvemos o problema proposto por Bafna e
Pevzner (1995): determinar o menor número de
transposições necessárias para transformar uma
permutação qualquer na sua inversa 
•
Seja n o número de genes de Provamos que:
–
•
dn / 2  + 1, para n  3.
Este é um dos raros casos em que se conhece o
valor exato da distância de transposição.
Transposition Distance Between
a Permutation and its Reverse
•
Conjecturamos que este seja o valor do diâmetro
de transposição (D(n)), ou seja, o maior valor de
distância de transposição para duas permutações
com n genes.
•
Artigo apresentado no IV South American
Workshop on String Processing (WSP'97),
realizado na cidade de Valparaíso, Chile, em
novembro de 1997.
Reversal and Transposition
Distance of Linear Chromosomes
•
Algoritmos de aproximação para o problema da
distância de reversão e transposição:
– Com Orientações dos Genes Desconhecidas:
Algoritmo com fator de aproximação 3.
• Sempre podemos remover um breakpoint.
– Com Orientações dos Genes Conhecidas:
• Algoritmo com fator de aproximação 2.
• Sempre podemos criar um ciclo.
•
Reversal and Transposition
Distance of Linear Chromosomes
•
Estabelecemos um limite inferior para o diâmetro
de reversão e transposição para cromossomos
quando conhecemos as orientações dos genes.
•
Conjecturamos que este seja o valor exato do
diâmetro de reversão e transposição.
•
Artigo apresentado no String Processing and
Information Retrieval (SPIRE'98), realizado em
Santa Cruz de la Sierra, Bolívia, em setembro de
1998.
A Lower Bound on the Reversal
and Transposition Diameter
•
Calculamos a distância de reversão e transposição
da permutação  = (-1 -2 ... -(n-1) -n) em relação a
permutação identidade n = (+1 +2 ... +(n-1) +n):
–
Dnn / 2  + 2, para n  3.
•
Limite inferior não trivial para o diâmetro de
reversão e transposição para genomas lineares.
•
Este trabalho é uma extensão de alguns resultados
apresentados no artigo anterior.
A Lower Bound on the Reversal
and Transposition Diameter
•
A versão apresentada na tese corresponde ao
relatório técnico IC-00-16 de outubro de 2000.
•
Um resumo deste trabalho será publicado num
dos mais importantes periódicos internacionais,
o Journal of Computational Biology (volume 9,
ano 5, novembro de 2002).
An Alternative Algebraic Formalism
for Genome Rearrangements
•
Relacionamos a teoria de rearranjo de genomas
com teoria de grupos de permutações de uma
forma nova.
•
Motivação: muitos argumentos em rearranjo de
genomas são baseados em figuras, ou em
enumeração exaustiva de todos os casos,
evidenciando a falta de um formalismo algébrico
adequado.
An Alternative Algebraic Formalism
for Genome Rearrangements
•
Definições algébricas de conceitos como:
–
–
–
–
•
Genoma
Breakpoint
Ciclo bom
Componente boa
Operações de rearranjo estudadas:
–
–
–
–
Reversão
Transposição
Reversão + Transposição
Block Interchange
An Alternative Algebraic Formalism
for Genome Rearrangements
•
Artigo apresentado no Gene Order Dynamics,
Comparative Maps and Multigene Families
(DCAF'2000), realizado na cidade de Le
Chantecler, no Canadá, em setembro de 2000.
•
Este trabalho integra também o livro Comparative
Genomics: Empirical and Analyitical Approaches
to Gene Order Dynamics, Map Alignment and
Evolution of Gene Families lançado em
novembro do mesmo ano.
The Genome Distance Problem by
Fusion, Fission, and Transposition is Easy
•
Algoritmo polinomial que determina uma série de
fusões, fissões e transposições, de peso mínimo,
que transforma um genoma circular em outro.
•
Neste problema, fusões e fissões tem peso 1,
enquanto que uma transposição recebe peso 2.
•
Algoritmo baseado em resultados clássicos da
teoria de Grupos de Permutações.
The Genome Distance Problem by
Fusion, Fission, and Transposition is Easy
•
Este é o primeiro resultado polinomial para um
problema de rearranjo de genomas envolvendo o
evento de transposição.
•
Sempre existe uma fusão ou uma fissão que
aumenta em uma unidade o número de ciclos, ou
uma transposição que cria dois novos ciclos.
•
A distância de rearranjo neste caso é igual ao
tamanho dos genomas menos o número de ciclos.
The Genome Distance Problem by
Fusion, Fission, and Transposition is Easy
•
Algoritmo quadrático que determina uma série de
eventos que transforma uma genoma no outro.
•
A versão apresentada na tese corresponde ao
relatório técnico IC-01-07 de julho de 2001.
•
Este trabalho, com pequenas alterações, foi
apresentado no String Processing and Information
Retrieval (SPIRE'2001), realizado na Laguna de
San Rafael, no Chile, em novembro de 2001.
The Genome Rearrangement Distance
Problem with Arbitrary Weights
•
Extensão do artigo sobre distância de fusão,
fissão e transposição apresentado no SPIRE'2001.
•
Agora, fusões e fissões tem peso 1, enquanto que
uma transposição recebe peso arbitrário .
•
Quando  faz parte da entrada, provamos que o
problema é pelo menos tão difícil quanto o
problema da distância de transposição, que ainda
permanece em aberto.
The Genome Rearrangement Distance
Problem with Arbitrary Weights
•
Estudamos também uma variação importante
deste problema: a distância sintênica ( = 0).
•
Mostramos um algoritmo polinomial para o
problema da distância sintênica com distinção de
genes, quando apenas eventos de fusões e fissões
são permitidos.
•
Provamos ainda que o problema similar de
distância sintênica sem distinção de genes é
NP-Difícil.
The Genome Rearrangement Distance
Problem with Arbitrary Weights
•
Estes resultados estão reunidos no relatório
técnico IC-02-01 de março de 2002.
•
Pretendemos submeter nos próximos meses este
trabalho a uma conferência internacional da área
de Biologia Computacional.
Sorting by Prefix Transpositions
•
Introduzimos um novo evento de Rearranjo de
Genomas que denominamos de Transposição de
Prefixos.
•
Esta operação move o bloco formado pelos
primeiros genes de um genoma linear para
qualquer outra posição do genoma.
•
Algoritmos com fatores de aproximação 2 e 3.
Sorting by Prefix Transpositions
•
Estabelecemos uma conjectura sobre o diâmetro
de transposição de prefixos:
–
D(n) = n -n / 4 
•
Exibimos resultados de vários testes
computacionais que sustentam esta hipótese.
•
Algoritmo que decide quando uma permutação,
pode ser ordenada usando apenas o número de
transposições de prefixos indicada pela lower
bound de breakpoints.
Sorting by Prefix Transpositions
•
Trabalho apresentado no String Processing and
Information Retrieval (SPIRE'2002), realizado em
Lisboa, Portugal, em setembro de 2002.
•
Este artigo foi um dos seis trabalhos do
SPIRE'2002 selecionados para publicação numa
edição especial do Journal of Discrete Algorithms
que deve ser lançada até o fim do ano.
Conclusões
•
•
Um novo formalismo algébrico:
–
As diferenças entre dois genomas  e  são
representadas pela fórmula  -1.
–
Número de breakpoints e ciclos.
–
Definimos os eventos de reversão, transposição,
transposição com reversão e block interchange.
Resultados envolvendo o evento de transposição:
–
Distância de Transposição: novo limite inferior para o
valor do diâmetro.
Conclusões
–
Distância de Transposição e Reversão: algoritmos de
aproximação e limite inferior para o valor do diâmetro.
–
Distância de Fusão, Fissão e Transposição: vários
resultados para o problema quando as fusões e fissões
tem peso 1 e as transposições tem peso 0 
–
Distância de Transposição de Prefixos: algoritmos de
aproximação, conjectura sobre o diâmetro, algoritmo
que verifica se uma permutação pode ser ordenada
apenas usando transposições de prefixos que sempre
removem dois breakpoints.
Apêndice
•
Permutation Info:
–
Visualizador de Diagramas de Ciclos
–
Número de breakpoints b()
–
Número de ciclos c()
–
Número de ciclos ímpares codd()
–
Lower bound de ciclos ímpares
–
Upper bound baseada no algoritmo de aproximação
1.5 proposto por Bafna e Pevzner.
Apêndice
•
Programas para o evento de transposição:
–
Distância Exata:
•
•
–
Algoritmo Branch and Bound
Variação do algoritmo de Bellman para o cálculo do
diâmetro de transposição
Heurísticas:
•
•
Algoritmo Guloso
Testes
www.ic.unicamp.br/~zanoni/tese
Rearranjo de Genomas:
Uma Coletânea de Artigos
Zanoni Dias
Orientador:
João Meidanis
Download