Apresentação (Documento PPS)

Propaganda
EMBRAPA _ Foco: Dados  Conhecimento
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Bioinformática na EMBRAPA
Fluxograma – descrição completa do projeto GENOMA
#1
Seqüenciamento
Testes no campo
Produto
#4
Alvos para ação dos
fármacos, agrotóxicos,
inseticidas, fungicidas etc.
In silico testes
#3
#2
Genoma completo
http://www.cbi.cnpia.embrapa.br
Estrutura Proteica
Goran Neshich
Structure
Sequence
Function
Role
Blast
SMS
Microarray
Image
Analysing
STING
Semantic
Lexical
Pragmatic
Sintactic
•Anotação Gênica
•Comparação de
genomas
http://www.cbi.cnpia.embrapa.br
•Descritores
de Função
•Descritores
de Estrutura
•Proteoma
•Redes
de expressão de genes
Goran Neshich
Bioinformática na EMBRAPA
Fluxograma – descrição completa do projeto GENOMA
Função
Seqüenciamento e
Anotação das seqüências
(unidades descentralizadas
da EMBRAPA)
Seqüências
Análise das Estruturas
das proteínas e seus
complexos com DNA e
Ligantes (Cenargen &
NBI/CNPTIA)
http://www.cbi.cnpia.embrapa.br
Alvos identificados nas
estruturas protéicas
e ligantes detectados como
modificadores da função
(NBI – CNPTIA)
Estrutura
Funcionalidade das
proteínas e seus
complexos
(NBI – CNPTIA)
Goran Neshich
Bioinformática na EMBRAPA
Fluxograma – sugestão baseada na competência atual
Usuários Lab 4
Usuários Lab 12, 2,3,7
Função
Estrutura
Seqüência
Sistema
de transfer.
Anotação das seqüências
Usuários Lab 3
http://www.cbi.cnpia.embrapa.br
Desktops Server 2
Seqüências
Usuários Lab 2
Server 3
Seqüências
Usuários Lab 7
Goran Neshich
Bioinformática na EMBRAPA
Seqüenciamento, junção e anotação das seqüências
 Os laboratórios de pesquisa das
unidades descentralizadas do sistema
Embrapa contribuem com arquivos
contendo as seqüências e suas
anotações
Usuários Lab 4
Usuários Lab 12, 2,3,7
 As seqüências são juntadas para criar o
genoma completo
 As sequências são anotadas de acordo
com sua similaridade com outras
sequências já existentes em BDs
 Todos os dados permanecem com
descritores originais, para busca fácil e
identificação
 As atualizações são refletidas para
todos os participantes
 O sistema exige o controle de acessos e
segurança.
Anotação das seqüências
Usuários Lab 3
http://www.cbi.cnpia.embrapa.br
Sistema
de transfer.
Desktops Server 2
Seqüências
Usuários Lab 2
Server 3
Seqüências
Usuários Lab 7
Goran Neshich
Bioinformática na EMBRAPA
HTS: Modelagem das estruturas, identificação dos alvos para fármacos
 Os laboratórios de pesquisa das
unidades descentralizadas do sistema
Embrapa RECEBEM DE VOLTA a
informação indicando a parte mais
pragmática do processo que começou
com a revelação da seqüência
Usuários Lab 4
Usuários Lab 12, 2,3,7
 Os descritores de estrutura e função são
elaborados e atribuídos ao arquivo
contendo a seqüência (gênica ou
proteica)
 Uma lista de “matching” entre um certo
local na superfície de qualquer proteína,
identificado como um alvo, e BDs dos
ligantes, será apresentado.
 Esta lista poderá então servir como base
para a pesquisa cuja finalidade será
identificar modificadores de função com
rigor da verificação experimental.
Geração das vacinas
Usuários Lab 3
http://www.cbi.cnpia.embrapa.br
Sistema
de transfer.
Desktops Server 2
Inibidores com
especificidade
alterada
Usuários Lab 2
Server 3
Controle de expressão
gênica
Usuários Lab 7
Goran Neshich
Aplicações de BioInformática com alta demanda por
CPU’s em era pós-genoma
Objetivos específicos do grupo da
BioInformática Estrutural EMBRAPA/CNPTIA:
Usar as ferramentas existentes (Java
Protein Dossier de STING Millennium Suite)
para gerar descritores de estrutura e função
de proteínas;
Seleção de alvos para desenvolvimento de
drogas a partir de seqüências genômicas
geradas por grupos participantes e/ou
outros, adaptando para este processo as
ferramentas existentes (Modeller e/ou
Dragon) para modelagem da estrutura
proteica automática
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Sting Millennium Suite (SMS) e Java Protein Dossier
(PD)- BD dos alvos
Objetivos específicos do grupo da
BioInformática Estrutural EMBRAPA/CNPTIA:
As interações macromoleculares acontecem
através das suas superfícies – formando as
interfaces.
Nós pretendemos mapear em detalhes todos
os parâmetros físico-químicos pertinentes
nestas interfaces e que definem o
reconhecimento entre o alvo na proteína e seu
ligante.
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Sting Millennium Suite (SMS) e Java Protein Dossier
(PD)- BD dos alvos
Objetivos específicos do grupo da
BioInformática Estrutural EMBRAPA/CNPTIA:
SMS e Java Protein Dossier são ferramentas
afinadas para a visualização e mapeamento
das interações na interface!
“Interface Forming Residues (IFR)” definidos
pelo SMS e seu JPD, possuem uma extensa
lista de parâmetros físico-químicos necessários
para a análise de reconhecimento entre
macromoléculas
http://www.cbi.cnpia.embrapa.br
Goran Neshich
SMS e Java Protein Dossier – Banco de dados
dos alvos para fármacos
Objetivos específicos do grupo da
BioInformática Estrutural EMBRAPA/CNPTIA:
Genoma
estrutural
Genomas de
sequenciamento
Livro da vida
BD das estruturas
Anotação
Descritores da estrutura
Estrutura-Função
Busca por novos
moduladores de função
Estudos dos mutantes
e sua dinâmica
http://www.cbi.cnpia.embrapa.br
Interações: Proteínas /
ligantes (Matching DB)
Descoberta de novos
Fármacos (Drug Discovery)
Docking
Goran Neshich
O Objetivo final: complementar o caminho
dos projetos Genoma…
Sequências do genoma
completo
Modelagem por homologia
BD dos pequenos
reagentes
Estruturas nos
arquivos locais
Impressão Digital
(Fingerprint)
Impressão Digital
(Fingerprint)
Casamento entre mapas 2D
do contorno das superfícies
Proteína-informação 2-D
do seu sítio ativo
(para comparação)
Ligando-informação2-D
da sua superfície
(para comparação)
Estudos dos mutantes
e sua dinâmica
http://www.cbi.cnpia.embrapa.br
Interações: Proteínas /
ligantes (Matching DB)
Docking
Goran Neshich
Busca por novos moduladores de função
Casamento entre impressões digitais
de proteínas e moduladores de função
Cartola de enzimas
Cartola de
moduladores de
função (e.g.
inibidores)
http://www.cbi.cnpia.embrapa.br
encaixe
encaixe
encaixe
Casamento
perfeito
Casamento
perfeito
Casamento
perfeito
Goran Neshich
Contatos na interface mapeados na sequência
Produtos específicos do NBI_Embrapa/CNPTIA
http://www.cbi.cnpia.embrapa.br
Goran Neshich
JPD com mapeamento de potencial
eletrostático, hidrofobicidade e curvatura
http://www.cbi.cnpia.embrapa.br
Goran Neshich
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Otimização do uso dos computadores disponíveis no
sistema Embrapa Tecnologia GRID (Grade computacional)
Serviços Web
Tecnologia GRID
Serviços GRID
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Acesso online aos recursos computacionais
descentralizados
ampla
disseminação
Busca por novos fármacos
In silico
Armazém
dos arquivos
Clientes com
desktop
Desafio de instalação de Grade Computacional na Embrapa
http://www.cbi.cnpia.embrapa.br
Goran Neshich
~3000 PCs e dezenas de estações de trabalho do
sistema EMBRAPA: ociosos?
Recursos Locais
HD
External
Networks
Campinas
Recursos Locais
HPSS
Rede
Externa
Brasília
Rede Externa
Rede Externa
Recursos Locais
CPU’s
ociosos
CPU’s
ocisosos
Recursos Locais
HD
HD
Otimização de uso dos recursos computacionais EXISTENTES para
criação eficaz dos produtos para agropecuária da nova geração
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Motivação para estabelecer a Grade Computacional
no sistema Embrapa
Aplicação
Planejamento
Serviços de
Catalogação
Serviços de
Informação
Execução
Monitoramento
Gerenciamento
Segurança
Serviço confiável
de transferência
Recursos
Computacionais
Recusros de
armazenamento
• Objetivo: providenciar a interface de Grid
portal através da qual os biólogos moleculares
podem disparar e gerenciar os processos e
dados
http://www.cbi.cnpia.embrapa.br
Goran Neshich
Modelo hierárquico de unidades descentralizadas
Outros parceiros
Unidade
#2
Brasília
Unidade
#3
Centros de
computação
descetralizados
do sistema Embrapa
http://www.cbi.cnpia.embrapa.br
Campinas
CNPTIA
Conexões de rede
dedicadas ou
compartilhadas
Unidade
#1
Goran Neshich
Grades Computacionais baseadas em conhecimento
Serviços de
Entrada
Conhecimento
Relação
Entre
Conceitos
Gerenciamento
Serviços de
Acesso
Repositório de
conhecimento
para as Regras
Query / Browse
Baseado em
Conhecimento
(Acesso baseado em modelo)
Informação
Atributos
Semântica
Repositório de
Informação
Query
baseado em
Atributo
(Sistema de gerenciamento de dados)
Dados
Campos
Containers
Fichários
http://www.cbi.cnpia.embrapa.br
Armazém
(Replicações,
IDs Permanentes)
Query baseado
em Propriedades
Goran Neshich
Download