EMBRAPA _ Foco: Dados Conhecimento http://www.cbi.cnpia.embrapa.br Goran Neshich Bioinformática na EMBRAPA Fluxograma – descrição completa do projeto GENOMA #1 Seqüenciamento Testes no campo Produto #4 Alvos para ação dos fármacos, agrotóxicos, inseticidas, fungicidas etc. In silico testes #3 #2 Genoma completo http://www.cbi.cnpia.embrapa.br Estrutura Proteica Goran Neshich Structure Sequence Function Role Blast SMS Microarray Image Analysing STING Semantic Lexical Pragmatic Sintactic •Anotação Gênica •Comparação de genomas http://www.cbi.cnpia.embrapa.br •Descritores de Função •Descritores de Estrutura •Proteoma •Redes de expressão de genes Goran Neshich Bioinformática na EMBRAPA Fluxograma – descrição completa do projeto GENOMA Função Seqüenciamento e Anotação das seqüências (unidades descentralizadas da EMBRAPA) Seqüências Análise das Estruturas das proteínas e seus complexos com DNA e Ligantes (Cenargen & NBI/CNPTIA) http://www.cbi.cnpia.embrapa.br Alvos identificados nas estruturas protéicas e ligantes detectados como modificadores da função (NBI – CNPTIA) Estrutura Funcionalidade das proteínas e seus complexos (NBI – CNPTIA) Goran Neshich Bioinformática na EMBRAPA Fluxograma – sugestão baseada na competência atual Usuários Lab 4 Usuários Lab 12, 2,3,7 Função Estrutura Seqüência Sistema de transfer. Anotação das seqüências Usuários Lab 3 http://www.cbi.cnpia.embrapa.br Desktops Server 2 Seqüências Usuários Lab 2 Server 3 Seqüências Usuários Lab 7 Goran Neshich Bioinformática na EMBRAPA Seqüenciamento, junção e anotação das seqüências Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa contribuem com arquivos contendo as seqüências e suas anotações Usuários Lab 4 Usuários Lab 12, 2,3,7 As seqüências são juntadas para criar o genoma completo As sequências são anotadas de acordo com sua similaridade com outras sequências já existentes em BDs Todos os dados permanecem com descritores originais, para busca fácil e identificação As atualizações são refletidas para todos os participantes O sistema exige o controle de acessos e segurança. Anotação das seqüências Usuários Lab 3 http://www.cbi.cnpia.embrapa.br Sistema de transfer. Desktops Server 2 Seqüências Usuários Lab 2 Server 3 Seqüências Usuários Lab 7 Goran Neshich Bioinformática na EMBRAPA HTS: Modelagem das estruturas, identificação dos alvos para fármacos Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa RECEBEM DE VOLTA a informação indicando a parte mais pragmática do processo que começou com a revelação da seqüência Usuários Lab 4 Usuários Lab 12, 2,3,7 Os descritores de estrutura e função são elaborados e atribuídos ao arquivo contendo a seqüência (gênica ou proteica) Uma lista de “matching” entre um certo local na superfície de qualquer proteína, identificado como um alvo, e BDs dos ligantes, será apresentado. Esta lista poderá então servir como base para a pesquisa cuja finalidade será identificar modificadores de função com rigor da verificação experimental. Geração das vacinas Usuários Lab 3 http://www.cbi.cnpia.embrapa.br Sistema de transfer. Desktops Server 2 Inibidores com especificidade alterada Usuários Lab 2 Server 3 Controle de expressão gênica Usuários Lab 7 Goran Neshich Aplicações de BioInformática com alta demanda por CPU’s em era pós-genoma Objetivos específicos do grupo da BioInformática Estrutural EMBRAPA/CNPTIA: Usar as ferramentas existentes (Java Protein Dossier de STING Millennium Suite) para gerar descritores de estrutura e função de proteínas; Seleção de alvos para desenvolvimento de drogas a partir de seqüências genômicas geradas por grupos participantes e/ou outros, adaptando para este processo as ferramentas existentes (Modeller e/ou Dragon) para modelagem da estrutura proteica automática http://www.cbi.cnpia.embrapa.br Goran Neshich Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos Objetivos específicos do grupo da BioInformática Estrutural EMBRAPA/CNPTIA: As interações macromoleculares acontecem através das suas superfícies – formando as interfaces. Nós pretendemos mapear em detalhes todos os parâmetros físico-químicos pertinentes nestas interfaces e que definem o reconhecimento entre o alvo na proteína e seu ligante. http://www.cbi.cnpia.embrapa.br Goran Neshich Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos Objetivos específicos do grupo da BioInformática Estrutural EMBRAPA/CNPTIA: SMS e Java Protein Dossier são ferramentas afinadas para a visualização e mapeamento das interações na interface! “Interface Forming Residues (IFR)” definidos pelo SMS e seu JPD, possuem uma extensa lista de parâmetros físico-químicos necessários para a análise de reconhecimento entre macromoléculas http://www.cbi.cnpia.embrapa.br Goran Neshich SMS e Java Protein Dossier – Banco de dados dos alvos para fármacos Objetivos específicos do grupo da BioInformática Estrutural EMBRAPA/CNPTIA: Genoma estrutural Genomas de sequenciamento Livro da vida BD das estruturas Anotação Descritores da estrutura Estrutura-Função Busca por novos moduladores de função Estudos dos mutantes e sua dinâmica http://www.cbi.cnpia.embrapa.br Interações: Proteínas / ligantes (Matching DB) Descoberta de novos Fármacos (Drug Discovery) Docking Goran Neshich O Objetivo final: complementar o caminho dos projetos Genoma… Sequências do genoma completo Modelagem por homologia BD dos pequenos reagentes Estruturas nos arquivos locais Impressão Digital (Fingerprint) Impressão Digital (Fingerprint) Casamento entre mapas 2D do contorno das superfícies Proteína-informação 2-D do seu sítio ativo (para comparação) Ligando-informação2-D da sua superfície (para comparação) Estudos dos mutantes e sua dinâmica http://www.cbi.cnpia.embrapa.br Interações: Proteínas / ligantes (Matching DB) Docking Goran Neshich Busca por novos moduladores de função Casamento entre impressões digitais de proteínas e moduladores de função Cartola de enzimas Cartola de moduladores de função (e.g. inibidores) http://www.cbi.cnpia.embrapa.br encaixe encaixe encaixe Casamento perfeito Casamento perfeito Casamento perfeito Goran Neshich Contatos na interface mapeados na sequência Produtos específicos do NBI_Embrapa/CNPTIA http://www.cbi.cnpia.embrapa.br Goran Neshich JPD com mapeamento de potencial eletrostático, hidrofobicidade e curvatura http://www.cbi.cnpia.embrapa.br Goran Neshich http://www.cbi.cnpia.embrapa.br Goran Neshich Otimização do uso dos computadores disponíveis no sistema Embrapa Tecnologia GRID (Grade computacional) Serviços Web Tecnologia GRID Serviços GRID http://www.cbi.cnpia.embrapa.br Goran Neshich Acesso online aos recursos computacionais descentralizados ampla disseminação Busca por novos fármacos In silico Armazém dos arquivos Clientes com desktop Desafio de instalação de Grade Computacional na Embrapa http://www.cbi.cnpia.embrapa.br Goran Neshich ~3000 PCs e dezenas de estações de trabalho do sistema EMBRAPA: ociosos? Recursos Locais HD External Networks Campinas Recursos Locais HPSS Rede Externa Brasília Rede Externa Rede Externa Recursos Locais CPU’s ociosos CPU’s ocisosos Recursos Locais HD HD Otimização de uso dos recursos computacionais EXISTENTES para criação eficaz dos produtos para agropecuária da nova geração http://www.cbi.cnpia.embrapa.br Goran Neshich Motivação para estabelecer a Grade Computacional no sistema Embrapa Aplicação Planejamento Serviços de Catalogação Serviços de Informação Execução Monitoramento Gerenciamento Segurança Serviço confiável de transferência Recursos Computacionais Recusros de armazenamento • Objetivo: providenciar a interface de Grid portal através da qual os biólogos moleculares podem disparar e gerenciar os processos e dados http://www.cbi.cnpia.embrapa.br Goran Neshich Modelo hierárquico de unidades descentralizadas Outros parceiros Unidade #2 Brasília Unidade #3 Centros de computação descetralizados do sistema Embrapa http://www.cbi.cnpia.embrapa.br Campinas CNPTIA Conexões de rede dedicadas ou compartilhadas Unidade #1 Goran Neshich Grades Computacionais baseadas em conhecimento Serviços de Entrada Conhecimento Relação Entre Conceitos Gerenciamento Serviços de Acesso Repositório de conhecimento para as Regras Query / Browse Baseado em Conhecimento (Acesso baseado em modelo) Informação Atributos Semântica Repositório de Informação Query baseado em Atributo (Sistema de gerenciamento de dados) Dados Campos Containers Fichários http://www.cbi.cnpia.embrapa.br Armazém (Replicações, IDs Permanentes) Query baseado em Propriedades Goran Neshich