55 Quimio -informática. Conteúdos que urge ensinar. JOÃO AIRES DE SOUSA* Resumo Na gestão de informação, computação, comunicação e conhecimentos de Informática. A existência de uma edição, a Química usa hoje intensivamente e com uma gama extensa de software para Química exige dos poten- especificidade muito própria, as principais funcionalida- ciais utilizadores conhecimentos específicos sobretudo des dos computadores. O aproveitamento da cada vez ao nível dos métodos envolvidos. Por tudo isto, sugere-se mais abundante informação química requer o desenvolvi- a incorporação de conteúdos de Quimio-informática no mento constante de metodologias novas, que não pode sistema de ensino universitário e são propostos temas a ser feito sem uma forte formação em Química e sólidos tratar nesse contexto. Introdução A rápida disseminação de suportes electrónicos para arquivo de informação, o desenvolvimento da instrumentação laboratorial, nomeadamente no sentido da automatização e da miniaturização e o aparecimento de novas técnicas como a química combinatorial e Por outro lado, a Internet trouxe possibi- zadas na maioria dos casos como caixas lidades inovadoras de comunicação, de negras que ora fazem milagres, ora pro- colaboração à distância e de acesso a duzem resultados sem sentido! vastíssimas fontes de informação, o que tem contribuído para a implementação de estratégias de representação e manuseamento de informação específicas da Química. Discute-se que nome dar a esta área nova, na fronteira entre a Química e a Informática, que aplica e desenvolve sistemas de informação, algoritmos, técnicas computacionais e métodos esta- HTS (high-throughput screening) provo- Simultaneamente tem-se observado um tísticos para problemas de Química. caram nos últimos anos uma verdadeira extraordinário incremento do poder "Cheminformatics", que aqui traduzo explosão na produção de informação computacional e uma notável sofistica- por Quimio-informática, é a designação química. Uma empresa farmacêutica ção das técnicas de computação em que vai sendo mais consensualmente aceite. "Química Computacional" é uma média que realize HIS pode produzir re- Química. A modelação molecular tor- sultados de dezenas de milhar de expe- nou-se clássica, ganhou honras de pré- expressão ainda usada como sinónimo, riências por dia'. O Chemical Abstracts mio Nobel 3 e a Química Teórica estabe- embora seja normalmente conotada adiciona actualmente cerca de 900 000 leceu-se como um reconhecido ramo da com a utilização de software (como o Química. Gaussian 4 , MOPAC, DOCK 6 , Autodock 6 novos compostos por ano à sua base de dados 2 . Isto requer tecnologias eficientes para arquivo e acesso a dados; o Os frutos obtidos em todas estas frentes ,...) para modelação molecular. problema mais sério que se põe é o de estão acessíveis ao químico experimen- Em todo o mundo industrializado, a in- como, para uma dada aplicação, des- tal comum através de software de fácil dústria química e farmacêutica que faz prezar o "ruído" e usar a informação útil. utilização para os sistemas operativos investigação e desenvolvimento, utiliza Mais ainda, a utilização desta informa- que lhe são familiares e através de in- fortemente recursos de Quimio-informá- ção permite estabelecer correlações, terfaces WWW. São ferramentas que in- tica, mas tem dificuldade em encontrar aprender, extrair conhecimento, objecti- vadiram gradualmente os laboratórios (e especialistas na área. Os informáticos vos que só são alcançáveis usando me- os universos mentais) e que se estão a raramente têm apetência para a Quími- todologias computacionais e de inteli- impor mesmo aos químicos avessos à ca e os químicos sabem normalmente gência artificial. modernidade electrónica. Mas são utili- muito pouco de Informática. Para suprir *Investigador na área de Quimio- informática, na FCT /UNL e na Universidade de Erlangen- Nürnberg (Alemanha). Morada: Departamento de Química, CQFB, campus FCT-UNL, Quinta da Torre, 2829 Monte de Caparica, Portugal. Email: [email protected] 56 I QUÍMICA estas necessidades, estão a implemen- utilizam nesse processo métodos com- ção vai rapidamente permeando os mé- tar-se rapidamente cursos de mestrado putacionais e técnicas intensivas basea- todos de decisão, as técnicas laborato- em Quimio-informática, sendo os pio- das em informação. É essa a razão por riais, os métodos de avaliação de resul- neiros os da Universidade de Sheffield que o fenómeno não aconteceu ainda tados. Se numa primeira fase o (Reino Unido)', UMIST (Universidade em Portugal, onde aquelas indústrias fenómeno se centrou na indústria de de Manchester, Reino Unido) 8 e IUPUI não têm tradicionalmente dimensão inovação aplicada, ele vai estender-se (Universidade de Indiana-Purdue, para desenvolver produtos novos. No ao ensino, á investigação fundamental, E.U.A.) 9 . A nível de pré-graduação, in- entanto, a tendência da indústria multi- à optimização de processos e aos siste- corporaram-se já disciplinas de Quimio- nacional para recorrer ao outsourcing mas de controlo de qualidade, áreas informática em numerosas Universida- também na investigação, e a abundante que empregam a maioria dos químicos des 10 . mão-de-obra científica formada em Por- em Portugal. tugal na última década, permitem per- E enquanto tudo isto acontece, que Onde ir buscar profissionais com com- guntar se não haverá oportunidade para adaptações sofrem os conteúdos das li- petências nesta área ? O problema pôs- empresas de investigação portugue- cenciaturas de Química nas Universida- se há décadas, em pequena escala, nos sas... des Portuguesas ? Que formação é pro- grupos académicos pioneiros da Qui- porcionada aos alunos portugueses mio-informática. Nessa primeira gera- nestas tecnologias ? ção recorreu-se normalmente a quími>.,.Q RI! Não são tecnologias cos que adquiriram conhecimentos de informáti- futuristas, nem distantes, nem inaces- Deu 250251 oprn 64636., re.dyfor sears.. MzdWOüzD MeufHSfo,bµg rep.rtse, mmenh síveis, nem caras... Query Type U ca de forma mais ou menos qualquer químico uly . slsere.nuam que queira hoje pro- 0/ Pug .n.scamdroan problema esten- Cmancel J r itu deu-se à indús- J Etlbar ^ Mal Wolf.L tria, em grande INenfel& fu bug reports. c.mmmmu ad quesu,ns I.+.. . rruJMESmurnme Edens byP F:d, 1,tat tpl ^ WO .m Ed I — pmm.a. szemamn duzir um relatório, u ^3s..en 0e,.0 manusear um es- u pectro, fazer pes- 04,004, quem geld. hr AND ° ORO XOR O Max. number oleos end search time ra lv,^ quisa bibliográfica, estruturada. O Query Data Value U Negate U J São exigidas por r I- ar This Sebm.mere Query —••••vO0000O I Aious ` Value swap . r O Dutput Sua esta adoptou meto- dologias second Duryo, pomo = computacionais, ...11311 • analisar resultados escala, quando e tem sido resolvido por químicos obtidos, fazer previ- 250251 opeotmucnres« W •D alenfeld, foe Ng re po r, eo sões para os pro- com formação Opasadrawió WaDaeasel of+Sn.cwes: blemas que tem em F.m,aal<efne O presente artigo pre- íACer e1 FAO nuuemes MaMR<cords ^ Vismamaaaa. complementar em J DataRemeval: Note m3Dr Sop If mão... matemática ou in- A leis Image calle,, formática. Msreomanaa: IPa.Ianaae,y lm fir allato-m No contexto actual exige-se Sample Soormm.. tende ser, por um lado, 297344 223345 ?-t6507 "346524 uma reflexão sobre as uma resposta mais sistemati- intervenções possíveis zada por par-te das institui- e necessárias no campo da Quimio-informática nas instituições de ^ ti 29^ t F_ . CAS C1eff14NiO Nu.) 12-edryl-5-med0d.1R-mdol-3-ylH4pynóMlmedtmone cursos de mestrado em QuiMiument Coe mio-informática e cadeiras ensino superior em Portugal e, por outro, um contributo para o planeamento dos cursos deste tipo que inevitavelmente vão ser criados. A situação Portuguesa A Quimio-informática e a Bio-informática têm sido consistentemente nos últimos anos áreas científicas com excesso de procura de mão-de-obra face à oferta existente. A necessidade deste tipo de especialistas tem origem nas indústrias química e farmacêutica que fazem investigação de novos produtos e que Reino Uni-do, estão a criar-se 3-21) ( .. a AO- ções de ensino e, nos EUA e Sample Nome dSYws C,yH0N70 (Moo nesta área a incluir nos curTradicionalmente tem-se exigido aos químicos 'conhecimentos de informáti- sos de graduação. ca na óptica do utilizador' e, mesmo Em Portugal, a criação de disciplinas de esses, não lhes são normalmente forne- Quimio-informática nas licenciaturas de cidos pelas universidades que frequen- Química parece, por tudo o que acima tam. Conhecimentos e capacidades se disse, urgente. Já a criação de mes- muito mais vastos nesta área vão ser ne- trados será provavelmente desajustada cessários no futuro próximo à medida no panorama presente. Para além do que os métodos computacionais em mais, o recrutamento para este campo, Química se desenvolvem e estabele- de licenciados em Química, será sem- cem, que o volume de informação quí- pre uma estratégia com poucos frutos. mica disponível começa a ser reconhe- Sempre serão raros os químicos que, cido e que a instrumentação gera e depois de uma licenciatura em Química arquiva mais e mais dados. A computa- de 4 ou 5 anos, decidirem entrar numa QUÍMICA 1 área com tão forte componente de In- b) Disciplinas de Química Computacio- mentos HTML, que podem ser editados formática. O mesmo problema acontece nal ou de Modelação Molecular que com editores próprios, e que podem in- em Biologia, para encontrar cientistas têm por vezes conteúdos sobreponí- corporar, de forma interactiva, estrutu- na área da Bio-informática. veis aos de cadeiras de Química ras químicas 2D ou 3D e espectros, por Teórica. Incidem especialmente exemplo utilizando o plug-in Chime' 2 Por outro lado, seria muito mais fácil propor a finalistas do ensino secundário uma licenciatura em Bio- e Quimio-informática cujos conteúdos principais seriam a Química, a Biologia e a Informática. A licenciatura daria formação básica em Biologia e em Química, com ênfase na instrumentação e nas aplica- sobre 1) aplicações de cálculos para browsers de WWW. Tem sido de- quânticos e de campos de forças senvolvida uma linguagem própria para empíricos ao estudo de mecanismos codificação de informação química reaccionais e de interacções ligan- (CML — Chemical Mark-up Language) do-receptor; 2) dinâmica molecular; tendo em vista sobretudo a Internet' 4. ' 5 3) generalidades sobre sistemas Estruturas e propriedades moleculares operativos e programação. ções informáticas; e daria formação sis- c) Disciplinas de Quimiometria que tra- temática em Informática. Produziria li- tam de aplicações de estatística e cenciados com formação e motivação redes neuronais à análise de dados próprias para trabalhar em Bio-informá- químicos. Aplicações de referência tica e em Quimio-informática; mas for- são a classificação de amostras a neceria também profissionais para em- partir de análises com múltiplas va- pregos mais frequentemente oferecidos riáveis e o estabelecimento de rela- podem ser visualizadas em ambiente de realidade virtual usando o formato VRML 16 . Informação química pode ser transmitida por email e reconhecida automaticamente pelo cliente de email de modo a utilizar editores ou visualizadores adequados. Tal é possível pela utilização de MIME químico 17 . nas áreas comerciais e de controlo de ções entre estrutura molecular e Arquivo de informação química. A es- qualidade de empresas químicas e far- função. sência de uma estrutura molecular está macêuticas, e mesmo para empregos na área da informática. Outra alternativa é a criação de um ramo de Bio- e Quimio-informática em licenciaturas de Química ou Biologia. Mas será algum destes caminhos possível, em tempo de diminuição de número de alunos, num sistema universitário cansado de licenciaturas com nomes novos e problemas velhos ?... Mais fácil será talvez introduzir cadeiras d) Disciplinas de Documentação Científica que abordam, para além das fontes tradicionais de informação em papel, as fontes de informação química na Internet e em suportes digitais. profissional nesta área. Embora com nomes diversos, em várias universidades portuguesas têm sido incluídas matérias de informática e computação em algumas disciplinas de Química, ainda que de forma pouco abrangente (existindo ainda licenciaturas em Departa- gações que estabelecem entre si e na orientação espacial destas. Têm sido propostas várias maneiras de codificar esta informação e existem consequentemente vários formatos e tipos de ficheiros em que são arquivadas estruturas e) Disciplinas de Química várias em cujos programas os docentes incluí- moleculares. Entre os mais comuns estão os ficheiros .mo1 18 e .pdb 19 . Tam- ram a utilização de software aplica- bém a informação espectroscópica é re- do às respectivas matérias. presentada em formatos próprios que usam frequentemente estratégias para de Quimio-informática nas licenciaturas de Química e criar cursos de formação na identidade dos seus átomos, nas li- Propostas de Conteúdos reduzir o tamanho dos ficheiros necessários. Há uma tendência para que o Sem entrar em pormenores quanto às reestruturações necessárias nas disciplinas existentes, proponho de seguida pistas de conteúdos que deveriam ser ensinados sistematicamente em disciplinas de Quimio-informática. formato JCAMP 20 se torne um padrão. Volumes grandes de informação arquivam-se de preferência em bases de dados. Existem vários sistemas para a construção de bases de dados com informação química (como o ChemFin- mentos nacionais de prestígio sem uma Edição e visualização de informação disciplina de Química Computacional). química. Através de editores molecula- Manager 23 ) que permitem arquivar As aproximações já feitas são resumida- res (por exemplo ChemDraw'', ISIS estruturas químicas, reacções, proprie- mente as seguintes: Draw 12 ou applets Marvin' 3 em Java) dades numéricas ou alfanuméricas, fór- a) Disciplinas de Química Teórica que tratam da teoria subjacente aos métodos de modelação molecular (química quântica, soluções aproximadas da equação de Schródinger, modelo de Hückel, método de Har- der 11 , ISIS Base 12 , CACTVS 22 , ACD Spec- criam-se e editam-se ficheiros electróni- mulas, espectros. Vários tipos de pes- cos contendo estruturas químicas. Es- quisas podem ser efectuadas, sendo truturas 2D ou 3D de moléculas simples específicas da Química as pesquisas de ou de macromoléculas, assim como sub-estruturas, de sub-espectros, de cromatogramas ou espectros, são visua- reacções ou de semelhança estrutural. lizados através de programas próprios, Através de bases de dados relacionais de que existem muitos exemplos, gratui- pode incorporar-se informação existente tos ou comerciais. em várias bases de dados, grupos e por vezes também de tra- Para apresentação de informação na Computação química. Através de méto- tamento de erros. WWW usam-se principalmente docu- dos estatísticos e de redes neuronais é tree-Fock,...). Incluem conteúdos de termodinâmica estatística, teoria de 57 58 QUÍMICA possível estabelecer correlações entre levantes destas bases de dados envolve te a consulta rápida á "base de dados" estrutura química e propriedade mole- algoritmos e software para alinhamento estabelecida pela ligação em rede dos cular (QSPR) ou entre estrutura química de sequências, cesquisa de semelhan- conhecimentos dos químicos envolvi- e actividade biológica (QSAR). Para tal, ças, estimativa de árvores filogenéticas, dos. Para além disso, os arquivos das é frequente representar estruturas quí- previsão estrutural e inferência funcio- mensagens trocadas nestas comunida- micas por números, mais concretamen- nal. te por um número fixo de parâmetros. Tem-se desenvolvido uma grande variedade de descritores moleculares baseados principalmente em grafos moleculares, em propriedades físico-químicas, ou em características geométricas. des, quando existem e são pesquisá- Fontes de informação química. O apa- veis, constituem fontes de informação recimento e omnipresença da Internet valiosas. veio revolucionar as fontes de informação a que os químicos têm acesso. 24,25,26 Para além de inúmeras fontes novas, também as antigas (revistas, enciclopé- Mas os canais mais consistentes para a disseminação de informação química de qualidade continuam a ser as publicações com sistema de refereeing. A utilização de descritores moleculares, dias, catálogos, índices) migraram ou de impressões digitais moleculares e de tendem a migrar (pelo menos em regi- Estas têm posto na Internet muitas das outros tipos de códigos permite analisar me complementar) para a Internet. suas funcionalidades 33 , incluindo a pos- o grau de diversidade estrutural existen- Estão disponíveis bases de dados es- sibilidade de publicar material de forma te num conjunto de compostos, o que é pectroscópicas e estruturais, toxicológi- interactiva, impossível no suporte de frequentemente útil no design de biblio- cas e de segurança, de reacções quími- papel. A submissão de artigos tende a tecas combinatoriais. Por outro lado cas, de propriedades moleculares e ser feita preferencialmente por email ou permite estabelecer medidas de seme- catálogos comerciais. Existem ferramen- por transferência de ficheiros num web lhança estrutural entre duas ou mais tas comerciais de pesquisa bibliográfica moléculas. (como o Chemical Abstracts ou o Beils- A aplicação mais clássica da computação química consiste no recurso à mecânica molecular ou à mecânica quântica para o cálculo de propriedades termodinâmicas de compostos e reacções. Vários tipos de programas estão disponíveis, com aproximações de vários níveis e têm tido muitas aplicações no design de fármacos e de reacções. Algoritmos muito utilizados são os algoritmos evolucionários, principalmente os algoritmos genéticos. Simulam a evolução de uma população em que os indivíduos com características mais desejáveis sobrevivem e reproduzem-se, fazendo sobressair, ao fim de várias gerações, as características que tornam os indivíduos mais aptos. São utilizados para problemas de optimização e têm tein) mas tam bém sites gratuitos como o da Ingenta 27 (herdeiro do BIDS e do Uncover) ou o Medline 28 , e serviços de alerta. Outra fonte formidável de informação disponível gratuitamente na Internet e frequentemente esquecida nas macional até à selecção de descritores moleculares mais adequados ao estabelecimento de QSAR. consultados na WWW pelos assinantes, havendo várias soluções consoante os editores. Normalmente o material suplementar dos artigos está disponível gratuitamente na WWW. É também frequente as revistas proporcionarem Universidades são as bases de dados de pesquisas nos abstracts ou nos títulos patentes 29 . E as revistas científicas tradi- dos seus artigos em arquivo, sendo cionais estão presentes na Internet a par estas pesquisas alargadas, em alguns com outras revistas exclusivamente casos, a todas as revistas de um mesmo electrónicas. editor (como no caso da ACS 34 ). Comunicação em Química. As comunidades vi rt uais ce químicos na Internet Conclusão têm tomado formas variadas. Nas mai- ling lists (ou listserv) a comunicação A Quimio-informática é uma área emer- funciona por email sendo cada mensa- gente que utiliza métodos computacio- gem distribuída por todos os membros nais para problemas de Química. Tem da lista 30 . Um exemplo é a ORGLIST 31 — sido intensamente utilizada pela indús- mailing list interiacional de Química Or- tria química e farmacêutica na desco- gânica, que te n sede em Po rt ugal. Nos berta de novos produtos e tem trazido - tido aplicação desde a análise confor- site e os artigos podem muitas vezes ser bulletin boards os membros da comuni- interpretações novas a questões científi- dade podem ertrar num web site para cas fundamentais. A presença destes visualizar as mensagens publicadas e criar as suas próprias mensagens. Os conteúdos no ensino universitário da Química em Portugal é escassa e a sua Bases de dados com informação bio- newsgroups são os mais antigos, têm química. Estes tipos de bases de dados um protocolo próprio e as mensagens têm a especificidade de conterem prin- são públicas. N3 ChemWeb 32 , os mem- cipalmente estruturas 3D de macromo- bros têm acesso a fora de discussão, a léculas biológicas, sequências (de ami- uma biblioteca, bases de dados, repor- noácidos ou ácidos nucleicos) e vias tagens sobre congressos, informação b) que muitos destes métodos passa- incorporação ao nível da graduação e pós-graduação deve ter em consideração a) o panorama nacional e europeu de emprego para químicos e cientistas; metabólicas. É de especial relevo neste sobre emprego, ou centro comercial. ram já para o núcleo dos métodos bási- contexto o projecto do genoma humano. Idealmente a interacção com outros quí- cos da Química. Neste artigo são lança- A análise para extrair conhecimentos re- micos numa comunidade virtual permi- das pistas de reflexão sobre o assunto. QUÍMICA 1 14 http://www.xml-cml.org/ 28 http://www.ncbi.nlm.nih.gov/entrez/ 1 D. J. Ausman, Modern Drug Discovery, 15 P. Murray-Rust, H. S. Rzepa, J. Chem. query.fcgi 2001. 4(5), 33-39. lnf. Comput. Sci. 1999, 39, 928. 29 http://ep.espacenet.com/ 2 http://www.cas.org 16 http://www2.chemie.uni-erlangen. 30 a) J. Aires-de-Sousa, Internet Journal of 3 http://www.nobel.se/chemistry/laurea- de/services/vrmIcreator/index.html Chemistry, 1999, 2. tes/1998/index.html 17 H. S. Rzepa, P. Murray-Rust, and B. J. b) P. van der Valk, Chemical Web Marketing 4 http://www.gaussian.com Whitaker, J. Chem. lnf. Comput. Sci., 1998, 5 http://www.cmpharm.ucsf.edu/kuntz/ 38 (6), 976-982. dock.html 18 http://www.mdli.co.uk/cgi/dynamic/ 6 http://www.scripps.edu/pub/olsonweb/doc downloadsect.html?uid=&key=&id=1#file Bibliografia /autodock/ (http://www.chemconnect.com/cwmt/cwmt03 .html#mailing). 19 http://www.resb.org/pdb/info html# 7 http://www.shef.ac.uk/—is/courses/ File Formats and Standard c) W. Warr, J. Chem. Inf. Comput. Sci. 1998. 38, 966-975. d) P. van der Valk, Chemical Web Marketing and Technology, 1998, 2(8) pgrad/mscci/mscci.html 8 http://www.ch.umist.ac.uk/ and Technology, 1997, 1(3) 20 http://www.isasdortmund.de/projects/ (http://www.chemconnect.com/cwmt/cwmt20 jcamp/(camp.htm 8.html#vc). 21 http://www.chemfinder.com e) A. Pisanty, J. Labanowski, Trends Anal. MScCheminf.htm 9 http://www.chem.iupui.edu/ 22 http://www2.chemie.uni-erlangen. 10 Por exemplo Chem. 1996, 15, 53. (http://www.elsevier.n1:80/homepage/saa/trac de/software/cactvs/index.html a) http://www.ch.ic.ac.uk/. /emltrac.htm) f) S. Miller, Trends Anal. 23 http://www.acdlabs.com b) http://www.stfx.ca/people/chemist/ Chem. 1996, 15, 164. (http:// www.else- 24 J. Aires de Sousa, Química, 1996. 61, chem375.html . 16-20. c) http://www.vscht.cz/syllab/Subjects/ vier.n1:80/homepage/saa/trac/lims.htm) 31 http://www.dq.fct.unl.pt/orglist Chemical I nformatics.html 25 G. Wiggins, J. Chem. Inf. Comput. Sci., 11 http://www.cambridgesoft.com/ 1998, 38(6), 956-965. 12 http://www.mdli.com 26 http://www.indiana.edu/—cheminfo/ library/journals/index.html 13 http://www.chemaxon.com/ 27 http://www.ingenta.com 34 http:/pubs.acs.org 32 http://www.chemweb.com 33 http://www.chemconnect.com/ kAPCER Certificado de Conformidade iaMr Ga,rKa<,vaepuranOti NUMERO/, s,, 96/CEP.410 A Associação Po rtuguesa de Certificação (APCER) Assovaton fer cemationtaca / certifica que o sistema da qualidade da SOQUÍMICA — SOCIEDADE DE REPRESENTAÇÕES DE QUÍMICA, LDA. Rua Coronel Santos Pedroso, 15 1500 - 207 LISBOA PORTUGAL SOQUIMICA Sociedade de Representações de Quimica. Lda Implementado na comercialização, manutenção e calibração de equipamentos de laboratório, cumpre os requisitos da R. Coronel Santos Pedroso 15 • 1500-207 Lisboa Tel 21 716 5160 • Fax 21 716 5169 NP EN ISO 9002:1995 R. 5 de Outubro 269 4100-175 Porto Tel 22 609 3069 • Fax 22 600 0834 Sistemas da Qualidade. Modelo de garantia da qualidade na produção, instalação e assistência após-venda. E-mail: [email protected]. O presente certificado é emitido no âmbito do Sistema Português da Qualidade. Data de emissào/m,. .rinse Luis Fonseca Director Geral/agiam muita 1999-06-18 Vilido até /uaawa 2002-06-17 www.soquimica.pt 59