CRÍTIC@: COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA GLAUBER JOSÉ CELINA MAKI SILVIO ROBERTO MEDEIROS EVANGELISTA1; LEANDRO HENRIQUE MENDONÇA OLIVEIRA1; IVO PIEROZZI JR.1 1 MOURA ; 1 VAZ ; 2 TAKEMURA ; 1. EMBRAPA INFORMÁTICA AGROPECUÁRIA 2. EMBRAPA MONITORAMENTO POR SATÉLITE RESUMO Propomos uma metodologia semi-automatizada de estruturação e indução de conhecimento a partir da informação técnicocientífica do domínio de recursos hídricos, que envolve desde a coleta de informações até a visualização de resultados de buscas, passando por extração de padrões, inferências e ontologias. OBJETIVOS Oferecer soluções que contribuam para o processo de gestão do conhecimento em recursos hídricos, especialmente no Brasil. Mais especificamente, visar à estruturação e indução de conhecimento, por meio de mineração de textos e construção de representações do conhecimento, buscando maior qualidade nos processos de recuperação, análise, visualização e utilização das informações relativas a recursos hídricos. MATERIAL E MÉTODOS Extração de padrões: nessa fase, serão obtidos metadados faltantes, em especial, de cobertura temporal e espacial, palavras-chaves e tópicos dos documentos. Também serão desenvolvidos classificadores de documentos e extratores de relações causa-consequência. Além disso, serão utilizadas ferramentas de business intelligence para a obtenção de estatísticas descritivas. Construção de uma ontologia de recursos hídricos: pretende-se alinhar, evoluir e adaptar à terminologia brasileira ontologias já existentes para o tema de recursos hídricos. Gestão terminológica: a partir da lista de candidatos a termos e das relações ontológicas criadas, serão desenvolvidos mecanismos para a criação e manutenção da terminologia, de fichas terminológicas e de um glossário de recursos hídricos. Mecanismos de busca e visualização: será disponibilizado um mecanismo de busca fácil de usar, eficiente e que traga resultados adequados ao perfil do usuário e contexto de uso. Diferentes formas de visualização dos resultados de busca e análise de informações também serão oferecidos. Para o desenvolvimento de uma metodologia semi-automática de estruturação e indução de conhecimento, pretende-se desenvolver as etapas mostradas na Figura 1 e descritas a Projetos e produtos associados: seguir: AINFO: sistema para automação de bibliotecas, armazenamento e recuperação de informações técnicocientíficas da Embrapa. Seu módulo de consulta e sua ferramenta de extração de tópicos e palavras-chaves são base para o mecanismo de busca da Rede AgroHidro. Agropedia Brasilis: ambiente tecnológico para trabalho colaborativo virtual e gestão do conhecimento para PD&I. TIENA: tecnologias em mineração de textos para extrair informações e padrões em notícias agrícolas em português. RESULTADOS ESPERADOS Serão disponibilizados no site da rede AgroHidro mecanismos de busca e visualização de informações sobre recursos hídricos e ferramentas que viabilizem análises de dados e observações sobre tendências tecnológicas, contribuindo Figura 1: Metodologia do Crític@ assim, para o processo de screening tecnológico. Além disso, a Coleta de dados: serão definidos e coletados os documentos e terminologia e a ontologia do domínio serão evoluídas. informações da Embrapa ou de seus parceiros. Esses dados passarão por um processo de padronização e serão CONCLUSÃO armazenados em uma base (metadados e textos completos). O Com os produtos desenvolvidos espera-se: promover a corpus resultante, tratado por ferramentas linguísticas, disseminação do conhecimento em recursos hídricos; servir de alimentará as análises de dados. referência a novas pesquisas na área; auxiliar a manutenção Extração de candidatos a termos: serão extraídos candidatos da rede de pesquisa; e, especialmente, ajudar na tomada de a termos, ou seja, palavras ou composições de palavras que decisões referente à gestão dos recursos hídricos. Além disso, possuem um peso estatisticamente significativo no corpus. a metodologia gerada com este trabalho poderá ser estendida Serão testadas e evoluídas algumas ferramentas de forma a a redes de pesquisa que tratem de qualquer outro tema. melhor se adaptarem à terminologia de recursos hídricos.