Universidade Estadual de Maringá Pró-Reitoria de Pesquisa e Pós-Graduação Relatório de Projeto Integrado de Pesquisa TÍTULO DA PESQUISA: Intersul – Sistema Integrado de Apoio à Rede Sul de Pesquisa e Pós-Graduação COORDENADORA: Itana Maria de Souza Gimenes, Ph. D PARTICIPANTES: Professores Elisa Hatsue Moriya Huzita, Dra. Maria Madalena Dias, Dra. Wesley Romão, Dr. Bolsistas: Fernando Sambinelli, IC Marcelo Pazzinatto, IC Veridiana de Vasconcelos Duarte, AT DURAÇÃO: Julho/01 – Junho 2003 PERÍODO DE ABRANGÊNCIA DO RELATÓRIO: Julho 2001 - Junho 2002 SUMÁRIO 1 Introdução ...................................................................................................................... 3 2 Instalação do Ambiente de desenvolvimento do projeto ............................................... 3 3 Estudo do domínio da aplicação e elicitação de requisitos ........................................... 4 3.1 Atividades do ator System Administrator (Administrador do Sistema) ................ 8 3.2 Atividades do ator User (Usuário) ........................................................................ 8 3.2.1 Atividades do ator Main User (Usuário Principal) ........................................ 8 4 Projeto da arquitetura do sistema................................................................................. 10 5 Estudos Preliminares sobre Técnicas de Mineração de Dados.................................... 16 6 Protótipação ................................................................................................................. 18 7 Gerenciamento das atividades deste projeto ..................................................................... 20 8 Conclusões .................................................................................................................... 20 9 Referências .................................................................................................................... 21 10 Anexos ..................................................................................................................... 22 10.1 VISITA DA EQUIPE AO GRUPO STELA – Florianópolis .............................. 22 2 1 Introdução O projeto Intersul tem por objetivo: desenvolver técnicas de extração de conhecimentos e tomada de decisão aplicáveis à C&T; desenvolver técnicas de visualização e apresentação de informações em C&T; construir indicadores de C&T confiáveis; contribuir para o processo de avaliação e acompanhamento das agências de fomento; tornar disponível, rapidamente, informações sobre o potencial de C&T. O sistema envolve, em seu desenvolvimento, técnicas de sistemas de informação baseados na Web (SIbWeb), arquitetura de software, integração de dados, mineração de dados e groupware e agentes inteligentes. No período de abrangência deste relatório as principais atividades desenvolvidas estão relacionadas a instalação do ambiente de desenvolvimento do projeto, a análise do domínio do sistema, a prototipação inicial e estudos preliminares sobre técnicas de mineraçao de dados. Este relatório está estruturada com base nestas atividades. 2 Instalação do Ambiente de desenvolvimento do projeto O ambiente de desenvolvimento do projeto, tanto nos itens de software como de hardware, foram instalados levando em consideração a natureza do projeto. Os requisitos que mais influenciaram foram aqueles relacionados à mineração de dados e ao fato do sistema Intersul ser baseado na Web. Abaixo estão as principais especificações de hardware do servidor do projeto: Processador Athon XP 1.6 Ghz; Capacidade de memória principal 1 GB; Capacidade de memória secundária : IDE 30 GB + SCSI 20 GB. Das características acima, justifica-se o uso de uma alta capacidade de processamento quanto de memória principal, pelo fato do servidor atuar tanto como servidor Web como servidor de banco de dados. É importante destacar que, o trabalho de mineração de dados requer bom desempenho de memória secundária, o que foi solucionado com a controladora SCSI. O servidor do Intersul está integrado no LES (Laboratório de Engenharia de Software), portanto, o projeto também utiliza as várias 3 estações de trabalho que este laboratório possui. Os produtos de software que o projeto utiliza são: sistema gerenciador de banco de dados - Oracle 8i Server [ORA02]; servidor web - Apache 1.3 [APA02]; interpretador Java JSP - TomCat 3.3 [APA02]; editor HTML – Dreamweaver MX; pacote de editoração gráfica - Adobe Edition; ambiente de programação Java – Netbeans 3.4 [NET02][HUN01][JAV02]. Além do servidor foi adquirido um cliente de configuração similar que está atualmente na sala do Prof. Wesley Romão. 3 Estudo do domínio da aplicação e elicitação de requisitos Nesta etapa do projeto procurou-se entender o domínio em que o sistema Intersul está inserido, bem como as tecnologias e áreas do conhecimento a serem utilizadas no desenvolvimento do mesmo. Na primeira reunião realizada em Curitiba (Outubro 2001) foram discutidos os objetivos do projeto e seus principais usuários foram discutidos. Assim, ficou definido como usuários principais do sistema Intersul: Gestores de FAPs e Pró-Reitores de Universidade. Os gestores de FAPs tem como interesse aspectos relacionados à formação e às atividades profissionais como segue: Formação Fomento à formação: distribuição geográfica de competência (ex. endereço correspondência, formação: nível, área, setor, instituição) Política de desenvolvimento: incentivos à inserção empresarial. Atividade Profissional Indução ou descoberta de relações institucionais, ex: competências institucionais complementares (incentivo a programas específicos) Com relação aos Pró-Reitores pode-se destacar os seguintes interesses: Formação Análise de distribuição de recursos humanos na instituição; Indução à formação de núcleos de pesquisa, ex: Programa institucional de novas tecnologias em educação (Livro Verde); Análise de egressos da própria instituição 4 Perfil de competências segundo políticas de Fundos Setoriais, linhas de financiamento, temáticas. Com relação à Produção de C&T os Pró-Reitores podem estar interessados em Perfil institucional da pesquisa; Políticas de tipificação institucional; Avaliação institucional; Análise da atividade de orientação, ex: PIBIC na instituição. Estudos referentes às políticas de planejamento aplicadas à administração pública, políticas de C&T, e gestão de informação em C&T e entrevistas foram realizadas. Estudou-se também as políticas federais de fomento à C&T, dispostas no “Livro Verde” [MCT02], elaborado pelo Ministério da Ciência e Tecnologia, bem como a aquisição de embasamento teórico sobre planejamento administrativo em geral. Concomitantemente, foram analisadas técnicas ou tecnologias que poderiam oferecer suporte ao desenvolvimento do projeto. Dentre as técnicas estudadas estão Inteligência Artificial para aquisição de conhecimento; Mineração de Dados em [ROM02] [DIA01], para descoberta de conhecimento em grandes massas de dados; Arquitetura de Software em [BAS97] [BRE02] [IRE97] [LAZ01], Groupware e Métodos de desenvolvimento baseado em componentes, em particular o Método Catalysis em [D´SO98] e [CAT02].. A partir das discussões e estudos realizados foi elaborado o modelo de negócios do sistema Intersul. A Figura 1 mostra os casos de uso identificados para o domínio do problema. Nela podemos ter uma visão global as atividades realizadas pelos usuários do sistema. Foram identificados os seguintes atores: User: que inclui os atores MainUser (usuário principal, que representam as agências de fomento e instituições de ensino) e quaisquer outros usuários do sistema. O tipo de usuário MainUser tem ações restritas à sua classe, além das mesmas funcionalidades que os demais usuários. Note-se que existem algumas restrições de acesso a operações por usuários diferentes do MainUser. Apenas as ações View C&T News (Ver Notícias em C&T ) e View Select Investigations (Ver Investigações Selecionadas) estão disponibilizadas aos demais usuários (comunidade em geral). MainUser: realiza as ações DoPlan (Planejar), que inclui a ação DoInvestigation (Realizar Investigação) e View Select Investigations (Ver 5 Investigações Selecionadas); DoControl (Controlar); DoAnalysis (Analisar); DoEvaluation (Avaliar); DoManager (Administrar); conforme proposto na concepção do projeto, além da atividade de ver notícias em C&T (View C&T News). System Manager (Administrador do Sistema): responsável pelas ações de gerenciamento de usuários do sistema (Manage Users); integração e manutenção da base de dados do sistema (Manages Database); e manutenção das notícias de C&T a serem disponibilizadas aos usuários (Maintain C&T News). 6 <<include>> DoPlan Do Investigation DoControl View Selected Investigations DoAnalysis MainUser (from Actors ) DoEvaluation * User DoManager (from Actors ) View C&T News Managers 1 Manager Users System Administrator (from Actors ) Manager Database Maintains C&T New Figura 1 – Casos de Uso do Domínio do Sistema Uma vez analisadas as atividades envolvidas no domínio em que o Intersul está envolvido identificou-se, da mesma forma, as ações envolvidas na atividade de planejamento em particular, pois esta é objeto de desenvolvimento da proposta de projeto. A Figura 2 ilustra os casos de uso significantes do ponto de vidtas da arquitetura da atividade planejamento. Considerando cada ator (usuário) envolvido tem-se o que segue. 7 3.1 Atividades do ator System Administrator (Administrador do Sistema) Register Selected Investigation (Registrar Investigações Selecionadas) - o administrador deve manter disponível aos usuários através do site as investigações realizadas no sistema por outros usuários, que apresentarem resultados considerados interessantes de acordo com alguns parâmetros; Maintains C&T News (Manter Notícias de C&T) - o administrador deve manter disponível aos usuários notícias no âmbito de C&T no Brasil, através do site; Integrate & Populate Databse (Integrar e Popular o Banco de Dados) - o administrador deve povoar a base de dados do Intersul com base nas bases já consolidadas no âmbito de C&T no Brasil, como o Lattes, além de manter este banco de dados em um estado atualizado e consistente; Manager Users (Gerenciar Usuários) - o administrador também é responsável pelas atividades de gerenciamento de usuários (apenas os usuários da classe Main User necessitam este gerenciamento) , que incluem a inclusão, a atualização e remoção de usuários mediante validações. 3.2 Atividades do ator User (Usuário) São as atividades visíveis tanto aos usuários principais (Main Users), quanto aos usuários secundários(Secondary User): View Selected Investigations (Ver Investigações Selecionadas) - qualquer usuário pode visualizar através do site do Intersul as investigações realizadas usuários principais que foram classificadas como importantes; View C&T News (Ver Notícias de C&T): qualquer usuário pode visualizar notícios referentes às atividades de C&T brasileiras, e disponibilizadas no site do Intersul. 3.2.1 Atividades do ator Main User (Usuário Principal) Além de herdar as atividades realizadas pelo usuário User, este usuário realiza as seguintes atividades. DoInvestigation (Investigar) - corresponde a toda a atividade de realizar uma investigação na base de dados através de mineração de dados em busca de indicadores em C&T. Esta atividade se sub-divide em: 8 Start Investigation (Iniciar Investigação) - antes de realizar uma investigação, o usuário deve realizar a identificação da investigação, através de um nome, uma data e um breve resumo objetivando a rápida identificação desta invstigação no futuro. Todas as investigações realizadas pelo usuário estarão disponíveis em uma área personalizada do usuário, para possíveis edições ou re-execuções. Configure General Impression (Configurar Impressão Geral): esta atividade constitui-se da definição das impressões gerais (crenças) do usuário necessárias à execução da mineração de dados, através da configuração de parâmetros e itens para cada impressão geral. O sistema deverá prover meios otimizados e de fácil uso para aquisição destas impressões gerais do usuário. Execute DataMining (Executar Mineração de Dados), que significa a execução do algoritmo de mineração de dados específico, após a definição das impressões gerais do usuário. Esta atividade pode ser realizada em uma das seguintes maneiras: Confirm Investigation (Investigação por Confirmação): utilizar-se de uma técnica de miniração de dados que tem como objetivo confirmar as crenças do usuário. Contradict Investigation (Investigação por Contradição): utilizar-se de uma técnica de mineração de dados que tem como objetivo encontrar conhecimento que contradizem as crenças do usuário. 9 Figura 2: Casos de Uso do Item Planejamento 4 Projeto da arquitetura do sistema Técnicas de arquitetura de software auxiliam a projetar sistemas baseado nos conceitos de componentes de modo a permitir o desenvolvimento incremental do sistema e garantir a sua continuidade [D´SO98]. A reutilização é uma técnica importante neste contexto, uma vez que permite a construção de software a partir de 10 padrões, frameworks e componentes bem especificados e testados. No entanto, os métodos de desenvolvimento de software tradicionais não oferecem suporte adequado a estes conceitos. Estudos neste sentido tem sido realizados pela equipe do projeto que apontam que métodos recentes como o Catalysis [D´SO98] [CAT02] e o Unified Process, baseados na notação UML [BOO00][BOO99][RUM99], oferecem alguns dos recursos necessários a este desenvolvimento. Um arquitetura de software é um artefato que dá o mais alto retorno em investimento com respeito à qualidade, definição de cronogramas e custo, dado que a arquitetura aparece nas primeiras fases da vida do produto, influenciando o desenvolvimento, a integração, o teste e as modificações [BAS97]. A arquitetura de um sistema computacional representa a estrutura ou estruturas organizacionais globais e de alto nível de um sistema. Esta abrange os componentes de software, as propriedades destes componentes visíveis externamente (serviços, desempenho, características, compartilhamento de recursos, etc), e os relacionamentos entre eles. A definição da arquitetura considera as influências externas e internas ao sistema, objetivando-se fornecer informação suficiente para servir como base de análise, tomada de decisões, redução de riscos e comunicação com stakeholders do sistema. Uma arquitetura pode ser decomposta recursivamente em partes (componentes) que interagem através de interfaces que representam as funcionalidades oferecidas para e requeridas de outros componentes. A Figura 3 mostra uma representação geral do contexto do sistema Intersul. 11 Figura 3 – Arquitetura Geral do Intersul Nesta figura é possível verificar a necessidade de construção de um Data Warehouse (DW) [INN96] que integre os dados provenientes das grandes agências de fomento (ex. CAPES, CNPq) com os dados das FAPs e das instituições e seus grupos de pesquisa. A figura ainda permite visualizar as principais funcionalidades do InterSul que são: planejamento, administração, avaliação e acompanhamento de projeto e análises de dados. Este projeto se concentrará nas funcionalidades de planejamento. O InterSul está sendo desenvolvido com base nas atuais tecnologias de desenvolvimento de sistemas de informações para a WEB (WBIS) [FOU99]. A Figura 4 mostra a arquiteura de integração Web SGBD (Sistema Gerenciador de Banco de Dados) adotada, a arquitetura SSI (Server Side Includes) [IRE97] que possibilita a geração de documentos Web dinâmicos através da inserção de trechos de código inseridos em documetnos Web a serem executados pelo servidor para acesso a banco de dados. 12 Figura 4 – Aplicações SSI. Uma vez definidas a arquitetura geral do sistema e as tecnologias de apoio ao desenvolvimento do sistema, passamos a elaborar a modelagem conceitual do caso de uso planejamento, objetivo desta primeira fase do projeto. A modelagem foi elaborado utilizando a ferramenta Rational Rose [RAT02], seguindo o processo de desenvolvimento Catalysis, o qual não é diretamente suportado pela ferramenta e constituiu-se em item particular de estudo. A arquitetura interna do sistema (para o componente planejamento) pode ser vista na Figura 5, na forma de uma hierarquia dos pacotes componentes da aplicação, e organizados em camadas horizontais representando os servições de mais alto nível nas camadas superiores e os serviços de mais baixo nível nas camadas inferiores. Os pacotes também estão dispostos de forma que pacotes relacionados a um dado tipo de usuário estejam agrupados na mesma camada [GIM01]. As setas tracejadas indicam que o pacote origem da seta importa serviços do pacote destino. Nela pode-se observar os seguintes pacotes de serviços: Monitoring News: pacote com objetivo de apresentar automaticamente ao usuário notícias na área de C&T e investigações realizadas por outros usuários consideradas de relevância; Making Investigation: este pacote compreende as atividades de condução e configuração das investigações. Nele estão inclusas as atividades de criar uma nova investigação, buscar uma ou mais investigações de usuários no banco, bem como remover e editar investigações de usuários. Ele importa serviços dos pacotes AGD, Viewing e GI_Editing. AGD: compreende o algoritmo genético-difuso (AGD) responsável pela mineração de dados no banco. O AGD utiliza-se por sua vez das funcionaldades do framework DataSource. DataSource: Este framework especifica as funcionalidades que são necessárias para a implementação do acesso aos dados pelos pacotes que os importam, e deixa a implementação destas para serem feitas durante a instalação do sistema em um 13 ambiente servidor específico. Ou seja, o framework especifica apenas as interfaces dos serviços requeridos pelos pacotes importadores. Com isso, existe um nível de componentização maior, permitindo a independência da fonte de dados (ex.: banco de dados específico ou sistema de arquivos) com o funcionamento dos pacotes. Viewing Results: este pacote é responsável pela apresentação dos resultados de mineração ao usuário; GI_Editing: responsável pela coleta das impressões gerais do usuário, para serem enviadas ao algoritmo de mineração de dados; Managing Users: este pacote é responsável pelas tarefas de manutenção e aceitação dos cadastros de usuários, além de importar as atividades do pacote Loging ; Loging: atividades de login/autenticação de usuários; Managing Database: este pacote encarrega-se das atividades de integração das bases de dados externas no DataWarehouse do Intersul, bem como pela fase de préprocessamento dos dados e manutenção do banco em um estado consistente e atualizado. 14 Monitoring News (from User Services) Making Investigation Managing Users (from User Services) (from User Services) External System (from DoPlan) Selected Investigation Investigation (from DoPlan) Services (from DoPlan) (from DoPlan) C&T News (from Business Object Model) AGD Viewing Results (from Business Services) Dataminig Dataminig Result (from DoPlan) <<DataSource_AGD>> (from Data Services) Loging (from Business Services) GI_Editing (from Business Services) (from DoPlan) (from Business Services) General Impression Editor General Impression (from DoPlan) <<DataSource_ViewingResults>> (from DoPlan) <<DataSource_GI_Editing (from Data Services) (from Data Services) Managing Database (from Data Services) Internal database External database (from Business Object Model) (from Business Object Model) Figure 5 : Diagrama de pacotes do item Planejamento 5 Estudos Preliminares sobre Técnicas de Mineração de Dados Foram realizados estudos preliminares sobre as técnicas de mineração de dados que atendem as funcionalidades de planejamento em C&T requisitadas pelo sistema Intersul. A escolha de uma técnica de mineração de dados a ser aplicada não é uma tarefa fácil. Segundo Harrison (1998), a escolha das técnicas de mineração de dados dependerá da tarefa específica a ser executada e dos dados disponíveis para análise. As técnicas de mineração são classificadas conforme as tarefas que as mesmas realizam. As principais tarefas da mineração de dados são: a) Classificação A tarefa de classificação consiste em construir um modelo de algum tipo que possa ser aplicado a dados não classificados visando categorizá- los em classes. Um objeto é examinado e classificado de acordo com uma classe definida. b) Estimativa (ou Regressão) A estimativa é usada para definir um valor para alguma variável contínua desconhecida como, por exemplo, receita, altura ou saldo de cartão de crédito. Ela pode ser usada para executar uma tarefa de classificação, convencionando-se que diferentes faixas (intervalos) de valores contínuos correspondem a diferentes classes. c) Associação A tarefa de associação consiste em determinar quais itens tendem a coocorrerem (serem adquiridos juntos) em uma mesma transação. O exemplo clássico é determinar quais produtos costumam ser colocados juntos em um carrinho de supermercado, daí o termo ‘análise de market basket ’. d) Segmentação (ou Clustering) A segmentação é um processo de partição de uma população heterogênea em vários subgrupos ou clusters mais homogêneos. Na segmentação, não há classes predefinidas, os registros são agrupados de acordo com a semelhança, o que a diferencia da tarefa de classificação. e) Sumarização Segundo Fayyad (1996), a tarefa de sumarização envolve métodos para encontrar uma descrição compacta para um subconjunto de dados. Das tarefas realizadas pela mineração de dados a que espeficificamente satisfaz as funcionalidades do Intersul á a tarefa de classificação. Os resultados da tarefa de classificação são regras no formato: SE <antecedente> ENTÃO <conseqüente>. Segundo Freitas (2000), as regras de classificação podem ser consideradas uma espécie de regras de previsão onde o antecedente contém uma combinação (tipicamente uma conjunção) de condições envolvendo valores do domínio dos atributos previsores, e o conseqüente contém um valor previsto para o atributo meta. O antecedente é formado por expressões condicionais envolvendo atributos do domínio da aplicação existentes nos bancos de dados. O conseqüente é formado por uma expressão que indica a previsão de algum valor para um atributo meta, obtido em função dos valores encontrados nos atributos que compõem o antecedente. Portanto, a tarefa é descobrir regras de classificação capazes de prever o valor de um atributo meta a partir dos valores de atributos previsores. As regras de previsão, portanto, objetivam auxiliar o planejamento de ações futuras, principal atividade do Intersul nesta fase. Além das tarefas de mineração de dados, foram estudas as técnicas que realizam essas tarefas. Destaca-se nessa etapa, os estudos realizados da ferramenta Weka, desenvolvida pela Universidade de Waikato, Nova Zelândia, que disponibiliza vários algoritmos que implementam essas técnicas de mineração de dados. As principais técnicas de mineração de dados são : a) Descoberta de Regras de Associação A técnica de descoberta de regras de associação estabelece uma correlaçãoestatística entre certos itens de dados em um conjunto de dados. b) Árvores de Decisão É uma árvore onde cada nó não terminal representa um teste ou decisão sobre o item de dado considerado. O objetivo principal é separar as classes; tuplas de classes diferentes tendem a ser alocadas em subconjuntos diferentes, cada um descrito por regra simples em um ou mais itens de dados. c) Raciocínio Baseado em Casos O raciocínio baseado em casos tem base no método do vizinhomais próximo, onde se procura os vizinhos mais próximos nos exemplos conhecidos e combina seus valores para atribuir valores de classificação ou de previsão. 17 d) Algoritmos Genéticos Os algoritmos genéticos são métodos generalizados de busca e otimização que simulam os processos naturais de evolução. Os algoritmos genéticos usam os operadores de seleção, cruzamento e mutação para desenvolver sucessivas gerações de soluções. Com a evolução do algoritmo, somente as soluções com maior poder de previsão sobrevivem, até os organismos convergirem em uma solução ideal (Harrison, 1998). e) Redes Neurais Artificiais As redes neurais são uma classe especial de sistemas modelados seguindo analogia com o funcionamento do cérebro humano e são formadas de neurônios artificiais conectados de maneira similar aos neurônios do cérebro humano. Optou-se por utilizar a técnica de AG (Algoritmos Genéticos) na tarefa de classificação. Essa escolha é motivada pelo fato de que AG’s realizam uma busca global que implicitamente considera a interação entre os atributos, enquanto que a maioria dos métodos tradicionais realizam busca local que não considera a importante interação entre os atributos. Em suma, após esses estudos preliminares sobre as técnicas de mineração de dados mais adquados ao Intersul, levando em consideração também os tipos de dados disponíveis para análise, selecionou-se o AG para a realização da tarefa de classificação, que é a mais adequada para os objetivos do projeto. 6 Protótipação O protótipo desenvolvido para o sistema Intersul, que contém a funcionalidade de planejamento, está em fase de implementação. A versão atual contém as interfaces principais do sistema e está disponível para avaliação no endereço www.din.uem.br/~intersul. A Figura 6 apresenta a tela principal do protótipo, responsável pela comunicação do sistema com o usuário, aquisição de impressões gerais e apresentação dos resultados da mineração. 18 Figura 6 – Tela Principal do Protótipo Para o aquisição de Impressões Gerais (IG) do usuário, foi formulado e implementado um editor, conforme mostra a figura 7. Por meio do editor o usuário encontra facilidades gráficas para a formulação de impressões gerais do sistema, através da identificação da investigação sendo realizada, bem como da seleção da entidade de referência, dos atributos e dos valores envolvidos a cada IG. O mesmo editor é utilizado para as atividades de edição de impressões gerais realizadas anteriormente. Figura 7 – Editor de Impressões Gerais 19 7 Gerenciamento das atividades deste projeto Durante o primeiro ano foram realizados acompanhamentos e gerenciamento das atividades desenvolvidas pela equipe técnica e bolsistas e, também, dos aspectos relacionados ao orçamento e divulgação dos resultados alcançados por este projeto. Foram realizadas as seguintes reuniões entre os parceiros do projeto: Curitiba: estiveram presentes Roberto Pacheco, Alex Freitas, Júlio Nievola, Itana Gimenes e Maria Madalena Dias. A discussão principal realizada foi em relação aos objetivos do projeto e definição do perfil dos principais usuários do sistema Intersul. Maringá: estiveram presentes Roberto Pacheco, Júlio Nievola, Itana Gimenes, Wesley Romão, Maria Madalena Dias, Elisa Huzita e os bolsistas Marcelo Pazzinato, Fernando Sambinelli e Veridiana Vasconcelos. O prótotipo do sistema Intersul foi apresentado e discutido. Foi também discutido a disponibilização dos dados do sistema Lattes e acertada a utilização dos dados da UEM e PUC-PR. Tivemos a visita do Pró-Reitor Gilberto Pavanelli, do Diretor do NPD Dilvo Palpitz e da Chefe de Pesquisa Rejane Sartori. Foi discutida a viabilização da plataforma Lattes UEM, ficando os membros do projeto disponíveis para auxiliar o NPD na instalação da plataforma. Além disso foi realizada uma visita técnica ao grupo Stella para discussão do protótipo do Intersul e conhecimento da plataforma Lattes, cujos dados são utilizados neste projeto. O relatório desta visita encontra-se em anexo. Para que todos os parceiros acompanhassem o desenvolvimento do projeto foi desenvolvido o site http://www.din.uem.br/~intersul, uma lista de discussão da equipe e divulgação das reuniões periódicas. 8 Conclusões O projeto tem se desenvolvido dentro do esperado. Alguma dificuldade foi encontrada na liberação da segunda parte dos recursos pela Fundação Araucária que até então disponibilizou apenas a verba de custeio. O principal resultado obtido até então foi o protótipo do sistema Intersul que representou o entendimento da equipe sobre como o sistema deve ser desenvolvido. A partir deste o sistema está sendo modelado conforme descrito nas seções anteriores. 20 9 Referências [APA02] The Apache Software Foundation. Disponível em www.apache.org [BAS97] BASS, Len; CLEMENTS, Paul; KAZMAN, Rick. Software Architecture in Practice. 1st edition. Addisson Wesley Publishing. 1997. [BOO00] BOOCH, Grady; RUMBAUGH, James; JACOBSON, Ivar. UML Guia do Usuário. 2nd edition. Editora Campus. 2000. [BOO99] BOOCH, Grady; RUMBAUGH, James; JACOBSON, Ivar. Applying UML and Patterns: An Introduction to Object-Oriented Analysis and Design. 1st edition. Editora Campus. 1999. [BRE02] Software Architecture, Software Architects, and Architecturing. Disponível em www.bredemeyer.com [CAT02] Catalysis – Enterprise components with UML. Disponível em www.catalysis.org [D´SO98] D´SOUZA, Desmond Francis; WILLS, Alan Cameron. Objects, Components and Frameworks with UML - The Catalysis Approach. 1st edition. Addisson Wesley Publishing. 1998. [DIA01] DIAS, Maria Madalena. Um Modelo de Formalização do Processo de Desenvolvimento de Sistemas de Descoberta de Conhecimento em Banco de Dados. 2001. Dissertação (Doutorado em Engenharia de Produção) Programa de Pós-Graduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis. [FRE00] Freitas A. A. Evolutionary Algorithms for Data Mining and Knowledge Discovery. Ghosh, A. & Tsutsui, S. (Eds.) Theory and Application of Evolutionary Computation – Recent Trends, 2000. [FOU99] FOURNIER, Roger. A Methodology for Client/Server and Web Application Development. Prentice Hall. 1999. [GIM01] GIMENES, Itana Maria de Souza, et al. O Processo de Desenvolvimento Baseado em Componentes Através de Exemplos. ERI Encontro Regional de Informática. Maringá. 2001. [HUN01] HUNTER, Jason; CRAWFORD, William. Java Servlet Programming. 2nd edition. O´Reilly & Associates. 2001. [INN96] INNON, W. H. Como construir o Data Warehouse. 2nd edition. Editora Campus. 1996. 21 [IRE97] LIMA, Iremar Nunes de. Ambiente Web Banco de Dados: Funcionalidades e Arquiteturas de Integração. 1997. Dissertação (Mestrado em Computação) – Centro de Computação, Universidade Federal de Minas Gerais, Belo Horizonte. [JAV02] The Source for the Java(TM) Technology. Disponível em www.java.sun.com [LAZ01] LAZILHA, Fabrício. Fundamentos para uma Proposta de Arquitetura de Linha de Produção para Workflow Management Systems. 2001. Programa de PósGraduação em Computação – Instituto de Informática, Universidade Federal do Rio Grande do Sul, Porto Alegre. [MCT02] Brasil. Ministério da Ciência e Tecnologia. Disponível em www.mct.gov.br [NET02] NetBeans. Disponível em www.netbeans.org [OMG02] OMG Home. Object Management Group. Disponível em www.omg.org. [ORA02] Oracle Corporation. Disponível em www.oracle.com [RAT02] Rational Software. Disponível em www.rational.com [ROM02] ROMÃO, Wesley. Descoberta de Conhecimento Relevante em Banco de Dados sobre Ciência e Tecnologia. 2002. Dissertação (Mestrado em Engenharia de Produção) - Programa de Pós-Graduação em Engenharia de Produção, Universidade Federal de Santa Catarina, Florianópolis. [RUM99] RUMBAUGH, J.; JACOBSON, I.; BOOCH, G. The Unified Language Reference Manual. Addison Wesley Publishing. 1999. 10 Anexos 10.1 VISITA DA EQUIPE AO GRUPO STELA – Florianópolis 1) Objetivo da Visita: Conhecimento do Laboratório Stela; Método de Desenvolvimento – Divisão da Equipe em Células; Tecnologias – Aperfeiçoamento; Conhecer a Plataforma Lattes – (Institucional) Componentes e Módulos; Tecnologia – Interface. 2) Apresentação das funcionalidades e recursos disponíveis na Plataforma Lattes – Institucional por Marcos Marchezan Arquitetura da Paltaforma Lattes; Ferramentas de desenvolvimento; Interface do sistema; 22 3) Apresentação informal do Sistema Intersul para equipe – Célula Data Mining do Lab. Stela Troca de idéias para futuras implementações no sistema Intersul; Dúvidas em relação ao gerar o Editor; INDICAÇÕES EQUIPE STELA – Célula Interface Material para estudo, para aperfeiçoamento e adequação do ambiente a ser desenvolvido, a qual será utilizado no Sistema Intersul. http://www.stela.ufsc.br/disciplinas/ O material sugerido tem o objetivo de estudar os critérios necessários para a preparação de documentos digitais, a serem apresentados através de um site via internet. Para um melhor entendimento sobre design de interfaces, pretende-se levantar questionamentos que dizem respeito à usabilidade, interatividade do usuário com o sistema e ao valor estético e funcional que devem caracterizar a interface gráfica de um site como é o caso desta proposta de sistema. Sugestões para Interface: Desenho da Interface by Flávio Targino da Silva Tipografia para Web by Arley Diagramação na Web by Clóvis Gueyer e Janaína Berti Design de Página Web by Janaína Berti e Clóvis Gueyer 23 Writing by Sandra Martins e Isabel M. Luclktenberg Outros Tópicos de Fundamental Importância: 1) História da Internet / Jornalismo On-line / Ambiente WEB; 2) Características da Internet e do Ambiente WEB; 3) Informação e Arquitetura da Informação; 4) Informação e Imagem; 5) Metodologia de Construção de sites - DADI; 6) Definindo o conceito e planejando seu site; 7) Metodologia aplicada a construção de portais web; 8) Estudo de Layout; 9) Design para Web; 10) Estudo da cor para Web; 11) Tipografia; Outras Considerações: - Verificou-se o uso de tecnologia web similar ao que já estava projetado para uso no INTERSUL, como no caso do interpretador JSP ( JavaServer Page), linguagem JAVA e da arquitetura da aplicação. - Absorvemos o trabalho foi realizado com o Lattes na área de DataWarehouse, tendo boa aplicação para nosso projeto. - Todo planejamento e arquitetura da utilização de Código Móvel também foi nos apresentada. - O uso de frameworks, sua aplicabilidade e necessidade em projetos de grande porte. - Algumas questões foram levantadas com relação a eficiência do Algoritmo de mineração de dados em ambiente web, que também serão estudadas posteriormente. LATTES INSTITUCIONAL O laboratório se disponibilizou a fornecer os fontes do Interlattes, tanto procedural como orientado a objetos. 24 - O Lattes Instituicional na UEM é sem especialização; - Para a UEM: módulo do Lattes destinado a projetos institucionais, já que lattes não o cobrem - O interlattes é implementado em Delphi, com módulos independentes - A independência de plataforma do Lattes não se dá pelo fato de haver módulos em delphi. - Ao enviar um currículo para a instituição, este na verdade vai primeiro para o CNPq - Banco de dados de pessoas, para autenticação, é interessante para restringir quem poderá colocar currículo no banco; -Lattes – Interlattes – Unisinos: unilattes.unisinos.br - árvore de navegação e barra de navegação no protótipo; - usar applet para ajuda e/ou autenticação; - gráficos são realmente viáveis para a apresentação dos resultados? - estudo da utilização de XML no intersul; 25