Relatório das atividades do primeiro ano do Projeto Intersul

Propaganda
Universidade Estadual de Maringá
Pró-Reitoria de Pesquisa e Pós-Graduação
Relatório de Projeto Integrado de Pesquisa
TÍTULO DA PESQUISA:
Intersul – Sistema Integrado de Apoio à Rede Sul de Pesquisa e Pós-Graduação
COORDENADORA:
Itana Maria de Souza Gimenes, Ph. D
PARTICIPANTES:
Professores
Elisa Hatsue Moriya Huzita, Dra.
Maria Madalena Dias, Dra.
Wesley Romão, Dr.
Bolsistas:
Fernando Sambinelli, IC
Marcelo Pazzinatto, IC
Veridiana de Vasconcelos Duarte, AT
DURAÇÃO:
Julho/01 – Junho 2003
PERÍODO DE ABRANGÊNCIA DO RELATÓRIO:
Julho 2001 - Junho 2002
SUMÁRIO
1
Introdução ...................................................................................................................... 3
2
Instalação do Ambiente de desenvolvimento do projeto ............................................... 3
3
Estudo do domínio da aplicação e elicitação de requisitos ........................................... 4
3.1
Atividades do ator System Administrator (Administrador do Sistema) ................ 8
3.2
Atividades do ator User (Usuário) ........................................................................ 8
3.2.1
Atividades do ator Main User (Usuário Principal) ........................................ 8
4
Projeto da arquitetura do sistema................................................................................. 10
5
Estudos Preliminares sobre Técnicas de Mineração de Dados.................................... 16
6
Protótipação ................................................................................................................. 18
7
Gerenciamento das atividades deste projeto ..................................................................... 20
8
Conclusões .................................................................................................................... 20
9
Referências .................................................................................................................... 21
10
Anexos ..................................................................................................................... 22
10.1
VISITA DA EQUIPE AO GRUPO STELA – Florianópolis .............................. 22
2
1
Introdução
O projeto Intersul tem por objetivo:

desenvolver técnicas de extração de conhecimentos e tomada de decisão
aplicáveis à C&T;

desenvolver técnicas de visualização e apresentação de informações em
C&T;

construir indicadores de C&T confiáveis;

contribuir para o processo de avaliação e acompanhamento das agências de
fomento;

tornar disponível, rapidamente, informações sobre o potencial de C&T.
O sistema envolve, em seu desenvolvimento, técnicas de sistemas de
informação baseados na Web (SIbWeb), arquitetura de software, integração de dados,
mineração de dados e groupware e agentes inteligentes. No período de abrangência
deste relatório as principais atividades desenvolvidas estão relacionadas a instalação
do ambiente de desenvolvimento do projeto, a análise do domínio do sistema, a
prototipação inicial e estudos preliminares sobre técnicas de mineraçao de dados. Este
relatório está estruturada com base nestas atividades.
2
Instalação do Ambiente de desenvolvimento do projeto
O ambiente de desenvolvimento do projeto, tanto nos itens de software como de
hardware, foram instalados levando em consideração a natureza do projeto. Os
requisitos que mais influenciaram foram aqueles relacionados à mineração de dados e
ao fato do sistema Intersul ser baseado na Web.
Abaixo estão as principais especificações de hardware do servidor do projeto:

Processador Athon XP 1.6 Ghz;

Capacidade de memória principal 1 GB;

Capacidade de memória secundária : IDE 30 GB + SCSI 20 GB.
Das características acima, justifica-se o uso de uma alta capacidade de
processamento quanto de memória principal, pelo fato do servidor atuar tanto como
servidor Web como servidor de banco de dados. É importante destacar que, o trabalho
de mineração de dados requer bom desempenho de memória secundária, o que foi
solucionado com a controladora SCSI. O servidor do Intersul está integrado no LES
(Laboratório de Engenharia de Software), portanto, o projeto também utiliza as várias
3
estações de trabalho que este laboratório possui. Os produtos de software que o projeto
utiliza são:

sistema gerenciador de banco de dados - Oracle 8i Server [ORA02];

servidor web - Apache 1.3 [APA02];

interpretador Java JSP - TomCat 3.3 [APA02];

editor HTML – Dreamweaver MX;

pacote de editoração gráfica - Adobe Edition;

ambiente de programação Java – Netbeans 3.4 [NET02][HUN01][JAV02].
Além do servidor foi adquirido um cliente de configuração similar que está
atualmente na sala do Prof. Wesley Romão.
3
Estudo do domínio da aplicação e elicitação de requisitos
Nesta etapa do projeto procurou-se entender o domínio em que o sistema
Intersul está inserido, bem como as tecnologias e áreas do conhecimento a serem
utilizadas no desenvolvimento do mesmo. Na primeira reunião realizada em Curitiba
(Outubro 2001) foram discutidos os objetivos do projeto e seus principais usuários
foram discutidos. Assim, ficou definido como usuários principais do sistema Intersul:
Gestores de FAPs e Pró-Reitores de Universidade.
Os gestores de FAPs tem como interesse aspectos relacionados à formação e às
atividades profissionais como segue:
Formação

Fomento à formação: distribuição geográfica de competência (ex. endereço
correspondência, formação: nível, área, setor, instituição)

Política de desenvolvimento: incentivos à inserção empresarial.

Atividade Profissional

Indução ou descoberta de relações institucionais, ex: competências
institucionais complementares (incentivo a programas específicos)
Com relação aos Pró-Reitores pode-se destacar os seguintes interesses:
Formação

Análise de distribuição de recursos humanos na instituição;

Indução à formação de núcleos de pesquisa, ex: Programa institucional de
novas tecnologias em educação (Livro Verde);

Análise de egressos da própria instituição
4

Perfil de competências segundo políticas de Fundos Setoriais, linhas de
financiamento, temáticas.
Com relação à Produção de C&T os Pró-Reitores podem estar interessados em

Perfil institucional da pesquisa;

Políticas de tipificação institucional;

Avaliação institucional;

Análise da atividade de orientação, ex: PIBIC na instituição.
Estudos referentes às políticas de planejamento aplicadas à administração
pública, políticas de C&T, e gestão de informação em C&T e entrevistas foram
realizadas. Estudou-se também as políticas federais de fomento à C&T, dispostas no
“Livro Verde” [MCT02], elaborado pelo Ministério da Ciência e Tecnologia, bem
como a aquisição de embasamento teórico sobre planejamento administrativo em
geral. Concomitantemente, foram analisadas técnicas ou tecnologias que poderiam
oferecer suporte ao desenvolvimento do projeto. Dentre as técnicas estudadas estão
Inteligência Artificial para aquisição de conhecimento; Mineração de Dados em
[ROM02] [DIA01], para descoberta de conhecimento em grandes massas de dados;
Arquitetura de Software em [BAS97] [BRE02] [IRE97] [LAZ01], Groupware e
Métodos de desenvolvimento baseado em componentes, em particular o Método
Catalysis em [D´SO98] e [CAT02]..
A partir das discussões e estudos realizados foi elaborado o modelo de negócios
do sistema Intersul. A Figura 1 mostra os casos de uso identificados para o domínio do
problema. Nela podemos ter uma visão global as atividades realizadas pelos usuários
do sistema. Foram identificados os seguintes atores:

User: que inclui os atores MainUser (usuário principal, que representam as
agências de fomento e instituições de ensino) e quaisquer outros usuários
do sistema. O tipo de usuário MainUser tem ações restritas à sua classe,
além das mesmas funcionalidades que os demais usuários. Note-se que
existem algumas restrições de acesso a operações por usuários diferentes do
MainUser. Apenas as ações View C&T News (Ver Notícias em C&T ) e
View Select Investigations (Ver Investigações Selecionadas) estão
disponibilizadas aos demais usuários (comunidade em geral).

MainUser: realiza as ações DoPlan (Planejar), que inclui a ação
DoInvestigation (Realizar Investigação) e View Select Investigations (Ver
5
Investigações
Selecionadas);
DoControl
(Controlar);
DoAnalysis
(Analisar); DoEvaluation (Avaliar); DoManager (Administrar); conforme
proposto na concepção do projeto, além da atividade de ver notícias em
C&T (View C&T News).

System Manager (Administrador do Sistema): responsável pelas ações de
gerenciamento de usuários do sistema (Manage Users); integração e
manutenção da base de dados do sistema (Manages Database); e
manutenção das notícias de C&T a serem disponibilizadas aos usuários
(Maintain C&T News).
6
<<include>>
DoPlan
Do Investigation
DoControl
View Selected Investigations
DoAnalysis
MainUser
(from Actors )
DoEvaluation
* User
DoManager
(from Actors )
View C&T News
Managers
1
Manager Users
System Administrator
(from Actors )
Manager Database
Maintains C&T New
Figura 1 – Casos de Uso do Domínio do Sistema
Uma vez analisadas as atividades envolvidas no domínio em que o Intersul está
envolvido identificou-se, da mesma forma, as ações envolvidas na atividade de
planejamento em particular, pois esta é objeto de desenvolvimento da proposta de
projeto. A Figura 2 ilustra os casos de uso significantes do ponto de vidtas da
arquitetura da atividade planejamento. Considerando cada ator (usuário) envolvido
tem-se o que segue.
7
3.1 Atividades do ator System Administrator (Administrador do
Sistema)

Register Selected Investigation (Registrar Investigações Selecionadas) - o
administrador deve manter disponível aos usuários através do site as
investigações realizadas no sistema por outros usuários, que apresentarem
resultados considerados interessantes de acordo com alguns parâmetros;

Maintains C&T News (Manter Notícias de C&T) - o administrador deve
manter disponível aos usuários notícias no âmbito de C&T no Brasil,
através do site;

Integrate & Populate Databse (Integrar e Popular o Banco de Dados) - o
administrador deve povoar a base de dados do Intersul com base nas bases
já consolidadas no âmbito de C&T no Brasil, como o Lattes, além de
manter este banco de dados em um estado atualizado e consistente;

Manager Users (Gerenciar Usuários) - o administrador também é
responsável pelas atividades de gerenciamento de usuários (apenas os
usuários da classe Main User necessitam este gerenciamento) , que incluem
a inclusão, a atualização e remoção de usuários mediante validações.
3.2 Atividades do ator User (Usuário)
São as atividades visíveis tanto aos usuários principais (Main Users), quanto aos
usuários secundários(Secondary User):

View Selected Investigations (Ver Investigações Selecionadas) - qualquer
usuário pode visualizar através do site do Intersul as investigações
realizadas usuários principais que foram classificadas como importantes;

View C&T News (Ver Notícias de C&T): qualquer usuário pode visualizar
notícios referentes às atividades de C&T brasileiras, e disponibilizadas no
site do Intersul.
3.2.1
Atividades do ator Main User (Usuário Principal)
Além de herdar as atividades realizadas pelo usuário User, este usuário realiza
as seguintes atividades.

DoInvestigation (Investigar) - corresponde a toda a atividade de realizar uma
investigação na base de dados através de mineração de dados em busca de
indicadores em C&T. Esta atividade se sub-divide em:
8

Start Investigation (Iniciar Investigação) - antes de realizar uma
investigação, o usuário deve realizar a identificação da investigação,
através de um nome, uma data e um breve resumo objetivando a rápida
identificação desta invstigação no futuro. Todas as investigações realizadas
pelo usuário estarão disponíveis em uma área personalizada do usuário,
para possíveis edições ou re-execuções.

Configure General Impression (Configurar Impressão Geral): esta
atividade constitui-se da definição das impressões gerais (crenças) do
usuário necessárias à execução da mineração de dados, através da
configuração de parâmetros e itens para cada impressão geral. O sistema
deverá prover meios otimizados e de fácil uso para aquisição destas
impressões gerais do usuário.

Execute DataMining (Executar Mineração de Dados), que significa a
execução do algoritmo de mineração de dados específico, após a definição
das impressões gerais do usuário. Esta atividade pode ser realizada em uma
das seguintes maneiras:

Confirm Investigation (Investigação por Confirmação): utilizar-se de
uma técnica de miniração de dados que tem como objetivo
confirmar as crenças do usuário.

Contradict Investigation (Investigação por Contradição): utilizar-se
de uma técnica de mineração de dados que tem como objetivo
encontrar conhecimento que contradizem as crenças do usuário.
9
Figura 2: Casos de Uso do Item Planejamento
4
Projeto da arquitetura do sistema
Técnicas de arquitetura de software auxiliam a projetar sistemas baseado nos
conceitos de componentes de modo a permitir o desenvolvimento incremental do
sistema e garantir a sua continuidade [D´SO98]. A reutilização é uma técnica
importante neste contexto, uma vez que permite a construção de software a partir de
10
padrões, frameworks e componentes bem especificados e testados. No entanto, os
métodos de desenvolvimento de software tradicionais não oferecem suporte adequado
a estes conceitos. Estudos neste sentido tem sido realizados pela equipe do projeto que
apontam que métodos recentes como o Catalysis [D´SO98] [CAT02] e o Unified
Process, baseados na notação UML [BOO00][BOO99][RUM99], oferecem alguns dos
recursos necessários a este desenvolvimento.
Um arquitetura de software é um artefato que dá o mais alto retorno em
investimento com respeito à qualidade, definição de cronogramas e custo, dado que a
arquitetura aparece nas primeiras fases da vida do produto,
influenciando o
desenvolvimento, a integração, o teste e as modificações [BAS97].
A arquitetura de um sistema computacional representa a estrutura ou estruturas
organizacionais globais e de alto nível de um sistema. Esta abrange os componentes de
software, as propriedades destes componentes visíveis externamente (serviços,
desempenho, características, compartilhamento de recursos, etc), e os relacionamentos
entre eles. A definição da arquitetura considera as influências externas e internas ao
sistema, objetivando-se fornecer informação suficiente para servir como base de
análise, tomada de decisões, redução de riscos e comunicação com stakeholders do
sistema. Uma arquitetura pode ser decomposta recursivamente em partes
(componentes) que interagem através de interfaces que representam as funcionalidades
oferecidas para e requeridas de outros componentes.
A Figura 3 mostra uma representação geral do contexto do sistema Intersul.
11
Figura 3 – Arquitetura Geral do Intersul
Nesta figura é possível verificar a necessidade de construção de um Data
Warehouse (DW) [INN96] que integre os dados provenientes das grandes agências de
fomento (ex. CAPES, CNPq) com os dados das FAPs e das instituições e seus grupos
de pesquisa. A figura ainda permite visualizar as principais funcionalidades do
InterSul que são: planejamento, administração, avaliação e acompanhamento de
projeto e análises de dados. Este projeto se concentrará nas funcionalidades de
planejamento.
O InterSul está sendo desenvolvido com base nas atuais tecnologias de
desenvolvimento de sistemas de informações para a WEB (WBIS) [FOU99]. A Figura
4 mostra a arquiteura de integração Web SGBD (Sistema Gerenciador de Banco de
Dados) adotada, a arquitetura SSI (Server Side Includes) [IRE97] que possibilita a
geração de documentos Web dinâmicos através da inserção de trechos de código
inseridos em documetnos Web a serem executados pelo servidor para acesso a banco
de dados.
12
Figura 4 – Aplicações SSI.
Uma vez definidas a arquitetura geral do sistema e as tecnologias de apoio ao
desenvolvimento do sistema, passamos a elaborar a modelagem conceitual do caso de
uso planejamento, objetivo desta primeira fase do projeto. A modelagem foi elaborado
utilizando a ferramenta Rational Rose [RAT02], seguindo o processo de
desenvolvimento Catalysis, o qual não é diretamente suportado pela ferramenta e
constituiu-se em item particular de estudo.
A arquitetura interna do sistema (para o componente planejamento) pode ser
vista na Figura 5, na forma de uma hierarquia dos pacotes componentes da aplicação, e
organizados em camadas horizontais representando os servições de mais alto nível nas
camadas superiores e os serviços de mais baixo nível nas camadas inferiores. Os
pacotes também estão dispostos de forma que pacotes relacionados a um dado tipo de
usuário estejam agrupados na mesma camada [GIM01]. As setas tracejadas indicam
que o pacote origem da seta importa serviços do pacote destino. Nela pode-se observar
os seguintes pacotes de serviços:
Monitoring News: pacote com objetivo de apresentar automaticamente ao
usuário notícias na área de C&T e investigações realizadas por outros usuários
consideradas de relevância;
Making Investigation: este pacote compreende as atividades de condução e
configuração das investigações. Nele estão inclusas as atividades de criar uma nova
investigação, buscar uma ou mais investigações de usuários no banco, bem como
remover e editar investigações de usuários. Ele importa serviços dos pacotes AGD,
Viewing e GI_Editing.
AGD: compreende o algoritmo genético-difuso (AGD) responsável pela
mineração de dados no banco. O AGD utiliza-se por sua vez das funcionaldades do
framework DataSource.
DataSource: Este framework especifica as funcionalidades que são necessárias
para a implementação do acesso aos dados pelos pacotes que os importam, e deixa a
implementação destas para serem feitas durante a instalação do sistema em um
13
ambiente servidor específico. Ou seja, o framework especifica apenas as interfaces dos
serviços requeridos pelos pacotes importadores. Com isso, existe um nível de
componentização maior, permitindo a independência da fonte de dados (ex.: banco de
dados específico ou sistema de arquivos) com o funcionamento dos pacotes.
Viewing Results: este pacote é responsável pela apresentação dos resultados de
mineração ao usuário;
GI_Editing: responsável pela coleta das impressões gerais do usuário, para
serem enviadas ao algoritmo de mineração de dados;
Managing Users: este pacote é responsável pelas tarefas de manutenção e
aceitação dos cadastros de usuários, além de importar as atividades do pacote Loging ;
Loging: atividades de login/autenticação de usuários;
Managing Database: este pacote encarrega-se das atividades de integração das
bases de dados externas no DataWarehouse do Intersul, bem como pela fase de préprocessamento dos dados e manutenção do banco em um estado consistente e
atualizado.
14
Monitoring News
(from User Services)
Making Investigation
Managing Users
(from User Services)
(from User Services)
External System
(from DoPlan)
Selected Investigation
Investigation
(from DoPlan)
Services
(from DoPlan)
(from DoPlan)
C&T News
(from Business Object Model)
AGD
Viewing Results
(from Business Services)
Dataminig
Dataminig Result
(from DoPlan)
<<DataSource_AGD>>
(from Data Services)
Loging
(from Business Services)
GI_Editing
(from Business Services)
(from DoPlan)
(from Business Services)
General Impression Editor
General Impression
(from DoPlan)
<<DataSource_ViewingResults>>
(from DoPlan)
<<DataSource_GI_Editing
(from Data Services)
(from Data Services)
Managing Database
(from Data Services)
Internal database
External database
(from Business Object Model)
(from Business Object Model)
Figure 5 : Diagrama de pacotes do item Planejamento
5
Estudos Preliminares sobre Técnicas de Mineração de Dados
Foram realizados estudos preliminares sobre as técnicas de mineração de dados
que atendem as funcionalidades de planejamento em C&T requisitadas pelo sistema
Intersul. A escolha de uma técnica de mineração de dados a ser aplicada não é uma
tarefa fácil. Segundo Harrison (1998), a escolha das técnicas de mineração de dados
dependerá da tarefa específica a ser executada e dos dados disponíveis para análise.
As técnicas de mineração são classificadas conforme as tarefas que as mesmas
realizam. As principais tarefas da mineração de dados são:
a) Classificação
A tarefa de classificação consiste em construir um modelo de algum tipo que
possa ser aplicado a dados não classificados visando categorizá- los em classes. Um
objeto é examinado e classificado de acordo com uma classe definida.
b) Estimativa (ou Regressão)
A estimativa é usada para definir um valor para alguma variável contínua
desconhecida como, por exemplo, receita, altura ou saldo de cartão de crédito. Ela
pode ser usada para executar uma tarefa de classificação, convencionando-se que
diferentes faixas (intervalos) de valores contínuos correspondem a diferentes classes.
c) Associação
A tarefa de associação consiste em determinar quais itens tendem a coocorrerem (serem adquiridos juntos) em uma mesma transação. O exemplo clássico é
determinar quais produtos costumam ser colocados juntos em um carrinho de
supermercado, daí o termo ‘análise de market basket ’.
d) Segmentação (ou Clustering)
A segmentação é um processo de partição de uma população heterogênea em
vários subgrupos ou clusters mais homogêneos. Na segmentação, não há classes
predefinidas, os registros são agrupados de acordo com a semelhança, o que a
diferencia da tarefa de classificação.
e) Sumarização
Segundo Fayyad (1996), a tarefa de sumarização envolve métodos para
encontrar uma descrição compacta para um subconjunto de dados.
Das tarefas realizadas pela mineração de dados a que espeficificamente satisfaz
as funcionalidades do Intersul á a tarefa de classificação. Os resultados da tarefa de
classificação são regras no formato: SE <antecedente> ENTÃO <conseqüente>.
Segundo Freitas (2000), as regras de classificação podem ser consideradas uma
espécie de regras de previsão onde o antecedente contém uma combinação
(tipicamente uma conjunção) de condições envolvendo valores do domínio dos
atributos previsores, e o conseqüente contém um valor previsto para o atributo meta.
O antecedente é formado por expressões condicionais envolvendo atributos do
domínio da aplicação existentes nos bancos de dados. O conseqüente é formado por
uma expressão que indica a previsão de algum valor para um atributo meta, obtido em
função dos valores encontrados nos atributos que compõem o antecedente.
Portanto, a tarefa é descobrir regras de classificação capazes de prever o valor de
um atributo meta a partir dos valores de atributos previsores. As regras de previsão,
portanto, objetivam auxiliar o planejamento de ações futuras, principal atividade do
Intersul nesta fase.
Além das tarefas de mineração de dados, foram estudas as técnicas que realizam
essas tarefas. Destaca-se nessa etapa, os estudos realizados da ferramenta Weka,
desenvolvida pela Universidade de Waikato, Nova Zelândia, que disponibiliza vários
algoritmos que implementam essas técnicas de mineração de dados.
As principais técnicas de mineração de dados são :
a) Descoberta de Regras de Associação
A técnica de descoberta de regras de associação estabelece uma correlaçãoestatística
entre certos itens de dados em um conjunto de dados.
b) Árvores de Decisão
É uma árvore onde cada nó não terminal representa um teste ou decisão sobre o
item de dado considerado. O objetivo principal é separar as classes; tuplas de classes
diferentes tendem a ser alocadas em subconjuntos diferentes, cada um descrito por
regra simples em um ou mais itens de dados.
c) Raciocínio Baseado em Casos
O raciocínio baseado em casos tem base no método do vizinhomais próximo, onde se
procura os vizinhos mais próximos nos exemplos conhecidos e combina seus valores para
atribuir valores de classificação ou de previsão.
17
d) Algoritmos Genéticos
Os algoritmos genéticos são métodos generalizados de busca e otimização que
simulam os processos naturais de evolução. Os algoritmos genéticos usam os
operadores de seleção, cruzamento e mutação para desenvolver sucessivas gerações de
soluções. Com a evolução do algoritmo, somente as soluções com maior poder de
previsão sobrevivem, até os organismos convergirem em uma solução ideal (Harrison,
1998).
e) Redes Neurais Artificiais
As redes neurais são uma classe especial de sistemas modelados seguindo
analogia com o funcionamento do cérebro humano e são formadas de neurônios
artificiais conectados de maneira similar aos neurônios do cérebro humano.
Optou-se por utilizar a técnica de AG (Algoritmos Genéticos) na tarefa de
classificação. Essa escolha é motivada pelo fato de que AG’s realizam uma busca
global que implicitamente considera a interação entre os atributos, enquanto que a
maioria dos métodos tradicionais realizam busca local que não considera a importante
interação entre os atributos.
Em suma, após esses estudos preliminares sobre as técnicas de mineração de
dados mais adquados ao Intersul, levando em consideração também os tipos de dados
disponíveis para análise, selecionou-se o AG para a realização da tarefa de
classificação, que é a mais adequada para os objetivos do projeto.
6
Protótipação
O protótipo desenvolvido para o sistema Intersul, que contém a funcionalidade
de planejamento, está em fase de implementação. A versão atual contém as interfaces
principais
do
sistema
e
está
disponível
para
avaliação
no
endereço
www.din.uem.br/~intersul. A Figura 6 apresenta a tela principal do protótipo,
responsável pela comunicação do sistema com o usuário, aquisição de impressões
gerais e apresentação dos resultados da mineração.
18
Figura 6 – Tela Principal do Protótipo
Para o aquisição de Impressões Gerais (IG) do usuário, foi formulado e
implementado um editor, conforme mostra a figura 7. Por meio do editor o usuário
encontra facilidades gráficas para a formulação de impressões gerais do sistema,
através da identificação da investigação sendo realizada, bem como da seleção da
entidade de referência, dos atributos e dos valores envolvidos a cada IG. O mesmo
editor é utilizado para as atividades de edição de impressões gerais realizadas
anteriormente.
Figura 7 – Editor de Impressões Gerais
19
7
Gerenciamento das atividades deste projeto
Durante o primeiro ano foram realizados acompanhamentos e gerenciamento das
atividades desenvolvidas pela equipe técnica e bolsistas e, também, dos aspectos
relacionados ao orçamento e divulgação dos resultados alcançados por este projeto.
Foram realizadas as seguintes reuniões entre os parceiros do projeto:

Curitiba: estiveram presentes Roberto Pacheco, Alex Freitas, Júlio Nievola,
Itana Gimenes e Maria Madalena Dias. A discussão principal realizada foi
em relação aos objetivos do projeto e definição do perfil dos principais
usuários do sistema Intersul.

Maringá: estiveram presentes Roberto Pacheco,
Júlio Nievola, Itana
Gimenes, Wesley Romão, Maria Madalena Dias, Elisa Huzita e os bolsistas
Marcelo Pazzinato, Fernando Sambinelli e Veridiana Vasconcelos. O
prótotipo do sistema Intersul foi apresentado e discutido. Foi também
discutido a disponibilização dos dados do sistema Lattes e acertada a
utilização dos dados da UEM e PUC-PR. Tivemos a visita do Pró-Reitor
Gilberto Pavanelli, do Diretor do NPD Dilvo Palpitz e da Chefe de
Pesquisa Rejane Sartori. Foi discutida a viabilização da plataforma Lattes
UEM, ficando os membros do projeto disponíveis para auxiliar o NPD na
instalação da plataforma.
Além disso foi realizada uma visita técnica ao grupo Stella para discussão do
protótipo do Intersul e conhecimento da plataforma Lattes, cujos dados são utilizados
neste projeto. O relatório desta visita encontra-se em anexo.
Para que todos os parceiros acompanhassem o desenvolvimento do projeto foi
desenvolvido o site http://www.din.uem.br/~intersul, uma lista de discussão da equipe e
divulgação das reuniões periódicas.
8
Conclusões
O projeto tem se desenvolvido dentro do esperado. Alguma dificuldade foi
encontrada na liberação da segunda parte dos recursos pela Fundação Araucária que
até então disponibilizou apenas a verba de custeio.
O principal resultado obtido até então foi o protótipo do sistema Intersul que
representou o entendimento da equipe sobre como o sistema deve ser desenvolvido. A
partir deste o sistema está sendo modelado conforme descrito nas seções anteriores.
20
9
Referências
[APA02] The Apache Software Foundation. Disponível em www.apache.org
[BAS97] BASS, Len; CLEMENTS, Paul; KAZMAN, Rick. Software Architecture in
Practice. 1st edition. Addisson Wesley Publishing. 1997.
[BOO00] BOOCH, Grady; RUMBAUGH, James; JACOBSON, Ivar. UML Guia do
Usuário. 2nd edition. Editora Campus. 2000.
[BOO99] BOOCH, Grady; RUMBAUGH, James; JACOBSON, Ivar. Applying UML
and Patterns: An Introduction to Object-Oriented Analysis and Design. 1st edition.
Editora Campus. 1999.
[BRE02] Software Architecture, Software Architects, and Architecturing. Disponível em
www.bredemeyer.com
[CAT02]
Catalysis
–
Enterprise
components
with
UML.
Disponível
em
www.catalysis.org
[D´SO98] D´SOUZA, Desmond Francis; WILLS, Alan Cameron. Objects, Components
and Frameworks with UML - The Catalysis Approach. 1st edition. Addisson
Wesley Publishing. 1998.
[DIA01] DIAS, Maria Madalena. Um Modelo de Formalização do Processo de
Desenvolvimento de Sistemas de Descoberta de Conhecimento em Banco de
Dados. 2001. Dissertação (Doutorado em Engenharia de Produção) Programa de
Pós-Graduação em Engenharia de Produção, Universidade Federal de Santa
Catarina, Florianópolis.
[FRE00] Freitas A. A. Evolutionary Algorithms for Data Mining and Knowledge
Discovery. Ghosh, A. & Tsutsui, S. (Eds.) Theory and Application of Evolutionary
Computation – Recent Trends, 2000.
[FOU99] FOURNIER, Roger. A Methodology for Client/Server and Web Application
Development. Prentice Hall. 1999.
[GIM01] GIMENES, Itana Maria de Souza, et al. O Processo de Desenvolvimento
Baseado em Componentes Através
de Exemplos. ERI Encontro Regional de
Informática. Maringá. 2001.
[HUN01] HUNTER, Jason; CRAWFORD, William. Java Servlet Programming. 2nd
edition. O´Reilly & Associates. 2001.
[INN96] INNON, W. H. Como construir o Data Warehouse. 2nd edition. Editora Campus.
1996.
21
[IRE97] LIMA, Iremar Nunes de. Ambiente Web Banco de Dados: Funcionalidades e
Arquiteturas de Integração. 1997. Dissertação (Mestrado em Computação) – Centro
de Computação, Universidade Federal de Minas Gerais, Belo Horizonte.
[JAV02] The Source for the Java(TM) Technology. Disponível em www.java.sun.com
[LAZ01] LAZILHA, Fabrício. Fundamentos para uma Proposta de Arquitetura de Linha
de Produção para Workflow Management Systems. 2001. Programa de PósGraduação em Computação – Instituto de Informática, Universidade Federal do Rio
Grande do Sul, Porto Alegre.
[MCT02] Brasil. Ministério da Ciência e Tecnologia. Disponível em www.mct.gov.br
[NET02] NetBeans. Disponível em www.netbeans.org
[OMG02] OMG Home. Object Management Group. Disponível em www.omg.org.
[ORA02] Oracle Corporation. Disponível em www.oracle.com
[RAT02] Rational Software. Disponível em www.rational.com
[ROM02] ROMÃO, Wesley. Descoberta de Conhecimento Relevante em Banco de
Dados sobre Ciência e Tecnologia. 2002. Dissertação (Mestrado em Engenharia de
Produção) - Programa de Pós-Graduação em Engenharia de Produção,
Universidade Federal de Santa Catarina, Florianópolis.
[RUM99] RUMBAUGH, J.; JACOBSON, I.; BOOCH, G. The Unified Language
Reference Manual. Addison Wesley Publishing. 1999.
10 Anexos
10.1 VISITA DA EQUIPE AO GRUPO STELA – Florianópolis
1) Objetivo da Visita:

Conhecimento do Laboratório Stela;

Método de Desenvolvimento – Divisão da Equipe em Células;

Tecnologias – Aperfeiçoamento;

Conhecer a Plataforma Lattes – (Institucional) Componentes e
Módulos;

Tecnologia – Interface.
2) Apresentação das funcionalidades e recursos disponíveis na Plataforma
Lattes – Institucional por Marcos Marchezan

Arquitetura da Paltaforma Lattes;

Ferramentas de desenvolvimento;

Interface do sistema;
22
3) Apresentação informal do Sistema Intersul para equipe – Célula Data
Mining do Lab. Stela

Troca de idéias para futuras implementações no sistema Intersul;

Dúvidas em relação ao gerar o Editor;
INDICAÇÕES EQUIPE STELA – Célula Interface
Material para estudo, para aperfeiçoamento e adequação do ambiente a
ser desenvolvido, a qual será utilizado no Sistema Intersul.
http://www.stela.ufsc.br/disciplinas/
O material sugerido tem o objetivo de estudar os critérios necessários
para a preparação de documentos digitais, a serem apresentados
através de um site via internet. Para um melhor entendimento sobre
design de interfaces, pretende-se levantar questionamentos que dizem
respeito à usabilidade, interatividade do usuário com o sistema e ao
valor estético e funcional que devem caracterizar a interface gráfica de
um site como é o caso desta proposta de sistema.
Sugestões para Interface:
Desenho da Interface
by Flávio Targino da Silva
Tipografia para Web
by Arley
Diagramação na Web
by Clóvis Gueyer e Janaína Berti
Design de Página Web
by Janaína Berti e Clóvis Gueyer
23
Writing
by Sandra Martins e Isabel M.
Luclktenberg
Outros Tópicos de Fundamental Importância:
1) História da Internet / Jornalismo On-line / Ambiente WEB;
2) Características da Internet e do Ambiente WEB;
3) Informação e Arquitetura da Informação;
4) Informação e Imagem;
5) Metodologia de Construção de sites - DADI;
6) Definindo o conceito e planejando seu site;
7) Metodologia aplicada a construção de portais web;
8) Estudo de Layout;
9) Design para Web;
10)
Estudo da cor para Web;
11)
Tipografia;
Outras Considerações:
- Verificou-se o uso de tecnologia web similar ao que já estava projetado para
uso no INTERSUL, como no caso do interpretador JSP ( JavaServer Page),
linguagem JAVA e da arquitetura da aplicação.
- Absorvemos o trabalho foi realizado com o Lattes na área de
DataWarehouse,
tendo boa aplicação para nosso projeto.
- Todo planejamento e arquitetura da utilização de Código Móvel também foi
nos apresentada.
- O uso de frameworks, sua aplicabilidade e necessidade em projetos de
grande porte.
- Algumas questões foram levantadas com relação a eficiência do Algoritmo de
mineração de dados em ambiente web, que também serão estudadas
posteriormente.
LATTES INSTITUCIONAL
O laboratório se disponibilizou a fornecer os fontes do Interlattes, tanto
procedural como orientado a objetos.
24
- O Lattes Instituicional na UEM é sem especialização;
- Para a UEM: módulo do Lattes destinado a projetos institucionais, já que
lattes não o cobrem
- O interlattes é implementado em Delphi, com módulos independentes - A
independência de plataforma do Lattes não se dá pelo fato de haver módulos
em delphi.
- Ao enviar um currículo para a instituição, este na verdade vai primeiro para
o CNPq
- Banco de dados de pessoas, para autenticação, é interessante para restringir
quem poderá colocar currículo no banco;
-Lattes – Interlattes – Unisinos: unilattes.unisinos.br
- árvore de navegação e barra de navegação no protótipo;
- usar applet para ajuda e/ou autenticação;
- gráficos são realmente viáveis para a apresentação dos resultados?
- estudo da utilização de XML no intersul;
25
Download