XXXVIII SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Sociedade: Educação, Meio Ambiente e Desenvolvimento 12 a 15/09/06 Goiânia, GO UMA PROPOSTA PARA UM SISTEMA DE Knowledge Discovery in DatabasesKDD UTILIZANDO ARQUITETURA DIRIGIDA A COMPONENTES Ricardo Menezes Salgado Faculdade de Jaguariúna Rua Amazonas, 504 Jd. Dom Bosco Jaguariúna / SP 13.820-000. [email protected] Maurício Tesserolli Faculdade de Jaguariúna Rua Amazonas, 504 Jd. Dom Bosco Jaguariúna / SP 13.820-000. [email protected] Clayton de Paiva Faculdade de Jaguariúna Rua Amazonas, 504 Jd. Dom Bosco Jaguariúna / SP 13.820-000. [email protected] Nas últimas décadas, a utilização de tecnologias da informação tem propiciado uma rápida coleta de informações viabilizando o armazenamento de grandes e variadas fontes de dados. Diante desta nova ótica, houve uma aceleração no desenvolvimento de novas técnicas e ferramentas que pudessem analisar essa enorme quantidade de dados descobrindo informações úteis, de maneira inteligente e automática já que o processamento de grandes quantidades de dados pelo homem é inviável sem o auxílio de ferramentas computacionais apropriadas. Neste cenário, é imprescindível o desenvolvimento de ferramentas que auxiliem de forma automática e inteligente, na tarefa de analisar, interpretar e relacionar esses dados para que possa desenvolver e selecionar estratégias de ação em cada contexto de aplicação. Muitas companhias têm reconhecido a importância estratégica do conhecimento escondido em suas grandes bases de dados, e com isso o interesse nas áreas de descoberta de conhecimento cresce a cada dia. Em conseqüência desta proliferação de informações, a habilidade técnica e humana de interpretação de dados passou a ser inviável, pois se tornou demorada, dispendiosa, sujeita a erros e falta de acurácia. Tendo em vista a necessidade de analisar, interpretar e transformar as grandes quantidades de dados em informações significativas e utilizáveis surge uma nova área denominada descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases - KDD). Neste contexto, o desenvolvimento de sistemas que utilizam conhecimentos extraídos de bases de dados tem propiciado valiosas ferramentas de apoio à decisão (Weiss & Indurkhya, 1998). Desta forma, ter um sistema que seja capaz de descobrir informações relevantes que estão implícitas dentro de uma base de dados é fundamental dentro da área de planejamento e/ou marketing em uma grande corporação. A grande dificuldade existente nos aplicativos de KDD disponíveis no mercado é que estes são estáticos, não permitindo que o usuário possa interagir com sistema para a criação de ferramentas especificas para o problema que esta sendo tratado. Um sistema de KDD onde fosse possível inserir novas ferramentas de mineração de dados sem grandes dificuldades seria ideal para XXXVIII SBPO [ 2349 ] XXXVIII SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL Pesquisa Operacional na Sociedade: Educação, Meio Ambiente e Desenvolvimento 12 a 15/09/06 Goiânia, GO qualquer usuário, pois o analista poderia inserir novas funcionalidades de acordo com a necessidade da aplicação que estivesse avaliando e tais funcionalidades passariam a ser parte do sistema compondo a lista de funções pré-existentes. O presente trabalho propõe um sistema computacional de Knowledge Discovery in DatabasesKDD utilizando a arquitetura dirigida a componentes, com esta abordagem, o usuário poderá inserir novas funcionalidades ao sistema sem a necessidade de acessar o código fonte do programa; isto será possível devido à inserção de novos plug-ins. Para avaliar o desempenho do novo sistema, utilizou-se um exemplo para inserção de um novo tipo de função de normalização. As ferramentas de KDD do sistema proposto são avaliadas através da análise de um banco de dados com curvas de consumo de energia elétrica. Tanto a inserção de plug-ins quanto a análise de dados feitas no sistema mostraram resultados animadores, onde pôde-se concluir a robustez do sistema. PALAVRAS CHAVE: Knowledge Discovery in Databases-KDD, Mineração de Dados, Arquitetura Dirigida a Componentes, Desenvolvimento de Sistemas, plug-ins. ABSTRACT This paper proposes a system of Knowledge Discovery in Database-(KDD) using the components architecture . In this approach, the user can insert new functionalities to the system without the need of accessing the program source code. This will be possible due to the components architecture, also known as plug-ins. To evaluate the perform of the new system for insert a new plug-in, an example was used for insert of a new type of normalization function. The KDD system tools are test through the database analysis, with electrical curves consumption. The plug-ins insert and the database analysis done in the system showed very good results, where the robustness could be concluded in the system. Keywords: Data Mining, Components Architecture, System Development XXXVIII SBPO [ 2350 ]