CURSO: SIS VERSÃO: Final: 02 UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS DEPARTAMENTO DE SISTEMAS E COMPUTAÇÃO CURSO DE SISTEMAS DE INFORMAÇÃO — BACHARELADO COORDENAÇÃO DE TRABALHO DE CONCLUSÃO DE CURSO (TCC) PROPOSTA PARA O TRABALHO DE CONCLUSÃO DE CURSO Título: BUSINESS INTELLIGENCE APLICANDO DATA MINING UTILIZANDO A TEORIA DOS CONJUNTOS APROXIMATIVOS NA GESTÃO DA SAÚDE Palavras-chave: Business Intelligence. Mineração de dados. Conjuntos aproximativos. 1 IDENTIFICAÇÃO 1.1 ALUNO Nome: Oraci Izidoro Corrêa Código/matrícula: 77496 Endereço residencial: Rua: Carius Complemento: Fundos n: S/N Bairro: Velha CEP: 89036-520 Telefone fixo: 3328-0066 Cidade: Blumenau UF: SC Celular: 8804-5127 Endereço comercial: Empresa: Lzt Soluções em Informática Ltda Rua: Marechal Deodoro CEP: n: 302 Cidade: Blumenau E-Mail FURB: [email protected] Bairro: Velha UF: SC Telefone: E-Mail alternativo: [email protected] 1.2 ORIENTADOR Nome: Oscar Dalfovo E-Mail FURB: [email protected] E-Mail alternativo: [email protected] 1.3 SUPERVISOR/ESPECIALISTA DA APLICAÇÃO Nome:Rafael Patricio Função/Cargo: Programador Telefone contato: 9962-6040 2 DECLARAÇÕES 2.1 DECLARAÇÃO DO ALUNO Declaro que estou ciente do Regulamento do Trabalho de Conclusão de Curso de Sistemas de Informação e que a proposta em anexo, a qual concordo, foi por mim rubricada em todas as páginas. Ainda me comprometo pela obtenção de quaisquer recursos necessários para o desenvolvimento do trabalho, caso esses recursos não sejam disponibilizados pela Universidade Regional de Blumenau (FURB). Assinatura: Local/Data: 2.2 DECLARAÇÃO DO ORIENTADOR Declaro que estou ciente do Regulamento do Trabalho de Conclusão do Curso de Sistemas de Informação e que a proposta em anexo, a qual concordo, foi por mim rubricada em todas as páginas. Ainda me comprometo a orientar o aluno da melhor forma possível de acordo com o plano de trabalho explícito nessa proposta. Assinatura: Local/Data: 2.3 DECLARAÇÃO DO SUPERVISOR/ESPECIALISTA DA APLICAÇÃO Declaro que estou ciente do Regulamento do Trabalho de Conclusão do Curso de Sistemas de Informação e que minha participação no referido trabalho não implica em nenhuma relação de ordem trabalhista e de remuneração bem como, manifesto ciência de que, por tratar-se de trabalho acadêmico, não tenho qualquer direito relacionada a sua autoria. Outrossim, autorizo a publicação do referido trabalho como também de informações técnicas de outros sistemas a ele relacionados. Assinatura: Local/Data: 3 AVALIAÇÃO DA PROPOSTA Orientador(a): Oscar Dalfovo ASPECTOS AVALIADOS 1. INTRODUÇÃO 1.1. O tema de pesquisa está devidamente contextualizado/delimitado? 1.2. O problema está claramente formulado? 2. OBJETIVOS 2.1. O objetivo geral está claramente definido e é passível de ser alcançado? 2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral? Caso não sejam apresentados objetivos específicos, deixe esse item em branco. RELEVÂNCIA 3.1. A proposta apresenta um grau de relevância em computação que justifique o desenvolvimento do TCC? METODOLOGIA 4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC? 4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a metodologia proposta? 3. ASPECTOS TÉCNICOS 4. 5. 6. 4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de maneira a permitir a execução do TCC no prazo disponível? REVISÃO BIBLIOGRÁFICA 5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a área referente ao objetivo? 5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange solução para todos os problemas apresentados? 5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos com a proposta? REQUISITOS 6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram claramente descritos e estão coerentes com os objetivos da proposta? 6.2. Os requisitos a serem implementados são suficientes e compõem um sistema? 6.3. O diagrama de casos de uso apresentado está coerente com os requisitos? ASPECTOS METODOLÓGICOS 7. 8. 9. 6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e objetivos propostos? REFERÊNCIAS BIBLIOGRÁFICAS 7.1. As referências bibliográficas obedecem às normas da ABNT? 7.2. As referências bibliográficas contemplam adequadamente os assuntos abordados na proposta (são usadas obras atualizadas e/ou as mais importantes da área)? CITAÇÕES 8.1. As citações obedecem às normas da ABNT? 8.2. As informações retiradas de outros autores estão devidamente citadas? AVALIAÇÃO GERAL (organização e apresentação gráfica, linguagem usada) 9.1. O texto obedece ao formato estabelecido? 9.2. A exposição do assunto é ordenada (as idéias estão bem encadeadas e a linguagem utilizada é clara)? A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se: qualquer um dos itens tiver resposta NÃO ATENDE; se 4 (quatro) itens dos aspectos técnicos tiverem resposta ATENDE PARCIALMENTE; ou se 4 (quatro) itens dos aspectos metodológicos tiverem resposta ATENDE PARCIALMENTE. PARECER: ( ) APROVADA ( ) NECESSITA DE COMPLEMENTAÇÃO Assinatura do(a) orientador(a): Local/data: não atende Oraci Izidoro Corrêa atende parcialmente Acadêmico(a): atende 3.1 AVALIAÇÃO DO ORIENTADOR CONSIDERAÇÕES DO ORIENTADOR Caso o orientador tenha assinalado em sua avaliação algum item como “atende parcialmente” devem ser relatos os problemas/melhorias a serem efetuadas. ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________ 3.2 AVALIAÇÃO DO ESPECIALISTA Acadêmico(a): Oraci Izidoro Corrêa 1. INTRODUÇÃO 1.1. O tema de pesquisa está devidamente contextualizado/delimitado? 1.2. O problema está claramente formulado? 2. OBJETIVOS 2.1. O objetivo geral está claramente definido e é passível de ser alcançado? 2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral? Caso não sejam apresentados objetivos específicos, deixe esse item em branco. RELEVÂNCIA 3.1. A proposta apresenta um grau de relevância que justifique o desenvolvimento do TCC? METODOLOGIA 4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC? 4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a metodologia proposta? 4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de maneira a permitir a execução do TCC no prazo disponível? FUNDAMENTAÇÃO DO SISTEMA 5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a área referente ao objetivo? 5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange solução para todos os problemas apresentados? 5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos com a proposta? REQUISITOS 6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram claramente descritos e estão coerentes com os objetivos da proposta? 6.2. Os requisitos a serem implementados são suficientes e definem um sistema? 3. 4. 5. 6. 6.3. O diagrama de casos de uso apresentado está correto e coerente com os requisitos? 6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e objetivos propostos? 7. AVALIAÇÃO GERAL (organização e apresentação gráfica / linguagem usada) 7.1. A exposição do assunto é ordenada, isto é, as idéias estão bem encadeadas e a linguagem utilizada é clara? 7.2. As informações retiradas de outros autores estão devidamente referenciadas e constam nas referências bibliográficas? 7.3. As referências bibliográficas citadas contemplam adequadamente os assuntos abordados na proposta (são usadas obras atualizadas e/ou as mais importantes da área)? A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se: qualquer um dos itens tiver resposta NÃO ATENDE; se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE; ou PARECER: ( ) APROVADA Assinatura do(a) avaliador(a): ( ) NECESSITA DE COMPLEMENTAÇÃO Local/data: não atende ASPECTOS AVALIADOS atende parcialmente atende Avaliador(a): 3.3 AVALIAÇÃO DO ESPECIALISTA Acadêmico(a): 1. INTRODUÇÃO 1.1. O tema de pesquisa está devidamente contextualizado/delimitado? 1.2. O problema está claramente formulado? 2. OBJETIVOS 2.1. O objetivo geral está claramente definido e é passível de ser alcançado? 2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral? Caso não sejam apresentados objetivos específicos, deixe esse item em branco. RELEVÂNCIA 3.1. A proposta apresenta um grau de relevância que justifique o desenvolvimento do TCC? METODOLOGIA 4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC? 4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a metodologia proposta? 4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de maneira a permitir a execução do TCC no prazo disponível? FUNDAMENTAÇÃO DO SISTEMA 5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a área referente ao objetivo? 5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange solução para todos os problemas apresentados? 5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos com a proposta? REQUISITOS 6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram claramente descritos e estão coerentes com os objetivos da proposta? 6.2. Os requisitos a serem implementados são suficientes e definem um sistema? 3. 4. 5. 6. 6.3. O diagrama de casos de uso apresentado está correto e coerente com os requisitos? 6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e objetivos propostos? 7. AVALIAÇÃO GERAL (organização e apresentação gráfica / linguagem usada) 7.1. A exposição do assunto é ordenada, isto é, as idéias estão bem encadeadas e a linguagem utilizada é clara? 7.2. As informações retiradas de outros autores estão devidamente referenciadas e constam nas referências bibliográficas? 7.3. As referências bibliográficas citadas contemplam adequadamente os assuntos abordados na proposta (são usadas obras atualizadas e/ou as mais importantes da área)? A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se: qualquer um dos itens tiver resposta NÃO ATENDE; se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE; ou PARECER: ( ) APROVADA Assinatura do(a) avaliador(a): ( ) NECESSITA DE COMPLEMENTAÇÃO Local/data: não atende ASPECTOS AVALIADOS atende parcialmente atende Avaliador(a): 3.4 AVALIAÇÃO METODOLÓGICA Acadêmico(a): 1. Os elementos pré-textuais (capa e folha de rosto) estão adequadamente formatados? 2. Os elementos textuais (capítulos, seções, formatação) estão corretamente definidos e formatados? 3. Os parágrafos (fonte, alinhamento, margem, espaçamento) estão corretos? 4. As siglas estão todas devidamente apresentadas? 5. As citações obedecem às normas da ABNT? 6. Os textos de citação (direta – citar página, quantidade de linhas, espaçamento, aspas - e indireta) estão adequadamente apresentados? 7. As listas estão adequadamente formatadas (numeração, alinhamento, uso do “;”e início com letra minúscula)? 8. As ilustrações e tabelas estão adequadamente formatadas (legenda, fonte, borda)? 9. As referências bibliográficas obedecem às normas da ABNT? 10. Os elementos pós-textuais (endereço protótipo, descrição casos de uso e protótipo) estão adequadamente apresentados? A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se: qualquer um dos itens tiver resposta NÃO ATENDE; se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE. PARECER: ( ) APROVADA ( ) NECESSITA DE COMPLEMENTAÇÃO Assinatura do(a) avaliador(a): Local/data: não atende ASPECTOS AVALIADOS atende parcialmente Dalton Solano dos Reis atende Avaliador(a): UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE SISTEMAS DE INFORMAÇÃO – BACHARELADO BUSINESS INTELLIGENCE APLICANDO DATA MINING UTILIZANDO A TEORIA DOS CONJUNTOS APROXIMATIVOS NA GESTÃO DA SAÚDE ORACI IZIDORO CORRÊA BLUMENAU 2009 ORACI IZIDORO CORRÊA BUSINESS INTELLIGENCE APLICANDO DATA MINING UTILIZANDO A TEORIA DOS CONJUNTOS APROXIMATIVOS NA GESTÃO DA SAÚDE Proposta de Trabalho de Conclusão de Curso submetida à Universidade Regional de Blumenau para a obtenção dos créditos na disciplina Trabalho de Conclusão de Curso I do curso de Sistemas de Informação — Bacharelado. Prof. Oscar Dalfovo, Dr. - Orientador BLUMENAU 2009 2 1 INTRODUÇÃO Business Intelligence (BI) é um conjunto de soluções voltadas para análise e interpretação de dados (SORDI, 2003, p. 96). Torna-se de extrema necessidade para as organizações a missão de administrar as informações, pois elas apresentam-se como as principais armas nas tomadas de decisões gerenciais. Uma vez que essas informações sejam expostas em forma de relatório ou telas gráficas, de maneira organizada e coesa, tornam a tomada de decisão mais facilitada (DALFOVO; AMORIM, 2000). O problema enfrentado pelas organizações está na falta da informação e na falta de organização na apresentação dessas informações, ou em muitos casos as informações que não tem um valor real, são entregues em momentos inoportunos para os tomadores de decisões. Sendo expostas de uma maneira a torná-las muito complexas para o entendimento, estas informações são consideradas de pouco valor para a organização. Informações pertinentes podem sofrer variações de acordo com cada atributo de qualidade que a mesma apresenta. “Por exemplo, dados de inteligência de mercado até certo ponto imprecisos e incompletos são admissíveis, mas a apresentação no momento exato é essencial” (STAIR; REYNOLDS, 2006, p. 6) A tecnologia Data Mining (DM) esta inserida no BI. O grande volume de dados disponíveis cresce a cada dia e desafia a capacidade de armazenamento, seleção e uso. Essa tecnologia com suas ferramentas permitem a “mineração” desses dados, a fim de gerar um real valor do dado, transformando-o em informação e conhecimento (REZENDE; ABREU, 2003, p. 215). Conforme Rezende e Abreu (2003, p. 216), o DM é uma tecnologia que tem a capacidade de fazer a seleção de dados relevantes, no intuito de gerar informações e conhecimentos para as empresas. Este tem a capacidade “de aprender com base nos dados, extrair deduções, gerar informações com hipóteses, correlacionar coisas aparentemente desvinculadas, fazer previsões, revelar os atributos importantes, gerar cenários, relatar e descobrir conhecimentos” importantes para a gestão empresarial. (REZENDE; ABREU, 2003, p. 216). Diante deste contexto, o problema da falta de informação e da organização da informação, neste trabalho será utilizada a técnica de mineração. Embasada na Teoria dos Conjuntos Aproximativos (TCA), em uma base de dados hospitalar com o objetivo de levantar as informações necessárias para os tomadores de decisão. De acordo com a 3 parametrização do usuário, as informações poderão ser demonstradas de uma maneira organizada e de fácil entendimento, através de gráficos e relatórios com informações estatísticas. A extensão da teoria dos conjuntos é a TCA, com o enfoque no tratamento de vagueza e incerteza em dados. “Foi inicialmente desenvolvida por Zdzislaw Pawlak no início da década de 80, década esta cujo preço e o desempenho dos computadores propiciaram o crescimento e surgimento de novas extensões para a TCA” (PESSOA; SIMÕES, 2004, p. ???). 1.1 OBJETIVOS O objetivo deste trabalho é o desenvolvimento de uma ferramenta aplicando Data Mining utilizando a teoria dos conjuntos aproximativos para a extração de informações que auxiliarão os gestores no setor hospitalar nas tomadas de decisões, através de relatórios e gráficos. Os objetivos específicos do trabalho são: a) aplicar a técnica de mineração de dados utilizando a TCA; b) possibilitar o acesso dinamicamente as informações nas bases de dados hospitalar; c) apresentar as informações extraídas, através de filtros e apresentá-las em forma de relatórios e gráficos; d) disponibilizar as informações gerenciais através de relatórios, telas e gráficos, para auxiliar os gestores da empresa na tomada de decisão. 1.2 RELEVÂNCIA DO TRABALHO A relevância deste trabalho consiste em auxiliar a tomada de decisão no nível gerencial. Objetiva-se realizar a busca das informações visando apresentá-las de uma forma organizada, coesa e precisa. Utilizando-se de relatórios e gráficos que irão auxiliar o gerente a tomar uma decisão mais acertada, uma vez que o mesmo terá as informações que necessita, reduzindo a possibilidade de erros. 4 Com o desenvolvimento deste trabalho os dados apresentados poderão ser mais confiáveis, tendo em vista que os dados não serão coletados separadamente, onde a análise será feita diretamente na base de dados, diminuindo a chance dos dados se perderem ou serem alterados durante o processo de coleta. Um ponto de grande relevância será a utilização da técnica da Teoria dos Conjuntos Aproximativos, com isso poderão ser realizados tratamentos de incertezas dos dados. Em um hospital é fundamental que se tenha, por exemplo, todas as estatísticas envolvendo as internações dos pacientes, que procedimentos, quais medicamentos, quais materiais foram utilizados para determinado paciente para que seja possível realizar o repasse para o convênio, e por sua vez que esse repasse seja correto, que não seja maior que o devido, e para que isso ocorra é necessário que o tomador de decisão tenha em suas mãos os gráficos e relatórios de estatísticas corretos e organizados de uma forma rápida, fácil e prática. Pode-se citar ainda outro caso que poderá auxiliar o tomador de decisão, no que diz respeito à compra de medicamentos, ou de materiais, ou seja, o seu estoque, controlando quais medicamentos e materiais são mais requisitados, através das estatísticas geradas e apresentadas pelos gráficos e relatórios. 1.3 METODOLOGIA O trabalho será desenvolvido observando as seguintes etapas: a) levantamento bibliográfico: estudo sobre a BI, DM, TCA e gestão da saúde; b) estudo da base de dados: estudar as tabelas, relacionamentos e informações existentes na base de dados onde será utilizada a aplicação para a mineração de dados; c) especificação dos requisitos : detalhar e reavaliar os requisitos, observando as necessidades levantadas durante a revisão bibliográfica; d) especificação da aplicação: especificar os processos da aplicação utilizando os diagramas de caso de uso, atividades e de estados através da notação Unified Modeling Language (UML), utilizando a ferramenta Enterprise Architect (EA); e) implementação : implementar a aplicação utilizando o ambiente de programação Borland Delphi 7.0; f) testes: nesta fase serão testadas as funcionalidades da ferramenta, bem como será 5 feita a verificação quanto ao atendimento dos requisitos solicitados; g) validação dos resultados: será realizada a validação, para que o gerente possa avaliar os resultados das operações que serão realizadas, a fim de verificar se corresponde ao que foi solicitado. O período previsto para realização de cada etapa deste projeto encontra-se representado no cronograma do Quadro 1. 2009 fev. mar. abr. maio jun. etapas / quinzenas 1 2 1 2 1 2 1 2 1 2 levantamento bibliográfico estudo da base de dados especificação dos requisitos especificação da aplicação implementação testes validação dos resultados X X x X X X X X X X X X X X X X X X X X X X Quadro 1 – Cronograma para o desenvolvimento do TCC.X 6 2 FUNDAMENTAÇÃO DO SISTEMA Nesta capítulo apresenta a fundamentação teórica referentes aos conceitos de Informação, Business Intelligence (BI), Data Mining (DM), Teoria dos Conjuntos Aproximativos (TCA) e Cubo de decisao . 2.1 INFORMAÇÃO “Informação é um conjunto de fatos organizados de modo a terem valor adicional, além do valor dos fatos propriamente ditos” (STAIR; REYNOLDS, 2006, p. 4). O valor da informação é medido diretamente por quão responsável ela foi para que os objetivos da organização fossem atingidos. A informação passa a ser um patrimônio valioso para as organizações, onde pode ser considerada um fator chave para o sucesso dos negócios. As mudanças excessivas de mercado e avanços tecnológicos fazem com que esse fator se torne ainda mais expressivo (DALFOVO; AMORIM, 2000, p. 4). É importante mencionar que para a tomada de decisão a informação deve conter uma serie de qualidades, ou seja, deve ser confiável, visualizada rapidamente e com um alto grau de detalhamento, possibilitando a comparação. (REZENDE; ABREU, 2003, p. 108). Pode-se dizer que uma decisão é oriunda de um conjunto de alternativas onde se realiza uma encolha dentre elas, “obedecendo a critérios preestabelecidos, em que é indiscutível a importância das informações em cada etapa do processo” (REZENDE; ABREU, 2003, p. 109). “Quanto maior o valor e a qualidade da informação, maior a probabilidade de acerto na tomada de decisão” (REZENDE; ABREU, 2003, p. 109). A grande dificuldade de um gerente é escolher dentre as varias fontes de informações apresentadas, quais realmente são as mais importantes e que levarão o gerente a tomar a melhor decisão para o trabalho. “Entretanto o uso incorreto da informação, ou trabalho com informação não adequadamente organizada, em vez de ajudar, irá prejudicar a empresa” (REZENDE; ABREU, 2003, p. 109). 7 2.1.1 Business Intelligence Conforme Barbieri (2001, p.34), o conceito de BI é definido como “a utilização de variadas fontes de informação para se definir estratégias de competitividade nos negócios da empresa”. As organizações apresentam grandes volumes de dados o que ocasiona uma desordem dificultando o processo de tomada de decisão dos executivos, os quais ficam perdidos em meio a esse amontoado sem nenhuma conclusão. (BARBIERI, 2001). Leme Filho (2004, p. 2:3) acrescenta que BI é um modelo que auxilia os executivos, que tem influencia direta nos negócios da organização, usado para extrair, transformar e analisar todo esse imenso volume de dados, apresentando ao final da sua aplicação o conhecimento necessário para o auxilio dos gestores para a tomada de decisão. O BI esta diretamente ligado como um subsidio para o apoio dos processos para a tomada de decisão, trabalhando de acordo para que se atinja cada vez mais as vantagens competitivas do mercado. (BARBIERI, 2001, p. 48). Para que se tenha um aprimoramento nas tomadas de decisões o emprego do BI é imprescindível, pois através dele há um aumento nas chances de sucesso das decisões. O seu foco principal esta em extrair informações pertinentes em meio a uma grande massa de dados. 2.1.2 O processo de Data Mining Essa tecnologia é formada por um conjunto de ferramentas que, por meio do uso de algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes de explorar um grande conjunto de dados transformando-os em conhecimento (REZENDE; ABREU, 2003, p. 215). Todos os dias as empresas inserem inúmeros dados em seus bancos de dados, fazendo com que esses se tornem verdadeiras minas de ouro de informações sobre os mais diversificados processos utilizados dentro das organizações. “Todos esses dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela e seu meio ambiente interno e externo, visando a uma rápida ação de seus gestores” (REZENDE; ABREU, 2003, p. 215). 8 Para que seja possível a extração de conhecimento de uma base de dados é necessário um conjunto de processos focados em um determinado domínio, a partir de uma base de dados bruta. Esses processos estão constituídos em: seleção, pré-processamento, transformação, mineração de dados (Data Mining) e interpretação/ avaliação (ALMEIDA et al., 2004). Seleção é a principal característica da mineração e sua finalidade é a de definir o conjunto de dados a ser analisado, deixando de fora os dados que não serão relevantes para o processo de extração do conhecimento exclusivamente do domínio proposto (RAMOS; SANTOS, 2003). O pré-processamento, conforme Ramos e Santos (2003) “Passa essencialmente pela redução do espaço de pesquisa, isto é, pela diminuição de linhas/colunas a analisar”. Almeida et al. (2004) acrescenta “que outra tarefa importante é a verificação de predominância de classes, sendo que nestes casos, deve-se eliminar alguns dos registros da classe predominante ou acrescentar registros das outras classes”. A transformação consiste na preparação da base de dados, onde por sua vez sofrerão formatações para que seja possível a aplicação dos algoritmos de extração do conhecimento (ALMEIDA et al., 2004). O Data Mining, por sua vez, tem como objetivo construir hipótese. Para a construção dessas hipóteses são utilizados sistemas especialistas. Conforme Almeida et al. (2004), “Um sistema de aprendizado é um programa de computador que toma decisões baseadas em experiências acumuladas contidas em exemplos resolvidos com sucesso”. Na interpretação/avaliação todo conhecimento extraído será analisado e caso o conhecimento apresentado não estiver de acordo com o esperado o processo pode ser reiniciado, alterando a base de dados ou modificando os parâmetros informados inicialmente, porém é de suma importância que a análise deva ser feita em conjunto com os especialistas deste determinado domínio (ALMEIDA et al., 2004). A aplicação do Data Mining torna possível comprovar o pressuposto da transformação de dados em informação e posteriormente em conhecimento. Esta possibilidade torna a técnica imprescindível para o processo de tomada de decisão. Para chegar-se a este resultado, é preciso investigar o uso efetivo do conhecimento obtido pelo Data Mining no processo de tomada de decisão, bem como os impactos que teve na solução efetiva de problemas e ações propostas e concretizadas (QUONIAM et al., 2001, p. 20). 9 2.1.3 Teoria dos Conjuntos Aproximativos “No início da década de 80, surgiu uma teoria, caracterizada pela simplicidade e bom formalismo matemático, o que facilita a manipulação de informações, em especial, incertas, conhecida como Teoria dos Conjuntos Aproximativos (TCA), do inglês Rough Set Theory.” (PESSOA; SIMÕES, 2004). A TCA é uma extensão da teoria dos conjuntos, onde tem como principal objetivo o tratamento das incertezas dos dados utilizando a relação de indiscernibilidade “que diz que dois elementos são ditos indiscerníveis, se possuem as mesmas propriedades, segundo Leibniz (Scuderi, 2001)” (PESSOA; SIMÕES, 2006). A outra relação é em torno das reduções que nada mais são que a retirada dos atributos que não serão utilizados, que não agregam valor para a base de conhecimento analisada (PESSOA; SIMÕES, 2006). 2.1.4 Cubo de Decisão Cubo de decisão é o grupo de componentes que auxiliam nas decisões, onde podem ser utilizados para relacionar tabelas de um banco de dados, que por sua vez são apresentados em forma de planilhas e gráficos. “Nesta etapa é envolvido cálculo de dados que o usuário virá a solicitar, mas que podem ser derivados de outros dados. Quando o usuário solicitar os dados, estes já estarão calculados e agregados em um Cubo de Decisão” (GHODDOSI; DALFOVO; MAIA, 2004). 2.2 SISTEMA ATUAL No sistema atual todo o trabalho para extração da informação e análise é realizado manualmente. Para a confecção dos gráficos e relatórios é utilizada a planilha eletrônica Excel Figura 1. 10 Figura 1 - Planilha de controle de censo de informações de internação. Por esta razão não há garantia de legitimidade das informações, pois as pessoas envolvidas na coleta de dados podem inserir valores errados, ocasionando problemas na análise, com isso não há um controle mais exato, tornando a análise falsa, afetando diretamente as tomadas de decisões dos executivos. As informações contidas na planilha são os dados coletados dentro do mês, cada paciente contêm um cadastro com suas informações, o tipo de internação, quais medicamentos e materiais foram utilizados em determinado paciente, o seu convênio. Através destas informações é possível realizar as estatísticas, ou seja, através da ficha de internação do paciente Figura 2. 11 Figura 2 - Ficha de Internação do Paciente. 2.3 SISTEMA PROPOSTO O sistema proposto trata do desenvolvimento de uma aplicação desktop, para realização da mineração dos dados da base da organização realizando um trabalho de verificação através da aplicação da teoria dos conjuntos aproximativos demonstrando-as através do cubo de decisão, onde por sua vez o usuário poderá interagir com o cubo cruzando as informações. O sistema irá apresentar relatórios e gráficos, conseqüentemente trazendo informações que realmente possam auxiliar o executivo a tomar sua decisão mais acertadamente. Basicamente o sistema irá apresentar uma interface gráfica, com os filtros previamente constituídos de acordo com a necessidade do usuário que irá trabalhar com a ferramenta. Apresentando informações através de relatórios e gráficos, o usuário poderá relacionar as colunas no cubo de decisão e realizar a pesquisa desejada. 12 2.4 TRABALHOS CORRELATOS A seguir são apresentados três trabalhos que se relacionam de forma direta com esta esta proposta, entre os quais: Barreto (2003), Schmitt (2007) e Zimmermann (2006). No trabalho de Schmitt (2007) desenvolveu-se um aplicativo utilizando Data Mining baseado na Teoria dos Conjuntos Aproximativos. Basicamente consiste em aplicar a TCA em uma base de dados de recursos humanos, para a identificação de perfis dos profissionais cadastrados que mais se adequavam para comporem as equipes de projetos de software, com isso auxiliando o executivo no processo de seleção. O objetivo principal do trabalho de Zimmermann (2006) foi o desenvolvimento de uma aplicação de Sistema de Apoio à Decisão baseado em Business Intelligence em que o sistema realizava a busca das informações no banco apresentando-as através do cubo de decisão, possibilitando o usuário de realizar o cruzamento das informações. A dissertação de Barreto (2003) teve como objetivo trazer a definição e a comparação da utilização do conjunto de ferramentas em Business Intelligence entre duas companhias, Microsoft e Oracle dentro das organizações, apresentando-as como uma ferramenta de suma importância para a obtenção das informações necessárias no escopo da gerência. Correlacionando os trabalhos citados acima, o trabalho proposto visa à utilização da técnica TCA em uma base de dados hospitalar. Diferentemente de Schmitt que a utilizou em uma base de dados de Recursos Humanos. Através de uma ferramenta integrada no BI, à técnica de mineração de dados Data Mining, para a seleção e coleta das informações. Para a apresentação das informações para o usuário será utilizado o cubo de decisão, além de relatórios e gráficos, assim como Zimmermann (2006) e Barreto (2003) utilizaram em seus trabalhos. Através do uso do cubo de decisão o usuário terá a possibilidade de cruzar as informações da mineração de dados. 2.5 REQUISITOS DO SISTEMA O Quadro 3 apresenta os requisitos funcionais previstos para o sistema e sua rastreabilidade, ou seja, vinculação com o(s) caso(s) de uso associado(s). 13 Requisitos Funcionais RF01: O sistema deverá permitir o cadastro, consulta e manutenção de Caso de Uso UC01 usuário RF02: O sistema deverá permitir importar/atualizar a estrutura de um banco. UC02 RF03: O sistema deverá emitir um relatório contendo os serviços em aberto. UC03 RF04: O sistema deverá possuir uma tela de login que, se aceita, levará para UC04 a tela inicial. RF05: O sistema deverá permitir a criação de relatórios de acordo com o UC05 universo cadastrado ao usuário. RF06: O sistema deverá permitir ao usuário a visualização do relatório. UC06 RF07: O sistema deverá permitir salvar o relatório gerado. UC07 RF08: O sistema deverá permitir abrir o relatório previamente salvo. UC08 RF09: O sistema deverá permitir a visualização do relatório através de UC09 gráficos. RF10: O sistema deverá aplicar a técnica de mineração de dados utilizando UC10 a TCA. Quadro 3: Requisitos funcionais O Quadro 4 lista os requisitos não funcionais previstos para o sistema. Requisitos Não Funcionais RNF01: O sistema deverá ser desenvolvido para o banco de dados Oracle. RNF02: O sistema deverá ser construído sobre a plataforma de desenvolvimento Delphi. RNF03: O sistema deverá habilitar ao usuário o perfil a ele designado conforme usuário e senha cadastrados. Quadro 4: Requisitos não funcionais 2.5.1 Diagrama de casos de uso Esta seção apresenta o diagrama de casos de uso preliminar do sistema proposto, sendo que o detalhamento de cada caso de uso, bem como seu protótipo, encontra-se no Apêndice A. 14 Na figura 3 apresenta-se o diagrama de casos de uso do sistema, onde o administrador é o responsável pelas inserções de dados no sistema, como cadastros e o usuário é responsável pelas extrações de dados que a ele está permitido. Figura 3: Diagrama de caso de uso – parametrização geral 15 2.5.2 Diagrama de atividades Na figura 4 apresenta-se o diagrama de atividades onde mostra o usuário realizando a geração de uma consulta. Figura 4: Diagrama de atividades – elaboração de uma consulta. Na figura 5 apresenta-se o diagrama de atividades onde mostra o administrador realizando elaborando o universo de dados. 16 Figura 5: Diagrama de atividades – administrador do sistema. 17 REFERÊNCIAS BIBLIOGRÁFICAS ALMEIDA, Leandro M. et al. Uma ferramenta para extração de padrões. 2004. 13 f. Centro Universitário Luterano de Palmas, Palmas. disponível em: <http://www.sbc.org.br/reic/edicoes/2003e4/cientificos/UmaFerramentaParaExtracaoDePadro es.pdf>. Acesso em: 22 mar. 2008. BARBIERI, Carlos. BI – Business Intelligence: modelagem & tecnologia. Rio de Janeiro: Axel Books do Brasil, 2001. BARRETO, David Guaspari; Business Intelligence: comparação de ferramentas. 2003. 73 f. Dissertação (Mestrado em Computação). Curso de Pós-Graduação em Ciência da Computação - Universidade Federal do Rio Grande do Sul - Porto Alegre. DALFOVO, Oscar; AMORIM, Sammy Newton. Quem tem informação: é mais competitivo. Blumenau: Santa Catarina Acadêmica Ltda, 2000. GHODDOSI, Nader M.A; DALFOVO, Oscar; MAIA, Luiz Fernando Jacinto. Sistema de apoio à tomada de decisões, utilizando técnicas de data warehouse e tecnologia web. Florianópolis. 2004. Disponível em: <http://inf.unisul.br/~ines/workcomp/cd/pdfs/2806.pdf>. Acesso em: 19 maio 2008. LEME FILHO, Trajano. Business intelligence no microsoft Excel. Rio de Janeiro: Axel Books do Brasil, 2004. PESSOA, Alex S. A.; SIMÕES, José D. S.; Estudo do comportamento climático utilizando uma abordagem neuro-aproximativa. 2004. Disponível em: < http://hermes2.dpi.inpe.br:1905/col/lac.inpe.br/worcap/2004/10.06.13.09/doc/worcap_alex200 4.pdf>. Acesso em: 07 abr. 2008. PESSOA, Alex S. A.; SILVA, José D. S.; CAMARGO, Hélio J. Redução de dados metereologicos aplicados a previsão climática por redes neurais. 2006. Disponível em: <http:// mtc-m17.sid.inpe.br/col/sid.inpe.br>. Acesso em: 06 abr. 2008. QUONIAM, Luc et al. Inteligência obtida pela aplicação de data mining em base de teses francesas sobre o Brasil. Brasília. 2001. Disponível em: <http://www.scielo.br/pdf/ci/v30n2/6208.pdf>. Acesso em: 22 mar. 2008. RAMOS, Isabel; SANTOS, Maribel Yasmina. Data mining no suporte à construção de conhecimento organizacional. Porto. 2003. Disponível em: <https://repositorium.sdum.uminho.pt/bitstream/1822/2302/1/CAPSI2003_IMR_MYS.pdf>. Acesso em: 23 mar. 2008. REZENDE, Denis Alcides; ABREU, Aline França de. Tecnologia da informação: aplicada a sistemas de informação empresariais. 3. ed. São Paulo: São Paulo Atlas S/A, 2003. 18 SCHMITT, Sidnei; Gestão do conhecimento: aplicação em Data Mining utililizando a Teoria do Conjuntos Aproximados para Geração do Capital Intelectual. 2007. 60f. Trabalho de Conclusão de Curso - Fundação Universidade Regional de Blumenau - Blumenau - SC. SORDI, José Osvaldo de. Tecnologia da informação aplicada aos negócios. São Paulo: São Paulo Atlas S/A, 2003. STAIR, Ralph M.; REYNOLDS, George W. Princípios de sistemas de informação: uma abordagem gerencial. Tradução: Flávio Soares Corrêa da Silva. São Paulo: Pioneira Thomson Learning, 2006. ZIMMERMANN, Thiago Rafael; Desenvolvimento de um sistema de apoio à decisão baseado em business intelligence. 2006. 76f. Trabalho de Conclusão de Curso – Fundação Universidade Regional de Blumenau – Blumenau – SC. 19 APÊNDICE A – Detalhamento dos casos de uso O protótipo funcional cujas telas encontram-se referenciadas nesta seção pode ser encontrado Identificação do UC Objetivo Cadastra usuário Permite o cadastro de usuários do sistema. (TEL001) Tela(s) TEL001 – Cadastro de usuários Identificação do UC Objetivo Importa banco dados Permite importar a base de dados que o sistema irá aplicar a técnica TCA. (TEL002) Tela(s) 20 TEL002 – Importa Banco de Dados Identificação do UC Objetivo Cadastro universo Permite escolher quais tabelas estarão liberadas para o usuário. (TEL003) Tela(s) TEL003 – Cadastro de universo Identificação do UC Visualizar relatório 21 Objetivo Permite a visualização de relatórios informando os filtros desejados. (TEL004) Pode-se visualizar um relatório. (TEL005) Tela(s) TEL004 – Filtro de relatórios Identificação do UC Objetivo TEL005 – Visualização de relatório Criar gráfico Permite a visualização de gráficos.(TEL006) e (TEL007) Tela(s) TEL007 – Gráfico TEL006 – Gráfico Identificação do UC Objetivo Criar gráfico Permite a manipulação dos dados através do cubo de decisão onde pode-se visualizar graficamente. (TEL008) Tela(s) TEL008 – Gráfico