1 introdução - Projeto Pesquisa

Propaganda
CURSO:
SIS
VERSÃO:
Final: 
02
UNIVERSIDADE REGIONAL DE BLUMENAU
CENTRO DE CIÊNCIAS EXATAS E NATURAIS
DEPARTAMENTO DE SISTEMAS E COMPUTAÇÃO
CURSO DE SISTEMAS DE INFORMAÇÃO — BACHARELADO
COORDENAÇÃO DE TRABALHO DE CONCLUSÃO DE CURSO (TCC)
PROPOSTA PARA O TRABALHO DE CONCLUSÃO DE CURSO
Título: BUSINESS INTELLIGENCE APLICANDO DATA MINING UTILIZANDO A TEORIA
DOS CONJUNTOS APROXIMATIVOS NA GESTÃO DA SAÚDE
Palavras-chave: Business Intelligence. Mineração de dados. Conjuntos aproximativos.
1 IDENTIFICAÇÃO
1.1 ALUNO
Nome: Oraci Izidoro Corrêa
Código/matrícula: 77496
Endereço residencial:
Rua: Carius
Complemento: Fundos
n: S/N
Bairro: Velha
CEP: 89036-520
Telefone fixo: 3328-0066
Cidade: Blumenau
UF: SC
Celular: 8804-5127
Endereço comercial:
Empresa: Lzt Soluções em Informática Ltda
Rua: Marechal Deodoro
CEP:
n: 302
Cidade: Blumenau
E-Mail FURB: [email protected]
Bairro: Velha
UF: SC
Telefone:
E-Mail alternativo: [email protected]
1.2 ORIENTADOR
Nome: Oscar Dalfovo
E-Mail FURB: [email protected]
E-Mail alternativo: [email protected]
1.3 SUPERVISOR/ESPECIALISTA DA APLICAÇÃO
Nome:Rafael Patricio
Função/Cargo: Programador
Telefone contato: 9962-6040
2 DECLARAÇÕES
2.1 DECLARAÇÃO DO ALUNO
Declaro que estou ciente do Regulamento do Trabalho de Conclusão de Curso de
Sistemas de Informação e que a proposta em anexo, a qual concordo, foi por mim rubricada
em todas as páginas. Ainda me comprometo pela obtenção de quaisquer recursos necessários
para o desenvolvimento do trabalho, caso esses recursos não sejam disponibilizados pela
Universidade Regional de Blumenau (FURB).
Assinatura:
Local/Data:
2.2 DECLARAÇÃO DO ORIENTADOR
Declaro que estou ciente do Regulamento do Trabalho de Conclusão do Curso de
Sistemas de Informação e que a proposta em anexo, a qual concordo, foi por mim rubricada
em todas as páginas. Ainda me comprometo a orientar o aluno da melhor forma possível de
acordo com o plano de trabalho explícito nessa proposta.
Assinatura:
Local/Data:
2.3 DECLARAÇÃO DO SUPERVISOR/ESPECIALISTA DA APLICAÇÃO
Declaro que estou ciente do Regulamento do Trabalho de Conclusão do Curso de
Sistemas de Informação e que minha participação no referido trabalho não implica em
nenhuma relação de ordem trabalhista e de remuneração bem como, manifesto ciência de que,
por tratar-se de trabalho acadêmico, não tenho qualquer direito relacionada a sua autoria.
Outrossim, autorizo a publicação do referido trabalho como também de informações técnicas
de outros sistemas a ele relacionados.
Assinatura:
Local/Data:
3 AVALIAÇÃO DA PROPOSTA
Orientador(a):
Oscar Dalfovo
ASPECTOS AVALIADOS
1.
INTRODUÇÃO
1.1. O tema de pesquisa está devidamente contextualizado/delimitado?
1.2. O problema está claramente formulado?
2.
OBJETIVOS
2.1. O objetivo geral está claramente definido e é passível de ser alcançado?
2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral?
Caso não sejam apresentados objetivos específicos, deixe esse item em branco.
RELEVÂNCIA
3.1. A proposta apresenta um grau de relevância em computação que justifique o
desenvolvimento do TCC?
METODOLOGIA
4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC?
4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a
metodologia proposta?
3.
ASPECTOS TÉCNICOS
4.
5.
6.
4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de
maneira a permitir a execução do TCC no prazo disponível?
REVISÃO BIBLIOGRÁFICA
5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a
área referente ao objetivo?
5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange
solução para todos os problemas apresentados?
5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos
com a proposta?
REQUISITOS
6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram
claramente descritos e estão coerentes com os objetivos da proposta?
6.2. Os requisitos a serem implementados são suficientes e compõem um sistema?
6.3. O diagrama de casos de uso apresentado está coerente com os requisitos?
ASPECTOS
METODOLÓGICOS
7.
8.
9.
6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e
objetivos propostos?
REFERÊNCIAS BIBLIOGRÁFICAS
7.1. As referências bibliográficas obedecem às normas da ABNT?
7.2. As referências bibliográficas contemplam adequadamente os assuntos abordados na
proposta (são usadas obras atualizadas e/ou as mais importantes da área)?
CITAÇÕES
8.1. As citações obedecem às normas da ABNT?
8.2. As informações retiradas de outros autores estão devidamente citadas?
AVALIAÇÃO GERAL (organização e apresentação gráfica, linguagem usada)
9.1. O texto obedece ao formato estabelecido?
9.2. A exposição do assunto é ordenada (as idéias estão bem encadeadas e a linguagem
utilizada é clara)?
A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se:

qualquer um dos itens tiver resposta NÃO ATENDE;

se 4 (quatro) itens dos aspectos técnicos tiverem resposta ATENDE PARCIALMENTE; ou

se 4 (quatro) itens dos aspectos metodológicos tiverem resposta ATENDE PARCIALMENTE.
PARECER: ( ) APROVADA
( ) NECESSITA DE COMPLEMENTAÇÃO
Assinatura do(a) orientador(a):
Local/data:
não atende
Oraci Izidoro Corrêa
atende
parcialmente
Acadêmico(a):
atende
3.1 AVALIAÇÃO DO ORIENTADOR
CONSIDERAÇÕES DO ORIENTADOR
Caso o orientador tenha assinalado em sua avaliação algum item como “atende parcialmente”
devem ser relatos os problemas/melhorias a serem efetuadas.
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
3.2 AVALIAÇÃO DO ESPECIALISTA
Acadêmico(a):
Oraci Izidoro Corrêa
1.
INTRODUÇÃO
1.1. O tema de pesquisa está devidamente contextualizado/delimitado?
1.2. O problema está claramente formulado?
2.
OBJETIVOS
2.1. O objetivo geral está claramente definido e é passível de ser alcançado?
2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral? Caso não
sejam apresentados objetivos específicos, deixe esse item em branco.
RELEVÂNCIA
3.1. A proposta apresenta um grau de relevância que justifique o desenvolvimento do TCC?
METODOLOGIA
4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC?
4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a metodologia
proposta?
4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de maneira a
permitir a execução do TCC no prazo disponível?
FUNDAMENTAÇÃO DO SISTEMA
5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a área
referente ao objetivo?
5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange solução para
todos os problemas apresentados?
5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos com a
proposta?
REQUISITOS
6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram claramente
descritos e estão coerentes com os objetivos da proposta?
6.2. Os requisitos a serem implementados são suficientes e definem um sistema?
3.
4.
5.
6.
6.3. O diagrama de casos de uso apresentado está correto e coerente com os requisitos?
6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e objetivos
propostos?
7. AVALIAÇÃO GERAL (organização e apresentação gráfica / linguagem usada)
7.1. A exposição do assunto é ordenada, isto é, as idéias estão bem encadeadas e a linguagem utilizada
é clara?
7.2. As informações retiradas de outros autores estão devidamente referenciadas e constam nas
referências bibliográficas?
7.3. As referências bibliográficas citadas contemplam adequadamente os assuntos abordados na
proposta (são usadas obras atualizadas e/ou as mais importantes da área)?
A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se:

qualquer um dos itens tiver resposta NÃO ATENDE;

se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE; ou
PARECER: (
) APROVADA
Assinatura do(a) avaliador(a):
( ) NECESSITA DE COMPLEMENTAÇÃO
Local/data:
não
atende
ASPECTOS AVALIADOS
atende
parcialmente
atende
Avaliador(a):
3.3 AVALIAÇÃO DO ESPECIALISTA
Acadêmico(a):
1.
INTRODUÇÃO
1.1. O tema de pesquisa está devidamente contextualizado/delimitado?
1.2. O problema está claramente formulado?
2.
OBJETIVOS
2.1. O objetivo geral está claramente definido e é passível de ser alcançado?
2.2. São apresentados objetivos específicos (opcionais) coerentes com o objetivo geral? Caso não
sejam apresentados objetivos específicos, deixe esse item em branco.
RELEVÂNCIA
3.1. A proposta apresenta um grau de relevância que justifique o desenvolvimento do TCC?
METODOLOGIA
4.1. Foram relacionadas todas as etapas necessárias para o desenvolvimento do TCC?
4.2. Os métodos e recursos estão devidamente descritos e são compatíveis com a metodologia
proposta?
4.3. A proposta apresenta um cronograma físico (período de realização das etapas) de maneira a
permitir a execução do TCC no prazo disponível?
FUNDAMENTAÇÃO DO SISTEMA
5.1. A descrição do sistema atual está clara, adequadamente fundamentada e abrange toda a área
referente ao objetivo?
5.2. A descrição do sistema proposto está clara, adequadamente fundamentada e abrange solução para
todos os problemas apresentados?
5.3. São apresentados trabalhos correlatos, bem como é realizada a correlação dos mesmos com a
proposta?
REQUISITOS
6.1. Os requisitos funcionais e não funcionais do software a ser desenvolvido foram claramente
descritos e estão coerentes com os objetivos da proposta?
6.2. Os requisitos a serem implementados são suficientes e definem um sistema?
3.
4.
5.
6.
6.3. O diagrama de casos de uso apresentado está correto e coerente com os requisitos?
6.4. O protótipo apresentado (quando aplicável) atende adequadamente aos requisitos e objetivos
propostos?
7. AVALIAÇÃO GERAL (organização e apresentação gráfica / linguagem usada)
7.1. A exposição do assunto é ordenada, isto é, as idéias estão bem encadeadas e a linguagem utilizada
é clara?
7.2. As informações retiradas de outros autores estão devidamente referenciadas e constam nas
referências bibliográficas?
7.3. As referências bibliográficas citadas contemplam adequadamente os assuntos abordados na
proposta (são usadas obras atualizadas e/ou as mais importantes da área)?
A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se:

qualquer um dos itens tiver resposta NÃO ATENDE;

se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE; ou
PARECER: (
) APROVADA
Assinatura do(a) avaliador(a):
( ) NECESSITA DE COMPLEMENTAÇÃO
Local/data:
não
atende
ASPECTOS AVALIADOS
atende
parcialmente
atende
Avaliador(a):
3.4 AVALIAÇÃO METODOLÓGICA
Acadêmico(a):
1. Os elementos pré-textuais (capa e folha de rosto) estão adequadamente
formatados?
2. Os elementos textuais (capítulos, seções, formatação) estão corretamente definidos
e formatados?
3. Os parágrafos (fonte, alinhamento, margem, espaçamento) estão corretos?
4. As siglas estão todas devidamente apresentadas?
5. As citações obedecem às normas da ABNT?
6. Os textos de citação (direta – citar página, quantidade de linhas, espaçamento,
aspas - e indireta) estão adequadamente apresentados?
7. As listas estão adequadamente formatadas (numeração, alinhamento, uso do “;”e
início com letra minúscula)?
8. As ilustrações e tabelas estão adequadamente formatadas (legenda, fonte, borda)?
9. As referências bibliográficas obedecem às normas da ABNT?
10. Os elementos pós-textuais (endereço protótipo, descrição casos de uso e
protótipo) estão adequadamente apresentados?
A proposta de TCC deverá ser revisada, isto é, necessita de complementação, se:

qualquer um dos itens tiver resposta NÃO ATENDE;

se 4 (quatro) itens tiverem resposta ATENDE PARCIALMENTE.
PARECER: ( ) APROVADA
( ) NECESSITA DE COMPLEMENTAÇÃO
Assinatura do(a) avaliador(a):
Local/data:
não atende
ASPECTOS AVALIADOS
atende
parcialmente
Dalton Solano dos Reis
atende
Avaliador(a):
UNIVERSIDADE REGIONAL DE BLUMENAU
CENTRO DE CIÊNCIAS EXATAS E NATURAIS
CURSO DE SISTEMAS DE INFORMAÇÃO – BACHARELADO
BUSINESS INTELLIGENCE APLICANDO DATA MINING
UTILIZANDO A TEORIA DOS CONJUNTOS
APROXIMATIVOS NA GESTÃO DA SAÚDE
ORACI IZIDORO CORRÊA
BLUMENAU
2009
ORACI IZIDORO CORRÊA
BUSINESS INTELLIGENCE APLICANDO DATA MINING
UTILIZANDO A TEORIA DOS CONJUNTOS
APROXIMATIVOS NA GESTÃO DA SAÚDE
Proposta de Trabalho de Conclusão de Curso
submetida à Universidade Regional de
Blumenau para a obtenção dos créditos na
disciplina Trabalho de Conclusão de Curso I
do curso de Sistemas de Informação —
Bacharelado.
Prof. Oscar Dalfovo, Dr. - Orientador
BLUMENAU
2009
2
1 INTRODUÇÃO
Business Intelligence (BI) é um conjunto de soluções voltadas para análise e
interpretação de dados (SORDI, 2003, p. 96). Torna-se de extrema necessidade para as
organizações a missão de administrar as informações, pois elas apresentam-se como as
principais armas nas tomadas de decisões gerenciais. Uma vez que essas informações sejam
expostas em forma de relatório ou telas gráficas, de maneira organizada e coesa, tornam a
tomada de decisão mais facilitada (DALFOVO; AMORIM, 2000).
O problema enfrentado pelas organizações está na falta da informação e na falta de
organização na apresentação dessas informações, ou em muitos casos as informações que não
tem um valor real, são entregues em momentos inoportunos para os tomadores de decisões.
Sendo expostas de uma maneira a torná-las muito complexas para o entendimento, estas
informações são consideradas de pouco valor para a organização.
Informações pertinentes podem sofrer variações de acordo com cada atributo de
qualidade que a mesma apresenta. “Por exemplo, dados de inteligência de mercado até certo
ponto imprecisos e incompletos são admissíveis, mas a apresentação no momento exato é
essencial” (STAIR; REYNOLDS, 2006, p. 6)
A tecnologia Data Mining (DM) esta inserida no BI. O grande volume de dados
disponíveis cresce a cada dia e desafia a capacidade de armazenamento, seleção e uso. Essa
tecnologia com suas ferramentas permitem a “mineração” desses dados, a fim de gerar um
real valor do dado, transformando-o em informação e conhecimento (REZENDE; ABREU,
2003, p. 215).
Conforme Rezende e Abreu (2003, p. 216), o DM é uma tecnologia que tem a
capacidade de fazer a seleção de dados relevantes, no intuito de gerar informações e
conhecimentos para as empresas. Este tem a capacidade “de aprender com base nos dados,
extrair deduções, gerar informações com hipóteses, correlacionar coisas aparentemente
desvinculadas, fazer previsões, revelar os atributos importantes, gerar cenários, relatar e
descobrir conhecimentos” importantes para a gestão empresarial. (REZENDE; ABREU,
2003, p. 216).
Diante deste contexto, o problema da falta de informação e da organização da
informação, neste trabalho será utilizada a técnica de mineração. Embasada na Teoria dos
Conjuntos Aproximativos (TCA), em uma base de dados hospitalar com o objetivo de
levantar as informações necessárias para os tomadores de decisão. De acordo com a
3
parametrização do usuário, as informações poderão ser demonstradas de uma maneira
organizada e de fácil entendimento, através de gráficos e relatórios com informações
estatísticas. A extensão da teoria dos conjuntos é a TCA, com o enfoque no tratamento de
vagueza e incerteza em dados. “Foi inicialmente desenvolvida por Zdzislaw Pawlak no início
da década de 80, década esta cujo preço e o desempenho dos computadores propiciaram o
crescimento e surgimento de novas extensões para a TCA” (PESSOA; SIMÕES, 2004, p.
???).
1.1
OBJETIVOS
O objetivo deste trabalho é o desenvolvimento de uma ferramenta aplicando Data
Mining utilizando a teoria dos conjuntos aproximativos para a extração de informações que
auxiliarão os gestores no setor hospitalar nas tomadas de decisões, através de relatórios e
gráficos.
Os objetivos específicos do trabalho são:
a) aplicar a técnica de mineração de dados utilizando a TCA;
b) possibilitar o acesso dinamicamente as informações nas bases de dados hospitalar;
c) apresentar as informações extraídas, através de filtros e apresentá-las em forma de
relatórios e gráficos;
d) disponibilizar as informações gerenciais através de relatórios, telas e gráficos, para
auxiliar os gestores da empresa na tomada de decisão.
1.2
RELEVÂNCIA DO TRABALHO
A relevância deste trabalho consiste em auxiliar a tomada de decisão no nível
gerencial. Objetiva-se realizar a busca das informações visando apresentá-las de uma forma
organizada, coesa e precisa. Utilizando-se de relatórios e gráficos que irão auxiliar o gerente a
tomar uma decisão mais acertada, uma vez que o mesmo terá as informações que necessita,
reduzindo a possibilidade de erros.
4
Com o desenvolvimento deste trabalho os dados apresentados poderão ser mais
confiáveis, tendo em vista que os dados não serão coletados separadamente, onde a análise
será feita diretamente na base de dados, diminuindo a chance dos dados se perderem ou serem
alterados durante o processo de coleta.
Um ponto de grande relevância será a utilização da técnica da Teoria dos Conjuntos
Aproximativos, com isso poderão ser realizados tratamentos de incertezas dos dados.
Em um hospital é fundamental que se tenha, por exemplo, todas as estatísticas
envolvendo as internações dos pacientes, que procedimentos, quais medicamentos, quais
materiais foram utilizados para determinado paciente para que seja possível realizar o repasse
para o convênio, e por sua vez que esse repasse seja correto, que não seja maior que o devido,
e para que isso ocorra é necessário que o tomador de decisão tenha em suas mãos os gráficos
e relatórios de estatísticas corretos e organizados de uma forma rápida, fácil e prática.
Pode-se citar ainda outro caso que poderá auxiliar o tomador de decisão, no que diz
respeito à compra de medicamentos, ou de materiais, ou seja, o seu estoque, controlando quais
medicamentos e materiais são mais requisitados, através das estatísticas geradas e
apresentadas pelos gráficos e relatórios.
1.3
METODOLOGIA
O trabalho será desenvolvido observando as seguintes etapas:
a) levantamento bibliográfico: estudo sobre a BI, DM, TCA e gestão da saúde;
b) estudo da base de dados: estudar as tabelas, relacionamentos e informações
existentes na base de dados onde será utilizada a aplicação para a mineração de
dados;
c) especificação dos requisitos : detalhar e reavaliar os requisitos, observando as
necessidades levantadas durante a revisão bibliográfica;
d) especificação da aplicação: especificar os processos da aplicação utilizando os
diagramas de caso de uso, atividades e de estados através da notação Unified
Modeling Language (UML), utilizando a ferramenta Enterprise Architect (EA);
e) implementação : implementar a aplicação utilizando o ambiente de programação
Borland Delphi 7.0;
f) testes: nesta fase serão testadas as funcionalidades da ferramenta, bem como será
5
feita a verificação quanto ao atendimento dos requisitos solicitados;
g) validação dos resultados: será realizada a validação, para que o gerente possa
avaliar os resultados das operações que serão realizadas, a fim de verificar se
corresponde ao que foi solicitado.
O período previsto para realização de cada etapa deste projeto encontra-se
representado no cronograma do Quadro 1.
2009
fev. mar. abr. maio jun.
etapas / quinzenas 1 2 1 2 1 2 1 2 1 2
levantamento bibliográfico
estudo da base de dados
especificação dos requisitos
especificação da aplicação
implementação
testes
validação dos resultados
X X
x X X X
X X
X X X
X X X X X
X X X
X X X
Quadro 1 – Cronograma para o desenvolvimento do TCC.X
6
2 FUNDAMENTAÇÃO DO SISTEMA
Nesta capítulo apresenta a fundamentação teórica referentes aos conceitos de
Informação, Business Intelligence (BI), Data Mining (DM), Teoria dos Conjuntos
Aproximativos (TCA) e Cubo de decisao .
2.1
INFORMAÇÃO
“Informação é um conjunto de fatos organizados de modo a terem valor adicional,
além do valor dos fatos propriamente ditos” (STAIR; REYNOLDS, 2006, p. 4). O valor da
informação é medido diretamente por quão responsável ela foi para que os objetivos da
organização fossem atingidos.
A informação passa a ser um patrimônio valioso para as organizações, onde pode ser
considerada um fator chave para o sucesso dos negócios. As mudanças excessivas de mercado
e avanços tecnológicos fazem com que esse fator se torne ainda mais expressivo (DALFOVO;
AMORIM, 2000, p. 4).
É importante mencionar que para a tomada de decisão a informação deve conter uma
serie de qualidades, ou seja, deve ser confiável, visualizada rapidamente e com um alto grau
de detalhamento, possibilitando a comparação. (REZENDE; ABREU, 2003, p. 108).
Pode-se dizer que uma decisão é oriunda de um conjunto de alternativas onde se
realiza uma encolha dentre elas, “obedecendo a critérios preestabelecidos, em que é
indiscutível a importância das informações em cada etapa do processo” (REZENDE;
ABREU, 2003, p. 109).
“Quanto maior o valor e a qualidade da informação, maior a probabilidade de acerto na
tomada de decisão” (REZENDE; ABREU, 2003, p. 109). A grande dificuldade de um gerente
é escolher dentre as varias fontes de informações apresentadas, quais realmente são as mais
importantes e que levarão o gerente a tomar a melhor decisão para o trabalho. “Entretanto o
uso incorreto da informação, ou trabalho com informação não adequadamente organizada, em
vez de ajudar, irá prejudicar a empresa” (REZENDE; ABREU, 2003, p. 109).
7
2.1.1 Business Intelligence
Conforme Barbieri (2001, p.34), o conceito de BI é definido como “a utilização de
variadas fontes de informação para se definir estratégias de competitividade nos negócios da
empresa”. As organizações apresentam grandes volumes de dados o que ocasiona uma
desordem dificultando o processo de tomada de decisão dos executivos, os quais ficam
perdidos em meio a esse amontoado sem nenhuma conclusão. (BARBIERI, 2001).
Leme Filho (2004, p. 2:3) acrescenta que BI é um modelo que auxilia os executivos,
que tem influencia direta nos negócios da organização, usado para extrair, transformar e
analisar todo esse imenso volume de dados, apresentando ao final da sua aplicação o
conhecimento necessário para o auxilio dos gestores para a tomada de decisão.
O BI esta diretamente ligado como um subsidio para o apoio dos processos para a
tomada de decisão, trabalhando de acordo para que se atinja cada vez mais as vantagens
competitivas do mercado. (BARBIERI, 2001, p. 48).
Para que se tenha um aprimoramento nas tomadas de decisões o emprego do BI é
imprescindível, pois através dele há um aumento nas chances de sucesso das decisões. O seu
foco principal esta em extrair informações pertinentes em meio a uma grande massa de dados.
2.1.2 O processo de Data Mining
Essa tecnologia é formada por um conjunto de ferramentas que, por meio do uso de
algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes de explorar
um grande conjunto de dados transformando-os em conhecimento (REZENDE; ABREU,
2003, p. 215).
Todos os dias as empresas inserem inúmeros dados em seus bancos de dados, fazendo
com que esses se tornem verdadeiras minas de ouro de informações sobre os mais
diversificados processos utilizados dentro das organizações. “Todos esses dados podem
contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela e seu meio
ambiente interno e externo, visando a uma rápida ação de seus gestores” (REZENDE;
ABREU, 2003, p. 215).
8
Para que seja possível a extração de conhecimento de uma base de dados é necessário
um conjunto de processos focados em um determinado domínio, a partir de uma base de
dados bruta. Esses processos estão constituídos em: seleção, pré-processamento,
transformação, mineração de dados (Data Mining) e interpretação/ avaliação (ALMEIDA et
al., 2004).
Seleção é a principal característica da mineração e sua finalidade é a de definir o
conjunto de dados a ser analisado, deixando de fora os dados que não serão relevantes para o
processo de extração do conhecimento exclusivamente do domínio proposto (RAMOS;
SANTOS, 2003).
O pré-processamento, conforme Ramos e Santos (2003) “Passa essencialmente pela
redução do espaço de pesquisa, isto é, pela diminuição de linhas/colunas a analisar”. Almeida
et al. (2004) acrescenta “que outra tarefa importante é a verificação de predominância de
classes, sendo que nestes casos, deve-se eliminar alguns dos registros da classe predominante
ou acrescentar registros das outras classes”.
A transformação consiste na preparação da base de dados, onde por sua vez sofrerão
formatações para que seja possível a aplicação dos algoritmos de extração do conhecimento
(ALMEIDA et al., 2004).
O Data Mining, por sua vez, tem como objetivo construir hipótese. Para a construção
dessas hipóteses são utilizados sistemas especialistas. Conforme Almeida et al. (2004), “Um
sistema de aprendizado é um programa de computador que toma decisões baseadas em
experiências acumuladas contidas em exemplos resolvidos com sucesso”.
Na interpretação/avaliação todo conhecimento extraído será analisado e caso o
conhecimento apresentado não estiver de acordo com o esperado o processo pode ser
reiniciado, alterando a base de dados ou modificando os parâmetros informados inicialmente,
porém é de suma importância que a análise deva ser feita em conjunto com os especialistas
deste determinado domínio (ALMEIDA et al., 2004).
A aplicação do Data Mining torna possível comprovar o pressuposto da
transformação de dados em informação e posteriormente em conhecimento. Esta
possibilidade torna a técnica imprescindível para o processo de tomada de decisão.
Para chegar-se a este resultado, é preciso investigar o uso efetivo do conhecimento
obtido pelo Data Mining no processo de tomada de decisão, bem como os impactos
que teve na solução efetiva de problemas e ações propostas e concretizadas
(QUONIAM et al., 2001, p. 20).
9
2.1.3 Teoria dos Conjuntos Aproximativos
“No início da década de 80, surgiu uma teoria, caracterizada pela simplicidade e bom
formalismo matemático, o que facilita a manipulação de informações, em especial, incertas,
conhecida como Teoria dos Conjuntos Aproximativos (TCA), do inglês Rough Set Theory.”
(PESSOA; SIMÕES, 2004).
A TCA é uma extensão da teoria dos conjuntos, onde tem como principal objetivo o
tratamento das incertezas dos dados utilizando a relação de indiscernibilidade “que diz que
dois elementos são ditos indiscerníveis, se possuem as mesmas propriedades, segundo Leibniz
(Scuderi, 2001)” (PESSOA; SIMÕES, 2006). A outra relação é em torno das reduções que
nada mais são que a retirada dos atributos que não serão utilizados, que não agregam valor
para a base de conhecimento analisada (PESSOA; SIMÕES, 2006).
2.1.4 Cubo de Decisão
Cubo de decisão é o grupo de componentes que auxiliam nas decisões, onde podem ser
utilizados para relacionar tabelas de um banco de dados, que por sua vez são apresentados em
forma de planilhas e gráficos. “Nesta etapa é envolvido cálculo de dados que o usuário virá a
solicitar, mas que podem ser derivados de outros dados. Quando o usuário solicitar os dados,
estes já estarão calculados e agregados em um Cubo de Decisão” (GHODDOSI; DALFOVO;
MAIA, 2004).
2.2
SISTEMA ATUAL
No sistema atual todo o trabalho para extração da informação e análise é realizado
manualmente. Para a confecção dos gráficos e relatórios é utilizada a planilha eletrônica Excel
Figura 1.
10
Figura 1 - Planilha de controle de censo de informações de internação.
Por esta razão não há garantia de legitimidade das informações, pois as pessoas
envolvidas na coleta de dados podem inserir valores errados, ocasionando problemas na
análise, com isso não há um controle mais exato, tornando a análise falsa, afetando
diretamente as tomadas de decisões dos executivos.
As informações contidas na planilha são os dados coletados dentro do mês, cada
paciente contêm um cadastro com suas informações, o tipo de internação, quais
medicamentos e materiais foram utilizados em determinado paciente, o seu convênio. Através
destas informações é possível realizar as estatísticas, ou seja, através da ficha de internação do
paciente Figura 2.
11
Figura 2 - Ficha de Internação do Paciente.
2.3
SISTEMA PROPOSTO
O sistema proposto trata do desenvolvimento de uma aplicação desktop, para
realização da mineração dos dados da base da organização realizando um trabalho de
verificação através da aplicação da teoria dos conjuntos aproximativos demonstrando-as
através do cubo de decisão, onde por sua vez o usuário poderá interagir com o cubo cruzando
as informações. O sistema irá apresentar relatórios e gráficos, conseqüentemente trazendo
informações que realmente possam auxiliar o executivo a tomar sua decisão mais
acertadamente.
Basicamente o sistema irá apresentar uma interface gráfica, com os filtros previamente
constituídos de acordo com a necessidade do usuário que irá trabalhar com a ferramenta.
Apresentando informações através de relatórios e gráficos, o usuário poderá relacionar as
colunas no cubo de decisão e realizar a pesquisa desejada.
12
2.4
TRABALHOS CORRELATOS
A seguir são apresentados três trabalhos que se relacionam de forma direta com esta
esta proposta, entre os quais: Barreto (2003), Schmitt (2007) e Zimmermann (2006).
No trabalho de Schmitt (2007) desenvolveu-se um aplicativo utilizando Data Mining
baseado na Teoria dos Conjuntos Aproximativos. Basicamente consiste em aplicar a TCA em
uma base de dados de recursos humanos, para a identificação de perfis dos profissionais
cadastrados que mais se adequavam para comporem as equipes de projetos de software, com
isso auxiliando o executivo no processo de seleção.
O objetivo principal do trabalho de Zimmermann (2006) foi o desenvolvimento de
uma aplicação de Sistema de Apoio à Decisão baseado em Business Intelligence em que o
sistema realizava a busca das informações no banco apresentando-as através do cubo de
decisão, possibilitando o usuário de realizar o cruzamento das informações.
A dissertação de Barreto (2003) teve como objetivo trazer a definição e a comparação
da utilização do conjunto de ferramentas em Business Intelligence entre duas companhias,
Microsoft e Oracle dentro das organizações, apresentando-as como uma ferramenta de suma
importância para a obtenção das informações necessárias no escopo da gerência.
Correlacionando os trabalhos citados acima, o trabalho proposto visa à utilização da
técnica TCA em uma base de dados hospitalar. Diferentemente de Schmitt que a utilizou em
uma base de dados de Recursos Humanos. Através de uma ferramenta integrada no BI, à
técnica de mineração de dados Data Mining, para a seleção e coleta das informações. Para a
apresentação das informações para o usuário será utilizado o cubo de decisão, além de
relatórios e gráficos, assim como Zimmermann (2006) e Barreto (2003) utilizaram em seus
trabalhos. Através do uso do cubo de decisão o usuário terá a possibilidade de cruzar as
informações da mineração de dados.
2.5
REQUISITOS DO SISTEMA
O Quadro 3 apresenta os requisitos funcionais previstos para o sistema e sua
rastreabilidade, ou seja, vinculação com o(s) caso(s) de uso associado(s).
13
Requisitos Funcionais
RF01: O sistema deverá permitir o cadastro, consulta e manutenção de
Caso de Uso
UC01
usuário
RF02: O sistema deverá permitir importar/atualizar a estrutura de um banco.
UC02
RF03: O sistema deverá emitir um relatório contendo os serviços em aberto.
UC03
RF04: O sistema deverá possuir uma tela de login que, se aceita, levará para
UC04
a tela inicial.
RF05: O sistema deverá permitir a criação de relatórios de acordo com o
UC05
universo cadastrado ao usuário.
RF06: O sistema deverá permitir ao usuário a visualização do relatório.
UC06
RF07: O sistema deverá permitir salvar o relatório gerado.
UC07
RF08: O sistema deverá permitir abrir o relatório previamente salvo.
UC08
RF09: O sistema deverá permitir a visualização do relatório através de
UC09
gráficos.
RF10: O sistema deverá aplicar a técnica de mineração de dados utilizando
UC10
a TCA.
Quadro 3: Requisitos funcionais
O Quadro 4 lista os requisitos não funcionais previstos para o sistema.
Requisitos Não Funcionais
RNF01: O sistema deverá ser desenvolvido para o banco de dados Oracle.
RNF02: O sistema deverá ser construído sobre a plataforma de desenvolvimento Delphi.
RNF03: O sistema deverá habilitar ao usuário o perfil a ele designado conforme usuário e
senha cadastrados.
Quadro 4: Requisitos não funcionais
2.5.1 Diagrama de casos de uso
Esta seção apresenta o diagrama de casos de uso preliminar do sistema proposto, sendo
que o detalhamento de cada caso de uso, bem como seu protótipo, encontra-se no Apêndice
A.
14
Na figura 3 apresenta-se o diagrama de casos de uso do sistema, onde o administrador
é o responsável pelas inserções de dados no sistema, como cadastros e o usuário é responsável
pelas extrações de dados que a ele está permitido.
Figura 3: Diagrama de caso de uso – parametrização geral
15
2.5.2 Diagrama de atividades
Na figura 4 apresenta-se o diagrama de atividades onde mostra o usuário realizando a
geração de uma consulta.
Figura 4: Diagrama de atividades – elaboração de uma consulta.
Na figura 5 apresenta-se o diagrama de atividades onde mostra o administrador
realizando elaborando o universo de dados.
16
Figura 5: Diagrama de atividades – administrador do sistema.
17
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA, Leandro M. et al. Uma ferramenta para extração de padrões. 2004. 13 f.
Centro Universitário Luterano de Palmas, Palmas. disponível em:
<http://www.sbc.org.br/reic/edicoes/2003e4/cientificos/UmaFerramentaParaExtracaoDePadro
es.pdf>. Acesso em: 22 mar. 2008.
BARBIERI, Carlos. BI – Business Intelligence: modelagem & tecnologia. Rio de Janeiro:
Axel Books do Brasil, 2001.
BARRETO, David Guaspari; Business Intelligence: comparação de ferramentas. 2003. 73 f.
Dissertação (Mestrado em Computação). Curso de Pós-Graduação em Ciência da
Computação - Universidade Federal do Rio Grande do Sul - Porto Alegre.
DALFOVO, Oscar; AMORIM, Sammy Newton. Quem tem informação: é mais
competitivo. Blumenau: Santa Catarina Acadêmica Ltda, 2000.
GHODDOSI, Nader M.A; DALFOVO, Oscar; MAIA, Luiz Fernando Jacinto. Sistema de
apoio à tomada de decisões, utilizando técnicas de data warehouse e tecnologia web.
Florianópolis. 2004. Disponível em: <http://inf.unisul.br/~ines/workcomp/cd/pdfs/2806.pdf>.
Acesso em: 19 maio 2008.
LEME FILHO, Trajano. Business intelligence no microsoft Excel. Rio de Janeiro: Axel
Books do Brasil, 2004.
PESSOA, Alex S. A.; SIMÕES, José D. S.; Estudo do comportamento climático utilizando
uma abordagem neuro-aproximativa. 2004. Disponível em: <
http://hermes2.dpi.inpe.br:1905/col/lac.inpe.br/worcap/2004/10.06.13.09/doc/worcap_alex200
4.pdf>. Acesso em: 07 abr. 2008.
PESSOA, Alex S. A.; SILVA, José D. S.; CAMARGO, Hélio J. Redução de dados
metereologicos aplicados a previsão climática por redes neurais. 2006. Disponível em:
<http:// mtc-m17.sid.inpe.br/col/sid.inpe.br>. Acesso em: 06 abr. 2008.
QUONIAM, Luc et al. Inteligência obtida pela aplicação de data mining em base de teses
francesas sobre o Brasil. Brasília. 2001. Disponível em:
<http://www.scielo.br/pdf/ci/v30n2/6208.pdf>. Acesso em: 22 mar. 2008.
RAMOS, Isabel; SANTOS, Maribel Yasmina. Data mining no suporte à construção de
conhecimento organizacional. Porto. 2003. Disponível em:
<https://repositorium.sdum.uminho.pt/bitstream/1822/2302/1/CAPSI2003_IMR_MYS.pdf>.
Acesso em: 23 mar. 2008.
REZENDE, Denis Alcides; ABREU, Aline França de. Tecnologia da informação: aplicada a
sistemas de informação empresariais. 3. ed. São Paulo: São Paulo Atlas S/A, 2003.
18
SCHMITT, Sidnei; Gestão do conhecimento: aplicação em Data Mining utililizando a
Teoria do Conjuntos Aproximados para Geração do Capital Intelectual. 2007. 60f. Trabalho
de Conclusão de Curso - Fundação Universidade Regional de Blumenau - Blumenau - SC.
SORDI, José Osvaldo de. Tecnologia da informação aplicada aos negócios. São Paulo: São
Paulo Atlas S/A, 2003.
STAIR, Ralph M.; REYNOLDS, George W. Princípios de sistemas de informação: uma
abordagem gerencial. Tradução: Flávio Soares Corrêa da Silva. São Paulo: Pioneira Thomson
Learning, 2006.
ZIMMERMANN, Thiago Rafael; Desenvolvimento de um sistema de apoio à decisão
baseado em business intelligence. 2006. 76f. Trabalho de Conclusão de Curso – Fundação
Universidade Regional de Blumenau – Blumenau – SC.
19
APÊNDICE A – Detalhamento dos casos de uso
O protótipo funcional cujas telas encontram-se referenciadas nesta seção pode ser
encontrado
Identificação do UC
Objetivo
Cadastra usuário
Permite o cadastro de usuários do sistema. (TEL001)
Tela(s)
TEL001 – Cadastro de usuários
Identificação do UC
Objetivo
Importa banco dados
Permite importar a base de dados que o sistema irá aplicar a
técnica TCA. (TEL002)
Tela(s)
20
TEL002 – Importa Banco de Dados
Identificação do UC
Objetivo
Cadastro universo
Permite escolher quais tabelas estarão liberadas para o usuário.
(TEL003)
Tela(s)
TEL003 – Cadastro de universo
Identificação do UC
Visualizar relatório
21
Objetivo
Permite a visualização de relatórios informando os filtros desejados.
(TEL004) Pode-se visualizar um relatório. (TEL005)
Tela(s)
TEL004 – Filtro de relatórios
Identificação do UC
Objetivo
TEL005 – Visualização de relatório
Criar gráfico
Permite a visualização de gráficos.(TEL006) e (TEL007)
Tela(s)
TEL007 – Gráfico
TEL006 – Gráfico
Identificação do UC
Objetivo
Criar gráfico
Permite a manipulação dos dados através do cubo de decisão onde
pode-se visualizar graficamente. (TEL008)
Tela(s)
TEL008 – Gráfico
Download