Objetivos De forma a atender à demanda local, objetiva

Propaganda
Objetivos
De forma a atender à demanda local, objetiva-se alavancar os setores da Zona
Oeste pela formação de mão de obra altamente qualificada, bem como, permitir às
micro e pequenas empresas do entorno, gerar extração de conhecimento, importante
etapa na aplicação de business intelligence na empresa.
Através do Data Warehouse, Data Mart ou Data Store é possível extrair
conhecimento para decisões estratégicas em empresas, por meio de ferramentas e
técnicas de KDD.
As empresas, em geral, têm a necessidade de manipular grandes e heterogêneos
volumes de dados; o tratamento de resultados representados em diferentes formatos e a
dificuldade de integração de diversos algoritmos específicos são alguns exemplos de
fatores operacionais. Por outro lado, os fatores de controle, mais complexos, envolvem
considerações sobre como conduzir processos de KDD. Entre tais fatores podem ser
citados:
A dificuldade na formulação precisa dos objetivos a serem alcançados em um
processo de KDD. Não raro nem mesmo os usuários do contexto da aplicação de KDD
apresentam de forma clara suas expectativas quanto aos resultados do processo
(Goldschmidt e Passos, 2005, p. 52, apud. Engels, 1996, p. 87).
A dificuldade na escolha de um algoritmo de mineração de dados com potencial
para geração de resultados satisfatórios. Tal dificuldade é intensificada na medida em
que surjam novos algoritmos com o mesmo propósito, aumentando a diversidade de
alternativas. Em geral, a escolha dos algoritmos se restringe às opções conhecidas pelo
analista de KDD, deixando muitas vezes de considerar outras alternativas promissoras
(Goldschmidt, 2003).
A dificuldade na escolha das alternativas de pré-processamento dos dados. Neste
caso, a diversidade de algoritmos de pré-processamento é agravada não só pelo
surgimento de novos algoritmos, mas pelas possibilidades de combinação entre eles. De
forma análoga ao item anterior, alternativas de pré-processamento potencialmente
adequadas podem sequer ser consideradas durante a escolha (Goldschmidt, 2003).
A dificuldade freqüente na escolha cuidadosa da parametrização adequada a
diversos algoritmos diante de cada nova situação.
Uma recorrente ruptura de concentração do analista de KDD causada muitas
vezes pelos longos tempos de experimentação de inúmeras alternativas na busca por
melhores resultados.
A incapacidade humana de memorização de resultados e alternativas
processadas na medida em que o tempo passa e o número de experimentos realizados
aumenta. Tal fato compromete ainda a desejável comparação entre alternativas e
resultados necessária à tomada de decisão quanto a novas alternativas a serem avaliadas.
A etapa de pré-processamento compreende todas as funções relacionadas à
captação, à organização e ao tratamento dos dados. Esta etapa tem como objetivo a
preparação dos dados para os algoritmos da etapa da mineração de dados. Funções de
pré-processamento: Seleção de dados, limpeza dos dados, codificação dos dados e
enriquecimento dos dados.
Durante a etapa de mineração de dados é realizada a busca efetiva por
conhecimentos úteis no contexto da aplicação de KDD. É a principal etapa do processo
de KDD. Alguns autores se referem à mineração de dados e à descoberta de
conhecimento em bases de dados como sinônimos. Envolve a aplicação de algoritmos
sobre os dados em busca de conhecimento implícitos e úteis.
Na etapa de mineração de dados, são definidos as técnicas e os algoritmos a
serem utilizados no problema em questão. Redes Neurais, Algoritmos Genéticos,
Modelos Estatísticos e Probabilísticos são exemplos de técnicas que podem ser
utilizadas na etapa de mineração de dados. A escolha da técnica depende, muitas vezes,
do tipo de tarefa de KDD a ser realizada. A seguir algumas tarefas de KDD encontramse comentadas.
Descoberta de associação, classificação, regressão, agrupamento (cluster),
sumarização, detecção de desvios e descoberta de seqüências.
A etapa de Pós-processamento abrange o tratamento do conhecimento obtido na
Mineração de Dados. Tal tratamento, muitas vezes desnecessário, tem como objetivo
facilitar a interpretação e a avaliação, pelo homem, da utilidade do conhecimento
descoberto. Entre as principais funções da etapa de pós-processamento estão:
elaboração e organização, podendo incluir a simplificação, de gráficos, diagramas, ou
relatórios demonstrativos; além da conversão da forma de representação do
conhecimento obtido.
Na figura 4, podemos observar a apresentação da metodologia de realização de
KDD proposta em (Goldschmidt e Passos, 2005) através do diagrama de caso de uso
com as principais funcionalidades necessárias à implementação do processo. Para tanto,
foram utilizados modelos da UML – Unified Modeling Language (Fowler e Scott,
2000).
Por meio do caso de uso “Definir Objetivos”, o ator deve registrar as tarefas de
KDD identificadas que são viáveis, procurando adequá-las de forma a atender às
necessidades e expectativas do usuário do domínio da aplicação. Neste momento,
devem ser registrados quais os requisitos levantados que se referem ao modelo de
conhecimento a ser produzido. Mais de um objetivo pode ser constituído por aplicação
de KDD.
Figura 4 – Diagrama de Caso de Uso para implementação da Metodologia da
Realização de KDD proposta em (Goldschmidt e Passos, 2005).
Fonte: Goldschmidt e Passos, 2005, p. 143.
Download