Objetivos De forma a atender à demanda local, objetiva-se alavancar os setores da Zona Oeste pela formação de mão de obra altamente qualificada, bem como, permitir às micro e pequenas empresas do entorno, gerar extração de conhecimento, importante etapa na aplicação de business intelligence na empresa. Através do Data Warehouse, Data Mart ou Data Store é possível extrair conhecimento para decisões estratégicas em empresas, por meio de ferramentas e técnicas de KDD. As empresas, em geral, têm a necessidade de manipular grandes e heterogêneos volumes de dados; o tratamento de resultados representados em diferentes formatos e a dificuldade de integração de diversos algoritmos específicos são alguns exemplos de fatores operacionais. Por outro lado, os fatores de controle, mais complexos, envolvem considerações sobre como conduzir processos de KDD. Entre tais fatores podem ser citados: A dificuldade na formulação precisa dos objetivos a serem alcançados em um processo de KDD. Não raro nem mesmo os usuários do contexto da aplicação de KDD apresentam de forma clara suas expectativas quanto aos resultados do processo (Goldschmidt e Passos, 2005, p. 52, apud. Engels, 1996, p. 87). A dificuldade na escolha de um algoritmo de mineração de dados com potencial para geração de resultados satisfatórios. Tal dificuldade é intensificada na medida em que surjam novos algoritmos com o mesmo propósito, aumentando a diversidade de alternativas. Em geral, a escolha dos algoritmos se restringe às opções conhecidas pelo analista de KDD, deixando muitas vezes de considerar outras alternativas promissoras (Goldschmidt, 2003). A dificuldade na escolha das alternativas de pré-processamento dos dados. Neste caso, a diversidade de algoritmos de pré-processamento é agravada não só pelo surgimento de novos algoritmos, mas pelas possibilidades de combinação entre eles. De forma análoga ao item anterior, alternativas de pré-processamento potencialmente adequadas podem sequer ser consideradas durante a escolha (Goldschmidt, 2003). A dificuldade freqüente na escolha cuidadosa da parametrização adequada a diversos algoritmos diante de cada nova situação. Uma recorrente ruptura de concentração do analista de KDD causada muitas vezes pelos longos tempos de experimentação de inúmeras alternativas na busca por melhores resultados. A incapacidade humana de memorização de resultados e alternativas processadas na medida em que o tempo passa e o número de experimentos realizados aumenta. Tal fato compromete ainda a desejável comparação entre alternativas e resultados necessária à tomada de decisão quanto a novas alternativas a serem avaliadas. A etapa de pré-processamento compreende todas as funções relacionadas à captação, à organização e ao tratamento dos dados. Esta etapa tem como objetivo a preparação dos dados para os algoritmos da etapa da mineração de dados. Funções de pré-processamento: Seleção de dados, limpeza dos dados, codificação dos dados e enriquecimento dos dados. Durante a etapa de mineração de dados é realizada a busca efetiva por conhecimentos úteis no contexto da aplicação de KDD. É a principal etapa do processo de KDD. Alguns autores se referem à mineração de dados e à descoberta de conhecimento em bases de dados como sinônimos. Envolve a aplicação de algoritmos sobre os dados em busca de conhecimento implícitos e úteis. Na etapa de mineração de dados, são definidos as técnicas e os algoritmos a serem utilizados no problema em questão. Redes Neurais, Algoritmos Genéticos, Modelos Estatísticos e Probabilísticos são exemplos de técnicas que podem ser utilizadas na etapa de mineração de dados. A escolha da técnica depende, muitas vezes, do tipo de tarefa de KDD a ser realizada. A seguir algumas tarefas de KDD encontramse comentadas. Descoberta de associação, classificação, regressão, agrupamento (cluster), sumarização, detecção de desvios e descoberta de seqüências. A etapa de Pós-processamento abrange o tratamento do conhecimento obtido na Mineração de Dados. Tal tratamento, muitas vezes desnecessário, tem como objetivo facilitar a interpretação e a avaliação, pelo homem, da utilidade do conhecimento descoberto. Entre as principais funções da etapa de pós-processamento estão: elaboração e organização, podendo incluir a simplificação, de gráficos, diagramas, ou relatórios demonstrativos; além da conversão da forma de representação do conhecimento obtido. Na figura 4, podemos observar a apresentação da metodologia de realização de KDD proposta em (Goldschmidt e Passos, 2005) através do diagrama de caso de uso com as principais funcionalidades necessárias à implementação do processo. Para tanto, foram utilizados modelos da UML – Unified Modeling Language (Fowler e Scott, 2000). Por meio do caso de uso “Definir Objetivos”, o ator deve registrar as tarefas de KDD identificadas que são viáveis, procurando adequá-las de forma a atender às necessidades e expectativas do usuário do domínio da aplicação. Neste momento, devem ser registrados quais os requisitos levantados que se referem ao modelo de conhecimento a ser produzido. Mais de um objetivo pode ser constituído por aplicação de KDD. Figura 4 – Diagrama de Caso de Uso para implementação da Metodologia da Realização de KDD proposta em (Goldschmidt e Passos, 2005). Fonte: Goldschmidt e Passos, 2005, p. 143.