Criação de Capacitação de Mineração de Dados Simão Lucas Teixeira Stocko Iniciação Científica PIBIC/CNPq Denise Fukumi Tsunoda /Josiete do Carmo A pesquisa tem como objetivo o desenvolvimento de uma capacitação de Mineração de Dados (MD) no modelo semipresencial. O público-alvo da pesquisa é formado pelo conjunto de todos os acadêmicos, pesquisadores e demais interessados na área de recuperação de informação em base de dados. As etapas envolvem: estudo das tarefas/técnicas de mineração de dados; criação, aplicação e avaliação dos resultados e documentação de todo o processo. Nesta fase foram realizadas leituras de diversos textos sobre Descoberta de Conhecimento em Base de Dados (KDD) e estudo das principais tarefas e técnicas de Mineração de Dados (MD) para a criação de subsídios teóricos para a construção da capacitação sobre o assunto. O software livre WEKA (Waikato Environment for Knowledge Analysis) foi estudado uma vez que é utilizado nas atividades práticas da capacitação. Até o momento apenas três tarefas foram abordadas: classificação, agrupamento e associação. TURBAN, Efraim et al. Tecnologia da informação para gestão. Porto Alegre: Bookman, 2010. FAYYAD et al. From data mining to knowledge discovery. American Association for Artificial Intelligence. 1996. Em agosto, a capacitação foi aplicada no Campus Sociais Aplicadas em forma de palestra para o GP-CIT (Grupo de Pesquisa em Ciência, Informação e Tecnologia), formado por uma equipe multidisciplinar de bolsistas, estagiários e docentes/pesquisadores. O total de participantes foi nove (9). Após a apresentação, foi aplicada uma pesquisa de avaliação, que obteve resultados positivos e um único comentário sobre a necessidade de se apresentar exemplos práticos de aplicação da MD. Este ponto já esta sendo aprimorado para a próxima capacitação. Na sequencia a pesquisa será convertida para o modelo semipresencial e compartilhada no Ambiente Virtual de Aprendizagem (AVA). Figura 1: PROCESSO DO KDD (FAYYAD, 1996) Futuramente a MD será algo rotineiro dentro das organizações, fato decorrente do grande volume de dados produzidos e armazenados pelas mesmas. Sendo um dos objetivos da MD a descoberta de “conhecimento surpreendente em base de dados”, estas tarefas / técnicas podem auxiliar na tomada de decisão e aumentar a competitividade empresarial. Como continuidade da pesquisa espera-se que outras tarefas tais como: regressão e sumarização sejam abordadas.