A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense – (Unipar) Paranavaí – PR – Brasil [email protected], [email protected], [email protected] Resumo: Este artigo abordará como a Mineração de Dados é de extrema importância para organizações que tenham um banco de dados muito grande e que necessitam tomar decisões de forma ágil. Também auxiliará as empresas que sofrem com queda de vendas em determinados períodos, queda de vendas de determinados funcionários e relatórios que não trazem todas as informações necessárias. A Mineração de Dados responde a todas essas questões citadas acima, mas para isso deve elaborar de forma criteriosa seu modelo. 1. Introdução Na atualidade empresas estão investindo mais na automação do software, pelo fato de agilizar os níveis estratégico e gerencial para as tomadas de decisões, pois esses softwares armazenam os dados de forma duplicadas dentro do datawarehouse para relatórios complexos. Os softwares que possuem o BI (Business Intelligence) faz com que o setor que irá tomar as decisões, consiga observar nos relatórios as informações necessárias para poder avaliar o resultado que eles esperam, dependendo o grau de complexidade ou quantidade de informações armazenadas dentro do banco, esses relatórios podem demorar dias, semanas ou meses. Será detalhada a ferramenta WEKA que é uma suíte que contem diversas técnicas para minerar os dados e sendo open source, ele é quem faz a interação dos arquivos de dados ficarem de forma visual. 2. Mineração de Dados (Data Mining) Nos anos 80, deu-se início a um novo ramo de computação, a mineração de dados, que surgiu da necessidade das empresas em relação ao grande volume de dados inúteis que eram estocados e tinha a função de extrair informação das bases de dados. Segundo Braga [2005], a mineração de dados é um processo de explorar grandes volumes de dados. Existem diversas etapas de mineração de dados, pois o administrador dos dados é que irá definir quais serão as etapas a serem seguidas, Carvalho [2005] definiu que a mineração de dados possui as etapas as quais serão mostradas a seguir e que podemos observar também na Figura 1 Entender o problema: é a primeira fase de um projeto, pois o mesmo tem como objetivo principal identificar quais são os problemas que estão ocorrendo. Figura 1 - Modelo de Mineração de Dados. Vasconcelos [2013] 2.1 Entendendo o Problema Observar quando a empresa estiver passando por um problema já que é necessário que o mesmo passe pela fase de entendimento do problema que está ocorrendo em determinado setor, será analisado o que está ocorrendo no setor para entender o motivo do problema. [Carvalho 2005] Será compreendido o porquê do problema ocorrido, por exemplo, qual foi o motivo pelo qual levou o setor de produção ter produzido tão pouco em determinada época do ano. 2.2 Descobrindo o Conhecimento Está fase é aonde irá começar a descoberta de relações que serão obtidas pelos danos já armazenados, toda essa relação é encontrada da inteligência artificial, no caso existem diversas ferramentas específicas. [Carvalho 2005] 2.3 Análise de Relações Nesta fase será efetuada uma exaustiva análise das relações obtidas, pode-se observar que através das relações obtidas com a mineração de dados às informações se relacionam entre si, por exemplo, qual foi o produto mais vendido em determinada época do ano entre outros. [Carvalho 2005] Agora que as informações obtidas estão analisadas pode-se tomar decisões de forma que o problema não venha acontecer novamente, caso não houvesse a mineração de dados, seria muito complicado chegar até a decisão. Depois destes procedimentos, a empresa cria padrões próprios para que esses problemas não ocorram novamente, pois agora tem as informações cabíveis do problema ocorrido. 3. Weka O Weka é um software desenvolvido em Java, formado por um conjunto de implementações de algoritmos de diversas técnicas de Mineração de Dados com as especificações GPL (General Public License) como podemos ver a ferramenta na Figura 2, sendo utilizada por estudantes e professores de universidade, embora ela também seja muito utilizada por profissionais que desejam aprender os conceitos básicos de mineração de dados. Por ter sua interface gráfica, é possível conduzir processos de mineração de dados de forma simples, realizando avaliações dos resultados obtidos e a comparação de algoritmos. Seu ponto forte é a tarefa de classificação, mas também é capaz de minerar regras de associação e clusters de dados. Figura 2 - Ferramenta WEKA. Abernethy [2013] O Weka pode ser utilizado de três diferentes formas: interface gráfica, linha de comando e através de sua API. A interface gráfica fornece as diversas ferramentas para seus usuários através de janelas e seus elementos. A linha de comando é um meio utilizado para dar mais agilidade a processos repetitivos e acesso direto a funcionalidades que teriam mais passos a serem executados, caso fossem acessados via interface gráfica. A opção de acesso via API é utilizada por desenvolvedores de software por fornecer um meio prático para o uso das funcionalidades implementadas no Weka. Iremos exemplificar os diferentes problemas utilizando a interface gráfica, especificamente a ferramenta Explorer [Damasceno 2013]. 4. Metodologia Para este artigo, foram utilizadas pesquisas em artigos científicos, sites da internet, leitura de livros. Com o conhecimento adquirido, realizou-se este artigo científico, tendo o fundamento de transmitir o conhecimento sobre o assunto pesquisado. 5. Conclusão Este artigo tem a finalidade de transmitir conhecimento para quem não entende sobre o assunto de Mineração de Dados (Data Mining) e WEKA. Como era o objetivo do artigo, foi apresentado com clareza o assunto abordado. A mineração de dados não traz somente números em seus relatórios, traz números e respostas como, porque o produto X vendeu mais no mês de janeiro do que no mês de junho, porque o vendedor B vendeu mais no mês de abril do que no mês de janeiro. A mineração de dados é a solução para as organizações tomarem decisões de forma mais rápida. O WEKA também traz grandes benefícios por conseguir fazer muitas tarefas de mineração de dados, sendo open source que é um fator muito importante. 6. Referências ABERNETHY, Michael. Mineração de Dados com WEKA, Parte 1: Introdução e Regressão <http://www.ibm.com/developerworks/br/opensource/library/os-weka1/>. Acesso em 04 de agosto de 2013. BRAGA, Luis Paulo Vieira. Introdução a Mineração de Dados. Rio de Janeiro: EPapers Serviços Editoriais, 2005. CARVALHO, Luís Alfredo Vidal de. Datamining – A Mineração de Dados no Marketing, Medicina, Economia, Engenharia e Administração. Rio de Janeiro: Editora Ciência Moderna LTDA, 2005. DAMASCENO, Marcelo - Introdução a Mineração de Dados Utilizando o WEKA <http://connepi.ifal.edu.br/ocs/anais/conteudo/anais/files/conferences/1/schedConfs/1 /papers/258/public/258-4653-1-PB.pdf>. Acesso em 03 de agosto de 2013. FAVARETTO, Fabio e RHODEN, Carlos Alberto. Considerações Sobre Atividades de Identificação, Localização e Tratamento de Dados na Construção de um Data Warehouse, 2006. GONÇALVES, Eduardo Corrêa. Mineração de Dados na Prática com Weka API, <http://www.devmedia.com.br/mineracao-de-dados-na-pratica-com-weka-apirevista-sql-magazine-107/26841>. Acesso em 03 de agosto de 2013. GONÇALVES, Eduardo Corrêa. Mineração de Dados no MySQL com a ferramenta Weka, <http://www.devmedia.com.br/mineracao-de-dados-no-mysql-com-a- ferramenta-weka/26360>. Acesso em 03 de agosto de 2013. MSDN, Mineração de dados (SSAS), <http://msdn.microsoft.com/pt- br/library/bb510516.aspx>. Acesso em 02 de junho de 2013. VASCONCELOS, Lívia Maria Rocha de. CARVALHO, Cedric Luiz de. Aplicação de Regras de Associação para Mineração de Dados na WEB, http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_00404.pdf>. Acesso em 04 de agosto de 2013. <