A Grande Importância da Mineração de Dados nas Organizações 1

Propaganda
A Grande Importância da Mineração de Dados nas
Organizações
Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime
Willian Dias¹
¹Universidade Paranaense – (Unipar)
Paranavaí – PR – Brasil
[email protected], [email protected], [email protected]
Resumo: Este artigo abordará como a Mineração de Dados é de extrema
importância para organizações que tenham um banco de dados muito grande
e que necessitam tomar decisões de forma ágil. Também auxiliará as
empresas que sofrem com queda de vendas em determinados períodos, queda
de vendas de determinados funcionários e relatórios que não trazem todas as
informações necessárias. A Mineração de Dados responde a todas essas
questões citadas acima, mas para isso deve elaborar de forma criteriosa seu
modelo.
1.
Introdução
Na atualidade empresas estão investindo mais na automação do software, pelo fato de
agilizar os níveis estratégico e gerencial para as tomadas de decisões, pois esses
softwares armazenam os dados de forma duplicadas dentro do datawarehouse para
relatórios complexos.
Os softwares que possuem o BI (Business Intelligence) faz com que o setor que
irá tomar as decisões, consiga observar nos relatórios as informações necessárias para
poder avaliar o resultado que eles esperam, dependendo o grau de complexidade ou
quantidade de informações armazenadas dentro do banco, esses relatórios podem
demorar dias, semanas ou meses.
Será detalhada a ferramenta WEKA que é uma suíte que contem diversas
técnicas para minerar os dados e sendo open source, ele é quem faz a interação dos
arquivos de dados ficarem de forma visual.
2.
Mineração de Dados (Data Mining)
Nos anos 80, deu-se início a um novo ramo de computação, a mineração de dados, que
surgiu da necessidade das empresas em relação ao grande volume de dados inúteis que
eram estocados e tinha a função de extrair informação das bases de dados.
Segundo Braga [2005], a mineração de dados é um processo de explorar grandes
volumes de dados.
Existem diversas etapas de mineração de dados, pois o administrador dos dados
é que irá definir quais serão as etapas a serem seguidas, Carvalho [2005] definiu que a
mineração de dados possui as etapas as quais serão mostradas a seguir e que podemos
observar também na Figura 1
Entender o problema: é a primeira fase de um projeto, pois o mesmo tem como
objetivo principal identificar quais são os problemas que estão ocorrendo.
Figura 1 - Modelo de Mineração de Dados. Vasconcelos [2013]
2.1 Entendendo o Problema
Observar quando a empresa estiver passando por um problema já que é necessário que o
mesmo passe pela fase de entendimento do problema que está ocorrendo em
determinado setor, será analisado o que está ocorrendo no setor para entender o motivo
do problema. [Carvalho 2005]
Será compreendido o porquê do problema ocorrido, por exemplo, qual foi o
motivo pelo qual levou o setor de produção ter produzido tão pouco em determinada
época do ano.
2.2 Descobrindo o Conhecimento
Está fase é aonde irá começar a descoberta de relações que serão obtidas pelos danos já
armazenados, toda essa relação é encontrada da inteligência artificial, no caso existem
diversas ferramentas específicas. [Carvalho 2005]
2.3 Análise de Relações
Nesta fase será efetuada uma exaustiva análise das relações obtidas, pode-se observar
que através das relações obtidas com a mineração de dados às informações se
relacionam entre si, por exemplo, qual foi o produto mais vendido em determinada
época do ano entre outros. [Carvalho 2005]
Agora que as informações obtidas estão analisadas pode-se tomar decisões de
forma que o problema não venha acontecer novamente, caso não houvesse a mineração
de dados, seria muito complicado chegar até a decisão.
Depois destes procedimentos, a empresa cria padrões próprios para que esses
problemas não ocorram novamente, pois agora tem as informações cabíveis do
problema ocorrido.
3.
Weka
O Weka é um software desenvolvido em Java, formado por um conjunto de
implementações de algoritmos de diversas técnicas de Mineração de Dados com as
especificações GPL (General Public License) como podemos ver a ferramenta na
Figura 2, sendo utilizada por estudantes e professores de universidade, embora ela
também seja muito utilizada por profissionais que desejam aprender os conceitos
básicos de mineração de dados. Por ter sua interface gráfica, é possível conduzir
processos de mineração de dados de forma simples, realizando avaliações dos resultados
obtidos e a comparação de algoritmos.
Seu ponto forte é a tarefa de classificação, mas também é capaz de minerar
regras de associação e clusters de dados.
Figura 2 - Ferramenta WEKA. Abernethy [2013]
O Weka pode ser utilizado de três diferentes formas: interface gráfica, linha de
comando e através de sua API. A interface gráfica fornece as diversas ferramentas para
seus usuários através de janelas e seus elementos. A linha de comando é um meio
utilizado para dar mais agilidade a processos repetitivos e acesso direto a
funcionalidades que teriam mais passos a serem executados, caso fossem acessados via
interface gráfica. A opção de acesso via API é utilizada por desenvolvedores de
software por fornecer um meio prático para o uso das funcionalidades implementadas
no Weka. Iremos exemplificar os diferentes problemas utilizando a interface gráfica,
especificamente a ferramenta Explorer [Damasceno 2013].
4.
Metodologia
Para este artigo, foram utilizadas pesquisas em artigos científicos, sites da internet,
leitura de livros. Com o conhecimento adquirido, realizou-se este artigo científico, tendo
o fundamento de transmitir o conhecimento sobre o assunto pesquisado.
5.
Conclusão
Este artigo tem a finalidade de transmitir conhecimento para quem não entende sobre o
assunto de Mineração de Dados (Data Mining) e WEKA. Como era o objetivo do artigo,
foi apresentado com clareza o assunto abordado.
A mineração de dados não traz somente números em seus relatórios, traz
números e respostas como, porque o produto X vendeu mais no mês de janeiro do que
no mês de junho, porque o vendedor B vendeu mais no mês de abril do que no mês de
janeiro. A mineração de dados é a solução para as organizações tomarem decisões de
forma mais rápida.
O WEKA também traz grandes benefícios por conseguir fazer muitas tarefas de
mineração de dados, sendo open source que é um fator muito importante.
6.
Referências
ABERNETHY, Michael. Mineração de Dados com WEKA, Parte 1: Introdução e
Regressão <http://www.ibm.com/developerworks/br/opensource/library/os-weka1/>.
Acesso em 04 de agosto de 2013.
BRAGA, Luis Paulo Vieira. Introdução a Mineração de Dados. Rio de Janeiro: EPapers Serviços Editoriais, 2005.
CARVALHO, Luís Alfredo Vidal de. Datamining – A Mineração de Dados no
Marketing, Medicina, Economia, Engenharia e Administração. Rio de Janeiro:
Editora Ciência Moderna LTDA, 2005.
DAMASCENO, Marcelo - Introdução a Mineração de Dados Utilizando o WEKA
<http://connepi.ifal.edu.br/ocs/anais/conteudo/anais/files/conferences/1/schedConfs/1
/papers/258/public/258-4653-1-PB.pdf>. Acesso em 03 de agosto de 2013.
FAVARETTO, Fabio e RHODEN, Carlos Alberto. Considerações Sobre Atividades de
Identificação, Localização e Tratamento de Dados na Construção de um Data
Warehouse, 2006.
GONÇALVES, Eduardo Corrêa. Mineração de Dados na Prática com Weka API,
<http://www.devmedia.com.br/mineracao-de-dados-na-pratica-com-weka-apirevista-sql-magazine-107/26841>. Acesso em 03 de agosto de 2013.
GONÇALVES, Eduardo Corrêa. Mineração de Dados no MySQL com a ferramenta
Weka,
<http://www.devmedia.com.br/mineracao-de-dados-no-mysql-com-a-
ferramenta-weka/26360>. Acesso em 03 de agosto de 2013.
MSDN,
Mineração
de
dados
(SSAS),
<http://msdn.microsoft.com/pt-
br/library/bb510516.aspx>. Acesso em 02 de junho de 2013.
VASCONCELOS, Lívia Maria Rocha de. CARVALHO, Cedric Luiz de. Aplicação de
Regras
de
Associação
para
Mineração
de
Dados
na
WEB,
http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_00404.pdf>. Acesso em 04 de agosto de 2013.
<
Download