Qual a definição para data mining? Uma das tecnologias de apoio ao CRM e que mais despertam atenção, embora ainda sejam relativamente desconhecidas é o data mining ou mineração de dados. Dificilmente dois profissionais de TI coincidem nas suas definições sobre o que é data mining! Mas podemos usar a seguinte definição: "data mining é um processo de extração e apresentação de informações utilizáveis, implícitas e recentes a partir de dados, que possam ser utilizadas para resolver um problema de negócios." Analisando esta definição observamos que falamos em processo, ou seja, não é apenas uma tecnologia, mas uma série de etapas inter-relacionadas. E o objetivo final é descobrir informações que tenham valor significativo para as empresas. Daí resolver um problema de negócios... Do lado tecnológico, existem diversas ferramentas de data mining no mercado. Entretanto, as técnicas de garimpagem de dados adotadas pelo fornecedor são diferentes e em conseqüência, as suas aplicabilidades também não são as mesmas. Um data mining não é uma panacéia que resolve todos os problemas. Apenas tenta descobrir os padrões e relacionamentos entre dados de modo que a empresa possa se embasar melhor para a tomada de decisões. [...] A ferramenta de mineração de dados pode ser arma poderosa para extração de informações úteis perdidas em toneladas de dados aparentemente sem relacionamentos entre si. E por outro lado, um uso incorreto desta tecnologia pode gerar muito mais confusão, levando a empresa a tomar decisões erradas. Embora só recentemente o tema mineração de dados tenha aparecido na mídia, despertando o interesse dos profissionais de TI, as suas técnicas básicas já existem há muito tempo, algumas desde os anos 40. Hoje existem diversos produtos no mercado, a maioria ainda voltada a garimpar dados em bases de dados relacionais ou multidimensionais. Em breve, com a expansão acelerada da Web, estas ferramentas deverão começar a extrair informações de uma imensa base de dados armazenadas em meios tão díspares entre si como texto, imagem ou vídeo, buscando padrões de uso de sites de ecommerce. Uma ferramenta de data mining pode ser usada em diversas áreas de negócio, como finanças, seguros, saúde, transporte, telecomunicações e varejo, apenas para citar algumas. No âmbito das iniciativas CRM podemos pensar em usar mineração de dados para ações de marketing dirigido, retenção de clientes, detecção de fraudes, análise de cesta de compras, segmentação de clientes, pontuação de crédito, avaliação de riscos de crédito, análise da lucratividade de clientes, gerenciamento de campanhas, análise e desempenho de canal de distribuição, loja ou filial, e assim por diante! Existem, em nível internacional, inúmeras aplicações de sucesso reportadas que incluem casos interessantes como: a)Uma aplicação que analisa empréstimos baseados nos padrões de compra, crédito e endividamento dos clientes; b)Um supermercado que organiza suas gôndolas de acordo com os padrões de compras associadas entre produtos; 1 c)Um laboratório farmacêutico americano que envia material promocional baseado nas prescrições médicas e padrões de vida dos clientes; d)Uma empresa financeira que analisa fraudes baseadas nos padrões de compra de seus clientes; e)Uma empresa aérea que usa informações sobre padrões e tendências de viagens para maximizar a ocupação de seus vôos. f)Uma empresa de telefonia celular que, baseada em padrões de uso dos telefones e outros fatores de mercado, faz previsões de quais clientes estão propensos a migrar para os concorrentes. A escolha da ferramenta de data mining deve ser considerada com atenção. As técnicas adotadas em cada produto são diferentes e portanto suas aplicações também são variadas. As técnicas mais conhecidas são: a)Classificação. Esta técnica agrupa itens baseados em atributos pré-definidos, como, por exemplo, identificar os clientes que moram na Barra da Tijuca, no Rio de Janeiro, que tenham apartamento próprio e viajem ao exterior. b)Associação. Busca correlações entre itens e indivíduos, deduzindo relacionamentos. Um exemplo típico é identificar que quem compra peixe compra também vinho branco. c)Clustering. Agrupa itens baseados em atributos como clientes tipo C serão aqueles que tem renda mensal menor que R$ 2.000,00; clientes tipo B terão renda mensal entre R$ 2001,00 e R$ 5.000,00 e clientes tipo A terão renda maior que R$ 5001,00. d)Predição. Buscar prever tendências como no ano 2005 o Ticket médio de cada checkout será de R$ 500,00. e)Estimativa. Examina tendências e padrões para deduzir outras caraterísticas. Um exemplo seria analisar padrões de compra de determinado cliente para identificar se este tem filhos pequenos. f)Análise de desvio ou afastamento. Compara dados reais de modo a preestabelecer normas que detectem anomalias. Pode-se usar esta técnica para identificar fraudes baseadas em desvios dos padrões normais de compras. A primeira etapa de um projeto de data mining é definir claramente os objetivos a serem alcançados. Para que eu preciso de um data mining? Que resultados espero alcançar? Tenho condições (recursos e expertise do grupo de tecnologia e dos usuários que usarão a ferramenta) para implementar um projeto esta natureza? Será necessário expertise externa para complementar meu grupo de trabalho? Que tipo de técnica de data mining será mais adequada as análises que preciso fazer? Esta é uma questão muito importante. Nem todas as técnicas respondem adequadamente às necessidades de análise da organização. Basicamente existem dois modelos de análise. No primeiro, verificação, você já tem hipóteses e quer apenas validá-las. O usuário é o responsável pela formulação das hipóteses e direciona a ferramenta para confirmá-las ou não. No outro modelo, descoberta, você está buscando identificar correlações em uma massa de dados. 2 São approaches diferentes e que demandam consequentemente, ferramentas diferentes... de técnicas diferentes. E, A seguir precisarmos identificar as bases de dados. A existência de um Data Warehouse é requisito básico. Um Data Warehouse deverá ser construído para agrupar, estruturar e formatar as diversas e heterogêneas fontes de dados para que a garimpagem seja bem sucedida. Os dados deverão ser validados, ou seja, a sujeira deverá ser eliminada. Este é um aspecto importante: se a base de dados não for válida, não será extraída nenhuma informação útil. Ou seja, não vale a pena garimpar em um local que não tenha ouro... A interpretação dos dados e as posteriores ações são fundamentais para o sucesso do data mining. Se a empresa identificou que cervejas e fraldas são compradas juntas e não reorganizou as gôndolas não adianta nada ter um data mining. Lição básica: um projeto de data mining não deve ser um projeto patrocinado pela área de TI. É um projeto dos usuários que usarão a ferramenta. Não devemos esperar milagres de um data mining. Dificilmente ele vai produzir resultados surpreendentes que transformarão uma empresa, tornando-a muito mais lucrativa de um dia para o outro. Por outro lado o data mining bem aplicado pode resultar em decisões embasadas, com resultados concretos para o negócio. É essencial que os usuários tenham capacitação no seu uso. São eles que criarão modelos, formularão e testarão hipóteses ou agirão sobre relacionamentos recém descobertos. Se a organização não tiver maturidade suficiente para usar rotineiramente um data mining, seu sucesso será questionável. TAURION, Cezar. Qual a definição para data mining? Disponível <http://www.mktdireto.com.br/materia6.html>. Acesso em: 07 ago. 2007. Fonte em: 3