UNIVERSIDADE FEDERAL DE SANTA CATARINA – UFSC DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA CURSO DE CIÊNCIAS DA COMPUTAÇÃO TRABALHO DE CONCLUSÃO DE CURSO Um Estudo dos Pressupostos para uma Ferramenta de Apoio ao Gerenciamento do Relacionamento com os Clientes (CRM) baseada em Técnicas de Mineração de Dados Saulo Cecim El Achkar Orientadora Profª: Maria Marta Leite Florianópolis, SC – Dezembro de 2004 2 SAULO CECIM EL ACHKAR “Um Estudo dos Pressupostos para uma Ferramenta de Apoio ao Gerenciamento do Relacionamento com os Clientes (CRM) baseada em Técnicas de Mineração de Dados” Trabalho de Conclusão de Curso em Ciências da Computação da Universidade Federal de Santa Catarina, Graduação. Orientadora: Profª Maria Marta Leite Florianópolis 2004 como requisito para 3 SAULO CECIM EL ACHKAR “Um Estudo dos Pressupostos para uma Ferramenta de Apoio ao Gerenciamento do Relacionamento com os Clientes (CRM) baseada em Técnicas de Mineração de Dados” Este trabalho de Conclusão de Curso foi julgado adequado para obtenção de Graduação em Ciências da Computação e aprovado em sua forma final junto à Universidade Federal de Santa Catarina – UFSC , Florianópolis, SC. _________________________________________ Profº Nome Completo e Sobrenome Coordenador do Curso de Ciências da Computação da UFSC Apresentada à Banca Examinadora, integrada pelos Professores: _________________________________________ Profª Maria Marta Leite _________________________________________ Profª Alessandra Schweitzer _________________________________________ Profº Paulo José Ogliari 4 Dedicatória Parte reservada para uma possível dedicatória do trabalho realizado. 5 Agradecimentos Reservado para os agradecimentos do trabalho feito. 6 RESUMO Entender as necessidades e os anseios do consumidor moderno tornou-se objeto de sobrevivência do mercado ultra competitivo do século 21. Este trabalho busca o estudo das modernas técnicas de Mineração de Dados e CRM. O resultado deste estudo é a fomentação e planejamento do desenvolvimento de um software de relacionamento empresa-cliente. Este software será responsável pela compreenssão e antecipação das necessidades dos consumidores, através da técnicas citadas. Palavras chaves: CRM, Mineração de Dados, relacionamento com o cliente. 7 ABSTRACT Understanding modern buyer’s needs became a survival subject in this 21st century competitive market. This work aims the study of the modern techniques Data Mining and CRM (Costumer Relationship Management). As a result of this study will be the planning of relationship company-client software. This software will be responsible for comprehension and predicting consumer’s needs, through the techniques related. Key words: CRM, Data Mining, costumer relationship. 8 SUMÁRIO RESUMO ABSTRACT 1 INTRODUÇÃO ......................................................................................................... 11 1.1 TEMA ......................................................................................................................... 11 1.2 JUSTIFICATIVA ...................................................................................................... 14 1.3 OBJETIVOS .............................................................................................................. 15 1.3.1 OBJETIVO GERAL ....................................................................................................... 15 1.3.2 OBJETIVOS ESPECÍFICOS............................................................................................ 15 1.4 PROBLEMA .............................................................................................................. 16 2 REVISÃO BIBLIOGRÁFICA ................................................................................. 17 2.1 GESTÃO DE RELACIONAMENTO COM O CLIENTE – CRM ....................... 17 2.2 MINERAÇÃO DE DADOS ...................................................................................... 18 2.2.1 TÉCNICAS CLÁSSICAS ................................................................................................. 19 2.2.1.1 ESTATÍSTICAS .............................................................................................................. 19 2.2.1.2 VIZINHO MAIS PRÓXIMO ............................................................................................. 19 2.2.1.3 AGRUPAMENTO ............................................................................................................ 20 2.2.2 TÉCNICAS DA NOVA GERAÇÃO .................................................................................. 20 2.2.2.1 ÁRVORES DE DECISÃO ................................................................................................. 20 9 2.2.2.2 REDES NEURAIS........................................................................................................... 21 2.2.2.3 REGRA DA INDUÇÃO..................................................................................................... 21 2.2.2 DATA WAREHOUSING ................................................................................................. 22 2.2.3 UTILIZANDO MINERAÇÃO DE DADOS E DATA WAREHOUSING ................................. 22 3 ESTUDO DO MERCADO ........................................................................................ 23 3.1 CONCORRÊNCIA ................................................................................................... 23 3.1.1 EMPRESA A ................................................................................................................. 23 3.1.1.1 SOFTWARE X ................................................................................................................ 24 3.1.2 EMPRESA B ................................................................................................................. 24 3.1.2.1 SOFTWARE Y ................................................................................................................ 24 3.2 ÁREAS DE ATUAÇÃO ............................................................................................ 24 3.2.1 MERCADOS ALVOS ..................................................................................................... 24 3.2.2 REGIÕES GEOGRÁFICAS ............................................................................................. 25 4 DESENVOLVIMENTO DO TRABALHO ............................................................. 26 4.1 A FERRAMENTA .................................................................................................... 26 5 CONSIDERAÇÕES FINAIS.................................................................................... 27 REFERÊNCIAS ..................................................................................................................... 28 ANEXOS ................................................................................................................................. 29 10 1 INTRODUÇÃO A busca das empresas é por fatias cada vez maior do mercado altamente disputado de consumidores. Para tanto, bem conhecer e relacionar-se com o cliente tornou-se premissa básica para o sucesso comercial de promoções, propagandas e lançamentos e renovações de produtos. Atrair a atenção do público requer o conhecimento dos gostos, preferências, desejos e hábitos de quem estamos nos dirigindo. A complexidade da situação apresentada aumenta, quando consideramos que as empresas não têm, mesmo dentro do seu público-alvo, clientes com as mesmas características. É, porém, possível encontrar sub-grupos de pessoas com caracterísicas e gostos semelhantes. Até pouco tempo atrás, trabalhar com tal problemática, restrigia os analistas a poucas variáveis, pois este tipo de tarefa era realizada manualmente. Hoje, podemos e devemos utilizar diversas variáveis que ajudam a definir melhor o comportamento dos consumidores. 1.1 TEMA O surgimento da computação no mundo possibilitou não apenas processamento, mas também o armazenamento de dados em grandes quantidades. Com a evolução das tecnologias, supercomputadores trabalham em velocidades inimagináveis e conseguem 11 armazenar inúmeros terabytes1 de informações. Com o passar do tempo, notou-se a possibilidade de utilizar tal processamento e esse imenso volume de dados para obter informações relevantes. O uso de tais informações no meio dos negócios é de fundamental importância para as empresas que querem se manter no mercado, aumentando sua competitividade. Não apenas os equipamentos tiveram de evoluir, mas também as técnicas para a obtenção de informações relevantes sobre os dados obtidos. O amadurecimento das técnicas de Mineração de Dados2 permite hoje que uma imensa quantidade de dados possa ser analisada em busca de informações escondidas. “Ferramentas de mineração de dados prevêem tendências e comportamentos futuros, permitindo as empresas a tomarem decisões pró-ativas dirigidas pelo conhecimento” (THEARLING). As ferramentas de mineração de dados buscam padrões de comportamentos e tendências através de técnicas probabilísticas, estatísticas e matemáticas. Imagine se pudéssemos prever o que os consumidores de uma determinada empresa desejam ou necessitam comprar? Esta é a idéia por trás da mineração de dados. Entretanto, a mineração só pode ser feita, se tivermos um grande Data Warehouse3 a partir do qual possamos obter informações relevantes. Uma forma de obtenção de dados dos clientes, entretanto, é através de aplicativos CRM4. As ferramentas de CRM garante que todo o contato de uma empresa feito com seus clientes sejam registrados e acompanhados. Desta forma, os administradores podem conhecer cada cliente em particular e assim oferecer os produtos certos, no momento certo, pelo canal correto, para a pessoa certa. Esta prática garante uma maior fidelidade por parte dos consumidores, o que reduz os gastos das empresas e maximiza o retorno das campanhas de marketing. 1 Terabyte é o equivalente à um trilhão de bytes Do inglês, Data Mining 3 Data Warehouses são grandes banco de dados com grande fluxo de entrada e saída de dados 4 Customer Relationship Management – Administração do relacionamento com o cliente 2 12 A utilização destas duas tecnologias apresentadas, Mineração de Dados e CRM, em uma única ferramenta demonstra um grande potencial computacional e comercial. 13 1.2 JUSTIFICATIVA Conseguir prever o mercado e a tendência dos consumidores garante às empresas que se utilizam de ferramentas de mineração de dados, uma vantagem competitiva sem precedentes. Nunca antes tivemos acesso a computadores de tão alto processamento e armazenamento, que nos garantisse com tamanha agilidade informações futuras confiáveis. O custo de manutenção de clientes é várias vezes menor que o custo de obtenção de novos clientes e ainda menor que o preço de reconquista de um cliente perdido. Identificar e manter os clientes mais rentáveis é uma tarefa difícil quando feita manualmente para um número muito elevado de clientes, justificando a utilização das técnicas aqui apresentadas. 14 1.3 OBJETIVOS 1.3.1 Objetivo Geral Estudar e planejar o desenvolvimento de uma ferramenta de Apoio ao Gerenciamento ao Cliente (CRM) baseada em Técnicas de Mineração de Dados. 1.3.2 Objetivos Específicos Conhecer os fundamentos das aplicações CRM; Levantar as principais técnicas de Mineração de Dados e conhecer suas características e funcionalidades; Escolher as técnicas de Mineração de Dados mais apropriadas para utilização na ferramenta a ser desenvolvida e; Delimitar o escopo da ferramenta a ser desenvolvida. 15 1.4 PROBLEMA O trabalho desenvolvido fornecerá subsídios para as atividades de modelagem e de desenvolvimento de uma aplicação comercial de uso real. Sua plataforma ainda não será escolhida neste momento, nem a linguagem de programação ou a tecnologia de banco de dados. Serão pesquisadas as técnicas de mineração de dados existentes, relatando a característica, relevância e vantagem da utilização de cada uma delas. De antemão, pode-se dizer que as técnicas de mineração de dados, dividem-se, segundo Berson, Smith e Thearling, em dois grandes blocos: as técnicas clássicas e as técnicas da próxima geração. As técnicas clássicas utilizam estatística, vizinhança e clustering. As técnicas da próxima geração utilizam árvores de decisão, redes neurais ou regras de indução. Várias são as técnicas e muitas são as variâncias que existem. Ainda existem técnicas que podem ser agrupadas e usadas em conjunto. Cada caso necessita de uma avaliação para a decisão de qual técnica utilizar. Deve-se decidir ao final deste trabalho o escopo da aplicação CRM de uso comercial que se deseja no futuro. Isto porque uma aplicação CRM para uma financiadora é diferente de uma aplicação CRM para um supermercadista. No final, espera-se responder a pergunta: qual as técnicas de mineração de dados ideais para a aplicação CRM de desejamos construir? 16 2 REVISÃO BIBLIOGRÁFICA 2.1 GESTÃO DE RELACIONAMENTO COM O CLIENTE – CRM Do termo inglês CRM, ou Customer Relationship Management, a Gestão de Relacionamento de Clientes pode ser definida como uma estratégia de negócio que mantém a organização focada no cliente e em obter a maior optimização e rentabilidade dos mesmos. O CRM parte das seguintes premissas do mundo moderno dos negócios: Empresas precisam gastar muito mais dinheiro para conquistar um novo cliente do que para manter um cliente; É muito mais caro ganhar de volta um cliente depois que perdemos do que mantê-lo satisfeito desde o começo; É muito mais fácil vender um novo produto para um cliente que já temos do que para um novo cliente; Alguns clientes são muito mais lucrativos do que outros clientes. Alguns clientes não geram lucro e alguns clientes não geram lucro e nunca darão lucro. Para ajudar na solução de tais premissas, um Sistema de Gestão de Relacionamento com o Cliente deve, Segundo Berson, Smith e Thearling (1999, p. 43), responder as seguintes questões: Quais clientes são os mais lucrativos para mim? E porquê? 17 Quais promoções são as mais efetivas? E para quais clientes? Que tipo de cliente vai estar mais interessado no meu novo produto? Quais clientes estão mais propensos a mudar para o meu concorrente? Como eu identifico futuros clientes com o maior potencial de lucro? A resposta das perguntas acima ajudam, se bem organizadas, na tomada de decisões em um processo CRM. 2.2 MINERAÇÃO DE DADOS A Mineração de Dados automatiza o processo de detecção de padrões em uma base de dados. Um exemplo de padrão poderia ser que pais separados que não moram com os filhos têm o dobro de chances de aceitar uma oferta de viagem de aventura do que pais casados. Em base de dados muito grandes, informações desse tipo podem passar despercebidas por um gerente de marketing, porém, podem ser detectadas através da mineração de dados automatizada. Os processos atuais de Mineração de Dados utilizam coleções de técnicas estatísticas e de inteligência artificial de aprendizado para prever o comportamento dos clientes. Ainda assim, são necessários analistas que possam intervir na definição dos modelos e na relevância dos padrões encontrados automaticamente. Os modelos criados e os comportamentos futuros de clientes previstos servem de apoio para os tomadores de decisão nas empresas. Os próximos tópicos dissertarão sobre as técnicas existentes na Mineração de Dados e sobre Data Warehousing, objeto essencial na construção de Sistemas de Mineração de Dados. 18 2.2.1 Técnicas Clássicas A seguir serão apresentadas as Técnicas Clássicas e posteriormente as Técnicas da Nova Geração. As Técnicas Clássicas são aquelas utilizadas muito antes do termo Mineração de Dados surgirem. Elas incluem conhecimento estatístico e matemático avançado na resolução dos problemas. 2.2.1.1 Estatísticas Estatística é um ramo da matemática com milhares de anos de existência. Refere-se a coleção e descrição de dados. A contribuição da estatística para a Mineração de Dados ocorre principalmente no uso de suas ferramentas, como histogramas, gráficos e cálculos como moda, mediana e variância. 2.2.1.2 Vizinho Mais Próximo A técnica do Vizinho Mais Próximo busca objtos semelhantes para a suposição de valores que não se conhece. A premissa desta técnica é que objetos semelhantes terão dados com valores semelhantes. Por exemplo, um Corsa e um Gol terão valores mais próximos (velocidade máxima, consumos, potência, etc) entre si, do que entre uma BMW e um Gol. 19 2.2.1.3 Agrupamento O método do Agrupamento tenta manter em grupos os dados parecidos. O exemplo mais intuitivo de Agrupamento pode ser o da lavanderia. Quando separamos as roupas em “brancas”, “coloridas” e “delicadas” para serem lavadas, estamos realizando um processo de Agrupamento. Grandes sistemas utilizam o Agrupamento para estabelecer informações demográficas de populações. Estes dados servem para dar uma visão ampla da situação analisada. 2.2.2 Técnicas da Nova Geração As técnicas da Nova Geração são aquelas criadas e desenvolvidas nas ultimas décadas. Tais técnicas vêm ganhando enorme popularidade na mídia e representam a Mineração de Dados atual. Estas técnicas podem ser usadas para descobrir novas informações em grandes bancos de dados ou para construir modelos de previsão. 2.2.2.1 Árvores de Decisão Os modelos de previsão criados a partir de Árvores de Decisão são baseados em perguntas, que fazem a divisão em galhos, ou ramos, dos objetos analisados. As perguntas feitas em série farão uma segmentação dos dados que temos de forma a isolar uma parcela que queremos atingir ou estudar. 20 2.2.2.2 Redes Neurais Redes Neurais é o termo usado para identificar sistema biológicos, com o cérebro, que podem identificar padrões, fazer previsões e aprender. Sistemas computacionais que tentam imitar o comportamento de um cérebro são, na verdade, chamados de Redes Neurais Artificias, um estudo originalmente da área de Inteligência Artificial. A popularidade deste método para a Mineração de Dados é grande devido ao grande número de problemas as quais as Redes Neurais podem se adaptar e resolver. 2.2.2.3 Regra da Indução Regra de indução é uma das grandes técnicas de mineração de dados atuais. A busca neste técnica, é por fatos que acontecem juntos e frequentemente. Parece ser mais fácil explicar por exemplos. Imagine uma rede supermercadistas com dados completos das compras dos clientes. Agora o sistema entra com uma hipótese: Se um cliente compra um saco de carvão, ele compra linguiça? Digamos que a resposta para essa pergunta é que 90% das compras de saco de carvão foram acompanhadas pela compra de linguiça. Para serem úteis estas regras, ou suposições, criadas devem trazer consigo duas variáveis como resposta: Precisão – Quantas vezes a regra está correta? Cobertura – Quantas vezes a regra se aplica? 21 Para o exemplo apresentado, 90% representa a precisão com que a regra está correta, isto é, 90% das vezes em que foi comprado carvão, também foi comprado linguiça. Para continuar exemplificando cobertura, digamos que em 1,5% das compras realizadas no supermercado houve a compra de carvão com linguiça. 2.2.2 Data Warehousing Data Warehousing, um termo em inglês sem tradução para o português, é a união de tecnologias com o objetivo da efetiva integração operacional de base de dados em ambientes que permitam o uso estratégico dos dados. Dentre estas tecnologias encontramos sistemas de gerenciamento de banco de dados relacional e multidimensional, arquiteturas cliente/servidor, modelagem de metadados, interfaces gráfica de usuário e outras. 2.2.3 Utilizando Mineração de Dados e Data Warehousing [Explicar como e porque se dá a utilização conjunta da mineração de dados e de Data Warehousing] 22 3 ESTUDO DO MERCADO Antes da demilitação da ferramenta a ser desenvolvida é necessário que defina-se o mercado em que ela estará incluida. Para isso, é necessário o estudo minucioso das empresas concorrentes, dos mercados de atuação mais promissores e das oportunidades disponíveis. 3.1 CONCORRÊNCIA Neste tópcio serão apresentados as empresas que desenvolvem e apresentam solução que envolvem Mineração de Dados e/ou Gestão de Relacionamento com o Cliente em sistemas próprios. 3.1.1 Empresa A [Estudo de caso sobre a empresa...] 23 3.1.1.1 Software X [Descrição e estudo do Software X, desenvolvido pela Empresa A...] 3.1.2 Empresa B [Estudo de caso sobre a empresa...] 3.1.2.1 Software Y [Descrição e estudo do Software Y, desenvolvido pela Empresa B...] 3.2 ÁREAS DE ATUAÇÃO 3.2.1 Mercados Alvos [Estudo dos mercados de possível atuação do ferramenta. Ex: Atacadistas, como supermercados, grandes lojas de conveniências, roupas, grandes cadeias nacionais, alimentação, Financeiro: bancos, financiadoras, corretoras da bolsa de valores, seguradoras, Mercados emergentes, Internet, notícias, etc] 24 3.2.2 Regiões Geográficas [Estudo dos possíveis locais de atuação, alocação de empresa...] 25 4 DESENVOLVIMENTO DO TRABALHO Após conhecer todos os principais aspectos da Mineração de Dados e da Gestão de Relacionamento com o Cliente, os quais são conceitos e teorias relativamente modernas e inovadoras, neste capítulo será delimitado o escopo da ferramenta a ser desenvolvida, bem como todos os aspectos relativas a ela. 4.1 A FERRAMENTA [Aqui será definida a ferramenta. Mercado de atuação, linguagem de programação a ser utilizada, arquitetura de banco de dados, técnicas de mineração de dados, modelo de CRM a ser utilizado. A seguir podem ser definida uma modelagem UML, relação de requisitos, e outros assuntos de Engenharia de Software, que encaminhem para o desenvolvimento da aplicação. Relatar sobre a empresa a ser constituida?] 26 5 CONSIDERAÇÕES FINAIS [Discursas sobre resultados esperados e alcançados no projeto e na confecção do TCC. Relacionar trabalhos futuros e trabalho necessário para a concretização da ferramenta.] 27 REFERÊNCIAS BERSON, Alex; SMITH, Stephen; THEARLING, Kurt – Building Data Mining Applications for CRM – McGraw-Hill, 1999. BERSON, Alex; SMITH, Stephen; THEARLING, Kurt – An Overview of Data Mining Techniques – Disponível em <http://www.thearling.com/text/dmtechniques/dmtechniques.htm> Acesso em 29 de jan. de 2004. THEARLING, Kurt – An Introduction to Data Mining – Disponível <http://www.thearling.com/text/dmwhite/dmwhite.htm> Acesso em 29 de jan. de 2004 em 28 ANEXOS