1 Desenvolvimento de Metodologia para a Identificação de Conhecimento nos Registros Textuais do Call Center da Ampla através de Técnicas de Mineração de Textos da Língua Portuguesa C. L. De Oliveira, AMPLA, A. Theobald, AMPLA, G. M. Caputo, COPPE/UFRJ, V. M. Bastos, COPPE/UFRJ, G. M. Tavares, UFF e N. F.F. Ebecken, COPPE/UFRJ Resumo - Entender as necessidades dos clientes é a principal motivação de empresas de prestação de serviços. A partir de dados dos próprios clientes, é possível obter uma análise de suas perspectivas e compreender as falhas e processos, que uma vez analisados, possam ser úteis para a melhoria do atendimento. O objetivo do trabalho é aplicar mineração de textos nos registros das reclamações dos clientes para descobrir o conhecimento escondido nessas manifestações. A base de dados que armazena tais informações possui conhecimento implícito sobre os principais motivos de reclamação dos clientes e conseqüente insatisfação. O resultado da análise, combinado com técnicas de visualização, auxilia na compreensão do perfil dos clientes da empresa. Todas essas vantagens orientam o processo de tomada de decisão, o direcionamento de projetos de P&D e a identificação dos clientes em potencial para a oferta de novos produtos e serviços. Palavras-chave: Call Center, Clustering, Mineração de Textos. • I. INTRODUÇÃO A utilização de informações armazenadas em banco de dados tem sido cada fez mais explorada por empresas que visam melhorar processos e a prestação dos serviços que prestam. A idéia de extração de conhecimento é a área que trata do entendimento dessas informações, que na maioria das vezes, são subutilizadas pelas empresas, uma vez que é fonte de importantes informações sobre os clientes da empresa e sobre os competidores [1]. Para esse trabalho foi aplicada uma metodologia utilizando uma base de dados contendo registros de ligações C. L. de Oliveira e A. Theobald trabalham na AMPLA (email: {catialopes, theobald}@ampla.com.br). G.M Caputo é doutoranda e pesquisadora na COPPE/UFRJ (email: [email protected] ). V. M. Bastos trabalha na COPPE/UFRJ como pesquisadora (email: [email protected]) G. M. Tavares é professor titular da Universidade Federal Fluminense (email: [email protected]) N. F. F. Ebecken é professor titular da COPPE/UFRJ (email: [email protected]) de clientes para o Call Center de uma empresa de fornecimento de energia elétrica. O processo de extração de conhecimento na base de dados do Call Center consiste em entender os registros, como um todo, e agrupar as informações de acordo com o conteúdo [2]. A partir dos agrupamentos criados é possível obter informações como: quais os maiores motivos das reclamações, quais as maiores falhas da empresa com relação ao atendimento, motivos de insatisfação dos clientes, quais as áreas que precisam ser reestruturadas no que diz respeito ao atendimento, entre outros. Todas as ligações dos clientes para o call center são armazenadas pelo atendente e encaminhadas para o setor responsável de execução da solicitação. Tais registros, além de conter informações sobre tais solicitações, devidamente analisados, se tornam um poderoso recurso de tomada de decisão. A aplicação da mineração de textos [3] nesses registros tem o objetivo de analisar, utilizando processamento avançado de inteligência computacional, e extrair conhecimento até então implícito na base de dados, ou seja, aquela informação não óbvia, mas relevante para a melhoria do atendimento. O conhecimento obtido permite: entender o relacionamento com o cliente, melhorar a qualidade do atendimento, aumentar a satisfação dos clientes e o direcionamento às ações adequadas e eficazes. Dessa maneira, o processo de extração do conhecimento constitui das seguintes etapas: • • • • • • • identificação e obtenção da base de dados adequada, que possui as informações necessárias, definição da metodologia mais apropriada para os dados e para o conhecimento pretendido, coleta e preparação dos dados, pré-processamento dos dados, processamento dos dados utilizando mineração de textos, pós-processamento dos dados, análise dos resultados e implantação das soluções encontradas, e divulgação interna dos resultados obtidos. 2 Cada uma das conclusões obtidas devem, então, ser tratadas com especial atenção e julgada a viabilidade de adoção de novos mecanismos e aperfeiçoamento de tratamentos já existentes. Cada um dos estudos de caso a serem criados e analisados devem apresentar conhecimento significativo e poderão ser respondidas questões como maiores motivos das reclamações dos clientes em cada sub-área da empresa e que geram insatisfação dos clientes. Tal conhecimento é capaz de demonstrar em quais setores os clientes possuem mais necessidades e aqueles pontos que devem ser melhorados. Além disso, é possível responder como alguns problemas devem ser abordados pelo pessoal do atendimento, dando um direcionamento para a decisão que deve ser tomada. Tal conhecimento indica treinamentos que devem ser dados à equipe de atendimento para orientar os clientes e aperfeiçoar o atendimento. Este artigo se divide em seções: a descrição da base de dados do call center e como foi realizada a sua segmentação, metodologia de extração do conhecimento, incluindo o préprocessamento e o pós-processamento, a análise de resultados juntamente com a implantação da metodologia, e finalmente, as conclusões do trabalho. II. BASE DE DADOS DO CALL CENTER A base de dados dos registros das ligações do call center da AMPLA armazena as informações dos motivos de reclamações de seus clientes. Quando um cliente liga para o call center, o atendente digita o seu pedido, detalhando as informações, e já realiza uma primeira classificação definindo de acordo com o motivo da classificação. Essas classificações buscam abranger as diversas áreas de atendimento ao cliente existente na empresa que são: • • • • • • • • • Arrecadação Atendimento a Clientes Faturamento Inadimplência (Corte e Religação) Perdas Projeto Ligação Nova Qualidade do Fornecimento Qualidade no Atendimento Soluções em Família O primeiro estudo de caso inclui a separação dos dados não só pelo ano do registro da ligação, como também pelo motivo da realização da mesma, definido pelo campo “motivo-cliente”. Esse estudo de caso possui dezoito bases de dados que são descritas na tabela 1, com seus respectivos anos, motivos da ligação e as quantidades de registros que cada base possui. O segundo estudo de caso segmenta a base de registros de cada ano em quatro bases de dados distintas, de acordo com o trimestre que a ligação foi realizada. Ou seja, cada ano foi dividido em 4 períodos de ligações, relativos ao primeiro, segundo, terceiro e quarto trimestre dos anos. Dessa forma, a base de dados total foi segmentada em 8 bases distintas de acordo com a tabela 2. Tabela 1 – Bases de Dados do Estudo de Caso segmentada pelo Ano e pelo “motivo-cliente” Ano Motivo 2004 2004 Arrecadação Atendimento a Clientes Faturamento Inadimplência (Corte e Religação) Perdas Projeto Ligação Nova Qualidade do Fornecimento Qualidade no Atendimento Arrecadação Atendimento a Clientes Faturamento Inadimplência (Corte e Religação) Perdas Projeto Ligação Nova Qualidade do Fornecimento Qualidade no Atendimento Soluções em Família 2004 2004 2004 2004 2004 2004 2005 2005 2005 2005 2005 2005 2005 2005 Para melhor aproveitamento dos dados existentes e uma busca mais detalhada por conhecimento novo através desses registros, alguns estudos de caso foram determinados. Esses estudos de caso incluem dois critérios: utilizando o campo “data” dos registros, onde os registros são separados de acordo com o ano em que a reclamação ocorreu; e utilizando o campo que armazena a pré-classificação definida pelo atendente. Cada um dos estudos de caso criado é separado da base de dados e tratado de forma independente. O estudo de caso é pré-processado e agrupado, visando obter o conteúdo dos dados. O objetivo é encontrar os principais motivos de reclamação em cada setor em cada ano. Dessa informação, é possível entender onde os clientes não estão satisfeitos, e o por quê. Assim, melhorar o processo de atendimento e de fornecimento do serviço. 2005 Quantidade de Registros 4375 14587 59583 41509 5918 9909 14997 26158 4012 21028 30842 20513 1901 13419 26882 6293 273 Tabela 2 – Bases de Dados do Estudo de Caso segmentada pelo trimestre de cada ano Ano Trimestre 2004 2004 2004 2004 2005 2005 2005 2005 Primeiro Segundo Terceiro Quarto Primeiro Segundo Terceiro Quarto Quantidade de Registros 59946 62126 44577 10387 63869 41848 17009 2437 3 III. METODOLOGIA DE EXTRAÇÃO DE CONHECIMENTO Extração de conhecimento é o processo de obtenção de informações úteis e novas de bases de dados. Os dados textuais são também chamados de não-estruturados, pois não apresentam uma formatação bem definida, composta de par valor-atributo. O uso desse tipo de dado requer uma metodologia especifica para o tratamento dessa estrutura de forma que as palavras contidas nos textos se transformem em atributos, e a relevância de cada palavra seja transformada em um valor. Realizar esse processo na base de dados do call center é a transformação dos registros das ligações utilizando métodos computacionais e análise inteligente. A utilização desses registros visa encontrar conhecimento sobre motivos de ligações dos clientes e que possam ser úteis para melhorar o processo de atendimento e a satisfação do cliente. Os próximos tópicos relatam uma metodologia estudada para a manipulação dos dados textuais do call center da empresa AMPLA de fornecimento de energia elétrica. A. Pré-processamento A fase de pré-processamento dos dados textuais constitui da transformação dos registros das ligações realizadas pelos clientes em dados que possam ser interpretados pelas ferramentas de mineração de textos. É a etapa mais demorada do processo, pois cada termo presente na base de textos é analisado e retirado ou transformado de acordo com a necessidade. Inclui as etapas onde é editada a metalinguagem que é utilizada pela equipe de atendimento das ligações dos clientes. Essa linguagem é especifica do call center e por isso precisa de um tratamento personalizado. Além disso, essa fase inclui a retirada dos ruídos dos dados, onde os dados são manipulados e convertidos para que reste apenas a parte com informação útil para a obtenção de novos conhecimentos. O pré-processamento tem o objetivo de encontrar semelhança, a partir das palavras, entre os registros das ligações dos clientes. Destacando essas semelhanças os padrões de comportamento e necessidades dos clientes são mais facilmente encontrados. Pode ser realizado seguindo passos padrões da mineração de textos, que ocorrem iterativamente, ou seja, a execução de uma funcionalidade aperfeiçoa o resultado de outro. Tratamento da Metalinguagem Além do tratamento do idioma português, conforme é necessário para a perfeita realização da mineração de textos, também é necessário um tratamento especial para a base de dados analisada. No caso do Call Center da Ampla, é comum encontrar erros de digitação e vícios de linguagem. Para o tratamento da metalinguagem, foi gerada uma lista com os principais termos que são importantes para o entendimento do processo de atendimento do Call Center. Nessa lista estão contidos abreviações (bastante comum para agilizar o atendimento, como por exemplo, “cli” e “clt”, como variações para o termo “cliente”), correção dos erros de escrita (por exemplo, “reclamção”, quando a forma correta é “reclamação”). Case Folding Case Folding ou “Caso Sensitivo” é o processo de conversão dos caracteres do texto em um mesmo tipo de letra: maiúsculo ou minúsculo. Esse processo acelera o mecanismo de comparação entre os termos para a descoberta de padrões existentes entre registros, e diminui o número de termos iguais escritos de formas diferentes, por exemplo, “AMPLA” e “ampla”. Caracteres Especiais Para um melhor aproveitamento dos dados, um passo bastante importante para a etapa de pré-processamento é a retirada de alguns caracteres especiais, como por exemplo, números, caracteres de pontuação, barras de divisão e símbolos. Tais caracteres são bastante explorados pelos atendentes do call center, e por isso são bastante comuns na base de dados. Porém, na maioria dos casos são apenas utilizados como separadores de assuntos que os atendentes digitam, e por isso não são importantes para o conteúdo dos textos. Além disso, a acentuação das palavras nem sempre ocorre de forma completa ou correta. Por isso, para agilizar o mecanismo de comparação entre os termos e reduzir a quantidade de erros inseridos na base, é recomendado a substituição das palavras acentuadas, por palavras sem acentuação, como por exemplo, “arrecadação” e “arrecadacao”. Stop Words A próxima classificação de ruídos tratada na fase de preparação dos dados foram as palavras consideradas Stop Words, que dizem respeito àqueles termos que não agregam conhecimento à base de dados. Para otimizar esse item e obter um melhor resultado, a lista de Stop Words foi dividida em três diferentes listas, a saber: • Lista contendo: nomes próprios de pessoas, sobrenomes, nomes de empresas e de outras instituições e logins de usuários do sistema. Esses dados estão presentes no campo “NOME DO CLIENTE”. No total, essa lista contém 10039 termos. • Lista com termos padrão de termos Stop Words da língua portuguesa (como preposições, conjunções, artigos e outros), separadores comumente utilizados pelos atendentes (como por exemplo, “xxxx”) e palavras originadas de Stop Words, mas que foram digitadas incorretamente. No total, essa lista contém 2931 termos. • Lista com os termos que possuíam freqüência 1 dentro do conjunto total de registros de cada estudo de caso. Estudos comprovam que a presença desses termos atrapalha a qualidade dos resultados obtidos, além de aumentar o tempo de processamento do algoritmo de classificação. Com exceção dessa lista, todos os outros procedimentos foram aplicados igualmente a todos os estudos de caso. Nesse caso, os 4 termos que apareciam com freqüência considerada baixa, foram incluídos na lista de Stop Words. No final, as duas primeiras listas de Stop Words criadas foram retiradas das bases de dados, e em seguida, foi retirada a lista de termos de baixa freqüência. Todo esse processo melhorou o tempo de processamento dos registros e a qualidade da informação armazenada. Após esse processo de limpeza das informações, foi observado que aproximadamente 61% dos termos contidos nas bases de dados propostas pelo estudo de caso, possuíam freqüência igual a 1. Pôde ser comprovado, através das ferramentas de mineração de textos, que esses termos representam uma situação de erro de digitação ou um termo não significativo para o conjunto e, portanto, não influenciam ou até mesmo pioram o resultado final. Stemming Após todo o processo de limpeza dos dados, apenas a parcela com dados relevantes e devidamente modificados restaram para a próxima fase de mineração de texto, reduzindo significativamente o montante de informação, e consequentemente, otimizando o processo de descoberta de conhecimento. Para a realização da mineração de textos, os dados devem ser cuidadosamente pré-processados. É considerada a fase mais importante e demorada do processo de mineração de textos, por seu nível de detalhamento e precisão na busca, pois visa obter apenas as informações relevantes. Essa fase pode ser realizada de acordo com dois pontos importantes a serem considerados nos dados: a metalinguagem utilizada pelo pessoal do call center, e os ruídos existentes em dados textuais. B. Clusterização Algoritmos de Stemming tem o objetivo de reduzir palavras aos seus relativos stems ou raiz. Com isso, os sufixos das palavras são retirados, padronizando palavras que possuem o mesmo sentido, independente de suas formas verbais e/ou plurais. Esses algoritmos são específicos para cada idioma. No caso da língua portuguesa, é comum a redução pela seguinte ordem: 1. Redução do plural (ex.: contas Æ conta, ligações Æ ligação) 2. Redução do feminino (ex.: atrasada Æ atrasado) 3. Redução do advérbio (ex.: constantemente Æ constante) 4. Redução do aumentativo/Diminutivo 5. Redução de Sufixo Vale ressaltar que o idioma português possui várias exceções que não se encaixam em algoritmos de stemming padrão. A clusterização dos registros das ligações tem o objetivo de agrupar assuntos semelhantes e revelar qual o principal motivo de cada agrupamento. A organização da informação não-estruturada é responsável pela obtenção do conhecimento em dado textuais. Tal técnica é indicada para a organização de registros de ligação do call center pois busca informações, justamente em dados não previamente classificados. Isso quer dizer, que a priori não se possui informação sobre o conteúdo dos dados e nem sobre o que cada registro diz respeito. Analisando os agrupamentos realizados é possível entender quais são os principais problemas ocasionados dentro do conjunto de registros. Dessa forma, a clusterização é capaz de mostrar combinações de registros que indicam assuntos cujos problemas devem ser levados em consideração. Atendimento não efetuado Serviço mal executado OS não atendida Atraso na instalação Cobranças Indevidas Problemas Técnicos 2004 Queima de aparelhos 2005 2ª via Corte Indevido Problemas na Entrega da Conta Falta de Energia (Atend. Cliente) Falta de Energia (Qualid. Fornecimento) Problema de leitura de consumo 0 5000 10000 15000 20000 25000 30000 Figura 1 – Principais motivos nos anos de 2004 e 2005 5 C. Processamento Para o call center da AMPLA, algoritmos de clusterização são capazes de organizar os registros de ligações com motivos semelhantes e explicitar o conhecimento inserido na base de dados, através de agrupamentos e análise computacional. O método de agrupamento utilizado é baseado na freqüência linear dos termos dentro de cada registro de ligação. Para isso, os termos são convertidos em par valoratributo, de acordo com a relevância de cada termo dentro do conjunto total. Para isso podem ser usados métodos como: freqüência binária, freqüência dos termos ou o TF x IDF, que corresponde à freqüência dos termos multiplicada pelo inverso da freqüência dos documentos. O algoritmo de clusterização considera a co-ocorrência dos termos, objetivando uma clusterização mais subjetiva através do agrupamento de registros que contem assuntos de reclamações semelhantes. Além disso, o método de clusterização efetua uma classificação sintática e semântica para cada termo, identificando se o termo é um nome, um verbo ou um adjetivo. Como resultado, o processo, além de conseguir separar os principais assuntos das reclamações, ainda é capaz de especificar os motivos das ligações, obtendo uma visão clara do conteudo da base de dados. Tal resultado é possivel realizando clusterização iterativamente, ou seja, criando subclusters a partir de clusters previamente criados. IV. IMPLANTAÇÃO DA METODOLOGIA E ANÁLISE DOS RESULTADOS Baseado nas informações obtidas através da aplicação de algoritmos de mineração de textos, foram alcançados os resultados que podem ser interpretados e transformados em conhecimento a ser utilizado para a obtenção de novas informações. A análise dos resultados identifica o conhecimento obtido pela execução das ferramentas de mineração de texto. Além dos conteúdos, o resultado também possibilitou uma melhor compreensão das ligações relacionadas a cada problema. A aplicação da metodologia de extração do conhecimento citada na seção II determinou os resultados classificados pelos motivos das reclamações dos clientes, trimestralmente, como mostrado na figura 1. O exemplo prático da figura 1 apresenta a diferença dos motivos das ligações ocorridas nos anos de 2004 e 2005. A figura demonstra a evolução do processo de atendimento, idealizando como a empresa aprimorou o serviço prestado a algumas áreas, e onde é possível aperfeiçoar o atendimento e execução de serviços. A figura 2 e 3 apresentam o gráfico de evolução dos problemas dos anos de 2004 e 2005 respectivamente. Trimestre 1 23.89 25 18.57 10 17.74 20.00 16.90 15.00 11.48 10.86 10.03 22.22 22.08 25.00 20 15 Trim estre 2 16.32 10.68 8.9 8.71 10.00 7.33 5.09 5.14 3.81 5 3.49 5.00 0.00 0 Trimestre 3 Trimestre 4 19.96 23.7 25.0 22.5 20 18 17.7 20.0 10.22 12 10.0 5.0 13.06 14 13.9 15.0 14.82 16 15.7 7.8 3.9 10 7.6 7.8 10.74 7.67 9.82 7.63 8 6.05 6 4.1 1.9 4 2 0.0 0 Queima de Aparelhos Má Conduta de Funcionário Pedido de Religação Problemas Técnicos Cobranças Indevidas 30 20 10 0 Taxas Indevidas Contas não Entregues Solicitação de Refaturamento Reclamação da Rede Ampla Reclamação Troca de Medidor 1 Corte Indevido Falta de Energia Cancelamento de Seguro e Doação OS finalizada Demora no atendimento Figura 2 – Problemas detectados no ano de 2004 ao longo dos trimestres Serviço Mal Executado Atraso na Instalação de Ligação Nova Não recebimento de Aviso Prévio Carta de Recurso de TEOR 6 O trimestre 3 apresenta um alto índice de reclamações para “Contas não Entregues”. Outro problema apresentado está associado com o consumo faturado, representado por “Solicitação de Refaturamento”, onde o cliente não concorda com o valor da leitura. Pode-se concluir: Nas figuras estão expostos tanto os principais problemas ocorridos ao longo dos trimestres quanto a quantidade de registros (em medidas de proporção) de ligações de cada um deles. Para o trimestre 1 de 2004, “Pedido de Religação” e “Solicitação de Refaturamento” são os maiores motivos de reclamações. Pode ser observado que o relacionamento entre corte indevido e contas não entregues está presente neste trimestre. O trimestre 2 se caracteriza pelas reclamações de “Contas não Entregues” e “Solicitação de Refaturamento”. Pode-se notar que alguns motivos de reclamações estão relacionados entre si: • • • • • • A falta de energia acarreta num índice de queima de aparelhos; Contas não entregues geram reclamações de taxas indevidas; Pedidos de religação estão relacionados ao corte indevido. No trimestre 4 os índices de “Pedido de Religação” e “Contas não Entregues” são os maiores motivos de reclamações. Neste trimestre são apresentados dois novos problemas relacionados com “Cancelamento de Seguro e Doação” e “OS finalizada” sem que a solicitação tenha sido concluída, até então não ocorridos com tanta freqüência. Grande parte dos pedidos de religação se deve às ocorrências de corte indevido; Contas não entregues geram um percentual de reclamações de taxas indevidas; Demora no atendimento é conseqüência de ocorrências de corte indevido, falta de energia e pedido de religação. Trimestre 2 Trimestre 1 29.91 30 25.00 25 20.00 20.87 19.19 18.46 15.19 20 15.00 12.46 15 11.17 10.00 8.46 8.17 12.21 10.74 10.63 15.81 15.69 10 5 5.00 0 0.00 3.32 1.83 1.51 Trimestre 4 Trimestre 3 32.4 35.0 30.0 26.49 30 26.6 25 20.39 25.0 20 20.0 15 15.0 10.0 9.4 6.2 5.1 6.1 15.88 15.42 17.4 16.0 15.3 9.1 9.0 6.35 10 6.35 4.4 5.0 5 0.0 0 Queima de Aparelhos Taxas Indevidas Corte Indevido Serviço Mal Executado Má Conduta de Funcionário Contas não Entregues Falta de Energia Atraso na Instalação de Ligação Nova 4 0.0 3 0.0 3 2.4 2 0.0 2 6 .6 Pedido de Religação Problemas Técnicos 1 5.3 1 7 .4 1 6 .0 6.2 Solicitação de Refaturamento Reclamação da Rede Ampla 5.1 0.0 0.0 6 .1 9 .4 4 .4 9.0 0.0 Cancelamento de Seguro e Doação 1 0.0 Não recebimento de Aviso Prévio 0.0 Figura 3 – Problemas detectados no ano de 2005 ao longo dos trimestres Dentro do trimestre 1 de 2005, a “Falta de Energia” é o motivo principal das reclamações, ficando os “Pedidos de Religação” em segundo lugar. As solicitações de religação são causadas pelos seguintes problemas: 7 • • • Contas entregues fora do endereço do cliente, o que leva ao não pagamento em dia da fatura e o provável corte de energia; Leitura de consumo, onde o cliente não concorda com o valor faturado e solicita refaturamento, cuja demora na aprovação pode provocar o corte de energia; Corte indevido, onde o cliente efetua o pagamento da conta e o mesmo não foi registrado pelo sistema, provocando o corte de energia. No trimestre 2, várias causas importantes foram observadas, e algumas delas se inter-relacionam como causa e efeito. Por exemplo: • • • Falta de energia – Queima de aparelhos; Contas não entregues – Pedido de Religação fora do prazo; Mal atendimento – Problemas Técnicos; Porém, a reclamação mais registrada pelos clientes foi a “Solicitação de Refaturamento”, pelo fato do cliente não concordar com a leitura realizada pela empresa. No trimestre 3 as reclamações que representam os maiores índices de insatisfação são: “Falta de Energia”, “Serviço Mal Executado” e “Contas não Entregues”. Podese supor que alguns problemas se apresentam como conseqüência de outros registrados nos trimestres anteriores, como por exemplo: • • Corte Indevido – devido às contas não entregues; Taxas Indevidas – devido às contas pagas e não registradas no sistema. Dessas reclamações e grupos de problemas encontrados, grande parte é levada para o BackOffice UTI, responsável por manter o contato com o cliente até a solução do problema. Em alguns momentos, alguns grupos foram separados de forma a mostrar a satisfação ou não do cliente. Percebeu-se que os clientes que gostariam de fazer o Cancelamento do Seguro e da Doação, no geral, ficam satisfeitos do atendimento, pois ou conseguiam fazer o cancelamento de fato, ou desistiam de fazer. Os clientes que reclamavam de Conta Recebida após o Vencimento e aqueles que solicitavam Refaturamento, muitos não ficam satisfeitos com a conclusão do atendimento. A figura do trimestre 3 relaciona alguns grupos de motivos de reclamações já vistos nos trimestres anteriores, que são: “Queima de aparelhos”, “”Mal atendimento”, “Falta de Energia” e “Má conduta de funcionário”. O mal atendimento e a má conduta de funcionário estão relacionados ao problema existente no atendimento prestado pela empresa terceirizada, já retratado na Qualidade do Atendimento. A queima de aparelhos é conseqüência da oscilação e falta de energia que ocorrem com freqüência, como registrado nas reclamações referentes a Qualidade no Fornecimento. Algumas observações podem ser feitas para melhor entendimento do conhecimento: • Uma reclamação pode referenciar vários tipos de problemas classificados como vários motivos-cliente. • • A forma de tratamento do problema depende da necessidade do cliente e complexidade do assunto. Como por exemplo: reclamações de falta de energia pode ser tanto um problema ocasionado por algum problema técnico, quanto por algum corte indevido ou ausência de pagamento. O atendente destaca as palavras falta de energia. Durante a execução do processo de mineração, foi constatado que alguns registros de reclamação estão classificados erroneamente. Isso pode ter gerado uma pequena parcela de erro no resultado da metodologia. É possível separar os grupos de problemas e as conseqüências dos mesmos, quando existir. Como por exemplo, reclamações de pedido de ressarcimento como conseqüência de queima de aparelho e este, como conseqüência de falta de energia ocasionada por algum defeito técnico. Tal metodologia, aplicada ao Data Warehouse da empresa fornece melhor visualização das tendências ocorridas ao longo do tempo [4]. É possível obter uma demonstração da evolução da satisfação do cliente de acordo com as decisões tomadas pela empresa. A visualização dos resultados da mineração do DW pode caracterizar as tendências por regiões, faixa etária, classe social e outros atributos que combinados na base de dados identificam os consumidores em potencial para orientar na oferta de diferentes produtos e serviços. Além disso, cada um dos problemas apresentados pode ser detalhado para o melhor entendimento e obtenção da melhor forma de solução, o que atua na direção da satisfação do cliente e agrega valor ao processo de tomada de decisão da empresa. Os resultados obtidos podem ser, futuramente, implantados no Oracle 10g, que possui ambiente de mineração de textos denominado Oracle Text [5]. Esse módulo realiza cada uma das etapas contidas na metodologia de mineração de textos necessárias para a obtenção dos resultados. Assim, este resultado poderá ser utilizado para automatizar o processo de monitoramento e diagnóstico da qualidade do serviço prestado. V. CONCLUSÕES O presente trabalho mostrou a usabilidade da mineração de textos em registros de ligação da empresa de fornecimento de energia elétrica da AMPLA. As informações obtidas do processo de mineração de textos realçam as áreas que necessitam de aprimoramento, tal como a evolução da prestação do serviço e da satisfação dos clientes ao longo dos anos. A partir dos resultados, a empresa identificou os pontos de maior prioridade e onde o direcionamento ideal dos projetos de P&D é capaz de trazer maior satisfação aos seus clientes. A aplicação desses recursos possibilitou uma visão consolidada das informações do relacionamento dos clientes com a empresa, permitindo que os atendentes tenham em mãos subsídios para responder rapidamente aos requisitos que surgem durante os processos de atendimento. A aplicação da mineração de textos utilizando o aplicativo Oracle Text nos dados contidos no Data Warehouse viabiliza o processo de descoberta de conhecimento e 8 possibilita a visualização das soluções às deficiências do atendimento e que são capazes de aumentar a satisfação dos clientes. A central de relacionamento com o cliente envolve o constante acesso a relatórios históricos, permitindo avaliar o desempenho dos atendentes, monitorar os incidentes e assegurar a constante satisfação dos clientes, otimizando assim, a eficiência nos processos internos. Dessa maneira, a partir dos resultados obtidos e das melhorias inseridas no processo de atendimento, a empresa se torna apta para aprimorar o gerenciamento do relacionamento com o cliente (CRM). Para tal, é apropriado utilizar duas fontes de informações: 1) conhecimentos obtidos através dos resultados apresentados sobre as reclamações dos clientes e seus motivos de insatisfações, e 2) informações relacionadas ao comportamento do cliente, como, por exemplo, consumo médio mensal, possíveis atrasos em pagamento e débito automático a serem tratadas através de mineração de dados e análise estatística. A aplicação do aperfeiçoamento do CRM na empresa visa, entre outras coisas, identificar questões comparando dados e tendências históricas, permitindo, entre outras questões, direcionar produtos e serviços que atendam às necessidades do cliente. VI. REFERÊNCIAS BIBLIOGRÁFICAS [1] ZANASI, A., 2005, Text Mining and its Applications to Intelligence, CRM and Knowledge Management. 1 ed. Great Britain, WIT Press. [2] CAPUTO G. M., BASTOS V. M. & EBECKEN N. F. F., Knowledge Discovery in Customers’ Attendance Services Databases. In: CILAMCE 2006, Belém,Pará, 2006. [3] LOPES, M.C.S., 2004. Mineração de Dados Textuais Utilizando Técnicas de Clustering para o Idioma Português, Tese de Doutorado, COPPE/UFRJ. [4] BERSON A., SMITH S., Data Warehouse, Data Mining, and OLAP, McGraw-Hill, New York, 1997. [5] ORACLE Text Application Developer’s Guide – 10g – Release 2 (10.2) – June 2005.