1 UNIVERSIDADE COMUNITÁRIA DA REGIÃO DE CHAPECÓ UNOCHAPECÓ Curso de Graduação Sistemas de Informação Talita Rodrigues PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES BASEADO NO PERFIL DO USUÁRIO Chapecó-SC, 2010 2 TALITA RODRIGUES PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES BASEADO NO PERFIL DO USUÁRIO Monografia II apresentada à UNOCHAPECÓ como parte dos requisitos para a obtenção do grau de Bacharel Sistemas de Informação. Orientadora: Ana Márcia Debiasi Duarte Chapecó-SC, Jul. 2010 3 TALITA RODRIGUES PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES BASEADO NO PERFIL DO USUÁRIO Esta Monografia foi julgada para obtenção do título de Bacharel em Sistemas de Informação, no Curso de Graduação em Sistemas de Informação da Universidade Comunitária da região de Chapecó - UNOCHAPECÓ – Campus Chapecó, com a seguinte Banca Examinadora: ________________________________________________ Prof. Ana Márcia Debiasi Duarte Professora Orientadora ________________________________________________ Prof. Denio Duarte – Membro ________________________________________________ Prof. Elton Luís Minetto – Membro Chapecó (SC), Julho de 2010. 4 Dedicatória Aos meus pais e meus irmãos que representam tudo o que sou e tenho de mais precioso, que são a minha base e minha razão de continuar em busca de ser alguém melhor. Aos meus queridos amigos que me deram força quando eu acreditava não mais encontrar em lugar algum, que acreditaram no meu potencial quando até mesmo eu duvidava do que eu conseguiria. Dedico também a todas as mulheres que tem e tiveram a ousadia e a coragem de escolher uma área em sua maioria dominada por homens, enfrentando os preconceitos típicos, as desconfianças e ao final batendo de igual pra igual e provando que somos tão capazes quanto qualquer homem. 5 Agradecimentos Agradeço primeiramente a Deus por ter me dado a graça de chegar ao fim de mais uma caminhada e ter permitido que eu encontrasse tantas pessoas especiais durante esta jornada. Agradeço a minha família pelo apoio incondicional e pela compreensão nos momentos em que estive ausente. Agradeço aos meus amigos simplesmente por existirem, somente isto me basta para continuar acreditando que sou capaz de conseguir tudo o que desejo. Agradeço especialmente a uma pessoa incrível e única que tive o prazer de encontrar neste período de faculdade que é muito mais que minha colega, é minha amiga do coração. Eli muito obrigada pela companhia nos sábados e nas madrugadas de TCC, pela força, pela confiança, pelos risos, sem as palavras de apoio talvez nada disso teria sido possível. Agradeço também ao meu orientador o professor Denio, obrigada pela confiança depositada no meu trabalho e as orientações que foram de suma importância para a realização do mesmo. Este agradecimento se estende também a todos os mestres que eu encontrei no período acadêmico. Por fim agradeço a todos aqueles que fazem o bom e velho rock n'roll que foi a trilha sonora de minhas madrugadas de TCC. \m/ 6 “...The answer, my friend, is blowin' in the wind …”(Bob Dylan) 7 Resumo Existem determinados rituais ligados ao comportamento humano que mesmo com o passar do tempo continuam sendo realizados, um deles é o ato de presentear. Registros da troca de presentes datam de vários séculos atrás, no entanto mesmo sendo algo intrínseco no comportamento humano a realização do mesmo não representa uma tarefa fácil para muitos indivíduos. A dificuldade apresentada na pratica deste ato refere-se à grande dúvida que paira quando é necessário definir o que comprar, esta dúvida se tornou maior ainda devido ao vasto numero de opções oferecidos atualmente no comércio convencional e eletrônico. A dúvida também existe devido à falta de conhecimento que se tem sobre os gostos, preferências da pessoa que será presenteada. Objetivando a minimização da dificuldade na pratica deste ato tão bonito se propôs o desenvolvimento de um protótipo de sistema de recomendação de presentes baseado no perfil do usuário, que utiliza técnicas de inteligência artificial para realizar a determinação de um presente ideal. Palavras-chave: Ato de presentear, dificuldades, preferências, perfil, recomendação. 8 Abstract There are certain rituals related to human behavior that even with the passage of time continue to be made, one of them is the act of giving. Records of exchanging gifts date back several centuries ago. Yet, even though it is inherent in human behavior, to achieve the same is not an easy task for many individuals. The practical difficulty presented in this act refers to the great doubt that hangs when it is necessary to define what to buy, such doubts become even greater due to the vast number of options currently offered in conventional and electronic commerce. Doubt also exists due to a lack of knowledge we have about the tastes and preferences of the person we want to gift. Aiming to minimize the difficulty in practicing this wonderful act is the proposed development of a prototype system based on the recommendation to present the user profile, which uses artificial intelligence techniques to make the determination of an ideal gift. Keywords: The act of giving, difficulties, preferences, profile, and recommendation. 9 Lista de Figuras Figura 1 – Processo de sistema de recomendação. Fonte Sampaio 2006 .............................................23 Figura 2 – Avaliação dos usuários sobre o álbum Elvis 30 # 1 hits .....................................................25 Figura 3 – Lista dos itens de informática mais vendidos no site da Americanas.com ..........................27 Figura 4 – Itens sugeridos a partir da visualização do CD ELVIS 30 # 1 HITS no site da Americanas.com ...............................................................................................................................28 Figura 5 – Recomendações baseadas na pesquisa por Chuck Berry no site da Amazon.com ...............29 Figura 6 – Recomendação personalizada com base no perfil do usuário. ............... Fonte REATEGUI e CAZELLA 2005 ...............................................................................................................................30 Figura 7 – Exemplo de identificação no servidor ...............................................................................31 Figura 8 – Identificação do cliente de forma implícita .......................................................................32 Figura 9 – Avaliação do serviço de ajuda oferecido pela Google.com ................................................33 Figura 10 – Tela de cadastro de usuário no Yahoo.com exemplo de abordagem explícita ...................33 Figura 11 – Fórmula do cálculo da distância euclidiana .....................................................................42 Figura 12 – Modelo da árvore de decisão de gostos musicais .............................................................59 Figura 13 – Modelagem desenvolvida para controle dos itens da base de dados .................................92 Figura 14– Modelagem desenvolvida para controle dos dados dos usuários .......................................94 Figura 15 – Modelagem referente as avaliações de itens por usuários ................................................95 Figura 16 – Fórmula da distância Euclidiana .....................................................................................96 Figura 17 – Tabelas Religião, Região e Sexo padronizadas na base de dados .....................................98 Figura 18 – Fórmula da distância euclidiana aplicada no protótipo. ................................................. 100 Figura 19 – Esboço do funcionamento do algoritmo de recomendação aplicado ao protótipo ........... 101 Figura 20 – Esboço do processo para recomendar por email buscando por ocasiões....... .................. 103 Figura 21 – Esboço de recomendação por email através da busca por aniversariantes ...................... 103 Figura 22 - Tela de login do protótipo.............................................................................................. 104 Figura 23 – Tela de cadastro de usuário na aplicação. ...................................................................... 105 Figura 24 – Tela de avaliação de itens ............................................................................................. 106 Figura 25 – Tela de perfil do usuário ............................................................................................... 107 10 Figura 26 – Menu do aplicativo ....................................................................................................... 108 Figura 27 – Interface da tela de recomendação sem usuário ............................................................. 109 Figura 28 – Interface dos itens recomendados ................................................................................. 110 Figura 29 – Interface de recomendação com amigo cadastrado. ....................................................... 110 Figura 30 – Interface de pesquisa de amigos ........................................................................................ . 111 Figura 31 – Interface para adicionar amigos. ................................................................................... 111 Figura 32- Interface com os dados detalhados de um amigo. ............................................................ 112 Figura 33 – Detalhe da interface de avaliação de itens. .................................................................... 112 Figura 34 – Fórmula aplicada ao protótipo. .......................................... Erro! Indicador não definido. 11 Lista de Tabelas Tabela 1 – Áreas de Interesse x Forma de Coleta ...............................................................................34 Tabela 2 – Exemplo de disposição dos dados na avaliação de gêneros musicais .................................41 Tabela 3 – Comparativo entre as avaliações dos usuários vizinhos .....................................................43 Tabela 4 – Principais diferenças entre as duas abordagens que podem ser supridas na filtragem hibrida 45 Tabela 5 – Classificação dos sistemas de recomendação proposta por ADOMAVICIUS 2005 ............47 Tabela 6 – Graus de associação no exemplo de preferência musical de usuários de um sistema ..........55 Tabela 7- Dados para classificação de estilo musical .........................................................................58 Tabela 8 – Requisitos Funcionais do protótipo ...................................................................................90 Tabela 9 – Requisitos Não Funcionais do protótipo. ..........................................................................90 Tabela 10 – Aspectos envolvidos no ato de presentear .......................................................................91 Tabela 11 – Pontuação de acordo com a relevância do fator na determinação de um presente .............99 Tabela 12 – Tabela legenda das características avaliadas no cálculo da distância euclidiana ............. 100 Tabela 13 – Dados do usuário .............................................................................................................112 Tabela 14 – Dados da tabela Usuário x Personalidade........................................................................112 Tabela 15 – Dados da tabela Usuário x Área de Interesse ...................................... ...........................112 Tabela 16 – Usuários cadastrados na base de dados ...........................................................................113 Tabela 17 – Exemplo da tabela de amigos ..........................................................................................113 Tabela 18 – Dados do usuário .............................................................................................................113 Tabela 19 – Dados da tabela Usuário x Personalidade .......................................................................113 Tabela 20 – Dados da tabela Usuário x Área de Interesse ..................................................................113 Tabela 21 – Dados adicionais para a recomendação .............................. Erro! Indicador não definido. Tabela 22 – Dados dos itens armazenados na base de dados.................. Erro! Indicador não definido. Tabela 23 – Tabela legenda das características avaliadas no cálculo da distância euclidiana ......... Erro! Indicador não definido. Tabela 24 – Exemplo do cálculo de similaridade realizado pelo sistema Erro! Indicador não definido. 12 Lista de Abreviaturas FBC FC FH HTML IA PHP Filtragem Baseada em Conteúdo Filtragem Colaborativa Filtragem Híbrida Hypertext Markup Language Inteligência Artificial Hypertext Preprocessor 13 SUMÁRIO 1. INTRODUÇÃO .......................................................................................................... 15 2. SISTEMAS DE RECOMENDAÇÃO ........................................................................ 18 3. 2.1 INTRODUÇÃO ..................................................................................................... 18 2.2 SISTEMAS DE RECOMENDAÇÃO .................................................................... 21 2.3 TAREFAS DE UM SISTEMA DE RECOMENDAÇÃO ........................................ 24 2.4 COLETA DE DADOS ........................................................................................... 30 2.5 FILTRAGEM DE INFORMAÇÃO ........................................................................ 35 2.5.1 FILTRAGEM BASEADA EM CONTEÚDO .................................................. 36 2.5.2 FILTRAGEM COLABORATIVA ................................................................... 38 2.5.3 FILTRAGEM HÍBRIDA................................................................................. 44 2.6 TÉCNICAS DE RECOMENDAÇÃO .................................................................... 46 2.7 LIMITAÇÕES PRESENTES EM UM SISTEMA DE RECOMENDAÇÃO........... 47 2.8 CONSIDERAÇÕES FINAIS ................................................................................. 49 TÉCNICAS DE MINERAÇÃO DE DADOS COM INTELIGÊNCIA ARTIFICIAL 51 3.1 INTELIGÊNCIA ARTIFICIAL, A CIÊNCIA DO RACIOCÍNIO ........................... 51 3.2 TÉCNICAS DE MINERAÇÃO DE DADOS ......................................................... 53 3.2.1 ASSOCIAÇÃO ............................................................................................... 53 3.2.2 AGRUPAMENTO .......................................................................................... 55 3.2.3 CLASSIFICAÇÃO ......................................................................................... 57 3.3 3.3.1 ÁRVORES DE DECISÃO .............................................................................. 60 3.3.2 TD-IDF (Term Frequency / Inverse Document Frequency) ............................. 62 3.3.3 MODELOS PROBABILÍSTICOS .................................................................. 63 3.3.4 REDES BAYESIANAS .................................................................................. 64 3.4 4. ALGORITMOS DE MINERAÇÃO DE DADOS .................................................. 60 CONSIDERAÇÕES FINAIS ................................................................................. 65 A ARTE DE PRESENTEAR ...................................................................................... 67 4.1 INTRODUÇÃO ..................................................................................................... 67 4.2 O PRESENTE EM DIFERENTES CULTURAS DA SOCIEDADE ....................... 67 4.3 PRESENTEAR ALGUÉM. O QUE SIGNIFICA ESTE ATO? ............................... 70 4.4 DIMENSÃO SIMBÓLICA .................................................................................... 73 4.5 DIMENSÃO EMOCIONAL .................................................................................. 74 4.6 DIMENSÃO PESSOAL E SOCIAL ...................................................................... 76 14 4.7 DIMENSÃO ECONÔMICA .................................................................................. 77 4.8 DIMENSÃO DA OBRIGAÇÃO ............................................................................ 78 4.9 MOTIVOS PARA PRESENTEAR ALGUÉM........................................................ 80 4.10 ETAPAS DO PROCESSO DE PRESENTEAR .................................................. 81 4.11 CONSIDERAÇÕES FINAIS ................................................................................. 82 5. 6. ESTUDO DAS TECNOLOGIAS ............................................................................... 83 5.1 HTML (Hypertext Markup Language) ................................................................... 83 5.2 PHP (Hypertext PreProcessor) ............................................................................... 83 5.3 MYSQL ................................................................................................................. 83 IMPLEMENTAÇÃO ........................................................ Erro! Indicador não definido. 6.1 O ATO DE PRESENTEAR .................................................................................... 84 6.2 REQUISITOS DO SISTEMA ................................................................................ 87 6.3 MÉTODO DE FILTRAGEM DO PROTÓTIPO..................................................... 91 6.4 MODELAGEM DA BASE DE DADOS ................................................................ 91 6.5 MÉTODO DE DEFINIÇÃO DA SIMILARIDADE ............................................... 96 6.6 TELAS DO PROTÓTIPO.................................................................................... 103 6.7 ESTUDO DE CASO................................................................................................113 7. CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS ..................................1144 8. REFERÊNCIAS BIBLIOGRÁFICAS .................................................................11616 15 1. INTRODUÇÃO A era da informação trouxe consigo a democratização da tecnologia, a expansão das telecomunicações e o acesso facilitado à informação. Estes avanços possibilitaram a difusão do conhecimento nos mais diversos campos, proporcionando o crescimento intelectual e as mudanças de comportamentos na sociedade. No entanto, mesmo com o passar dos anos e os diversos avanços que aconteceram, alguns aspectos que são inerentes ao comportamento humano não se modificaram em sua essência. Um exemplo é o ato de presentear, que é praticado desde os tempos mais remotos e ainda persiste de forma indispensável para manter os relacionamentos. Mas apesar de estar associado ao comportamento humano, este ato ainda representa certa complexidade para determinadas pessoas. Um dos motivos desta complexidade é a rotina que a vida moderna proporciona, que ocasiona a falta de tempo hábil para se criar ou manter vínculos afetivos entre os indivíduos. Outro fator que ocasiona a dificuldade na escolha de um presente é o fato de que atualmente os comércios convencionais e eletrônicos oferecem inúmeras opções de produtos e serviços. Esta oferta demasiada de diferentes produtos ocasiona em um aumento na dúvida na hora de determinar qual presente comprar. Uma forma encontrada para descobrir qual é o presente ideal é a busca na web, afinal a democratização da internet permitiu que as mais diversas classes tivessem acesso a rede e através dela obter as informações de que necessitam. Porém, mesmo com todos os benefícios gerados com o livre acesso a informação criouse um novo problema, a sobrecarga de informações. Todos os dias milhões de informações são armazenadas em páginas web espalhadas pela internet o que torna a busca por dados significativos um processo lento e que nem sempre resulta em informações relevantes. Segundo o escritor americano John Naisbitt “Estamos afogados em informação, mas morrendo de fome por conhecimento.”, o problema que se observava há algum tempo com acesso restrito e monopólio de informações é praticamente inimaginável se compararmos a facilidade de acesso que se tem atualmente. Esta facilidade aumentou a busca pelo conhecimento, mas a prejudicou justamente porque com esta disposição para qualquer indivíduo armazenar informação na web ocasionou em um número incalculável de informações sem credibilidade alguma, informações falsas, sem relevância. Uma maneira encontrada para minimizar as dificuldades na busca por informações pertinentes é a utilização de sites com mecanismos de “motores de busca” (por exemplo, 16 Google®, Altavista®) que possuem sistemas de recuperação da informação (CAZELLA, 2006). Entretanto, a utilização destas ferramentas de busca não garante aos usuários a relevância das informações encontradas, pois para realizar a procura, são utilizadas as palavras-chaves, e caso o usuário não possua conhecimento suficiente sobre o que deseja pesquisar, estará informando dados à ferramenta de busca que resultarão em informações inesperadas e inúteis. Uma prática utilizada há muito tempo pela humanidade para auxiliar na busca por determinado item quando não se sabe exatamente o que se quer, é recorrer para as recomendações. Dessa forma, o conhecimento adquirido é baseado em informações oriundas de experiências vivenciadas por outros indivíduos. A recomendação também pode ser utilizada com recursos tecnológicos, através dos chamados sistemas de recomendação. Estes sistemas são responsáveis por associar produtos e/ou serviços aos usuários de acordo com as preferências informadas em seus perfis. Os recursos tecnológicos têm um papel fundamental na sociedade atual, promover a melhoria da qualidade de vida das pessoas, sendo aplicada em grandes segmentos bem como na resolução de problemas menores, mas não menos importantes, como no ato de presentear. A dificuldade apresentada ao realizar o ato de presentear esta associada a diversos motivos, porém a resolução ou minimização deste problema pode ser oferecida através da utilização de um sistema de recomendação. A utilização de um sistema de recomendação de presentes baseado no perfil do usuário poderá oferecer: O conhecimento das preferências do usuário pesquisado; Maior agilidade na procura por um item para presentear, pois o universo de pesquisa fica restrito as preferências do usuário que se esta pesquisando; Aumento das chances de acerto na escolha do presente, pois o item escolhido será de acordo com os gostos do presenteado e o número de opções possíveis será bem mais limitado; A satisfação em escolher um presente correto e ter a certeza de que irá agradar. Este sentimento de satisfação proporcionado quando se tem a certeza da escolha correta de um presente é um dos principais objetivos quando se pretende presentear alguém e é exatamente isto que o protótipo de sistema de recomendação de presentes proposto neste trabalho pretende proporcionar aos seus usuários, tornar este ato mais prazeroso do que 17 problemático, evidenciando nele os benefícios que o mesmo proporciona e não mais destacando seus pontos dificultosos. Com a escolha correta de um presente o simbolismo que envolve este ato se torna mais efetivo. O presente representa para quem o recebe uma imagem da pessoa que lhe ofereceu, da mesma forma que ao oferecer um presente a alguém você esta projetando nele a imagem da pessoa que irá recebê-lo. Esta extensão de ambos os indivíduos através de um presente é que cria nestes um sentimento de união, afeto, admiração e reciprocidade tão essências na vida de todo ser humano e atualmente tão difíceis de obter. Portanto, no contexto apresentado, este trabalho tem como objetivo propor uma abordagem para recomendação de presentes baseado no perfil do presenteado. A abordagem aqui apresentada será implementada na forma de um protótipo para validar a mesma. Este trabalho está organizado em 7 capítulos. Neste capítulo são apresentadas a motivação, objetivos e contexto no qual esse trabalho está inserido. No capítulo 2 são revisados alguns aspectos inerentes a sistemas de recomendação, como os métodos de filtragem aplicados nos sistemas, vantagens e desvantagens de cada método, problemas apresentados nos sistemas de recomendação, bem como as vantagens na criação e aplicação de um sistema deste tipo. No capítulo 3 são descritos conceitos referentes as técnicas de inteligência artificial utilizadas para realizar a mineração de dados, no mesmo capítulo são apresentados alguns exemplos de algoritmos que podem auxiliar nesta tarefa de mineração. No capítulo 4 é apresentado um panorama referente ao ato de presentear, aspectos importantes envolvidos neste ato, a importância do mesmo na vida das pessoas, na criação de laços e o significado que lhe é atribuído pela sociedade. O capítulo 5 traz uma breve descrição das tecnologias utilizadas para desenvolvimento do protótipo, que foram respectivamente o HTML, o php e o banco de dados MySQL. No capítulo 6 são descritos os aspectos referentes a implementação do protótipo, é realizada uma descrição do problema estudado, são elencadas as técnicas definidas para utilização no sistema, o método de filtragem, o método de cálculo da similaridade, aspectos da base de dados bem como são exibidas as interfaces do protótipo desenvolvido. No Capítulo 7 são discutidas as conclusões, principais contribuições e propostas para trabalhos futuros. 18 2. SISTEMAS DE RECOMENDAÇÃO O presente capítulo apresenta conceitos sobre sistemas de recomendação. Tais conceitos são importantes para a base teórica deste trabalho, pois o propósito deste projeto é o desenvolvimento de um protótipo de um sistema de recomendação de presentes. 2.1 INTRODUÇÃO A expansão tecnológica possibilitou a sociedade inúmeros avanços nas mais diversas áreas, fronteiras foram quebradas através do acesso fácil a comunicação, tempo foi ganho em decorrência de tecnologias que auxiliam em tarefas que antes detinham muito esforço. Um dos principais benefícios oferecidos por esta expansão foi à democratização da informação. Uma das grandes responsáveis senão a principal responsável pela democratização da informação é a Internet. Segundo Druker apud Bezerra 2004, a Internet está para a atual e crescente revolução da informação assim como a estrada de ferro estava para a revolução industrial do século XVII. Uma das conseqüências desta democratização é a sobrecarga de informações: diariamente as pessoas são submetidas a uma grande quantidade de informações, principalmente aquelas oriundas na Internet. O problema da dificuldade de acesso a informação foi substituído na era digital pela necessidade de filtrar as informações e apresentá-las de acordo com a necessidade dos interessados. A necessidade da filtragem surge a partir do momento que os interessados em obter informação ficam perdidos em meio a tantas opções, sendo um número considerável destas informações irrelevantes para o usuário (KAJIMOTO et.al. 2008). Por exemplo, suponha que um usuário necessite pesquisar sobre o histórico do Grêmio Football Porto Alegrense. No entanto ao realizar a pesquisa o usuário informa apenas a palavra Grêmio, o resultado da pesquisa será relativamente grande e extenso o suficiente para deixar o usuário confuso em meio a tantas informações. Até encontrar a informação que deseja o usuário despenderá tempo na filtragem das opções que lhe foram disponibilizadas. A produção de informação atualmente é maior do que um indivíduo poderia lidar durante todo o seu tempo de existência. Filtrar o que é relevante se torna humanamente impossível. Objetivando minimizar essa dificuldade vários pesquisadores desenvolveram técnicas que auxiliam na pesquisa por informações (ZAIANE apud CAZELLA, 2006). Uma das técnicas desenvolvidas mais empregadas em pesquisas é a recuperação de 19 informação (RI). Esta técnica está presente na maioria dos sites de pesquisa, ou motores de busca como também são conhecidos. Exemplos destes sites são o Google.com, Altavista.com, Cade.com, Yahoo.com, que fornecem um mecanismo de busca na Internet através de palavras-chave informadas pelo usuário (CAZELLA, 2006). Apesar de bastante difundida esta técnica não resolve todos os problemas da sobrecarga de informações. Um problema na utilização deste tipo de ferramenta é que o usuário obriga-se a explicitar o seu interesse, ou seja, deve saber apresentar as palavras-chave que são relevantes para a consulta. Portanto para que esta técnica se torne eficiente é necessário que o usuário tenha um conhecimento considerável sobre o que deseja pesquisar, senão o sistema lhe retornará um universo grande de opções referentes à pesquisa realizada e a dúvida sobre que informação é relevante permanecerá (CAZELLA, 2006). No exemplo anterior sobre a pesquisa pelo histórico do clube de futebol Grêmio, uma maneira de diminuir o universo de pesquisa poderia ser informar junto do nome do clube a palavra futebol, ou ainda incluir além destas a palavra histórico. Assim o sistema de recuperação retornaria para o usuário somente informações ligadas a estas três palavras-chave. Outra técnica desenvolvida objetivando auxiliar na busca e obtenção de informações é a filtragem de informação. A filtragem de informação é uma técnica que se baseia no perfil de um usuário especifico para realizar as suas pesquisas. Normalmente os sistemas que utilizam esta técnica mantém uma base com as preferências e interesses do usuário (BURIN, 2007). Nessa técnica as informações que o usuário tem acesso são sempre baseadas em seu perfil. A relevância em comparação com a técnica de recuperação de informação é muito maior, já que nesta técnica o usuário recebe informações que são compatíveis com as suas preferências. As duas técnicas apresentadas atuam com um objetivo em comum, minimizar as dificuldades encontradas pelos usuários na realização de pesquisas em meio a muitas informações. Porém, as formas para atingir o objetivo a que estão propostas são diferentes nas duas técnicas. Em RI é necessário que o usuário explicite o que deseja encontrar, já na filtragem de informação o sistema define de acordo com o perfil do usuário o que pode ser do interesse do usuário que pesquisa. Outro ponto importante diz respeito ao contexto em que pode ser aplicada cada técnica, este aspecto também é distinto entre as duas (SAMPAIO, 2006). A RI é aplicada normalmente em sistemas que são baseados em conteúdos, são aplicações mais genéricas não necessitam de personalização por perfil de usuário. Por 20 exemplo, em uma base de documentos grande de uma empresa, a utilização de um mecanismo de RI pode ser interessante na busca por informações em meio há muitos dados. Já a filtragem de informação é aplicada quando se deseja especialização, serviços personalizados. A filtragem de informação poderia também ser aplicada ao exemplo citado anteriormente, no entanto poderia oferecer uma funcionalidade de filtrar os documentos de acordo com os setores, por funcionários, sem que para isto estes precisassem interagir diretamente com o sistema. Com a finalidade de melhorar o processo de busca de informações relevantes surgiu uma nova categoria de sistemas de informação, os chamados sistemas de recomendação. Sistemas de Recomendação podem ser definidos como sistemas que procuram auxiliar indivíduos a identificarem conteúdos de interesse em um conjunto de opções que poderiam caracterizar uma sobrecarga. São sistemas que procuram facilitar a penosa atividade de busca por conteúdo interessante (CAZELLA, 2008, página 1). Para promover esta facilidade e oferecer uma pesquisa com informações relevantes aos seus usuários, os sistemas de recomendação podem utilizar técnicas de filtragem de informação e recuperação de informação dependendo do contexto e do objetivo em que o sistema está submetido. Segundo Bezerra (2004), os sistemas de recomendação podem ser vistos como sistemas de informação que fornecem uma visão personalizada de acordo com a base de dados que está submetido. Esta visão pode ser entendida como a resposta que o sistema informará ao usuário, esta dependerá do objetivo ou tarefa que este sistema está proposto. Lichtnow (2009), declara que o objetivo dos sistemas de recomendação não é apenas apresentar aos usuários itens a partir de consultas que este pode realizar, mas que o sistema seja capaz de prever o interesse de um usuário por determinado item sem a participação explicita do usuário. Ainda segundo Lichtnow (2009), esta capacidade de prever pode ser uma forma de tentar evitar a sobrecarga de informação. A utilização de sistemas de recomendação pode aumentar a eficácia e a capacidade do processo de recomendação bastante conhecido e praticado pelo homem há muito tempo. (RESNICK e VARIAN apud REATEGUI e CAZELLA, 2005) . 21 2.2 SISTEMAS DE RECOMENDAÇÃO Sistemas de Recomendação são atualmente utilizados nas mais diversas áreas, o início de sua utilização se deu principalmente durante a década de 90. Um dos primeiros sistemas de recomendação criados foi chamado de Tapestry desenvolvido em 1992(Goldberg apud VENSON, 2002) por Goldberg e ainda hoje utilizado. O sistema Tapestry não era automático e exigia que os usuários construíssem queries (consultas) complexas em uma linguagem especificamente projetada para o sistema retornar as suas recomendações. O termo filtragem colaborativa surgiu nesta época, Goldberg o definiu como uma atividade na qual as pessoas auxiliam umas as outras a filtrar informações através da sua opinião sobre cada documento lido. Era exatamente este o funcionamento do Tapestry, cada usuário ao receber determinado documento informava sua opinião e depois outros usuários poderiam utilizar esta opinião para identificar se gostariam ou não do conteúdo do documento (VENSON, 2002). Foi a partir do desenvolvimento do Tapestry que os sistemas de recomendações evoluíram e as técnicas de filtragem se tornaram mais eficientes e refinadas. Desde o inicio de sua utilização os sistemas de recomendação têm contribuído significativamente com o crescimento intelectual de organizações empresariais bem como de indivíduos particularmente. A adequação e crescente utilização dos recursos oferecidos por estes sistemas atualmente se deve há alguns fatores específicos, dentre eles podem ser destacados: Democratização da tecnologia e consequente sobrecarga de informações; Dificuldade na pesquisa por conteúdos relevantes em meio a muitas informações; Valorização da customização; Busca por ferramentas que auxiliem o processo de fidelização de clientes. Os dois primeiros aspectos citados já foram abordados anteriormente, os dois seguintes serão descritos a seguir. A valorização da customização surgiu a partir do momento que as pessoas não adquirem mais produtos somente para a sua sobrevivência. Nas sociedades mais desenvolvidas, o problema das necessidades primárias foi resolvido, porém outro problema surgiu, o da necessidade da representação social, problema solucionado atualmente através do consumo simbólico (BAUDRILLARD apud PEPECE 2002, PEPECE 2002). Neste sentido, enquanto em algumas sociedades os indivíduos não conseguem satisfazer as necessidades de 22 alimentação e vestuário, em outras, os indivíduos necessitam satisfazer seus status, com roupas de marcas, entre outros. As pessoas desejam ser tratadas com exclusividades e em meio a tantos outros indivíduos, querem ser notadas como únicos, originais e por isso algumas vezes não desejam adquirir produtos, itens ou informações de massa, mas sim informações exclusivas, especificas para o seu perfil. A dificuldade em oferecer somente indicações personalizadas está na imensa gama de opções disponíveis. Isso pode ser percebido em sites de comércio eletrônico que oferecem milhares de itens ou em lojas convencionais de departamentos. Jeff Bezoz diretor executivo da Amazon.com citado em Venson (2002, 27) declarou que “Se eu tenho dois milhões de clientes na Web, devo ter dois milhões de lojas virtuais”. A declaração de Bezoz confirma o poder que a customização adquiriu atualmente. Um sistema de recomendação pode ser a solução para a afirmação de Bezoz, e não será necessária a criação de dois milhões de lojas virtuais para atender aos dois milhões de clientes, mas apenas uma que seja adaptada a cada um deles a partir de seu perfil no sistema de recomendação. A utilização de um sistema de recomendação pode beneficiar empresas que possuem site de comércio eletrônico, através das recomendações e informações fornecidas pelo sistema a empresa pode trabalhar com diferentes estratégias de marketing, dentre elas(BEZERRA, 2004): Marketing segmentado: aquele voltado para um determinado grupo de usuários que possuem preferências em comum; Marketing one-to-one: uma forma especifica e totalmente personalizada de recomendação de produtos para determinado cliente; A área de comércio eletrônico aderiu significativamente aos sistemas de recomendação, mas existem outras áreas que também contam com diversos sistemas de recomendação. Algumas delas são voltadas para a educação, para entretenimento, para a saúde, para áreas profissionais, enfim atualmente existem diversas áreas para aplicação de um sistema de recomendação. Objetivando uma melhor compreensão do funcionamento de um sistema de recomendação, será apresentado a seguir um estudo realizado por Terveen citado em Sampaio (2006) sobre o processo de um sistema de recomendação. 23 Figura 1 – Processo de sistema de recomendação. Fonte Sampaio 2006 A Figura 1 apresenta diagramaticamente, o processo de recomendação contando com os principais elementos que estão envolvidos neste processo (SAMPAIO, 2006): Alvo da recomendação: é o principal ator do processo e destinatário da recomendação. Participa do processo fornecendo suas opiniões sobre os itens presentes na base de informação ou apenas recebe as sugestões do sistema. Base de informação: depósito das informações referentes a todos os itens referentes ao universo de recomendações possíveis do sistema. Provedor de recomendações: é o agente que seleciona e recomenda os itens da base de informação que possuem maior compatibilidade e relevância para o alvo da recomendação. Para definir quais são os itens mais relevantes o provedor pode se basear em diferentes informações, como as preferências do próprio alvo da recomendação, pelas recomendações de outros usuários do sistema ou ainda levar em consideração o conteúdo dos itens da base. Provedores de preferência: podem ser entendidos como colaboradores do sistema de recomendação. Colaboradores pois a partir das opiniões expostas sobre os itens da base o provedor de recomendações poderá recomendar itens para outros usuários. Para conseguir atingir uma recomendação de qualidade são utilizadas técnicas de filtragem de informação e de inteligência computacional. Existem diversas técnicas que podem ser aplicadas nos sistemas de recomendação (SAMPAIO, 2006). A escolha da técnica 24 depende do objetivo que o sistema está proposto a atingir bem como da etapa de recomendação que irá empregar a técnica, algumas destas técnicas serão apresentadas no decorrer do capítulo. Um sistema de recomendação pode desempenhar e disponibilizar diferentes tarefas aos seus usuários. Algumas destas tarefas serão apresentadas a seguir. 2.3 TAREFAS DE UM SISTEMA DE RECOMENDAÇÃO As funcionalidades ou tarefas desempenhadas por um sistema de recomendação se referem a sua comunicação com o usuário e como os objetivos do usuário são satisfeitos com a sua utilização (SAMPAIO, 2006). As tarefas também são definidas por alguns pesquisadores como estratégias de um sistema de recomendação. As estratégias são os meios utilizados para atingir os objetivos definidos, um destes objetivos é sempre o de garantir um serviço de recomendação eficiente e de qualidade. Algumas das principais tarefas desempenhadas e disponibilizadas pelos sistemas de recomendação atuais serão elencadas a seguir (REATEGUI e CAZELLA 2005, BEZERRA 2004, TEIXEIRA 2002, SAMPAIO 2006): Apresentar a avaliação dos usuários: A opinião dos usuários sobre os itens oferecidos em um sistema de recomendação é muito importante, esta é uma das fontes de informação utilizadas pelo sistema para selecionar e definir uma melhor recomendação. Esta estratégia de avaliação dos usuários é utilizada nos sistemas de recomendação desde o primeiro sistema desenvolvido, o Tapestry. A grande utilização desta funcionalidade se deve a importância da troca de informações em um processo de recomendação. A Figura 2 apresenta um extrato de comentários e avaliações de usuários sobre o álbum “Elvis 30 # 1 hits” do cantor Elvis Presley no site de comércio eletrônico Americanas.com. 25 Figura 2 – Avaliação dos usuários sobre o álbum Elvis 30 # 1 hits As avaliações podem ser realizadas de diferentes formas dependendo do sistema de recomendação. Abaixo são elencados alguns exemplos: Através de comentários, onde o usuário descreve sua experiência, seu conhecimento sobre as funcionalidades, vantagens e desvantagens do item. Na Figura 2 os comentários dos usuários do sistema referentes ao álbum refletem a sua experiência e conhecimentos sobre o item, o que pode contribuir para a escolha deste item por outro usuário que tenha acesso a estas informações; Através de notas com valores definidos pelo sistema; E através de escalas, como por exemplo, de ruim a ótimo, número de estrelas, entre outros. Além do sistema de recomendação utilizar estas avaliações para realizar suas recomendações outros usuários podem embasar sua opinião a cerca de determinado item através da opinião de outro usuário do sistema. Apresentar a opinião de críticos conceituados; Através da opinião de um usuário sobre determinado item é possível extrair informações relevantes, assim como já foi mencionado esta informação pode ser utilizada pelo sistema ou pelo usuário. No entanto a veracidade e relevância da opinião deste usuário nem sempre pode ser 26 medida com certeza, pois suas avaliações podem ser falsas. Para minimizar este problema alguns sistemas contam com a avaliação e opinião de críticos conceituados. Estes críticos podem ser usuários que possuam uma relevância de opinião ou indivíduos que possuam conhecimento considerável sobre o que está sendo avaliado. Exibir listas de recomendação; Esta funcionalidade está presente na maioria dos sistemas de recomendação bem como de sistemas de comércio eletrônico que não possuam os recursos de recomendação. Por não necessitar de recursos de inteligência computacional e filtragem de informação esta funcionalidade é aplicada a domínios diferentes dos sistemas de recomendação. As listas de recomendação normalmente apresentam informações dos itens mais vendidos, de itens para presentes, itens para listas de casamento, itens mais acessados, entre outras listas. Mesmo sendo um recurso simples estas listas são importantes para os sistemas de recomendação, pois apresentam as informações divididas em segmentos o que facilita uma pesquisa. No entanto não existe uma ligação direta entre os itens exibidos e o perfil do usuário que está acessando o sistema, a recomendação não é personalizada. A Figura 3 apresenta um exemplo de uma lista presente no site de comércio eletrônico Americanas.com. A lista exibe os itens mais vendidos no departamento de informática, o usuário pode procurar pelos itens vendidos em outros departamentos da loja virtual. A facilidade que está lista proporciona ao usuário está em poder tornar a pesquisa mais simples, em vez de procurar diretamente entre todos os itens disponíveis do departamento pode se procurar pelos mais vendidos pode ser que somente através desta lista o usuário já tenha o seu desejo suprido e sem despender muito tempo em pesquisas. 27 Figura 3 – Lista dos itens de informática mais vendidos no site da Americanas.com Listar os produtos ou itens que tenham um nível de semelhança significativo com o contexto visualizado pelo usuário; O recurso especificado nesta tarefa também é conhecido, segundo os especialistas em marketing, como venda cruzada e consiste basicamente em oferecer ao usuário itens que sejam similares ao o que ele está visualizando no momento, ou que esta comprando. Variados sistemas oferecem esta funcionalidade, sistemas de recomendação de músicas podem exibir uma lista com músicas que possuam o mesmo estilo, ou que sejam do mesmo artista que o usuário está escutando no momento. Assim como em um sistema de recomendação de livros, uma lista de títulos que sejam similares ao que se esta procurando seja ofertados ao usuário procurando compreender o que este deseja. A Figura 4 exibe um exemplo de sugestões de produtos que estão ligados ao produto que está sendo visualizado pelo cliente. No exemplo da Figura 4, o usuário está visualizando o CD Elvis 30 # 1 hits, através desta visualização o sistema disponibiliza ao usuário informações sobre outros álbuns que podem ser do interesse do usuário. Esta definição de outros produtos que podem ser interessantes para o usuário pode ser realizada através da observação de diversos atributos existentes nos produtos. 28 Figura 4 – Itens sugeridos a partir da visualização do CD ELVIS 30 # 1 HITS no site da Americanas.com O site facilita a pesquisa do usuário ao elencar outros produtos que possuem ligação com o produto que esta sendo visualizado. Desta maneira o usuário não despenderá tempo pesquisando sobre outras informações que estão ligadas ao produto visualizado no momento. No entanto um cuidado que deve ser tomado ao oferecer este tipo de recomendação aos usuários é na definição da similaridade entre os itens “semelhantes”. A Figura 4 apresenta o CD Paramore -Riot que supostamente é semelhante ao item CD Elvis 30 # 1 Hits, entretanto se for realizada uma comparação entre os artistas será possível compreender que existe uma grande diferença entre ambos. Listar itens que estejam ligados ao o que o usuário esta visualizando e com o histórico da comunidade; Para disponibilizar esta funcionalidade em um sistema de recomendação é necessário um trabalho bem específico e que demanda recursos de inteligência artificial associados à mineração de dados para que o resultado seja o esperado. Além de pesquisar itens compatíveis com o que o usuário está pesquisando esta 29 funcionalidade requer que o sistema exiba também itens que foram pesquisados por outros usuários, quando estes realizavam uma pesquisa igual a que o usuário está realizando no momento Esta funcionalidade é importante devido ao número de possibilidades e opiniões que ela pode disponibilizar para o usuário Através do conhecimento agregado por outros indivíduos as chances de conhecer mais produtos ou itens que possuem ligação com o que se pesquisa aumentam em comparação com uma busca somente baseada no perfil do usuário Figura 5 – Recomendações baseadas na pesquisa por Chuck Berry no site da Amazon.com Na Figura 5 pode-se visualizar o resultado de uma pesquisa por Chuck Berry no site da Amazon.com. Perceba que diversos outros artistas foram recomendados, esta recomendação se baseou na compatibilidade entre o artista pesquisado e os artistas sugeridos bem como em outros aspectos, como o histórico de pesquisa de usuários que também já pesquisaram sobre Chuck Berry. Recomendação baseada no perfil; A especialização do perfil e das recomendações se torna mais evidente através desta tarefa. A recomendação é efetivamente personalizada, somente itens que forem compatíveis com o perfil do usuário serão recomendados. Esta customização proporciona às empresas a utilização do marketing one-to-one, onde o cliente é único para a organização, somente serão ofertados produtos/serviços que estiverem 30 em sintonia com outros itens apresentados em seu perfil. Na Figura 6 pode ser vista uma página do site Amazon.com que exibe uma recomendação do site onde são levadas em consideração algumas informações do perfil do usuário para recomendar estes itens expostos. Este sistema possui a capacidade de informar ao usuário como chegou a esta recomendação, no alto da figura é informado que a partir de 13 elementos adquiridos pelo usuário o sistema decidiu por esta recomendação (REATEGUI e CAZELLA, 2005). Figura 6 – Recomendação personalizada com base no perfil do usuário. Fonte REATEGUI e CAZELLA 2005 As estratégias citadas podem auxiliar um sistema de recomendação caso exista uma forma de coletar os dados relevantes para a recomendação. A próxima seção apresenta as maneiras (abordagens) para obter as informações mais utilizadas pelos sistemas de recomendação atualmente. 2.4 COLETA DE DADOS O processo de recomendação necessita ter um alvo de recomendação, que é o usuário do sistema. Para oferecer um serviço de qualidade para o usuário é necessário se ter 31 conhecimento sobre quem é este usuário. A base de dados do sistema de recomendação deve conter os dados pessoais e comportamentais dos usuários do sistema. A identificação e coleta de dados dos usuários são fundamentais em um sistema de recomendação. A identificação do usuário no sistema pode ser realizada de duas maneiras (REATEGUI e CAZELLA, 2005): Identificação no servidor: ao realizar um cadastro no sistema são solicitados ao usuário alguns dados pessoais, bem como um login e senha para identificá-lo. Estes dados são então armazenados em um banco de dados no servidor. Sempre que o usuário acessar o sistema será solicitado para que este informe o seu login e sua senha, desta forma o sistema consegue identificar os usuários que estão acessando a sua aplicação. A Figura 7 apresenta a tela de autenticação do usuário no site de comércio eletrônico MercadoLivre.com. Figura 7 – Exemplo de identificação no servidor Identificação no cliente: diferentemente da identificação no servidor onde o usuário é obrigado a informar que está acessando o sistema, na identificação no cliente isto acontece através de cookies automáticos. A identificação acontece através dos cookies gerados toda vez que determinado computador se conecta ao web site. Um problema apresentado neste método de identificação está na possibilidade de que nem sempre somente uma pessoa utiliza o computador. Desta forma a identificação é de uma máquina acessando o sistema e não um usuário em particular. A Figura 8 apresenta esta forma de identificação, onde foi identificado que o usuário Talita se conectou ao site Submarino. O sistema identifica que é este usuário sem que seja necessário que este informe o seu login e senha de autenticação no sistema, a identificação foi realizada através da máquina que acessou o site. 32 Figura 8 – Identificação do cliente de forma implícita Depois de identificado o usuário é necessário coletar os seus dados. Uma das principais etapas em um sistema de recomendação é a coleta de dados. Os dados são a matéria-prima para os sistemas de recomendação. É a partir dos dados que um sistema de recomendação desempenha suas funções e oferece recomendações de qualidade. A coleta de dados é um processo que possui certa complexidade, afinal os dados não são obtidos facilmente. Normalmente, os usuários não gostam de preencher formulários ou questionários porque isto demanda tempo e existem aqueles que não concordam com a obtenção de dados de forma implícita alegando como invasão de privacidade esta abordagem (BARCELLOS 2007, CAZELLA 2006). A coleta de dados pode ser realizada utilizando duas abordagens: Abordagem explícita: é feita normalmente utilizando questionários ou formulários. Nesta abordagem o usuário interage diretamente fornecendo os seus dados. A veracidade dos dados coletados através desta abordagem é alta, afinal reflete exatamente a opinião do usuário. Esta técnica é bastante utilizada em coletas de dados, porém existe a resistência de alguns usuários quanto a esta abordagem. Isto se deve ao tempo que é empregado para responder aos questionamentos feitos, outro problema alegado por alguns usuários está em definir se os seus dados serão utilizados de maneira confiável ou não (CAZELLA 2006, BARCELLOS 2006, KAJIMOTO et.al. 2008). A Figura 9 exibe um exemplo desta forma de abordagem onde o sistema deseja obter a opinião do usuário sobre o serviço prestado. Neste caso o sistema solicita que o usuário informe se a resposta dada por outro usuário sobre o mesmo serviço foi útil ou não. Através desta informação o sistema pode aprimorar os serviços que presta, bem como descobrir 33 possíveis falhas existentes. Figura 9 – Avaliação do serviço de ajuda oferecido pela Google.com A Figura 10 apresenta outro exemplo de abordagem explícita onde o usuário informa seus dados pessoais no site do Yahoo.com. Através do conhecimento do sexo, da idade, região em que vive o sistema pode direcionar determinadas informações para o usuário. O serviço poderá ser mais personalizado a partir das informações que o usuário disponibilizar sobre o seu perfil. Na Figura 10 o sistema exibe uma mensagem que confirma estas informações. A mensagem informa que através do CEP informado pelo usuário podem ser oferecidas notícias relacionadas a este local. Figura 10 – Tela de cadastro de usuário no Yahoo.com exemplo de abordagem explícita Nos sistemas de recomendação normalmente as avaliações explícitas realizadas pelos usuários se referem às notas, às opiniões e às preferências apresentadas pelos itens disponíveis na base de dados (SAMPAIO, 2006). A forma explícita ainda é a mais utilizada em sistemas de recomendação por oferecer dados claros e diretos sobre os usuários. Abordagem implícita: os dados do usuário são adquiridos sem que este tenha conhecimento sobre este processo. Esta coleta pode acontecer através do monitoramento da 34 navegação do usuário em sites, da interação dele com o sistema, através de logs gravados, histórico de compras de consultas, entre outras formas. Assim como na abordagem explícita a abordagem implícita apresenta a resistência de alguns usuários, isto se deve a falta de privacidade que os usuários estão expostos utilizando os recursos tecnológicos (CAZELLA 2006, BARCELLOS 2006). Algumas ações que podem ser utilizadas implicitamente são (i) colocar uma página nos favoritos, (ii) tempo gasto lendo determinada página, (iii) scrolling utilização do scroll ou dos botões de navegação , (iv)movimentos do mouse, (v) salvar e/ ou imprimir conteúdos, (vi) apagar determinado item ou conteúdo, (vii) consultar por itens ou conteúdos, entre outras ações que podem ser coletadas (NICHOLS 1997, CAZELLA 2008). Um problema apresentado nesta abordagem diz respeito à formação das preferências de um usuário baseando se em dados obtidos de forma implícita (SAMPAIO, 2006). A dificuldade apresentada está em como medir a relevância destes dados que não são tão claros e diretos como os obtidos de forma explicita (BEZERRA, 2004). Em 2001 Claypool desenvolveu o primeiro protótipo batizado de Web browser (Claypool et.al. 2001) que tem como meta a definição da relação entre os diversos dados obtidos de forma implícita e as preferências de um usuário. Segundo os primeiros estudos de Claypool existe uma relação entre o tempo de leitura gasto para uma página, a intensidade da utilização do scroll ou ainda uma combinação de ambos com as preferências explícitas de um usuário (BEZERRA, 2004). Através da associação das duas formas de obtenção de dados o perfil do usuário poderá ficar mais completo. A associação é uma boa alternativa para um sistema de recomendação visto que alguns usuários não explicitam todas as suas preferências em uma abordagem explícita. Desta forma ao combinar os dados implícitos com os explícitos deixa o perfil mais específico e rico em detalhes. A Tabela 1 exemplifica a associação entre as duas abordagens, utilizando como exemplo um usuário fictício de um sistema de recomendação de notícias. Áreas de Interesse Forma de Coleta Futebol Explícita Música Eletrônica Explícita Basquete Implícita Reggae Implícita Tabela 1 – Áreas de Interesse x Forma de Coleta 35 Pode-se perceber através da Tabela 1 que duas informações são coletadas diretamente com o usuário e duas coletadas de maneira implícita. As duas áreas de interesse baseadas no método implícita foram obtidas através de consultas frequentes que este usuário realizava por notícias de basquete e reggae. A importância da associação destas duas abordagens está em oferecer recomendações mais específicas para os usuários a partir das informações de seu perfil. Se o sistema de recomendação de notícias não utiliza um método implícito de coleta, o usuário continuaria desperdiçando seu tempo em pesquisas de notícias sobre basquete e reggae, mas como o sistema detectou o seu interesse sobre estes assuntos as notícias chegarão até ele de maneira automática. Após esta etapa de identificação do usuário e coleta de dados é necessário determinar a melhor técnica de filtragem a ser aplicada no sistema de recomendação. Esta técnica deve possibilitar que o sistema atinja todos os objetivos que está proposto. A próxima seção aborda este assunto com mais informações. 2.5 FILTRAGEM DE INFORMAÇÃO Como citado anteriormente, a sobrecarga de informações tomou conta da era digital, assim, para resolver esse problema surgiram técnicas para minimizar o trabalho humano na extração do conhecimento. A filtragem de informação é uma destas técnicas utilizadas atualmente e que fundamentam o funcionamento de um sistema de recomendação (REATEGUI e CAZELLA, 2005). O termo filtragem de informação pode ser compreendido como um nome utilizado para descrever uma série de processos que estão ligados a entrega de informação para as pessoas que realmente necessitam delas (BELVIN, 1992). BELVIN (1992) salienta que um sistema de filtragem de informação apresenta algumas características: Projetado para trabalhar com dados não estruturados ou semi-estruturados; Trabalha geralmente com informações textuais, bem como com imagens, vídeo e/ou voz; Capaz de lidar com uma grande quantidade de dados, aplicações normalmente lidam com gigabytes de textos ou com grandes quantidade de dados de outras mídias; É baseada em interesses de longa duração, nos perfis de indivíduos ou grupos. 36 Existem diversas técnicas de filtragem de informação atualmente, no entanto existem três que são mais comumente utilizadas em aplicações de sistemas de recomendação: filtragem baseada em conteúdo, filtragem colaborativa e filtragem híbrida (CAZELLA 2006, OLIVEIRA 2009, BARCELLOS 2007, BEZERRA 2004, LOPES 2007). Devido à importância destas três técnicas em aplicações de sistemas de recomendação, todas serão descritas a seguir. 2.5.1 FILTRAGEM BASEADA EM CONTEÚDO Também conhecida como filtragem cognitiva, esta técnica de filtragem é baseada no conteúdo dos itens disponíveis no banco de dados comparando com os itens que o usuário demonstra ou demonstrou interesse no passado (PEREIRA 2007, TORRES 2003, OLIVEIRA 2007). O interesse por determinados tipos de conteúdos pode definir o perfil de um usuário (TORRES 2003). Por exemplo, um usuário ao comprar ou pesquisar com frequência itens esportivos está demonstrando sua preferência por itens relacionados a este assunto. Através dos dados presentes no histórico de preferências do usuário por determinados tipos de itens e a semelhança existente entre eles, o sistema de recomendação baseado em filtragem por conteúdo é capaz de recomendar outros itens que podem ser do interesse do usuário (OLIVEIRA 2007). A recomendação baseada em conteúdo é definida pelas características presentes em cada item da base de dados (BURKE, 2002). Um carro, por exemplo, pode ser representado por seu modelo, por sua cor, por seu ano, por sua marca, por seu tipo de combustível entre outros atributos, enquanto um artigo será representado pelo seu autor, título, conteúdo, assunto, etc. Os sistemas de recomendação devem encontrar caminhos para fazer com que seus usuários avaliem os itens disponíveis Uma saída encontrada é solicitar que o usuário análise certa quantidade de itens, informando se estes são de interesse ou não. Estas avaliações obrigatórias são realizadas normalmente quando o usuário é novo no sistema e se faz necessário que este indique suas preferências (CAZELLA, 2006). Os maiores conhecimentos sobre os perfis dos usuários são adquiridos durante a utilização do sistema. Através dos itens que o usuário adquire, consulta, consome, entre outras ações que podem gerar conhecimento para o sistema (CAZELLA, 2006). Os sistemas 37 baseados em conteúdo mantêm perfis de longo prazo: o modelo de usuário se baseia nas características dos itens avaliados por ele, sendo atualizado à medida que outros itens vão sendo avaliados (BURKE, 2002). Esta forma de recomendação tem sua origem nas técnicas de recuperação da informação e nas pesquisas de filtragem de informação (OLIVEIRA, 2007). Por possuir uma ligação com as técnicas de recuperação de informação, esta técnica de filtragem utiliza em variados momentos a procura de itens através de palavras-chave. Podem ser utilizadas ferramentas de busca booleana, filtragem probabilista ou técnicas de indexação de freqüência de termos para determinar as relações entre itens e usuários. Esta técnica trabalha da seguinte maneira: as informações sobre o conteúdo do item e do usuário são armazenadas em vetores, onde cada palavra corresponde a uma posição. O conteúdo de cada posição armazena o número de ocorrências para determinada palavra. Então é feita uma comparação entre os vetores para determinar qual a proximidade de um item e um usuário (KAJIMOTO et.al., 2008). A filtragem baseada em conteúdo pode ser aplicada a qualquer domínio, porém na prática ela tende a ser utilizada em domínios cujos itens possuam uma quantidade considerável de informação armazenada de forma textual (PEREIRA, 2007). A necessidade em possuir uma quantidade considerável de informação está na dependência que a filtragem por conteúdo possui das informações dos itens. A maioria dos sistemas de recomendação que utilizam a filtragem por conteúdo estão voltados para a recomendação de documentos, artigos, páginas Web, notícias, entre outros. A melhoria proporcionada pelos sistemas baseados em conteúdo, em relação à tradicional recuperação de informação, vem da utilização de perfis de usuários que contém dados sobre seus gostos, preferências e necessidades (ADOMAVICIUS e TUZHILIN (2005) apud OLIVEIRA 2007). Um exemplo é o sistema Krakatoa, desenvolvido por pesquisadores do Instituto de Tecnologia da Geórgia e apresentado em 1995(TORRES, 2004). O sistema Krakatoa utiliza a filtragem baseada em conteúdo para recomendar notícias. Diferentemente dos jornais convencionais onde a ordem das notícias é definida pelo editor-chefe, no Krakatoa as notícias são apresentadas de maneira diferente para cada usuário. O sistema leva em consideração a similaridade com o perfil do usuário, realiza uma média entre as avaliações de todos os usuários, avalia o tamanho da notícia e a composição dos artigos 38 Apesar de ser bastante utilizada em diversos sistemas de recomendação, a filtragem por conteúdo apresenta alguns pontos fracos (PEREIRA 2007, BRESLER 2004, BEZERRA 2004, REATEGUI e CAZELLA 2005): Superespecialização: itens que o usuário poderia se interessar, mas que não são compatíveis com os itens presentes no histórico do usuário não serão recomendados pelo sistema; Qualidade do item: a avaliação da qualidade dos itens somente é realizada se houver alguma informação sobre isto no conteúdo do item. Podendo ser recomendado um programa cheio de bugs no caso de um sistema de recomendação de downloads, se este apresentar o mesmo conteúdo de um programa que não possua nenhum bug. A chance de a recomendação ser de qualidade ou não é a mesma; Conteúdos não-estruturados: Esta filtragem não consegue trabalhar com arquivos de multimídia, como imagens, músicas e vídeos por não se tratarem de dados estruturados como um texto por exemplo. Sinônimos: análise de sinônimos, por normalmente trabalhar com arquivos que possuam textos a análise das palavras pode ser prejudicada pela utilização de muitos sinônimos, o que torna a filtragem mais difícil; Escalabilidade: Com o aumento das avaliações e com a adição de novos itens ao sistema o tempo de pesquisa, filtragem e recomendação pode ser prejudicado. A utilização da memória será cada vez maior; 2.5.2 FILTRAGEM COLABORATIVA O termo filtragem colaborativa foi cunhado pela primeira vez por Goldberg (GOLDBERG apud VENSON 2004) para explicar o mecanismo de funcionamento do Tapestry. O termo filtragem colaborativa definido por Goldberg designa uma atividade na qual as pessoas auxiliam umas as outras a filtrar informações. No caso do Tapestry, isto acontecia através das anotações feitas pelos usuários sobre suas reações ao ler determinado documento que posteriormente eram utilizadas pelos outros usuários do sistema (VENSON 2004, CAZELLA 2006). A técnica de filtragem colaborativa ganhou espaço e atualmente diversos sistemas utilizam as funcionalidades em suas aplicações, dentre estes sistemas pode ser citado o 39 RINGO sistema de recomendação de músicas e o BELLCORE sistema de recomendação de vídeos. Existe uma grande aceitação desta técnica em sistemas que atuam na web (VENSON, 2004). Burke afirma que a recomendação colaborativa é provavelmente a mais familiar, a mais utilizada e a que apresenta tecnologias mais consolidadas atualmente. A técnica de filtragem colaborativa surgiu com a proposta de suprir os pontos falhos da filtragem por conteúdo. A filtragem colaborativa se diferencia da filtragem por conteúdo principalmente por não necessitar do conhecimento especifico de cada item, mas sim utilizar das experiências dos usuários do sistema para predizer suas recomendações (CAZELLA 2006, KAJIMOTO et.al. 2008). Segundo Oliveira (2007) os sistemas colaborativos puros resolvem as principais deficiências dos sistemas baseados em conteúdo. Isto se deve ao fato da recomendação colaborativa trabalhar com as avaliações de outros usuários podendo tratar qualquer tipo de conteúdo e recomendar itens, mesmo que esses não sejam semelhantes aos itens já avaliados pelo usuário. As pessoas frequentemente utilizam um mecanismo parecido com o da filtragem colaborativa para tomar decisões. Através da opinião e recomendação de outros indivíduos que possuam um gosto parecido são formadas opiniões e decididas algumas questões cotidianamente. A técnica de filtragem colaborativa é a automatização deste processo conhecido nas relações sociais humanas, como recomendação “boca-a-boca” (LICHTNOW 2006, BRESLLER 2004). Assim como ocorre na recomendação “boca-a-boca”, a essência do método colaborativo está na troca de experiências entre os usuários. Através da detecção de preferências semelhantes entre os usuários são criados grupos, os membros destes grupos colaboram entre si com as suas avaliações. O sistema então pode detectar itens que determinado usuário do grupo possui e os demais não possuem e recomendar para estes usuários o item, julgando que lhe poderá ser interessante (REATEGUI e CAZELLA 2005, FILHO 2006, VENSON 2004, SAMPAIO 2006). Portanto para que o sistema colaborativo ofereça um serviço de recomendações de qualidade é necessária a participação dos usuários. A colaboração através das avaliações dos itens é fundamental para um sistema de recomendação colaborativo. Normalmente o usuário pontua o quanto determinado item é compatível com as suas preferências e assim colabora com o sistema (REATEGUI e CAZELLA, 2005). 40 Segundo Kajimoto (2008), a abordagem colaborativa oferece um grau de surpresa maior ao usuário do que na abordagem por conteúdo, com boas recomendações. A surpresa é fruto da recomendação de itens algumas vezes não imaginados pelos usuários e que são compatíveis com o seu perfil. Esta possibilidade só acontece devido ao conhecimento agregado de diversos usuários, que torna o sistema apto a realizar recomendações inesperadas e de qualidade. Pode-se utilizar como exemplo a recomendação de músicas para download associado a um usuário que pertença a um grupo do gênero do rock. Para realizar a recomendação o sistema irá avaliar os itens que estão presentes no perfil dos usuários do grupo. Ao realizar a pesquisa o sistema detecta que a música Moneytalks do grupo AC/DC está muito bem avaliada pela maioria dos membros do grupo e não está presente no perfil do usuário alvo. Desta forma o sistema recomenda esta música ao usuário, baseado nas opiniões dos outros usuários considerando que a música sugerida é compatível com o perfil do usuário alvo. Para adquirir informações sobre os usuários o sistema utiliza o aprendizado através das ações desempenhadas pelo usuário no sistema ou ainda através das informações diretas fornecidas pelo próprio usuário (KAJIMOTO et.al., 2008). A filtragem colaborativa reforça o conceito de comunidade, na qual cada usuário contribui com suas avaliações para o desempenho geral do sistema (CAZELLA, 2006). Existem três fases no processo de recomendação colaborativa (CAZELLA 2006, REATEGUI e CAZELLA 2005, KAJIMOTO et.al. 2008, VENSON 2004, SAMPAIO 2006): Representação dos dados de entrada: é a etapa correspondente as avaliações que o usuário realiza dos itens disponíveis na base de dados. As avaliações podem ser positivas ou negativas e serão utilizadas posteriormente nas recomendações. Formação de vizinhança: para realizar a recomendação o sistema avalia o perfil do usuário alvo com os demais usuários da base de dados e define a similaridade existente entre eles. Os usuários que possuem um perfil compatível com o do usuário alvo são definidos como a sua vizinhança. Geração da recomendação: finalmente, com base nas avaliações feitas pelos componentes da vizinhança aos itens de informação, o sistema gera a recomendação para o usuário alvo. Esta etapa trata especificamente do problema de identificar os produtos mais recomendados para um cliente a partir da sua vizinhança. A primeira etapa que corresponde à representação dos dados de entrada pode ser 41 definida como a responsável pela organização das avaliações realizadas pelos usuários. Normalmente, os dados são representados por uma matriz, onde as linhas representam os usuários e as colunas são os itens disponíveis. Cada usuário realiza avaliação sobre o item que desejar, estes valores serão preenchidos nas colunas referentes ao item avaliado. Após realizadas as avaliações é necessário verificar as similaridades entre os usuários através das pontuações que ele definiu para cada item. Na Tabela 2 é exemplificado um caso de disposição dos dados referentes à avaliação de quatro usuários quanto a quatro gêneros musicais com avaliações de zero a sete pontos: Usuario1 Rock n' Roll Sertanejo Samba Reggae 5 1 3 5 Usuario2 2 Usuario3 3 6 Usuario4 5 2 1 3 ? Tabela 2 – Exemplo de disposição dos dados na avaliação de gêneros musicais A segunda etapa do processo da filtragem colaborativa é a definição da vizinhança. Utilizando a Tabela 2, pode-se definir o Usuario4 como usuário alvo. Será preciso definir a vizinhança para o Usuario4 com base nas suas avaliações e nas avaliações dos outros usuários disponíveis. Analisando as informações é necessário buscar itens que foram avaliados em comum entre os usuários da pesquisa e o Usuario4. No exemplo existem dois usuários que podem ser considerados vizinhos do Usuario4, são eles o Usuario1 que realizou respectivamente três avaliações e o Usuario3 que realizou duas avaliações dos mesmos itens que o usuário alvo. A próxima etapa após encontrar os usuários que avaliaram os mesmos itens é definir a similaridade das avaliações existente entre estes usuários. No exemplo, o usuário que possui as avaliações mais parecidas com o Usuario4 é o Usuario1, isto porque as notas que os dois apresentaram para os itens estão mais próximas do que a comparação com o Usuario3. Estas etapas são também comumente conhecidas como a técnica de “k-nearestneighbor” ou “user based”, que em português é conhecida a técnica do vizinho mais próximo (ou do k vizinho mais próximo) (HERLOCKER 2000 apud CAZELLA, 2006). A primeira etapa deste processo corresponde à definição da similaridade. Podem ser utilizadas diferentes técnicas para definir o grau de similaridade entre os usuários, uma das funções mais conhecidas para medir a similaridade é a distância euclidiana. A implementação 42 desta função não é considerada difícil, para provar isto tem-se um exemplo, uma empresa que comercializa CDs e DVDs pela Internet deseja saber se o novo álbum da cantora Ivete Sangalo agradará determinado cliente. Para realizar está avaliação é necessário avaliar o perfil do usuário e os atributos do novo álbum da cantora. Estes dois grupos distintos, usuários e o álbum em si podem ser considerados os dois vetores de comparação na fórmula da distância euclidiana. A distância é dada através da comparação entre a similaridade destes dois vetores, cada vetor pode por exemplo representar um usuário, e dentro desse vetor existir características, no caso de dois usuários pode ser idade e gosto musical. Para definir a similaridade entre estes dois usuários é aplicada a fórmula da distância euclidiana que consiste em pegar uma característica de um dos usuários subtrair pela característica referente do outro usuário e elevar o resultado ao quadrado, isto é feito para todos os atributos existentes depois se soma o resultado da exponenciação de cada um e tira-se a raiz quadrada. O resultado da fórmula é sempre um número positivo, quanto mais próximo de zero este número estiver maior é a similaridade entre os usuários pesquisados. Para utilizar esta técnica na definição da similaridade entre usuários é necessário discretizar as características dos mesmos. A discretização seria, por exemplo, na característica gosto musical definir da seguinte forma: 1- Sertanejo, 2-Pop, 3-Rock, 4-Blues, e utilizar os códigos definidos na aplicação da fórmula. Esta discretização deve ser realizada em todos os atributos que serão avaliados no perfil dos usuários. A Figura 11 exibe a fórmula da distância euclidiana. Figura 11 – Fórmula do cálculo da distância euclidiana Outra técnica utilizada para a definição da similaridade é o coeficiente de Pearson, que mede a força de duas variáveis. Nesta técnica primeiramente é calculado o coeficiente para os itens que ambos os usuários avaliaram depois é calculado a média das avaliações de todos os coeficientes calculados, resultando em quanto um usuário é similar ao outro. O valor do coeficiente de Pearson varia de -1, indicando ausência de correlação, a 1, indicando total correlação. Esta forma de cálculo é considerada ideal quando existem avaliações positivas e negativas para os itens disponíveis (FILHO 2006). Após a definição da similaridade e da vizinhança é chegada à terceira etapa do processo 43 de recomendação colaborativa, a geração da recomendação. Através das informações disponíveis o sistema deve predizer um valor que o usuário alvo da recomendação daria a cada item candidato a recomendação que não foi avaliado por ele. Esta predição define qual item é mais apropriado para a recomendação. As informações nas quais o sistema se baseia para recomendar determinado item são os valores das avaliações que os usuários vizinhos definiram para os itens passiveis de recomendação. A recomendação pode ser realizada através de uma média ponderada entre as avaliações da vizinhança do usuário alvo (PEREIRA, 2007). Voltando ao exemplo dos usuários presentes na Tabela 3, depois de encontrar o vizinho mais próximo do usuário alvo pode se partir para a última etapa, a geração da recomendação. Neste caso o sistema poderia recomendar em algum momento para o Usuario4 um item que estivesse ligado ao estilo musical Reggae. Rock n' Roll Sertanejo Samba Reggae Usuario1 5 1 3 5 Usuario4 5 2 3 ? Tabela 3 – Comparativo entre as avaliações dos usuários vizinhos Isto se deve ao fato de que mesmo o Usuario4 não tendo avaliado este estilo musical o seu vizinho mais próximo realizou uma avaliação. Através da avaliação do vizinho mais próximo e das demais avaliações realizadas por ambos os usuários o sistema definiu que o estilo musical Reggae pode ser interessante para o Usuario4. Podendo assim em determinado momento lhe recomendar itens e conteúdos ligados ao estilo musical Reggae. Mesmo sendo umas das técnicas mais utilizadas nos sistemas de recomendação atualmente, a filtragem colaborativa apresenta alguns problemas que serão brevemente detalhados abaixo(FILHO 2006, BEZERRA 2004, TORRES 2004, OLIVEIRA 2007, LOPES 2007): First-rater problem (Item novo): problema do primeiro avaliador consiste no fato de que enquanto um item não receber avaliações por nenhum usuário, ele não pode ser recomendado, pois não estará relacionado a nenhum perfil; Startup problem (Sistema novo): diz respeito ao estado inicial do sistema, quando existem poucos usuários Com menos usuários a dificuldade em encontrar similaridades entre os perfis é bem maior. Usuário ovelha-negra: algumas vezes pode acontecer do sistema avaliar dois usuários 44 como pertencentes ao mesmo grupo, mas na verdade eles têm preferências distintas. Isto ocorre porque quando os usuários possuem poucas avaliações o sistema entende que as avaliações dos mesmos itens podem significar que os usuários são parecidos. Os usuários ovelha-negra são aqueles que possuem um gosto distinto da maioria dos membros do sistema, as recomendações neste caso se tornam pouco eficientes, pois não existem usuários que possam colaborar para melhoria de sua qualidade; Formação dos grupos: o cálculo realizado para determinar os grupos de usuários demanda um gasto computacional considerável no sistema. Para calcular os grupos é necessário fazer diversos cálculos e verificações com todos os usuários do sistema, isto se torna um processo demorado e caro computacionalmente Sparcity problem (Avaliações esparsas): Como normalmente as bases de dados são muito grandes seria necessário que um usuário avaliasse muitos itens para que as recomendações ganhassem em nível de qualidade. Um exemplo deste problema acontece em sites de comércio eletrônico que possuem uma base de dados que pode passar de 1 milhão de produtos. Para um usuário formar um perfil com 0,1% dos itens disponíveis teria que avaliar ou comprar 1000 produtos. Escalabilidade: quanto maior o numero de usuários e de itens avaliados o consumo dos recursos disponíveis para o sistema será maior. Isto pode refletir na qualidade do serviço prestado aos usuários do sistema. ColdStart: “partida fria” quando não são inicialmente disponíveis dados sobre o perfil do usuário; 2.5.3 FILTRAGEM HÍBRIDA A filtragem híbrida é uma filtragem proveniente da combinação de dois ou mais tipos de filtragem. Normalmente a maioria dos sistemas que implementam a filtragem hibrida utilizam a filtragem baseada em conteúdo associada à filtragem colaborativa (CAZELLA, 2006). Na Tabela 4 são exibidos alguns pontos distintos presentes nas duas formas de filtragem. Filtragem Baseada em Conteúdo Filtragem Colaborativa Não consegue tratar itens que possuam conteúdo Pode oferecer a recomendação de itens não – estruturados. Exemplo: Imagens, Filmes, estruturados normalmente. Músicas; não- 45 Recomenda itens novos sem apresentar nenhum Item novo na base é um dos pontos fracos da filtragem problema. colaborativa. Somente após receber algumas avaliações um item poderá ser recomendado aos usuários. Superespecialização, um item somente é recomendado para um usuário se este for compatível com o seu perfil. Não acontecem recomendações inesperadas. Recomendações inesperadas, inusitadas, que causam surpresa nos usuários. Através do conhecimento agregado por outros usuários diversos itens desconhecidos porém compatíveis com o seu perfil podem lhe ser recomendados. Boas recomendações mesmo para usuários com Usuários com gostos diferentes da maioria dos gostos inusitados. usuários do sistema tendem a receber recomendações ineficientes ou nem mesmo receber recomendações. Não leva em consideração a qualidade do Através das avaliações dos usuários é possível avaliar produto, podendo recomendar item ou conteúdo a qualidade dos itens e conteúdos que serão com problemas. recomendados, garantindo assim a qualidade do serviço de recomendação. Tabela 4 – Principais diferenças entre as duas abordagens que podem ser supridas na filtragem hibrida Todos os tipos de filtragens apresentam pontos positivos e negativos, algumas vezes estes pontos se acentuam devido ao domínio em que estão aplicadas. A associação de diferentes técnicas objetiva reduzir ou até mesmo eliminar as desvantagens apresentadas em cada técnica e fortalecer as vantagens que cada uma possui. Para determinar uma abordagem híbrida é necessário uma pesquisa sobre as técnicas que serão aplicadas, uma vez que cada uma pode interferir de maneira diferente na qualidade das recomendações (TORRES, 2004). Existem maneiras diferentes para aplicar a filtragem hibrida em um sistema: a combinação da filtragem baseada em conteúdo com a colaborativa. A seguir são apresentadas algumas formas de combinação (Adomavicius e Tuzhilin (2005) apud OLIVEIRA 2007): Implementar as duas técnicas de forma separada e combinar as suas predições. Desta forma o sistema pode oferecer recomendações baseadas em diferentes técnicas. Pode ser utilizado um mecanismo para medir a qualidade de recomendação oferecida por cada uma das técnicas, aquela que apresentar o maior índice de qualidade é utilizado naquele momento. Incorporar algumas características baseadas em conteúdo em uma sistema colaborativo. Objetivando disponibilizar itens antes não recomendados através da utilização da filtragem colaborativa; Incorporar características colaborativas em um sistema baseado em conteúdo O objetivo é o de oferecer recomendações com maior qualidade e diminuir alguns problemas possíveis na filtragem por conteúdo; 46 Unificar as características das duas abordagens com o objetivo de obter recomendações mais precisas; Após a escolha da melhor forma de filtragem de informações é necessário decidir qual a melhor técnica de recomendação para ser empregada no sistema proposto. Os sistemas de recomendação se dividem em duas classes de técnicas de recomendação possíveis, que serão apresentadas na próxima seção. 2.6 TÉCNICAS DE RECOMENDAÇÃO Os algoritmos utilizados nas técnicas de filtragem de informação, baseadas em conteúdo e colaborativa podem ser divididos em duas classes distintas: aqueles baseados em memória e aqueles baseados em modelo. A diferença existente entre estas duas classes está na forma de funcionamento. Os algoritmos baseados em memória mantêm uma base de dados com todos os usuários e suas preferências, e sempre que fazem uma recomendação operam sobre toda a base de usuários ou itens. Enquanto os algoritmos baseados em modelo primeiro compilam todas as preferências do usuário gerando um modelo, e depois disso realizam as predições a partir do modelo gerado (PENNOCK et.al., 2000 apud OLIVEIRA 2007, ADOMAVICIUS apud CAZELLA, 2006). Os algoritmos baseados em memória tendem a produzir recomendações de melhor qualidade do que os baseados em modelo, isto se deve ao fato da predição ser realizada em toda a base. No entanto esta qualidade de recomendação acarreta em uma utilização maior dos recursos computacionais, visto que toda a base de dados será avaliada (OLIVEIRA, 2007). Diferentemente dos algoritmos baseados em memória os algoritmos baseados em conteúdo não utilizam toda a base de dados. Por este fato suas recomendações são mais rápidas, o universo de itens avaliados é bem menor neste caso. Entretanto a qualidade da recomendação pode ser afetada por se levar em consideração apenas um modelo e não base inteira de itens disponíveis (OLIVEIRA, 2007). A Tabela 5 representa a classificação de técnicas aplicadas a sistemas de recomendação desenvolvida por Adomavicius e extraída de Cazella 2006. Esta tabela classifica os sistemas de recomendação por técnicas de recomendação (método de filtragem da informação) e técnicas aplicadas (algoritmos baseadas em memória ou modelo). São apresentadas diversas 47 técnicas que são utilizadas no desenvolvimento dos sistemas de recomendação atualmente, como redes bayesianas, redes neurais, árvores de decisão, entre outras. Técnicas Recomendação de Técnicas Aplicadas Baseada em Memória Baseada em Modelo Baseada em Conteúdo Técnicas mais utilizadas: TF-IDF (recuperação de informação) Agrupamento Técnicas mais utilizadas: Classificadores Bayesianos Agrupamento Árvores de Decisão Redes Neurais Colaborativa Técnicas mais utilizadas: Vizinhança mais próxima (cosseno, correlação) Teoria dos Grafos Técnicas mais utilizadas: Redes Bayesianas Agrupamento Redes Neurais Regressão Linear Modelos Probabilísticos Hibrida Combinando componentes baseados em conteúdo e colaborativos: Combinação linear de avaliação previstas Esquemas variados de votação Incorporando um componente como parte da heurística de outro. Combinando componentes baseados em conteúdo e colaborativos: Incorporando um componente como parte de um modelo em outro Construindo um modelo unificado Tabela 5 – Classificação dos sistemas de recomendação proposta por ADOMAVICIUS 2005 Ao analisar a Tabela 5 pode se perceber a quantidade considerável de pesquisas realizadas na área de sistemas de recomendação. Este estudo frequente sobre as melhores técnicas a serem aplicadas é que impulsiona o crescimento no desenvolvimento e utilização destes sistemas. A próxima seção apresenta algumas limitações encontradas atualmente nos sistemas de recomendação. 2.7 LIMITAÇÕES PRESENTES EM UM SISTEMA DE RECOMENDAÇÃO Os sistemas de recomendação apresentam algumas limitações. Os problemas apresentados em um sistema de recomendação estão baseados desde a sua estruturação até problemas relativos ao domínio em que esta estabelecida a aplicação (BEZERRA, 2004). Existem alguns problemas que podem ser considerados mais graves, pois não existe um número significativo de estudos que objetivam solucioná-los, estes problemas estão relacionados à: (i) aspectos de escalabilidade, (ii) esparsidade, (iii) uso de memória, 48 (iv)desempenho em tempo real, (v)explicação e (vi)apresentação de recomendações (BEZERRA, 2004). Alguns destes problemas já foram apresentados no decorrer do capítulo e em sua maioria estão relacionados ao método de filtragem escolhido. Outras limitações encontradas na utilização de um sistema de recomendação serão elencadas a seguir: Problema de ausência ou descaso das dimensões temporal e espacial: em um sistema de recomendação várias informações do perfil do usuário são levadas em consideração para realizar uma recomendação adequada e com qualidade, porém existe uma variável importante que normalmente não é analisada nos sistemas de recomendação atuais. Esta variável se refere à localização do usuário, seja esta geograficamente ou temporalmente. A importância em avaliar esta informação esta nas diferenças apresentadas no perfil dos indivíduos de acordo com a sua região. Por exemplo, uma recomendação realizada em determinado período do ano, durante o inverno. Se por acaso o usuário que estiver realizando esta pesquisa residir na região sul do país o sistema deve ser capaz de compreender que não pode recomendar artigos de verão. Esta lógica deve ser aplicada devido ao inverno rigoroso da região sul. No entanto se o usuário estiver localizado na região nordeste, o sistema não deveria lhe recomendar artigos de inverno, visto que a região apresenta temperaturas elevadas em todas as épocas do ano. Esta forma de recomendação é mais complexa devido ao grau de comparações, verificações e pesquisas que o sistema precisa realizar para indicar uma recomendação satisfatória. Problema de dificuldade de explicação e apresentação das recomendações: a dificuldade apresentada neste caso se refere à descoberta de uma maneira de convencer o usuário de que o produto que esta sendo recomendado é realmente o que este necessita ou deseja. Alguns usuários encaram as recomendações somente como uma forma das empresas aumentarem os seus lucros. No entanto várias organizações procuram formas de demonstrar que a satisfação do cliente com os serviços por ela prestados é um dos principais objetivos da empresa. Uma alternativa é utilizar formas de comunicação com o cliente, (i) explicando o porquê do produto recomendado, (ii) quais as vantagens deste, (iii) como o sistema chegou a esta conclusão, (iv) apresentar opinião de outros usuários sobre o produto recomendado. Enfim realizar um serviço que normalmente é realizado em uma recomendação “boca-a-boca”. Onde o recomendador convence através da explicação dos fatores que leva ele a ter determinada 49 opinião sobre o produto e o faz recomendá-lo. Problema de ausência de informações de negócio e integração com outros sistemas: as informações presentes e filtradas através de um sistema de recomendação são muito valiosas para as empresas que detém de uma tecnologia deste porte. Estas informações, no entanto na maioria dos sistemas de recomendações são utilizadas apenas na sua aplicação não fazendo uma integração com sistemas de informações gerenciais ou de apoio a decisão. Além da falta de integração com outros sistemas existe a ausência de informações de negócios, que representam as regras que regem a empresa que possui o sistema de recomendação. Um exemplo conhecido é a oferta promocional de produtos quando estes estão com o prazo de validade próximo. Estas promoções são determinadas de acordo com a empresa e representam regras de negócio. A integração das funcionalidades usuais de um sistema de recomendação com as regras de negócio da empresa representam um aumento no valor agregado dos serviços prestados. 2.8 CONSIDERAÇÕES FINAIS Conforme foi visto no presente capítulo os sistemas de recomendação objetivam resolver ou ao menos minimizar um problema que a maioria das pessoas enfrenta com freqüência, decidir ou encontrar algo em meio a uma quantidade de possibilidades muito extensa. A principal tarefa de um sistema de recomendação é oferecer a informação correta para o usuário que dela necessita, sem que para isto este usuário precise despender de seu tempo e raciocínio. O processo de desenvolvimento de um sistema de recomendação é complexo. São diversas as etapas no decorrer do seu desenvolvimento. Cada uma possui o seu grau de importância para o sistema como um todo, e o resultado final pode ser influenciado por decisões tomadas em todas as etapas. Desde as escolhas do (i) método para coletar os dados do usuário, (ii) das formas de identificar o cliente no sistema, (iii) da técnica de filtragem, (iv) da determinação da classe de algoritmos utilizada. As limitações apresentadas em um sistema de recomendação são variadas e estão ligadas desde o seu desenvolvimento até a aplicação final. Ao invés de se encarar estas 50 limitações como obstáculos intransponíveis elas devem ser vistas como incentivo. Através de pesquisas podem-se encontrar as soluções ou pelo menos métodos para minimizar estes problemas. Fazendo isto a qualidade oferecida em um sistema de recomendação será cada vez maior e a satisfação dos usuários crescerá na mesma medida. Os sistemas de recomendação possuem algumas limitações especificas, no entanto os benefícios e funcionalidades que são oferecidas aos usuários superam estas limitações. A capacidade de auxiliar os usuários em diversos domínios e estimular a colaboração entre os indivíduos são pontos fortes destas aplicações. A proposta de aplicação de um sistema de recomendação de presentes objetiva exatamente a minimização das dificuldades dos usuários ao desempenhar esta função através do auxílio do sistema. A recomendação que é um processo já conhecido da humanidade aliado a tecnologia pode representar um diferencial e trazer diversos benefícios para aqueles que utilizam as aplicações de sistemas de recomendações. O próximo capítulo tratará especificamente de técnicas e métodos baseados em Inteligência Artificial (IA) que podem ser aplicados em sistemas de recomendação. Alguns destes métodos já foram citados no presente capítulo, porém de forma superficial. 51 3.TÉCNICAS DE MINERAÇÃO DE DADOS COM INTELIGÊNCIA ARTIFICIAL Atualmente a escassez e a dificuldade de acesso as informações foram substituídas pela sobrecarga de informações nos mais diversos locais (KAJIMOTO et al. 2008). Filtrar o que é realmente relevante em meio à grande quantidade de dados disponíveis é quase impossível sem o auxílio de técnicas de filtragem e mineração de dados. A partir dessa necessidade foram desenvolvidas técnicas que objetivam auxiliar neste processo. A mineração de dados consiste na tarefa de explorar grandes quantidades de dados a procura de padrões consistentes. Através da descoberta destes padrões pode se extrair conhecimento (DE SOUZA 2007). A definição do correto método de mineração de dados é importante, pois dependendo do objetivo da aplicação algumas técnicas são mais eficientes que outras (REATEGUI e CAZELLA 2005). Muitas das técnicas atualmente utilizadas na mineração de dados foram desenvolvidas durante a década de 80 e 90 pela área de Inteligência Artificial (DE SOUZA 2007). O presente capítulo objetiva demonstrar algumas das principais técnicas de mineração de dados utilizadas atualmente em sistemas de recomendação. A seguir será apresentada uma breve explicação sobre o campo da inteligência artificial que é uma das ciências que mais contribui com estudos e pesquisas em mineração de dados e posteriormente as técnicas individualmente. 3.1 INTELIGÊNCIA ARTIFICIAL, A CIÊNCIA DO RACIOCÍNIO A espécie humana possui inúmeras particularidades com relação às outras espécies animais, porém a que pode ser considerada a mais significativa é a sua capacidade de raciocinar. Através desta capacidade o homem conseguiu sobreviver à ambientes e situações adversas ao longo de sua evolução, aprendendo, prevendo, manipulando e de certa forma controlando um ambiente muito maior que ele próprio (RUSSEL, NORVIG, 2006). O estudo desta aptidão humana teve inicio há muito tempo, diversas áreas do conhecimento procuram entender como a mente humana atua. Dentre estas áreas estão à filosofia, a psicologia, a matemática mais tarde contando também com a economia, a neurociência entre outras (RUSSEL, NORVIG, 2006). 52 A inteligência artificial é fundamentada nas teorias e pesquisas cientificas realizadas por outras ciências, devido a este fato, a inteligência artificial pode ser entendida como um ciência antiga e atual ao mesmo tempo. Atual porque se compararmos com o tempo de vida de outras ciências esta é muito jovem, tendo seu nascimento oficial no ano de 1956 quando foi criado o termo inteligência artificial. Porém como a sua base de fundamentação contém estudos e pesquisas de ciências muito antigas alguns estudiosos defendem a idéia de que esta ciência é tão antiga quanto às ciências em que se fundamentou (BITTENCOURT, 2006). Mesmo tendo sua base de conhecimentos em parte por intermédio de outras ciências, o que diferencia a inteligência artificial das demais ciências que estudam o comportamento humano é que a primeira não objetiva apenas compreender os fatores que influenciam o ser humano a tomar decisões ou agir racionalmente, mas também construir modelos inteligentes a partir destas informações. “A Inteligência Artificial sistematiza e automatiza tarefas intelectuais e, portanto é potencialmente relevante para qualquer esfera da atividade intelectual humana. Neste sentido, ela é verdadeiramente um campo universal ”(RUSSEL, NORVIG, 2006). Na busca pela simplificação de problemas complexos ligados ao comportamento humano a inteligência artificial possibilita a abordagem de quatro métodos para se obter informações que caracterizem o comportamento de uma pessoa e depois reproduzi-las em entidades artificiais. Estas abordagens se baseiam em agir de forma humana, pensar de forma humana, pensar racionalmente e agir racionalmente (RUSSEL, NORVIG 2006). Com o decorrer do tempo o campo de inteligência artificial desenvolveu inúmeras técnicas que atualmente são utilizadas com o objetivo de reproduzir o comportamento humano de alguma maneira. Algumas destas técnicas estão ligadas ao processo de tomada de decisão ou ainda a descoberta de conhecimento. O estudo de como o homem chega a determinadas conclusões e realiza escolhas possibilitou o desenvolvimento de técnicas para a descoberta de conhecimento em fontes de dados. Algumas das principais técnicas são apresentadas no decorrer deste capítulo, primeiramente serão definidas as técnicas de mineração de dados, após esta definição serão exemplificadas as técnicas de inteligência artificial que podem ser utilizadas em cada uma das técnicas de mineração de dados. 53 3.2 TÉCNICAS DE MINERAÇÃO DE DADOS O maior desafio da mineração de dados se encontra na tarefa de extrair conhecimento que está embutido ou escondido nas bases de dados. O conhecimento pode ser adquirido até mesmo sem a utilização de qualquer técnica. No entanto uma grande parte do conhecimento fica implícita, para extrair este conhecimento são criadas técnicas especiais, as quais objetivam descobrir conhecimento em meio a coleções de dados (REZENDE 2005). Através dos diversos estudos e pesquisas realizados pela área de inteligência artificial tem se proporcionado aos pesquisadores a possibilidade de utilizar diferentes técnicas de reconhecimento e extração de dados (REZENDE 2005). Existem quatro técnicas que se destacam em meio às outras abordagens que podem ser utilizadas, são elas associação, classificação, agrupamento ou clusterização, e regressão. A seguir serão apresentadas três destas técnicas que respectivamente podem ser utilizadas em aplicações de sistemas de recomendação. Estas técnicas podem funcionar baseadas em dois tipos de aprendizado, sendo estes o aprendizado supervisionado e o aprendizado nãosupervisionado. O aprendizado supervisionado é aquele no qual existem padrões definidos para os dados serem classificados enquanto o aprendizado não-supervisionado realiza a classificação de acordo com os padrões que ele encontra durante a mineração dos dados. 3.2.1 ASSOCIAÇÃO A associação é uma das mais conhecidas técnicas de mineração de dados, algumas vezes sendo até mesmo confundida com o processo de mineração. Este método de extração de conhecimento foi o responsável por uma das descobertas mais famosas na cadeia de supermercados Wal-Mart: “nas sextas-feiras, quem comprava fraldas também comprava cerveja” (LOH e GARIN 2001). A capacidade que esta técnica possui em extrair conhecimento em meio a uma vasta gama de dados é um dos principais motivos de sua popularidade em meio aos métodos de mineração de dados. Esta técnica tem por objetivo encontrar associações entre os atributos existentes e a partir disto, gerar regras que representem estas associações. As regras descobertas são conhecidas como regras de associação (BRESSLER 2004). Desse modo, o objetivo das regras de associação é encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados (REZENDE 2005). Por 54 exemplo, observando as preferências musicais de determinado grupo de usuários percebe-se que 85 % dos usuários que gostam da banda Oasis também gostam da banda inglesa The Beatles. Esse exemplo é a identificação de uma tendência. As associações são realizadas com base na freqüência que um item aparece em um conjunto de dados, como estas avaliações são realizadas em toda a base de dados, os resultados com ela obtidos possuem um grau de confiabilidade alto. A regra de associação dos dados pode ser utilizada em diferentes domínios, uma área que apresenta uma considerável utilização desta técnica é a de negócios. Por exemplo, através das informações presentes no histórico de compras dos clientes varias associações podem ser realizadas. Muito conhecimento está implícito nestes dados, com a extração deste conhecimento a organização pode receber diversos benefícios. Obtendo por exemplo o conhecimento dos produtos que possuem ligação, isto é, que são mais frequentemente comprados em conjunto a empresa pode oferecer promoções direcionadas, pode modificar a disposição dos produtos na empresa, entre outras modificações que podem acontecer. Esta descoberta de conhecimento em históricos ou listas de compras é conhecida também como “carrinho de compras”, do qual o objetivo é descobrir, em uma lista de compras feitas em um mesmo carrinho, quais são os objetos que são comprados em conjunto (SANTOS 1999). As regras de associação possuem dois graus: a confiança e o suporte. O suporte é o número de casos onde a regra foi encontrada (onde X e Y aparecem juntos). A confiança é a probabilidade condicional da regra, ou seja, quais as chances do segundo elemento estar presente. A confiança é calculada pela divisão do número de casos onde X e Y aparecem juntos (o suporte absoluto), pelo número de casos onde somente X aparece, este cálculo indica o quanto Y é relacionado com X (LOH e GARIN 2001, SAMPAIO 2006). Na Tabela 6 é exibido o exemplo citado das preferências musicais, usuários que gostam da banda Oasis e também gostam de The Beatles. Através desta associação pode se direcionar notícias, informações ou promoções que possuam as duas bandas ligadas. Por exemplo, ao adquirir o último álbum do Oasis o usuário ganha desconto no álbum Revolver dos Beatles, ou em outro produto disponível da banda. A Tabela 6 apresenta os valores calculados, onde em uma base com 300 usuários, 68 admitem gostar de Oasis e The Beatles, este valor reflete o suporte da associação. No entanto para garantir que existe realmente uma ligação entre estas duas bandas é preciso calcular a 55 confiança existente entre ambas. Este cálculo é importante, pois em uma base com 300 usuários como a do exemplo o número de 68 que foi obtido com a associação entre estas duas bandas pode ser inferior, por exemplo, se a banda Oasis aparecer mais 200 vezes associada a outro artista, a confiança garante que o item que esta sendo avaliado possui realmente uma ligação com o outro. No exemplo a banda Oasis aparece somente 4 vezes em perfis de usuários que não gostam de Beatles o que pode deixar subentendido que existe uma forte ligação entre estas duas bandas na base de dados. Grau associação de Base para a Associação Valor Suporte Número de vezes em que a banda Oasis e The Beatles aparecem 68 juntos na preferência dos usuários Confiança Total de vezes que as duas bandas aparecem juntas, dividido pelo 68/4 = 17 numero de vezes em que somente aparece a banda Oasis nas preferências dos usuários Tabela 6 – Graus de associação no exemplo de preferência musical de usuários de um sistema Um dos algoritmos mais conhecidos e utilizados para realizar associações é o chamado a priori. Através deste algoritmo é possível descobrir novos conhecimentos utilizando os conceitos de suporte e confiança para validar e verificar a qualidade das regras, ou seja, dos padrões encontrados. O funcionamento básico deste algoritmo se fixa na condição ( SE , ENTÃO). Por exemplo, se o usuário gosta de Oasis então também gosta de The Beatles. Estas combinações são a base das associações (BRESSLER 2004, SANTOS 1999). A implementação e uso do algoritmo a priori requer preparo especial dos dados para que possam ser representados adequadamente (SANTOS 1999). A técnica de regras de associação pode apresentar alguns problemas em sua implementação, são eles (TAN 2000 apud CAZZELA 2006, VENSON 2002): Um número muito grande de regras é gerado dificultando a seleção das mesmas; Nem todas as regras geradas são interessantes; Pode não ser possível gerar regras de associação fortes suficientes se o número de dados consultados não for considerável; 3.2.2 AGRUPAMENTO Os algoritmos de agrupamento ou clustering estão associados aos sistemas baseados em 56 aprendizagem não-supervisionada. As classes e padrões somente são definidos avaliando a similaridade entre os elementos e dividindo estes em grupos (OLIVEIRA 2007, LOH E GARIN 2001). A técnica de agrupamento é considerada uma forma de descoberta natural, pois as similaridades próprias de cada elemento é que definem a sua classificação e não um modelo externo proposto. Dados agrupados em um mesmo grupo podem ser considerados parecidos o suficiente, e dados em grupos diferentes são considerados diferentes entre si (SANTOS 1999). A forma de agrupamento pode ser comparada com a maneira como as pessoas escolhem seus amigos. Não existe uma regra estabelecida que determine qual pessoa cada indivíduo deve escolher para ser amigo, esta escolha é definida a partir de diversos atributos existentes em cada indivíduo que podem ou não ser interessantes para a outra pessoa. Por exemplo, na maioria das vezes os indivíduos procuram nos amigos algo que seja compatível com o seu perfil mesmo que a primeira impressão seja a de total distinção entre ambos existe a possibilidade de em algum ponto surgir uma semelhança. Um grupo de indivíduos pode ser agrupado por possuir um mesmo gosto em comum, por exemplo, gostar de futebol, no entanto outros gostos podem ser bem diferentes como o estilo musical por exemplo. O ideal na utilização de um método de agrupamento é que a similaridade definida seja resultado da verificação de diversos atributos, para criar grupos mais específicos. Esta preocupação se deve ao fato de um mesmo indivíduo possuir muitas características podendo ser encaixado em diversos grupos, o agrupamento deve garantir que o indivíduo fique no grupo mais especifico com o seu perfil. Para identificar a similaridades entre os elementos de um universo de pesquisa é definida uma função para medida de similaridade. Esta função deve levar em consideração as características que representam os elementos. O agrupamento auxilia o processo de descoberta de conhecimento, facilitando a identificação de padrões (características comuns dos elementos) nas classes (LOH E GARIN 2001). Os algoritmos baseados em agrupamentos objetivam aumentar a similaridade intragrupo e diminuir a similaridade inter-grupo (BEZERRA 2004). Os grupos devem ser cada vez mais parecidos e compatíveis, com um grau de agrupamento maior o conhecimento extraído pode ser melhor e mais facilmente interpretado. Alguns exemplos de algoritmos que podem ser utilizados para desenvolver a técnica de agrupamento são o algoritmo K-Médias, o algoritmo Fuzzy C-Médias e o algoritmo de mapas 57 auto-organizáveis de Kohonen. Mesmo que a técnica de agrupamento seja menos precisa do que outros métodos de descoberta de conhecimento a sua utilização tem crescido constantemente, aplicações de comércio eletrônico normalmente utilizam esta técnica para a descoberta de conhecimento. Uma vantagem apresentada por este método em comparação com os demais se refere ao seu consumo de recursos computacionais ser mais baixo que o de outras técnicas. Esta vantagem é muito considerável quando se trata de aplicações de e-commerce devido ao alto número de usuários conectados ao sistema e a grande quantidade de itens disponíveis na base de dados (BEZERRA 2004). A maioria dos algoritmos clássicos de agrupamento somente permite o uso de atributos numéricos, já que uma função de distância é usada para determinar a pertinência de um determinado dado à um grupo, mas extensões que consideram dados numéricos e não numéricos de forma separada podem ser criadas (SANTOS 1999). 3.2.3 CLASSIFICAÇÃO Ao contrário do método de agrupamento que consiste em um aprendizado nãosupervisionado a técnica de classificação é supervisionada. Neste método são definidas as classes as quais os dados presentes no banco de dados poderão ser classificados (CABENA 1997 apud REATEGUI e CAZZELA 2005). Utilizando o mesmo exemplo citado na técnica de agrupamento, da formação das amizades. Neste caso existiriam classes definidas, de acordo com as características de cada indivíduo as suas possíveis amizades seriam definidas. Características como classe social, raça, religião, poderiam definir que indivíduos podem ter laços de amizade, por exemplo pessoas de classe social A somente podem ter laços de amizade com indivíduos de mesma classe. Segundo Lopes (1999) apud BRESSLER 2004, a classificação tem como função descobrir uma relação entre vários atributos preditivos e um atributo objetivo. O objetivo da classificação é descobrir determinado conhecimento que possa ser utilizado posteriormente para classificar itens desconhecidos, que ainda não possuem uma classificação (REATEGUI E CAZELLA, 2006). Por exemplo, um usuário novo no sistema não informou o seu estilo musical favorito, através da técnica de classificação o sistema pode tentar definir a qual grupo de gêneros 58 musicais o usuário é compatível. Esta capacidade somente é possível se for analisado alguns atributos que possam induzir a uma classificação. Algumas características que podem ser levadas em consideração neste exemplo são o sexo do usuário, a idade e o estilo musical definido. A Tabela 7 apresenta de melhor forma estes dados. Sexo Região do País Estilo Musical Feminino Sul Reggae Masculino Sudeste Reggae Masculino Sudeste Reggae Masculino Sul Rock Masculino Sul Rock Feminino Centroeste Sertanejo Feminino Centroeste Sertanejo Masculino Sul Rock Feminino Sul Reggae Feminino Sul Reggae Masculino Sudeste Reggae Tabela 7- Dados para classificação de estilo musical A partir das informações coletadas é feita uma classificação dos dados através dos atributos especificados, neste caso a classificação leva em consideração o atributo Sexo, a Região do País em que o usuário reside e o Estilo Musical definido em seu perfil. Com base nestas informações o usuário que não definiu o seu estilo musical pode ser incluído em algum grupo. Por exemplo, com base nas informações presentes na Tabela 7 pode se concluir que: Se o usuário é do sexo feminino e reside na região Centroeste o seu estilo musical preferido pode ser o sertanejo; Se o usuário é do sexo masculino e reside na região Sudeste o seu estilo musical preferido pode ser o Reggae; Se o usuário é do sexo feminino e reside na região Sul o seu estilo musical preferido pode ser o Reggae; Se o usuário é do sexo masculino e reside na região Sul o seu estilo musical preferido pode ser o Rock; O exemplo possui poucos dados e certamente que para extrair conhecimento das 59 classificações de forma eficiente o universo de dados deve ser consideravelmente grande. Em um sistema de recomendação este método de classificação pode ser muito válido para recomendações para usuários novos no sistema. Com a análise dos dados de outros usuários pode se fazer recomendações, isto através da comparação dos atributos do novo usuário com os já existentes no sistema (REATEGUI e CAZELLA 2005). As árvores de decisão são um dos algoritmos mais utilizados para determinar a classificação de dados. Segundo Bressler (2004), os métodos de classificação tiveram sua origem baseados nas árvores de decisão. A principal diferença existente entre estes dois métodos está no número de regras que são utilizas para realizar a classificação. Enquanto as árvores de decisão possuem um número pequeno de regras, os algoritmos de classificação puros possuem um número muito superior. Quinlan (1993) apud Bressler (2004) afirma que as árvores de decisão são formas simples para representar a classificação de uma base de dados, mas quando são muito extensas, tornam-se difíceis de serem compreendidas. Figura 12 – Modelo da árvore de decisão de gostos musicais A seguir são apresentados alguns exemplos de algoritmos que podem ser utilizados na etapa de mineração de dados. Estes algoritmos devem ser escolhidos principalmente de acordo com a técnica de mineração definida para a aplicação, por exemplo, a utilização de um algoritmo de árvore de decisão é apropriado somente para aplicações baseadas em classificação. 60 3.3 ALGORITMOS DE MINERAÇÃO DE DADOS A utilização de técnicas de mineração de dados desenvolvidas pela ciência da inteligência artificial passou a ser mais frequente a partir do momento que a informação passou a ter um valor maior nas organizações. A informação tem valor competitivo no mundo atual, qualquer ferramenta que possibilite a extração de conhecimento passa a ser encarada como um possível aliado na conquista de um diferencial (COMPOLT 1999). A seguir serão apresentados alguns dos algoritmos mais utilizados para a mineração de dados. A maioria destes algoritmos foi desenvolvida há algum tempo, porém sua utilização é recente devido à importância que a mineração dos dados obteve nos últimos anos (COMPOLT 1999). 3.3.1 ÁRVORES DE DECISÃO As árvores de decisão são uma forma simples de lógica condicional que buscam a representação de uma série de questões que estão subentendidas sobre a base de dados, são utilizadas em aplicações que são baseadas em métodos de classificação. O funcionamento de uma árvore de decisão esta fundamentado em dois tipos de atributos, são eles o decisivo e o não-decisivo. Os atributos decisivos são aqueles que contêm o resultado que se deseja obter enquanto os atributos não-decisivos são aqueles que conduzem a uma decisão, fazem o intermédio até o resultado final (COMPOLT 1999). A utilização de árvores de decisão é vantajosa quando o desejo é de classificar ou predizer saídas. A facilidade de compreensão das regras geradas por uma árvore também pode ser considerado uma vantagem, visto que o entendimento do processo de obtenção do conhecimento é fundamental para o desenvolvimento de uma aplicação (PELLEGRINI e COLLAZOS 2000). A idéia principal envolvida em uma árvore é identificar características que existam em alguma classe e não em outras. Também podem ser usados exemplos negativos, que servem para a identificação de características que afastem elementos de uma classe (LOH e GARIN 2001). A criação de uma árvore de decisão é realizada através da fórmula matemática denominada de entropia. Entropia é uma medida bem-definida da desordem ou da informação encontrada nos dados. A construção de uma árvore de decisão é guiada pelo objetivo de 61 diminuir a entropia. No processo de criação são realizados cálculos sobre os atributos não decisivos, denominados classes, onde é escolhido um nó inicial também chamado de raiz. A partir deste nó será realizada uma série de novos cálculos com o objetivo de decidir a estrutura de formação da árvore a ser gerada. Com base nos cálculos que são gerados durante o processo de criação da árvore são definidas as classificações possíveis que um atributo pode ter ao ser classificado através da árvore (COMPOLT 1999). Por exemplo, um empresário resolve investir em uma casa de shows em determinada cidade, no entanto ele não possui conhecimento sobre as preferências musicais dos habitantes deste local. Para definir qual seria o melhor estilo da casa de shows é necessário avaliar os dados dos indivíduos que moram na cidade e classificá-los. Como não se tem conhecimento sobre as preferências dos habitantes podem ser definidas as mais conhecidas como saídas da árvore, por exemplo, sertanejo, pagode, rock, tradicionalista, forró entre outros. Os nós intermediários desta árvore que serão os responsáveis pela classificação até o resultado final, podem conter informações como o sexo do pesquisado, faixa etária, área de trabalho, faixa salarial, nível de ensino, entre outras informações. A definição destas informações é importante, pois serão elas que irão classificar os indivíduos pesquisados e ao final da pesquisa demonstraram qual o melhor estilo para se investir. O objetivo da classificação com árvores de decisão é criar grupos distintos a partir de uma mesma base de dados. Através das ramificações existentes na árvore podem ser obtidos diversos resultados. A utilização do mecanismo de entropia objetiva reunir nos galhos da árvore dados que pertençam a uma mesma classe, assim as classificações podem ser consideradas eficientes (SANTOS 1999). Um dos primeiros algoritmos de árvore de decisão foi criado no final dos anos 70. O IDE 3 como foi batizado pelo seu criador o cientista Ross Quinlan, era baseado em sistemas de inferência e em conceitos de sistemas de aprendizagem. A principio o algoritmo foi aplicado em tarefas de aprendizagem, como o jogo de xadrez, atualmente este algoritmo é um dos mais conhecidos e aplicados em uma grande variedade de situações acadêmicas e industriais (GARCIA 2003). Além do IDE 3 existem outros dois algoritmos que são bastante disseminados quando se trata da utilização de árvores de decisão, o C4.5 e o PERT. Estes dois algoritmos são aperfeiçoamentos do IDE 3, alguns problemas encontrados com o IDE 3 foram solucionados ou ao menos minimizados nestes dois algoritmos (COMPOLT 1999). 62 Uma das mudanças realizadas com relação ao IDE 3 refere se a capacidade de poda deste algoritmo. A poda é um recurso utilizado nas árvores de decisão quando estas estão com uma dimensão muito grande comprometendo assim o seu desempenho. Quando a árvore atinge uma dimensão elevada alguns dos nós presentes são inúteis, prejudicando o processo de classificação. A poda é um recurso importante nas árvores de decisão, pois permite controlar as dimensões da árvore, assim deixando a sua compreensão mais facilitada e as suas classificações mais eficientes (COMPOLT 1999). Um exemplo de uma aplicação conhecida na Internet que pode ter o seu mecanismo de funcionamento baseado na utilização de uma árvore de decisão é o site do gênio Akinator. O geniosinho promete adivinhar em que pessoa o usuário está pensando somente a partir das respostas dadas ao sistema. O mecanismo de funcionamento da aplicação é baseado em perguntas que possuem cinco alternativas de respostas. Conforme o usuário vai respondendo as perguntas vão sendo direcionadas para um caminho do qual a aplicação pressupõe que possa ser a pessoa que o usuário esta pensando. Por exemplo, através da resposta obtida ao perguntar para o usuário se a pessoa em que ele está pensando é do sexo feminino o sistema já consegue descartar metade de suas possíveis alternativas. A cada pergunta o sistema filtra a base de dados até chegar à possível pessoa que o usuário estava pensando. 3.3.2 TD-IDF (Term Frequency / Inverse Document Frequency) A TD-IDF é uma técnica baseada na recuperação da informação. Esta técnica é uma das mais conhecidas para especificar o peso das palavras em sistemas de recuperação da informação. A TF-IDF é mais comumente utilizada em aplicações baseadas em técnicas de agrupamento de dados (OLIVEIRA 2007). A técnica se baseia em duas abordagens para um melhor funcionamento. Calcula o número de vezes que uma palavra aparece em um documento (term frequency) e calcula também a medida inversa da freqüência de uma palavra em um documento (inverse document frequency). Através destes valores encontrados nestes dois cálculos é verificado o peso da palavra no documento. A medida inversa é importante devido a probabilidade de palavras comuns aparecerem muitas vezes em diversos documentos, assim tornando-se pouco úteis para distinguir o conteúdo do documento (OLIVEIRA 2007). O peso de uma palavra em um dado documento é calculado como sendo o produto das 63 duas medidas (TF-IDF). Assim, o documento pode ser representado como um vetor de palavras e seus pesos. Por se tratar de uma pesquisa por palavras esta técnica é utilizada em sistemas baseados em conteúdo, onde as descrições dos itens e dos usuários do sistema são a base de dados. Com o usuário e o documento representados como vetores é possível medir a similaridade, calculando o cosseno entre eles (OLIVEIRA 2007). Uma limitação apresentada nesta técnica está em não conseguir trabalhar com dados não-estruturados, a base de pesquisa precisa sempre ser estruturada. O tratamento e classificação de dados não-estruturados como, por exemplo, uma música, ou um filme somente podem ser realizados se estes itens possuírem um campo de observação onde estejam armazenadas informações sobre o produto. Por exemplo, ao pesquisar sobre determinado estilo musical, somente será possível receber a indicação de determinado arquivo de mp3, se este contiver a especificação do estilo pesquisado (OLIVEIRA 2007). 3.3.3 MODELOS PROBABILÍSTICOS O modelo probabilístico é uma técnica bastante difundida de recuperação de informação. A sua base de funcionamento está fixada em teorias estatísticas e de interpretação da informação (DE MAGALHÃES, 2008). Este método é difuso principalmente em sistemas que tratam diretamente da recuperação da informação em arquivos estruturados, como documentos de textos, planilhas eletrônicas, entre outros. A pesquisa na base de dados é realizada levando em consideração um termo chave informado pelo usuário ou pelo sistema. Através deste termo é feito uma varredura na base de dados identificando a probabilidade dos documentos ali armazenados possuir ligação com a palavra-chave de pesquisa (DE MAGALHÃES, 2008). A busca e definição da similaridade entre a palavra-chave e os documentos da base são realizadas através da utilização de vetores de probabilidade. Estes vetores de probabilidade utilizam a notação binária para classificar os documentos. Se for encontrado o termo pesquisado no documento este recebe o valor 1, que corresponde a probabilidade deste documento ser similar ao termo de pesquisa. Quando o documento não possui nenhuma ligação com o termo de pesquisa recebe o valor 0 que indica ausência de similaridade com a pesquisa (CARDOSO 2008 apud DE MAGALHÃES 2008, LOPES 2007). A praticidade encontrada na utilização de um método de recuperação de pesquisa como o modelo probabilístico é um ponto a favor desta técnica. No entanto existem alguns pontos 64 fracos na escolha deste método de recuperação de informação como (i) dependência de uma palavra-chave bem definida, (ii) não considerar a freqüência do termo no documento para definir a sua similaridade, (iii) não levar em consideração o problema de filtragem da informação, (iv) ou ainda se tornar uma procura lenta e ineficiente em uma base de dados muito grande (CARDOSO 2008 apud DE MAGALHÃES 2008, LELES 2004). Um exemplo de aplicação do modelo probabilístico está concentrado no armazenamento de informações da relação de interatividade entre usuários e sistemas. O trabalho realizado pelo método probabilístico nestas aplicações consiste em guardar as informações referentes as respostas que o usuário dá ao sistema. Por exemplo, em uma aplicação de jogos eletrônicos, através dos movimentos realizados pelo usuário ou através dos aplicativos que acessou o método cria um modelo especifico do usuário. Munido destas informações é possível oferecer um serviço mais personalizado aos usuários e descobrir falhas ou problemas no sistema. O agente interativo Kurupako desenvolvido por estudantes e pesquisadores da Universidade de Caxias do Sul é um exemplo de aplicação do método probabilístico. (REATEGUI e LORENZATTI 2005). O Kurupako é um agente interativo que objetiva o auxílio na aprendizagem de alunos da disciplina de algoritmos do departamento de informática da universidade. O modelo probabilístico auxilia o agente na descoberta do nível de conhecimento que determinado aluno possui, como já foi mencionado somente através das interações realizadas pelo usuário com a aplicação. 3.3.4 REDES BAYESIANAS As redes bayesianas são um exemplo de representação de dados baseados em modelos probabilísticos. Devido aos problemas encontrados em métodos que somente definem as pesquisas através de respostas booleanas como sim e não, ou binárias 0 e 1, desenvolveram se estudos e pesquisas que objetivaram o melhoramento destas pesquisas de recuperação de informação. A capacidade de trabalhar com níveis de certeza além de valores booleanos é uma das propostas das redes bayesianas. Segundo especialistas as redes bayesianas representam de formas simples as complexidades encontradas no universo de um problema. A simplificação ocorre através da utilização de variáveis que representam os agentes envolvidos no universo escolhido (MARQUES e DUTRA 2000). 65 Uma rede bayesiana representa um modelo do domínio que esta aplicada, é uma simplificação da realidade. Para não comprometer o funcionamento e a escalabilidade de aplicação de uma rede bayesiana em um domínio que possua muitas variáveis, não se faz necessário que todas as variáveis existentes sejam modeladas. Mesmo com poucas variáveis aleatórias pode se trabalhar com um universo complexo, os resultados podem perder um pouco em credibilidade, no entanto serão aproximados (DA SILVA e LADEIRA 2002). As redes bayesianas têm sido aplicadas em diversas áreas, no entanto a área de diagnósticos médicos é uma que merece uma atenção especial por aderir mais solidamente a esta técnica. Mesmo com as restrições éticas existentes com relação a utilização de prontuários médicos em ambientes que não representem um consultório a tecnologia conseguiu conquistar este domínio. Os benefícios que podem ser oferecidos por sistemas inteligentes baseados em redes bayesianas são os responsáveis pela disseminação desta técnica neste meio médico (DA SILVA e LADEIRA 2002, MARQUES e DUTRA 2000). Na área médica as redes bayesianas além de contar com os prontuários dos pacientes, podem utilizar do conhecimento sobre patologias que estão armazenados em livros e enciclopédias para realizar as suas inferências e descobertas. Através da análise de diferentes fontes de dados o resultado tende a ganhar em qualidade e eficiência. Mesmo com toda a capacidade de descoberta de conhecimentos de uma rede bayesiana o conhecimento humano dos especialistas não deve ser descartado nos diagnósticos. Aliar a capacidade humana com os artifícios e benefícios de uma ferramenta computacional parece ser o melhor caminho neste caso. Um exemplo é o diagnóstico em exames de mamografia, onde o conhecimento técnico do médico aliado as informações precisas e detalhadas de um sistema de informação garantem a precisão do diagnóstico. 3.4 CONSIDERAÇÕES FINAIS A ciência da inteligência artificial atua principalmente com o objetivo de melhorar a qualidade de vida dos indivíduos. Através dos estudos do comportamento humano e dos eventos naturais que influenciam diretamente a vida da espécie humana, diversos problemas já foram solucionados ou minimizados, diversas soluções foram propostas e muitas ainda estão sendo pesquisadas e desenvolvidas. Uma tarefa que foi muito beneficiada com os estudos e pesquisas da inteligência 66 artificial é a de mineração de dados. Devido a quantidade de dados que são diariamente gerados por empresas, governo e por indivíduos individualmente perdeu se a capacidade de filtrar o que é relevante do que não é com certeza do que se esta fazendo. A pesquisa por dados importantes se torna cansativa, estressante e em alguns casos frustrante. Quando não se dispõe de um meio computacional para pesquisar estas sensações ficam ainda mais afloradas, no entanto mesmo contando com o auxílio de tecnologias os usuários por vezes se sentem desta forma. Para minimizar esta dificuldade na pesquisa por dados relevantes deve se escolher o método mais adequado para o meio que será aplicado. A determinação deste método depende exclusivamente do objetivo da aplicação em que este será utilizado. O usuário deve ter a qualidade de serviços a ele prestados garantida. Conforme foi salientado neste capítulo, as técnicas de mineração e de inteligência artificial possuem particularidades que as tornam aptas para determinadas aplicações. A escolha e determinação da melhor, mais eficiente e mais eficaz técnica depende de um estudo aprofundado da aplicação que será desenvolvida. O tempo disposto na escolha da melhor técnica pode representar o diferencial na aplicação. A determinação da técnica de mineração em um sistema de recomendação representa um dos pontos mais importantes no processo de desenvolvimento do sistema. O sucesso ou o fracasso das recomendações podem ser definidos pela técnica de mineração escolhida. Estudar e pesquisar as vantagens e desvantagens de cada uma de acordo com o objetivo e universo que será aplicado o sistema pode auxiliar na escolha da melhor ferramenta. O próximo capítulo apresenta os aspectos ligados ao ato de presentear já que este é o foco do presente trabalho, o desenvolvimento de um protótipo de um sistema de recomendação de presentes. São explicados aspectos que estão diretamente ligados a troca de presentes, bem como aspectos históricos e sociais envolvidos neste ato. 67 4. A ARTE DE PRESENTEAR Este capítulo apresenta conceitos que são inerentes ao ato de presentear, descrevendo um breve histórico deste ato nas relações humanas, dos significados e dimensões que podem ser encontradas bem como das funções que este ato desempenha na construção de laços entre os indivíduos. O estudo mais aprofundado deste assunto é interessante neste trabalho pois presentear é o foco do mesmo. Através de um estudo mais especifico sobre o universo envolvido neste ato se obtém maior respaldo para desenvolver uma aplicação que auxilie no processo de presentear alguém. 4.1 INTRODUÇÃO Diariamente o ser humano desempenha diversas atividades e ações naturalmente. A facilidade em realizar estas atividades se encontra principalmente devido ao número de vezes em que estas são desempenhadas, o que as torna rotineiras e, portanto fáceis. No entanto existem algumas atividades que mesmo sendo desempenhadas várias vezes ainda assim podem representar um “problema” para quem as realiza. O ato de presentear pode ser considerado uma atividade pertencente ao grupo das “atividades problema”. O grau de dificuldade em sua realização é maior do que em outras atividades devido aos diversos fatores envolvidos na sua prática e ao simbolismo que este ato representa (MACHADO, 2004). Alguns fatores implícitos e explícitos neste processo complexo e natural presente há tanto tempo na vida em sociedade são apresentados no presente capítulo, objetivando uma maior compreensão do significado, da história, dos motivos, das funções, e de outros assuntos inerentes ao ato de presentear. 4.2 O PRESENTE EM DIFERENTES CULTURAS DA SOCIEDADE O ato de presentear é praticado pelo homem há muito tempo. São diversos relatos históricos que comprovam a prática da troca de objetos envolvendo um simbolismo implícito Uma das passagens mais conhecidas mundialmente esta ligada a religião, a oferta de presentes ao menino Jesus realizada pelos três reis magos citada na Bíblia esta passagem é 68 capaz de demonstrar os aspectos sentimentais envolvidos no ato de presentear como o respeito,o afeto,a admiração,a servidão, entre outros. A complexidade do ato de presentear pode ser percebida pelas inúmeras reações, sensações e ações que este ato pode causar. Este ato praticado há tanto tempo possui aspectos implícitos que modificam o relacionamento entre os indivíduos envolvidos de diferentes maneiras. A capacidade que o ato de presentear possui em influenciar e modificar as relações entre os indivíduos é visível em diversos povos. Vários estudos foram realizados em sociedades primitivas objetivando compreender o que este ato representava na vida destas sociedades. Um dos estudiosos mais famosos com relação ao sistema de trocas em sociedades, é o antropólogo Marcel Mauss. No ano de 1923, este francês públicou o seu famoso Ensaio sobre a dádiva: forma e razão de troca nas sociedades arcaicas. Mauss estudou o sistema de trocas em sociedades da Melanésia (ilha Trobriand), da Polinésia e do Noroeste americano (culturas indígenas) (LOURENÇO, 2006). A dádiva para Mauss assumia um caráter bastante amplo, incluindo festas, casamentos, patrimônio, esmolas, troca de presentes e até mesmo os tributos pagos pelos grupos a um poder centralizador (LANNA, 2000). Mauss procurou compreender o que estas trocas representavam para as sociedades arcaicas, e que conseqüências estes atos teriam na vida destas sociedades. O sistema de trocas dos indígenas do noroeste americano estudados por Mauss funciona de forma desinteressada e obrigatória segundo o pesquisador. Essa obrigação se exprime de maneira simbólica e coletiva: ela assume o aspecto do interesse ligado às coisas trocadas. As coisas jamais se separam completamente de quem as troca; a comunhão e a aliança que elas estabelecem são relativamente indissolúveis (MAUSS, 2003 apud LOURENÇO, 2006). As trocas acontecem entre tribos vizinhas e o cacique que oferecer mais presentes é visto com melhor status que os demais. Os presentes podem ser alimentos e bens preciosos. O simbolismo em criar laços com outros indígenas através deste ritual chamado de potlach é apenas um dos ganhos. Neste ritual dependendo das trocas realizadas, podem se acertar casamentos, ganhar status político, entre outras coisas (GODBOUT 1999 apud LOURENÇO, 2006). Assim, o ato de presentear para as tribos indígenas do noroeste americano representa um evento muito importante, podendo este modificar as definições de status social na tribo, a 69 criação de alianças com outras tribos. Enfim o ritual do potlach tem a capacidade de modificar a vida dos membros que dele participam. Outro antropólogo que realizou estudos sobre as trocas simbólicas em sociedades primitivas foi Bronislaw Malinowski. Um dos seus estudos foi baseado no ritual do Kula, um sistema de trocas praticado pelos habitantes das ilhas de Trobriand, este ritual também foi pesquisado por Mauss. Neste sistema assim como no Potlach as trocas são realizadas com tribos vizinhas (LOURENÇO, 2006). O Kula seria um sistema de obtenção de prestígio e renome, por meio de trocas materiais (COELHO, 2006). A troca de objetos simbólicos pode envolver diversos objetivos, isto é relativo a cultura do povo que realiza este ritual. Enquanto para alguns a troca pode apenas representar a criação de um laço, para outros pode representar a sua superioridade, ou o seu poder, ou ainda a sua inserção em determinada classe social. Durante uma época a troca de presentes foi uma maneira encontrada para garantir a paz entre os povos. Através da oferta de presentes para outro povo, se criava uma aliança. Já a recusa de um presente ou a não retribuição de um presente recebido equivalia a recusar a aliança criada, demonstrar inimizade e uma possível guerra. Um exemplo conhecido na história da troca de presentes entre povos inimigos é o presente oferecido pelos gregos aos troianos, durante a guerra de Tróia. Os troianos ao receber o presente dos seus inimigos acreditaram que este era um sinal de paz, o fim da guerra. No entanto tudo não passou de uma estratégia inteligente dos gregos para tomar a cidade inteira. Os troianos foram traídos pelo simbolismo que um presente representava para as sociedades da época. No Brasil a prática da troca de presentes é feita há muito tempo. Mesmo antes do descobrimento do país pelos portugueses os povos indígenas já realizavam trocas de presentes entre os membros das tribos e ofertas de objetos simbólicos para seus deuses. Segundo um estudo antropológico com índios da tribo Krahó realizado pelo pesquisador Júlio César Melatti publicado em 1973, o ato de presentear é praticado normalmente e está incluso em regras que regem a tribo. Na tribo o marido tem o dever de presentear os parentes de sua mulher, bem como realizar agrados com presentes para a sua esposa sempre que possível. A realização deste ato além de criar laços, mantêm o status social do indivíduo perante os outros índios. Um estudo publicado pela antropóloga Débora Diniz com índios da tribo Yanomami 70 concluiu que atualmente é praticamente impossível fazer contato com determinadas tribos indígenas sem lhes oferecer presentes em troca. Os yanomamis representam uma destas tribos, o contato deve sempre ser feito com a oferta de presentes a tribo. Alguns pesquisadores encaram esta exigência como forma de garantir e contribuir para o bem-estar da comunidade durante o trabalho de pesquisa. Outros, alegam que esta prática é comum pois é uma forma de ser bem aceito na comunidade, uma prática que os missionários e colonizadores praticavam (DINIZ, 2007). Segundo Mauss (apud Lourenço, 2006), por trás do caráter voluntário do ato de presentear esta implícita o formalismo, a mentira e a ficção social e ligados a estes a obrigação e o interesse. A ficção social talvez seja um dos grandes responsáveis pela difusão deste ato em diferentes culturas da sociedade. Isto porque através da prática da troca de presentes pode se (i) ser aceito em uma comunidade ou grupo, (ii) receber um melhor status social, (iii) ganhar a confiança de outras pessoas, (iv) obter satisfação pessoal ou ainda (v)promover a satisfação em outras pessoas. Após um breve histórico da troca de presentes em diferentes culturas é necessário entender os significados deste ato. A próxima seção objetiva elenca algumas definições para o ato de presentear. 4.3 PRESENTEAR ALGUÉM. O QUE SIGNIFICA ESTE ATO? Independentemente de raça, religião, cultura ou localização o ato de presentear se faz presente há muito tempo. Compreender os significados que este ato pode possuir é importante para compreender as conseqüências que ele pode desencadear nas relações sociais humanas. Atualmente pesquisas sobre o comportamento de presentear e dos fatores que estão ligados a prática são desenvolvidas por diferentes áreas como, a psicologia, a antropologia, o marketing e também a sociologia. A maioria dos estudos publicados são referentes a pesquisadores estrangeiros, em sua maioria norte americana. O Brasil é carente de estudos nesta área há algum tempo (LOURENÇO e REZENDE 2008, FARIAS 2001). O estudo da troca de presentes é importante devido ao seu valor representativo na economia, quanto pela sua representatividade em criar e manter relacionamentos interpessoais. A troca como instituição social desempenha um papel na economia e na vida 71 social como um todo muito maior do que normalmente se imagina. Estas influências estão presentes desde muito tempo antes do capitalismo, quanto hoje em dia durante o regime capitalista (SHERRY apud LOURENÇO e REZENDE 2008, OLIVEIRA 2009, PEPECE 2002). São variadas as definições sobre o ato de presentear. Segundo salientou Bourdieu citado em Coelho (2006), a diferença na definição sobre a troca de presentes pode acontecer apenas devido a diferentes postos e tempos de observação. Bourdieu chegou a esta conclusão após avaliar as definições feitas por dois estudiosos da área, Marcel Mauss e Lévi-Strauss (COELHO, 2006). Mauss definia a troca de dádivas ou presentes como estas eram vivenciadas, segundo o antropólogo o presente era espontâneo e desinteressado. Enquanto para Lévi-Strauss que examinava o presente fora de sua inserção cotidiana o definia como algo forçado e motivado pelo interesse (COELHO, 2006). A observação de Bourdieu proporciona a compreensão de que um mesmo ato pode ser interpretado de maneiras distintas visto que diversos fatores podem ocasionar a sua definição. As discrepâncias nas definições do ato de presentear se acentuam também devido às diferentes áreas que atualmente objetivam estudá-lo. A definição que um antropólogo possui deste ato pode ser totalmente distinta da definição de um especialista em marketing por exemplo. Em um dos primeiros estudos realizados nesta área Mauss propôs o sistema de trocas de presentes como um “fato social total”. Este fato social total sugerido por Mauss é algo maior do que os aspectos religiosos, políticos, judiciários e estéticos É uma junção de tudo isso, uma mistura de alma e coisas. Algo que possui uma dupla verdade, podendo ser caracterizado por transações voluntárias ou por movimentos obrigatórios (COELHO 2006, LOURENÇO 2006). A troca de presentes pode ser vista como um ato de comunicação. Através da troca de um presente são trocados sentimentos, sensações, conhecimentos (COELHO, 2006). O ato de presentear pode ser encarado como o único capaz de transmitir mensagens sem utilizar palavras e de expressar carinho sem utilizar o toque (PEPECE, 2002). A capacidade que um presente possui em transmitir mensagens ao receptor é fruto do simbolismo envolvido neste ato. Para Mauss as coisas dadas são “animadas”, presentear alguém com alguma coisa seria presentear algo de si (COELHO 2006, LOURENÇO 2006). O presente, portanto teria vida, a vida de quem está lhe ofertando. 72 A valorização das trocas simbólicas nas sociedades depende muito da cultura do seu povo. O que pode ser percebido atualmente é que o consumo simbólico ganhou espaço na sociedade moderna. Isto se deve ao fato do consumo simbólico ser capaz de influenciar o status social dos indivíduos (PEPECE, 2002). O presente é o melhor exemplo da troca simbólica, pois um objeto, quando é dado (qualquer que seja ele, contanto que seja dado), sela um pacto transferencional entre duas pessoas (PEPECE, 2002). A troca simbólica também pode ser chamada de valor de vínculo. O ato de presentear pode ter três valores implícitos - o valor de uso, valor econômico e valor de vínculo. Sendo o valor de vínculo o mais importante neste ato, que representa a manutenção, o estabelecimento ou a reconstrução de um vínculo ou relação social (LOURENÇO, 2006). Para um vínculo ser criado é necessário a existência de mais de um indivíduo. Através deste vínculo é criada uma relação de reciprocidade entre os indivíduos O ato de presentear pode então ser encarado como uma ferramenta de integração entre as pessoas. Quando um presente é ofertado a alguém, esta pessoa precisa aceitar recebê-lo. Ao receber o presente está criado um vínculo entre ambas as partes (PEPECE, 2002). O receptor do presente se vê então “obrigado” a retribuir este ato, o que evidencia as três etapas existentes no ato de presentear, dar, receber e retribuir. Mauss foi o primeiro estudioso a propor teoricamente este processo no ato de presentear (LOURENÇO 2006, COELHO 2006). Existem algumas diferenças entre uma troca mercantil e a troca de presentes uma delas está no tipo do vínculo criado no processo de troca. Enquanto em uma troca mercantil é feito um contrato onde a outra parte é obrigada a retribuir, na troca de presentes não existe essa cobrança. Não se pode processar um amigo por não ter retribuído um presente dado. A retribuição deve ser espontânea assim como o ato de presentear. Outra diferença existente entre as trocas de mercadorias e as trocas de presentes está na maneira como são ofertados os objetos. Em uma troca mercantil o vendedor exalta as qualidades da mercadoria, e o comprador as desmerece. No processo de troca de um presente acontece o contrário quem esta ofertando o presente tende a diminuir o que esta oferecendo, normalmente dizendo “- É só uma lembrancinha”, enquanto o presenteado exalta as suas qualidades ao receber o objeto (OLIVEIRA, 2009). Outro aspecto citado que diferencia a troca de presentes da troca mercantil se refere ao preço do produto oferecido ficar sempre implícito. Nicolas apud Lourenço 2006 afirma que o valor do presente não é o aspecto mais importante, mas a intenção e o rito conhecido. 73 Informando o valor pago pelo produto perde se a magia envolvida no ritual de presentear (LOURENÇO, 2006). Além de ser considerado um instrumento de integração o ato de presentear pode ser considerado um instrumento de individualidade. Pois cada presente é único, é a imagem do presenteador e é marcado pelo momento da entrega do presente, que não será repetido em nenhuma outra troca de presentes (PEPECE, 2002). Presentear alguém pode representar uma atividade arriscada para algumas pessoas. Esta tensão envolvida neste ato está ligada a possibilidade do presente ofertado ser recusado ou não apresentar os resultados planejados. A recusa de um presente envenena uma relação, ao invés de criar laços eles são destruídos. É como se o ato de doar fizesse o indivíduo andar sobre o fio de uma navalha: a pessoa se doa para o outro, se está não a acolher, o sentimento será de traição, de decepção, engano (OLIVEIRA, 2009). A complexidade do ato de presentear pode ser mais bem entendida dividindo esta prática em algumas dimensões. As dimensões definidas para o ato de presentear são referentes aos objetivos que este ato pode ter, aos fatores que podem influenciar a sua prática bem como as conseqüências que ele terá. A dimensão simbólica já mencionada em alguns aspectos é reconhecida como a predominante diante das demais dimensões (LOURENÇO E REZENDE 2008). Isto comprova que mesmo com os aspectos econômicos ganhando espaço o simbolismo ainda persiste nas relações de trocas entre os indivíduos Algumas das principais dimensões são definidas a seguir, objetivando o entendimento dos diferentes aspectos envoltos no ato de presentear. 4.4 DIMENSÃO SIMBÓLICA A dimensão simbólica é uma das mais importantes dentre todas as existentes na prática da troca de presentes, sendo considerada por alguns pesquisadores como a predominante neste ato. Os presentes possuem um valor muito maior do que o seu valor financeiro, o simbolismo envolvido sobressai os benefícios proporcionados pela troca material (WOLFINBARGER (1990) apud FARIAS 2001). “Os presentes não são tão sagrados quanto as conexões que eles simbolizam entre as pessoas” (BELK apud LOURENÇO E REZENDE, 2008). O valor de vínculo que representa o simbolismo do presente é o que há de mais valioso 74 em uma troca de presentes. A ligação criada através de um presente não possui valor econômico. O simbolismo envolvido na troca de presentes está ligado a doação não somente de algo material entre ambas as partes, mas a doação de si para o outro indivíduo. As trocas de presentes são compostas de elementos simbólicos como a reciprocidade, a sociabilidade e a espontaneidade (LOURENÇO, 2006). O simbolismo envolvido no ato de presentear foi classificado em quatro categorias distintas, sendo elas (WOLFINBARGER 1990 apud FARIAS 2001): Presentes que simbolizam o próprio doador; Presentes que simbolizam a percepção que o doador tem sobre o receptor; Presentes que simbolizam uma convenção; Presentes que são expressivos e possuem muitos significados atrelados a eles. Normalmente os presentes são escolhidos com base na imagem do próprio doador. Isto foi comprovado em um estudo qualitativo realizado por Sherry e McGrath em 1989. As pessoas compram produtos para presente que representem a sua imagem objetivando ser incluída na vida da outra pessoa. Ao ofertar um presente que possua as características pessoais do presenteador este faz com que o presenteado ao entrar em contato com o presente, tenha a lembrança do seu presenteador (PEPECE 2002, FARIAS 2001). Além dos presentes que simbolizam o próprio doador existem aqueles que simbolizam uma percepção que o doador possui do receptor. A escolha de um presente que reflita o receptor é mais arriscada. Para escolher um presente que seja compatível com o perfil do receptor é necessário certo conhecimento sobre as preferências do presenteado. É preciso lembrar que um presente mal escolhido pode ocasionar um abalo na relação entre os envolvidos na troca de presentes. Este abalo pode ser momentâneo ou representar a ruptura dos vínculos (OLIVEIRA, 2009). O simbolismo envolvido no presente é a sua essência, relacionamentos podem ser criados, mantidos ou até mesmo rompidos através da troca de presentes. A doação conjunta existente neste ato deve ser realizada de modo que ambas as partes envolvidas sejam beneficiadas. Desta forma fortalecendo ainda mais seus laços de ligação. 4.5 DIMENSÃO EMOCIONAL A dimensão emocional envolvida no ato de presentear está também ligada a dimensão 75 simbólica. Os aspectos emocionais envolvidos neste processo contribuem para o simbolismo existente na prática do ato de presentear. Farias (2001), aponta uma questão relevante no estudo do ato de presentear, “porque um ritual considerado relaxante e prazeroso deve ser tão torturante?”. A complexidade em compreender o real significado da troca de presentes pode ser visto como um dos motivos para a dificuldade na realização deste ato. A ambigüidade de sentimentos e definições envolvidos neste ato provocam a dificuldade de sua realização (Caillé (1998) e Godbout (1999) apud LOURENÇO, 2006). O processo de troca de presentes esta envolto em um universo de sentimentos. São sentimentos individuais, sentimentos compartilhados, sentimentos trocados. A capacidade que este ato tem de influenciar o aspecto emocional dos indivíduos talvez seja o seu grande segredo. Segredo este que pode proporcionar prazeres e danos (LOURENÇO, 2006). As emoções estão tão presentes na realização deste ato que podem extrapolar o valor do presente. Os sentimentos que são desencadeados ao longo do processo de troca de presentes podem ter consequências diversas em cada indivíduo. Um estudo publicado por Wooten (2000) apud Farias (2001) salientou que as pessoas ficam mais ansiosas quando estão motivadas a induzir reações desejadas em outro indivíduo, mas estão em dúvida se obterão sucesso. Quando alguém compra um presente para outra pessoa normalmente deseja que esta pessoa fique feliz ao receber o presente. Quando a reação do presenteado não é a que se imaginou um sentimento de insatisfação é desencadeado, podendo ter conseqüências no relacionamento dos indivíduos envolvidos. Outros aspectos que podem aumentar a dificuldade no ato de presentear são pertinentes a decisão do que comprar. A escolha do presente ideal é feita através do estudo de diversas variáveis. Podendo ser citados (i) o perfil do presenteado, (ii) a ocasião em que irá se presentear, (iii) o grau de intimidade entre os dois, (iv) o valor do presente, além de diversos outros fatores que podem ser utilizados para a determinação de um presente ideal. Esta decisão de compra pode representar para algumas pessoas a etapa mais difícil e torturante no ato de presentear. Sheth, Mittal e Newman (2001) citados em Prêto (2008), classificam o ato de presentear como um “consumo hedonista”, aquele que visa práticar o consumo de produtos ou serviços e a partir destes obter prazer, sensação de bem estar e não para resolver problemas no ambiente físico 76 O custo psíquico do presente é mais valioso do que o valor monetário pago pelo objeto. O custo psíquico envolve toda a pesquisa, toda a escolha, as dúvidas envolvidas na decisão pela compra de um presente que agrade o receptor. Este tempo gasto é valorizado no ato de presentear, pois representa a dedicação que o presenteador teve para com o presente do presenteado (PRÊTO, 2008). O que pode se perceber muitas vezes é que o presente pode ser apenas uma lembrancinha, o seu valor monetário pode ser baixo, porém o valor emocional transcende tudo isto. A satisfação em ser lembrado sobressai os aspectos financeiros envolvidos neste processo de troca. Os presentes diferem se de outros produtos normais de uma loja de departamentos justamente por estes objetos conter agregados a eles sentimentos, emoções, os valores sentimentais transcendem qualquer valor econômico (PRÊTO, 2008). Os presentes podem ser definidos como “objetos de amor”. Através de um presente sentimentos podem ser transmitidos, mensagens de carinho e afeto estão implícitas na prática deste ato em muitos casos( Belk e Coon citados em Prêto, 2008). Qualquer pessoa pode comprar algo, mas não é qualquer pessoa que pode dar algo (Belk e Coon apud Prêto, 2008). Este fato se deve as regras implícitas existentes na prática da troca de presentes. São diversos fatores implícitos e explícitos que podem definir o presente escolhido e o indivíduo que pode ser presenteado. A complexidade na compreensão da troca de presentes pode ser mais claramente percebida quando se leva em consideração os valores envolvidos na prática deste ato. Alguns valores foram elencados por Lourenço 2006 com base em diversos estudiosos que pesquisam o sistema de trocas simbólicas, sendo que alguns destes valores são a amizade, a benevolência, o caráter, a ética, o comprometimento, a confiança, a emoção, a estima, o respeito, a honra, entre outros valores. 4.6 DIMENSÃO PESSOAL E SOCIAL A troca de presentes é uma forma de doação de si realizada pelo presenteador para com o receptor do presente. A doação se efetiva quando o receptor aceita o presente e desta forma recebe a “essência espiritual” do doador. Esta troca e doação é a base para a criação, para manter e para acabar com laços de ligação entre os indivíduos (Belk e Coon (1993) apud PRÊTO, 2008). Os presentes contribuem para a socialização dos indivíduos, através da prática desde ato 77 as pessoas ficam mais propensas a serem incluídas em comunidades ou participar de determinados grupos. Os valores dos presentes ofertados já foi uma maneira encontrada para definir o poder que a pessoa possuía. Ofertas de presentes para reis, rainhas, para a nobreza, para membros da igreja, definiam o poder e a classe que estes teriam perante a sociedade. A troca de presentes como instituição social, desempenha um papel na economia e na vida social como um todo muito maior do que normalmente se imagina. Tanto em formações sociais anteriores ao capitalismo, quanto no próprio capitalismo. Os aspectos ligados a este ato influenciam as relações sociais, pessoais, políticas, econômicas entre outras esferas da sociedade (OLIVEIRA, 2009). O ser humano constitui-se como um feixe de relações, desempenhando múltiplos papéis e caracterizando-se por meio dos laços que estabelece, na família, no trabalho, nas diversas instâncias da organização social. E a ação de doar, a doação, seria o motor principal dessa constituição de laços (MAUSS apud MACHADO, 2004). As coisas jamais se separam completamente de quem as troca, a comunhão e a aliança que elas estabelecem no ato de trocar um objeto simbólico são relativamente indissolúveis. A permanência da influência das coisas trocadas é um símbolo da vida social que demonstra a maneira pela qual os subgrupos das sociedades tradicionais estão constantemente imbricados uns nos outros (LOURENÇO 2006, MAUSS apud LOURENÇO 2006). Através dos laços criados com outros indivíduos é que um ser humano se torna um ser social, que faz parte de algo maior, de um grupo, uma comunidade. A doação é um convite a fazer parte da vida de outra pessoa, como alguns estudiosos afirmam é uma doação de si para o outro. 4.7 DIMENSÃO ECONÔMICA A dimensão econômica atualmente está muito valorizada em nossa sociedade. Desde o trabalho ao lazer, das artes aos esportes, em tudo parece se encaixar a dimensão econômica. As relações humanas são fortemente influenciadas por aspectos desta dimensão (MACHADO, 2004). O ato de presentear também está ligado à economia, seja por questões de mercado, de lucros empresariais, como de aspectos do materialismo individual. A auto-afirmação pessoal através dos bens que são adquiridos, a busca da felicidade através de artigos comprados, são exemplos da dimensão econômica que um presente pode tomar. Alem das funções de auto-afirmação e de busca da felicidade através da compra de 78 presentes, existem os consumidores que adquirem presentes que possuem funções utilitárias, creditando a compra de presentes pelas suas vantagens funcionais (PRÊTO, 2008). A estrutura familiar, tamanho da família, ciclo de vida, educação e renda influenciam na probabilidade de dar presentes e nos valores gastos com este tipo de despesa (GARNER e WAGNER (1991) apud PRÊTO, 2008). Solomon (apud Farias 2001) expõe que para alguns pesquisadores a troca de presentes é tida como uma forma de troca econômica onde um doador realiza a transferência de um item de valor a determinado receptor, e este receptor de algum modo é obrigado a retribuir. A área de marketing tem dado enfoque especial para os aspectos econômicos envolvidos no ato de presentear objetivando com isto garantir cada vez mais o aumento nas vendas de presentes e principalmente o aumento na satisfação dos clientes que realizam as trocas de presentes. O percentual econômico envolvido na compra de presentes anualmente no comércio mundial representa um montante muito alto. Machado (2004), alerta que se por acaso fossem eliminados os motivos apresentados no calendário anual para a circulação de presentes, como são as datas comemorativas todos os setores da atividade econômica sofreriam um impacto brutal. 4.8 DIMENSÃO DA OBRIGAÇÃO A troca de presentes apesar de apresentar um caráter espontâneo e livre em sua realização também denota um caráter de obrigação. Os dois aspectos que este ato pode apresentar podem ser considerados duas posições distintas e não opostas de um mesmo espectro (PRÊTO, 2008). A troca de presentes apresenta um sentido de obrigação por conter implicitamente obrigações. Ao ofertar um presente a alguém, um processo é desencadeado que não termina na entrega do presente ao receptor. Existe uma tripla obrigação no processo de realização deste ato: dar, receber e retribuir. A retribuição talvez seja o aspecto que represente a maior obrigação neste ato, aquele que não retribui se sente em dívida com o seu presenteador e se vê obrigado a retribuí-lo em algum momento (MAUSS apud TAVARES 2006, FARIAS 2001). O ato de presentear pode ser entendido como algo espontâneo e obrigatório. Mesmo quando não se deseja explicitamente receber algo em troca com a oferta de um presente este sentimento fica implícito. No caso do receptor mesmo ele sabendo que não existe algo 79 formalizado que o obrigue a retribuir existe a regra implícita no ato (LANNA, 2000). Aqueles que se sentem obrigados a presentear experimentam um sentimento de culpa se não o fazem e presenteiam simplesmente para atender às expectativas dos outros, sentindo-se obrigados a retribuir por um presente recebido (FARIAS, 2001). Segundo Wolfinbarger (1990) apud Farias (2001), o comportamento de presentear por obrigação é motivado pela concordância com as normas sociais. Para não infringir as regras que regem este ato as pessoas retribuem mesmo que este ato não seja espontâneo. Mauss (2003) citado em Lourenço e Rezende (2008) afirma em seu Ensaio sobre a dádiva publicado em 1923, que nas sociedades mais tradicionais os presentes são formas de trocas e contratos, que em teoria são voluntários, mas na verdade são obrigatoriamente dados e retribuídos. Estudiosos do comportamento humano unidos a outros pesquisadores concluíram que presentes são “objetos de luxo” e que estes são utilizados como ferramentas para “comprar” interações sociais (FARIAS, 2001). Enquanto na dimensão simbólica os presentes são vistos como “objetos de amor” na dimensão de obrigação estes apresentam se como “objetos de luxo”. Esta visão distinta que pode se ter de um mesmo objeto por dimensões diferentes comprova a complexidade do ato de presentear. Dependendo do prisma que se observa as conclusões podem ser completamente divergentes. Em uma pesquisa realizada com 200 entrevistados em uma região metropolitana do Brasil (FARIAS, 2001), Farias comprovou que no Brasil a dimensão de obrigação em realizar uma troca de presentes representou apenas 3% do total pesquisado. Aspectos como demonstração de afeto, respeito, para obter satisfação, para proporcionar prazer receberam percentuais muito superiores. Farias (2001) salienta que este sentimento de obrigação em retribuir pode estar ligado a manutenção da relação. A troca de presentes cria um ciclo, o doador presenteia alguém, esta pessoa retribui o doador, o doador deseja retribuir pelo presente recebido e assim segue o ciclo, fortalecendo o laço afetivo existente entre os envolvidos. O ato de presentear pode ser obrigatório e desinteressado ao mesmo tempo. Mesmo sendo oposto o sentido de obrigação e liberdade se misturam na troca de presentes. Esta obrigação se exprime de maneira simbólica e coletiva (MAUSS 2003 apud LOURENÇO 2006). Após compreender melhor as dimensões envolvidas e existentes no ato de presentear, outro ponto a ser estudado é o entendimento dos motivos pelos quais alguém presenteia outra 80 pessoa. A compreensão desta etapa do processo de presentear é importante, pois poderão influenciar nas demais etapas. 4.9 MOTIVOS PARA PRESENTEAR ALGUÉM Os motivos pelos quais uma pessoa presenteia outra representam um ponto importante neste processo como um todo. A importância na determinação do motivo que induz um indivíduo a presentear é relevante, pois dependendo deste, a dificuldade na escolha do presente, os objetivos implícitos no ato e as conseqüências que este ato ocasionará sofrerão influencia. Beatty citado em Pepece elenca três motivos pelos quais normalmente uma pessoa presenteia outra: Para dar prazer; Para obter prazer; Ou somente por obrigação; A escolha de um presente objetivando proporcionar prazer para o outro ou para obter prazer pessoal são mais minuciosas do que aquela que é realizada somente por obrigação. Normalmente as trocas por obrigação estão mais ligadas a somente cumprir a função de oferecer um presente. Enquanto os presentes oferecidos objetivando o bem do próximo ou mesmo pessoais envolvem um processo mais complexo até a definição do presente ideal. Para Macklin e Walker (1988) citados em Lourenço e Rezende 2008 o ato de presentear é definido como a avaliação, a seleção e a transferência de objetos tangíveis ou não de uma maneira espontânea ou que caracterize uma obrigação. A caracterização espontânea de presentear envolve normalmente familiares, amigos, pessoas mais próximas ao indivíduo que oferecerá o presente. Estas trocas normalmente possuem um percentual de realizações superior ao das ofertas de presentes para pessoas com que não se tem tanta intimidade e afeto (LOURENÇO e REZENDE, 2008). A obrigação em presentear normalmente esta ligada a indivíduos com que não se tem um relacionamento íntimo, não existe afeto entre as partes, mas existem interesses em manter a relação existente. Um exemplo pode ser o convite para a festa de um colega de trabalho ou mesmo o seu chefe com quem você não possui tanta afinidade, mas deverá presentear pois o evento e as regras exigem isto. Outros pesquisadores elencam diferentes motivos pelos quais um indivíduo pode ser engajado no ato de presentear o seu próximo. Segundo Webster e Nottingham (2000) apud 81 Prêto 2008 o comportamento de presentear pode ser baseado em recompensas sentimentais, experimentais e subjetivas ou em desejos que visam alcançar benefícios funcionais. 4.10 ETAPAS DO PROCESSO DE PRESENTEAR Com a finalidade de diminuir a complexidade na compreensão do processo de presentear e proporcionar o conhecimento sobre as etapas envolvidas neste ato o pesquisador Sherry desenvolveu um modelo que oferece uma visão completa sobre a estrutura do processo de troca de presentes (SHERRY apud PRÊTO, 2008). Na teoria de Sherry o processo contém três fases: Gestação; Prestação; E reFórmulação. A primeira etapa conhecida como a fase da gestação corresponde a todo comportamento antecedente à real troca de presentes. Esta etapa envolve as definições do que poderia ser um presente bom para o presenteado. Estas definições podem ser obtidas através do conhecimento que o presenteador tem do receptor, tem de si mesmo e dos presentes que julgam apropriados para a ocasião. Além da definição do que comprar, o presente é adquirido nesta etapa. Então além de pesquisas particulares o presenteador realiza buscas externamente, no comércio, na internet ou através de recomendações de outras pessoas. A fase da prestação envolve a troca real do presente, nesta etapa serão conhecidas as sensações que o presente escolhido gera no presenteado bem como no presenteador. Os sentimentos desencadeados nesta etapa podem ser variados e acarretar em conseqüências completamente distintas. O resultado afetivo da troca de presentes pode variar entre satisfação, reconhecimento, descaso até decepção, entre outros resultados. As fases de gestação e prestação podem ser definidas como as etapas onde o custo psíquico definido por Prêto (2008) se torna mais evidentes. O custo psíquico conforme já explicitado é equivalente aos esforços despendidos em busca do presente ideal durante o processo de escolha, bem como durante o ato de entrega. Normalmente quando um indivíduo deseja presentear alguém especial planeja todos os detalhes possíveis, exatamente nestes planejamentos e na execução do plano se encontra o custo psíquico de um presente. A fase da reFórmulação é a fase final do processo em que através dos resultados obtidos com a troca influenciaram diretamente na realimentação e na reFórmulação da relação 82 existente entre as partes envolvidas. A etapa da reFórmulação compreende a etapa após a entrega do presente, onde já se sabe se o presente agradou ou não. A partir dos resultados obtidos nesta etapa que a ligação entre os envolvidos será mais influenciada. 4.11CONSIDERAÇÕES FINAIS A troca de presentes é um ato universal que influencia a vida do ser humano de diversas maneiras. Há muito tempo a prática deste ato é realizada em diferentes lugares do mundo, independentemente de raça e cultura. O simbolismo existente na troca de presentes é um dos principais responsáveis pela sua prática ao longo dos tempos e contínua realização. O fortalecimento dos laços afetivos entre os indivíduos envolvidos no ato de presentear é apenas um dos vários resultados que podem ser obtidos com esta prática. A capacidade de envolver diferentes dimensões em um único ato é uma das características da troca de presentes. Esta capacidade faz com que sejam diversas as definições sobre o significado do presente e da troca de objetos simbólicos As pesquisas nesta área estão crescendo devido a dimensão alcançada pela prática deste ato. São estudos nas mais diversas áreas que objetivam compreender como um ato tão contraditório em sua essência pode ser tão difundido na sociedade. A contradição existente nesta prática pode ser o segredo de seu sucesso, a liberdade e a obrigação, a felicidade e a decepção, a aflição e a tranqüilidade, a preocupação e o descaso, são apenas alguns exemplos das distinções que estão envolvidos em um mesmo processo. A essência existente na troca de presentes está na troca de sentimentos, o valor monetário gasto no presente é o que menos importa. O presente é um meio de fazer o bem para o próximo, por mais que existam diferentes objetivos implícitos ao presentear alguém, o que prevalece é o desejo de fazer o bem. Um presente é um objeto de amor. O que mais se prioriza no desenvolvimento de um protótipo de um sistema de recomendação de presentes é proporcionar uma maior facilidade na escolha do presente ideal. O próximo capítulo explica brevemente quais foram as tecnologias utilizadas no desenvolvimento do protótipo do sistema de recomendação. 83 5. ESTUDO DAS TECNOLOGIAS O presente capítulo objetiva contextualizar de forma breve as tecnologias utilizadas no desenvolvimento do protótipo do sistema de recomendação de presentes, posteriormente o próximo capítulo abordará os aspectos específicos da implementação. 5.1 HTML (Hypertext Markup Language) Segundo Graham (1998), o HTML é uma linguagem de marcação de hipertexto, que é usada para produzir páginas web. O HTML é a linguagem usada pelos navegadores para mostrar as páginas webs ao usuário, sendo hoje em dia a interface mais extensa na rede. 5.2 PHP (Hypertext PreProcessor) Segundo GUTMANS (2005), o PHP é uma linguagem de criação de scripts, que permite embutir fragmentos de códigos de páginas de HTML, código este que é interpretado e fornecido aos usuários finais. O PHP é uma linguagem de alto nível, livre, interpretada, possui tipagem fraca, oferece suporte a programação estruturada e orientada a objetos, multiplataforma, além de possuir capacidade de conexão com inúmeros bancos de dados. 5.3 MYSQL “O MySQL é um banco de dados compatível com a linguagem SQL Ansi. Ele oferece uma plataforma prática, rápida, eficiente, de fácil manuseio e extremamente confiável. Sua instalação pode ser obtida gratuitamente na Internet. Existem várias versões para as mais diversas plataformas.”(ZAGO, 2001). O MySQL é um banco de dados gratuito e bastante utilizado mundialmente. Para usá-lo, basta baixar o gerenciador para o sistema operacional desejado (site www.MySQL.com), instalá-lo. Segundo ZAGO (2001), o MySQL nasceu da insatisfação de algumas pessoas com o gerenciador msql. Essas pessoas desenvolveram novas interfaces com o banco e chamaramno de MySQL. 84 6. IMPLEMENTAÇÃO O presente capítulo apresenta as particularidades envolvidas na implementação de um protótipo de sistema de recomendação de presentes. Obter o conhecimento destas particularidades é importante, pois estes detalhes englobam os requisitos do sistema, o método de recomendação utilizado, a modelagem definida da base de dados. Primeiramente é realizada uma contextualização do problema estudado para melhor compreensão das dificuldades envolvidas. 6.1 O ATO DE PRESENTEAR A escolha de um presente pode representar um ato simples se for levado em consideração o fato de que ele é realizado com certa frequencia pelas pessoas. E normalmente atividades que possuem uma realização frequente tendem a ser mais fáceis. No entanto, o ato de presentear mesmo possuindo esta característica apresenta certas dificuldades no momento de sua realização. Uma das possíveis causas para estas dificuldades pode ser a existência de diversos aspectos que podem influenciar na escolha de um presente. Alguns destes aspectos são elencados a seguir: A ocasião O em que será entregue o presente; grau de intimidade com a pessoa que receberá o presente; Os gostos e preferências do receptor; A orientação religiosa do receptor; A localização A estação A idade geográfica do receptor; do ano em que ocorrerá o evento no qual será entregue o presente; do receptor; O sexo do receptor; E o valor que deseja se pagar pelo item para presentear; 85 Os itens acima devem ser considerados no momento da compra do presente, pois negligenciar um deles pode resultar em uma experiência desagradável tanto para o presenteado quanto para o presenteador. Um presente é a representação de uma relação entre duas pessoas, por isso errar na escolha pode ser algo prejudicial para o relacionamento dos indivíduos envolvidos. Segundo Oliveira (2009), é como se o ato de doar fizesse o indivíduo andar sobre o fio de uma navalha: a pessoa se doa para o outro, se está não a acolher, o sentimento será de traição, de decepção, engano. Além destes itens elencados existem outros que interferem na escolha de um presente, no entanto foram definidos somente estes para utilização no protótipo, pois com base em pesquisas realizadas estes foram considerados os mais relevantes. Uma das pesquisas na qual foi baseada a extração destes itens é a pesquisa de Pepece realizada em 2002 (PEPECE, 2002), no qual foram extraídos vários aspectos referentes ao ato de presentear. Para melhor assimilar a importância dos itens definidos com o ato de presentear cada um será descrito a seguir. A ocasião em que será realizada a entrega do presente é importante, pois dependendo da mesma, existem determinados itens que não são muito indicados. Por exemplo, em uma festa de 15 anos escolher um refrigerador como item para presentear a aniversariante não seria a melhor escolha, isto porque em uma ocasião destas normalmente presenteia-se a aniversariante com artigos mais de uso pessoal, como perfumes, jóias, uma roupa que seja parecida com o estilo da aniversariante, entre outros itens. O refrigerador poderia ser ofertado a alguém em um casamento, pois usualmente em casamentos os presentes são dados para o casal, não são artigos pessoais e como o novo casal está construindo uma nova vida, móveis, eletrodomésticos e eletrônicos podem ser bons presentes. Além da ocasião existem outros fatores que podem influenciar a escolha do presente, um deles é o grau de intimidade que se tem com a pessoa que o receberá. Se for considerada a situação onde deverá se presentear um colega de trabalho e outra onde o presente será entregue para o cônjuge, estas duas situações podem estar presentes em uma mesma ocasião, uma festa de aniversario, por exemplo, no entanto os itens para presentear um indivíduo que é apenas seu conhecido e os itens para presentear o seu cônjuge que é alguém mais próximo são diferentes. Outro fator importante que pode significar uma barreira na escolha de determinados itens para presentear é o gosto e as preferências do presenteado. Este aspecto representa uma 86 dificuldade porque pode-se não conhecer exatamente o gosto da pessoa e presentear com algo que a pessoa deteste. Por exemplo, o que se sabe sobre o gosto do presenteado é que o mesmo adora música, mas não se tem conhecimento de que estilos musicais ele prefere. Esta informação incompleta pode causar a escolha de um presente errado, seguindo com o exemplo o presenteado é um apaixonado por Elvis Presley, Bob Dylan, Beatles entre outros artistas neste estilo, no entanto o presenteador escolhe para presenteá-lo, o novo CD do Parangolé, uma banda baiana que não tem nada a ver com o gosto musical do presenteado. As chances de acertar o presente para alguém quando se conhece pelo menos algumas informações sobre os seus gostos e preferências auxilia muito na escolha de um presente ideal. Um aspecto que pode passar despercebido, mas que possui um alto grau de importância na escolha de um presente é a orientação religiosa do presenteado. Da mesma maneira como é inoportuno presentear um roqueiro com um CD de axé, é inconveniente presentear um evangélico com algum item que contenha imagens de santos, por exemplo, ou com um CD de funk. Dessa forma, é possível afirmar que existem alguns itens que não são convenientes para presentear de acordo com a orientação religiosa. Além da orientação religiosa, existe a localização geográfica da pessoa que será presenteada, o local onde ela vive. Cada local possui uma cultura, tradições, presentear alguém com um item que seja totalmente fora do contexto do local onde vive pode representar um constrangimento. Por exemplo, presentear um baiano com uma pala gaúcho, além de não representar um item comum no vestuário baiano o presente estaria em desacordo com outro aspecto que é a localização temporal. A localização temporal leva em consideração a estação do ano em que a troca de presentes se dará associada à localização geográfica. Na Bahia normalmente o clima é quente, mesmo nos meses em que a temperatura deveria cair, já no sul do Brasil o clima varia muito de acordo com a estação do ano. O pala gaúcho utilizado no exemplo poderia representar um bom presente se a região em que o presenteado morasse fosse o sul do país e ainda mais conveniente caso a estação do ano fosse o inverno ou outono. Neste contexto, um pala gaúcho poderia servir como um presente para o baiano ter como decorativo e não como um vestimenta de inverno. Um aspecto que determina um agrupamento e classifica os itens que podem ser utilizados para presentear ou não, é a idade. Baseado neste aspecto pode-se procurar o presente em determinados grupos específicos de itens, um exemplo claro disto são as crianças, é possível 87 identificar que o presenteado é uma criança pela idade e a partir disto verificar que brinquedos, artigos educacionais e vestuário são os melhores itens para presentear. Outro fator determinante na escolha de um presente é o sexo da pessoa que será presenteada, as diferenças entre os itens para os dois sexos são consideráveis. Segundo pesquisa realizada por PEPECE em 2002 (PEPECE, 2002), homens normalmente costumam ganhar itens que estejam ligados a produtos culturais e de lazer como CDs, livros, artigos esportivos, enquanto as mulheres são mais presenteadas com artigos de uso pessoal como roupas, calçados, cosméticos, jóias, perfumes. Isto pode ser verificado em um amigo secreto onde primeiro se compra o presente e depois é sorteado quem será o presenteado, desta maneira os presentes são artigos unissex, para garantir que não ocorrerá um constrangimento ao entregar, por exemplo, um par de brincos hippies para o cara mais machão da turma. Além de todos estes fatores já elencados, existe um que também faz a diferença na determinação de um presente, este aspecto é o valor que se pretende pagar. Ao possuir um valor pré- estabelecido o universo de possibilidades para escolha diminui, o que pode representar uma vantagem, pois quando não se trabalha com um valor especifico, existe uma quantidade maior de opções. Com base nestas informações pode-se dimensionar a complexidade envolvida na realização do ato de presentear. O protótipo proposto tenta gerenciar essas particularidades para assim realizar uma recomendação satisfatória para os usuários. A maneira pela qual o protótipo utiliza estes itens na definição de um presente ideal será melhor esclarecida no decorrer do capítulo. Baseado na descrição do problema estudado é apresentado os requisitos para a implementação do protótipo de sistema de recomendação de presentes. 6.2 REQUISITOS DO SISTEMA Segundo Sommervile (1997), requisitos são descrições de como o sistema poderá comportar-se, informações do domínio da aplicação, condições sobre operação de sistema ou, especificações de uma propriedade ou atributo de sistema. Os requisitos de um software podem ser divididos em dois, são eles os requisitos funcionais e os requisitos não funcionais. Sommerville (1997) define requisitos funcionais e não funcionais da seguinte maneira: Requisitos funcionais: entendem-se os fenômenos ambientais referentes ao negócio e domínio da aplicação que se queira conhecer e estudar, ou seja, o que fazer. São 88 escritos do ponto de vista do cliente. Normalmente são expressos em linguagem natural, diagrama informal ou usando alguma notação que é apropriada para o entendimento do problema. Requisitos não-funcionais ou especificações: entendem-se as especificações técnicas de como melhor adequar a solução do problema para responder ao cliente. A Tabela 8 apresenta os requisitos funcionais identificados na aplicação do protótipo. Já a Tabela 9 apresenta os requisitos não-funcionais. Requisitos Funcionais RF1 - O sistema deverá permitir o cadastro dos usuários no sistema; RF2 - Somente usuários cadastrados poderão buscar recomendações no sistema. RF3 - Obrigar o preenchimento de informações que são necessárias para realizar a recomendação. Como data de nascimento, sexo, algumas áreas de interesse, orientação religiosa, a cidade onde vive e algumas informações sobre sua personalidade. RF4 - Permitir que além dos dados que influenciam diretamente na escolha de um presente, o usuário cadastre seu nome, login e senha que será utilizado para permitir acesso ao sistema. RF5 - O sistema deverá solicitar que o usuário realize avaliação de alguns existentes na base de dados, com o intuito de saber mais sobre as preferências relacionadas ao usuário. RF6 - O sistema deverá permitir que o usuário realize constantemente as avaliações de itens e não apenas no momento de criação do perfil. RF7 - Permitir que as avaliações sejam realizadas pelo usuário, utilizando uma das quatro opções: “Não gosto”, “Gosto Pouco”, “Gosto” e “Gosto Muito”. RF8 - Os itens armazenados na base de dados possuirão características especificas, dentre elas um grupo e um subgrupo, por exemplo, o CD do ColdPlay está vinculado ao grupo CD subgrupo Rock. RF9 - O sistema deverá gerar uma lista com alguns itens para serem avaliados randomicamente, garantindo assim, que todos os itens das diversas categorias tenham avaliações. RF10 - O sistema deverá permitir que um usuário adicione amigos ao seu perfil. RF11 - Ao adicionar um amigo o sistema deverá controlar quando este indivíduo 89 está de aniversário e quando estiver próximo deste dia, sete dias antes disparar uma recomendação para o usuário que é amigo do aniversariante; RF12 - A recomendação poderá ser automática como no caso de um amigo aniversariante ou o usuário poderá buscar uma recomendação manualmente; A recomendação automática é efetivada da seguinte maneira, o protótipo controla quando o amigo vai fazer aniversario, quando o dia do aniversario estiver próximo é enviado um email para o usuário que é amigo do aniversariante informando sobre o aniversário e já contendo uma recomendação de presente. A definição de quantos dias antes da data festiva o email deve ser enviado será um dado definido pelo usuário no momento do cadastro. Já a manual, o usuário informa os dados necessários para a recomendação. RF13 - Os itens possuem características especificas: sexo, faixa etária, grau de amizade, áreas de interesse, estação do ano, região, orientação religiosa e ocasião. Estes dados permitem que seja criado cluster de itens, pois itens com características semelhantes serão mais indicados para determinado tipo de ocasião, ou para determinado sexo, determinada faixa etária assim com todas as demais características. RF14 - A definição da similaridade deverá ser realizada através do cálculo da distância euclidiana entre os itens da base de dados com os dados da ocasião de troca de presentes que são respectivamente: ocasião da troca de presentes, sexo do presenteado, faixa etária do presenteado, grau de amizade com o presenteado, cidade do presenteado, orientação religiosa do presenteado, áreas de interesse do presenteado, traços de personalidade do presenteado e a estação do ano em que ocorrerá a troca de presentes. Aqueles itens que obterem as menores distâncias serão recomendados para o usuário presenteador. O método da similaridade e o cálculo da distância euclidiana aplicados são apresentados no próximo tópico do capítulo. RF15 - Deverão ser definidos pesos para cada característica avaliada no cálculo da distância euclidiana, sendo que as particularidades levadas em consideração são as seguintes: ocasião da troca de presentes, sexo do presenteado, faixa etária do presenteado, grau de amizade com o presenteado, cidade do presenteado, orientação religiosa do presenteado, áreas de interesse do presenteado, traços de personalidade do presenteado e a estação do ano em que ocorrerá a troca de presentes. 90 RF16 - Após enviar a recomendação para o usuário o sistema devera solicitar que este avalie a recomendação que recebeu desta forma o sistema realizará recomendações de melhor qualidade; RF17 - O sistema deve permitir que seja realizada recomendação tanto para amigos do usuário, quanto para indivíduos que não estão cadastrados, neste caso o usuário presenteador devera preencher todas as informações necessárias para a realização da recomendação que são: ocasião da troca de presentes, sexo do presenteado, faixa etária do presenteado, grau de amizade com o presenteado, cidade do presenteado, orientação religiosa do presenteado, áreas de interesse do presenteado, traços de personalidade do presenteado e a estação do ano em que ocorrerá a troca de presentes. RF18 - O usuário poderá pesquisar por outros usuários do sistema para poder adicioná-los a seu perfil, a busca é efetuada pelo nome do usuário que se deseja encontrar; RF19 - O usuário poderá editar o seu perfil, caso ache necessário a atualização de alguma informação; RF20 - O sistema deverá buscar informações da tabela de compras do usuário para melhor definir o seu perfil na aplicação e melhorar as recomendações para este; RF21 - O sistema deverá permitir que o usuário avalie quantos itens quiser, sempre que tiver vontade; Tabela 8 – Requisitos Funcionais do protótipo Requisitos Não funcionais RNF1 - Interface amigável, utilizando conceitos de ergonomia e usabilidade. RNF2 - Para gerar as recomendações de itens com base no perfil do usuário, o sistema deverá possuir um mecanismo de similaridade entre itens, o perfil do usuário e os dados da ocasião de troca de presentes. Esta similaridade será buscada através das características que cada item possui. Tabela 9 – Requisitos Não Funcionais do protótipo. As particularidades existentes na modelagem do projeto, bem como os métodos de filtragem, de definição de similaridade e o cálculo aplicado para determinar a escolha dos presentes ideais são descritos a seguir. 91 6.3 MÉTODO DE FILTRAGEM DO PROTÓTIPO Segundo Albuquerque (2008), a principal diferença encontrada entre os sistemas de recomendação é a técnica utilizada para realizar a recomendação. Dentre as três técnicas existentes, filtragem baseada em conteúdo, filtragem colaborativa e filtragem híbrida (para maiores detalhes veja Capítulo 2) a escolhida para o desenvolvimento do protótipo de recomendação de presentes foi a FBC – Filtragem baseada em conteúdo. Levando em consideração que está técnica trabalha com o relacionamento entre as características existentes entre os itens e o perfil do usuário, optou-se pela mesma no protótipo proposto. Isto porque após realizado o levantamento de requisitos foram identificadas características que relacionam os indivíduos aos itens utilizados para presentear. Além da verificação das características entre os itens e os usuários o protótipo também leva em consideração outros fatores que influenciam diretamente a escolha de um presente, como por exemplo, a ocasião em que será entregue o presente. Este é um fator que não é pertinente ao usuário, mas sim ao ato de presentear e por isto deve ser relacionado aos itens da base de dados. Essas características foram modeladas para um banco de dados relacional que será apresentado a seguir. 6.4 MODELAGEM DA BASE DE DADOS Algumas das variáveis envolvidas no ato de presentear já foram anteriormente elencadas e na base de dados essas variáveis se tornaram tabelas apresentadas na Tabela 10. Área de interesse Personalidade Faixa etária Sexo Orientação religiosa Região Grau de amizade Ocasião Estação do ano Tabela 10 – Aspectos envolvidos no ato de presentear Todas as tabelas elencadas na Tabela 10 possuem ligação com as tabelas de item e usuário respectivamente, isto porque é através dos dados armazenados nestas tabelas que o 92 protótipo irá realizar as inferências para gerar a melhor recomendação possível. No caso da tabela de Produtos que na base de dados foi nomeada de Item, a modelagem está representada na Figura 13. Figura 13 – Modelagem desenvolvida para controle dos itens da base de dados Como pode-se perceber na Figura 13, a modelagem da tabela Itens possui nove tabelas associativas, justificadas pela possibilidade que os itens possuem de preencher mais de uma característica armazenada em cada uma das tabelas. Por exemplo, um item pode estar relacionado com mais de uma orientação religiosa, com mais de uma faixa etária, mais de uma região, da mesma forma com as outras tabelas das quais foi criado uma associativa. A modelagem definida objetiva abranger todos os pontos levantados sobre os aspectos que interferem na escolha de um presente,segue uma breve explicação sobre algumas das tabelas criadas e apresentadas na Figura 13. Tabela item_areainteresse: armazena quais são as áreas de interesse relacionadas ao referido item, por exemplo o livro “Dylan – A Biografia” pode ser associado à área de interesse música, rock, blues, folk, arte entre outras áreas. Através destes dados relacionados a este item ao realizar uma recomendação para um usuário que possua 93 áreas de interesse iguais as armazenadas no livro as chances desse item ser recomendado aumentam com relação aos outros itens. Tabela item_religião: devido à existência de certas restrições no consumo de determinados produtos para algumas religiões especificas se faz necessária a identificação da orientação religiosa que o item possui uma ligação. Um exemplo simples e de fácil compreensão é a oferta de um item que possua imagem de alguma entidade santificada pela igreja católica para um indivíduo evangélico. O problema neste caso está exatamente na ligação existente entre o item e o indivíduo que lhe recebe, evangélicos não crêem em santos, isto é algo próprio dos católicos. Tabela item_região: segundo Bezerra (2004) um problema existente nas aplicações de sistemas de recomendação é o fato de não ser levado em consideração à localização geográfica do usuário. Este dado é importante para a recomendação porque pode interferir diretamente no resultado, mais ainda quando se trata da escolha de um presente. Um baiano poderia se sentir frustrado ao receber de presente um kit chimarrão, pois é algo que não está ligado a cultura e as tradições do local em que ele vive, ao contrário de um gaúcho onde a probabilidade de agradar ofertando um presente destes é bem maior. Tabela item_estacaoano: Bezerra (2004) ressaltou , também, a falta de controle sobre os aspectos ligados as dimensões temporais nos sistemas de recomendação. No protótipo foi utilizado como aspecto de avaliação a estação de ano em que ocorrerá a troca de presentes. A estação do ano engloba a dimensão temporal pois refere-se a um período especifico. A principio pode parecer algo irrelevante, mas se for analisado este aspecto influencia na escolha de um presente principalmente nos casos em que o presente é dado objetivando que este seja útil. Um exemplo disto pode ser quando se escolhe como presente um cobertor térmico no inverno, é possível dizer que a escolha objetivou suprir uma necessidade da estação e proporcionar conforto ao indivíduo que recebeu, no entanto se este mesmo produto fosse oferecido no verão à percepção poderia ser de descaso, pois não foi levado em consideração a utilidade daquele item no momento. Este controle acontece com as demais tabelas associativas criadas na modelagem pois é necessário identificar que características são pertinentes ao item e armazenar estes valores na 94 tabela associativa para posterior utilização no processo de recomendação. Um questionamento que pode ser levantado quanto à efetivação da modelagem desta maneira normalizada refere-se ao desempenho da aplicação. Devido ao número considerável de tabelas associativas e a conseqüente necessidade da utilização de junções nas consultas à aplicação pode pecar em desempenho. No entanto mesmo com o conhecimento sobre esta problemática optou-se por não desnormalizar a tabela de itens por se tratar de um protótipo de ambiente acadêmico e não comercial e, a princípio, as consultas ao banco não irão afetar tanto a aplicação. Outro ponto levado em consideração ligado ao ambiente acadêmico que justifica esta normalização é de que esta formalização da base é um principio defendido por diversos professores da área de banco de dados, mesmo que um número considerável de profissionais defendam que na “realidade” isso não se aplica a todas as bases. A Figura 14 apresenta a modelagem referente aos aspectos do usuário. Figura 14– Modelagem desenvolvida para controle dos dados dos usuários 95 A Figura 14 apresenta a modelagem para controle de usuários, quase todas as tabelas que estão relacionadas aos itens também estão ligadas a tabela Usuário, isto porque é através da definição da similaridade entre os itens e o perfil do usuário que o processo de recomendação realiza suas tarefas. As únicas tabelas que não estão relacionadas no usuário e aparecem nos itens são a Estação do ano, a ocasião e a faixa etária. A tabela Faixa Etária não foi relacionada ao usuário diretamente, pois através da data de nascimento o sistema obtém a idade do usuário e pode comparar com a faixa etária do item, as outras duas tabelas não são relacionadas porque não possuem ligação com perfis de usuários. São dados importantes que necessitam apenas serem correlacionados aos itens da base de dados. Além da definição da similaridade entre as características dos itens com o perfil do usuário existe outro dado que pode definir se o item irá agradar ou não ao usuário que irá receber o presente: a avaliação que o usuário realizou dos itens da base de dados. A Figura 15 ilustra como foi modelado o mecanismo de avaliação de itens na base de dados do protótipo. Figura 15 – Modelagem referente as avaliações de itens por usuários O usuário pode avaliar o item escolhendo entre uma das opções cadastradas na tabela Avaliação que são: não gosto, gosto pouco, gosto e gosto muito ou atribuir uma nota para o item que pode variar entre zero e 10. Através das avaliações do usuário pode-se ter o controle, 96 por exemplo, em uma situação onde o item que resultou na recomendação é um que o usuário demonstrou não gostar o sistema já retira este da lista de recomendados. Após definir a modelagem de toda a base de dados é necessário popular as tabelas, o que pode parecer uma tarefa simples somente de inserção de dados é algo mais complexo, pois envolve os dados que serão utilizados para definição das similaridades no protótipo. A seguir é melhor explanado sobre a definição do método escolhido para o cálculo das similaridades entre os itens da base de dados. 6.5 MÉTODO DE DEFINIÇÃO DA SIMILARIDADE A definição da similaridade é algo essencial em um sistema de recomendação. A definição do método a ser utilizado na aplicação influência na maneira como os dados devem ser armazenados na base. No presente trabalho o método escolhido é o da distância euclidiana. A distância euclidiana é um método bastante conhecido para calcular a distância entre dois pontos A e B em um espaço n-dimensional. (Neto, Moita, 97). A fórmula do cálculo da distância euclidiana é o seguinte: Figura 16 – Fórmula da distância Euclidiana Para definir a similaridade entre estes dois pontos é aplicada a fórmula da distância euclidiana que consiste em obter uma coordenada de um dos pontos (p) subtrair pela coordenada referente do outro ponto (q) e elevar o resultado ao quadrado. Isto é feito para todos os atributos existentes, depois se soma o resultado da exponenciação de cada um e tirase a raiz quadrada. O resultado da fórmula é sempre um número positivo, quanto mais próximo de zero este número estiver maior é a similaridade entre os dados pesquisados. Para melhor compreensão de como esta fórmula será utilizada no protótipo será exemplificada uma situação. Por exemplo, para medir a similaridade entre um usuário e o novo CD do cantor Benjamin Del Shreve, será utilizado no cálculo dois atributos presentes no CD que também existem no perfil do usuário, são eles a área de interesse e a faixa etária. O valor do atributo área de interesse no CD equivale ao valor 7 que representa Folk Rock, já no perfil do usuário este mesmo atributo possui o valor 2 que representa a área de interesse Música Pop. 97 Quanto à faixa etária o usuário possui 8 cadastrado em seu perfil que equivale a idades de 15 a 20 anos, o CD de Benjamin possui o valor 12, equivalente a idades acima de 40 anos. A partir dessas informações será calculada a distância entre esses dois pontos referentes ao CD e ao perfil do usuário. O resultado final depois de aplicada a fórmula foi de 6.40, o que representa uma distância considerável entre o item calculado e o perfil do usuário. Boas distâncias para recomendar são aquelas que se aproximam mais do valor 0 até o valor 3. Isto porque esses valores demonstram que existe uma similaridade entre os itens avaliados, portanto pode ser interessante a recomendação dos mesmos. Conforme mencionado a determinação do método de cálculo da similaridade pode implicar em algumas restrições ou exigências na modelagem ou inserção de dados na base. No caso do protótipo o método escolhido foi o da distância euclidiana, como visto anteriormente a fórmula trabalha com valores numéricos, portanto os dados de todos os elementos utilizados no protótipo que vão determinar a recomendação devem ser transformados em números. A transformação dos dados da base em atributos numéricos pode ser chamada de discretização. A discretização de dados converte um atributo contínuo da base de dados em um atributo discreto. Esta transformação é necessária para garantir que a similaridade possa retornar valores realmente pertinentes e reais. Voltolini (2007) defende que a discretização de dados proporciona um pré-processamento em bases de dados que serão utilizadas em aplicações de mineração de dados, pois promove uma compreensão mais rápida dos itens nela armazenados. No protótipo, a discretização dos dados é aplicada no atributo código das tabelas da base de dados. A discretização aplicada deve ser efetivada da seguinte maneira, por exemplo, na tabela de áreas de interesse armazenar os dados que são mais semelhantes como música, arte, cinema com códigos próximos, outro exemplo também referente à área de interesse armazenar rock, folk, blues, jazz com códigos mais próximos e distantes por exemplo de axé, pagode, samba. Desta maneira deve ser a inserção em todas as tabelas da base de dados seguindo esta padronização. O que objetiva-se com esta forma de inserção é um melhor desempenho na aplicação da distância euclidiana como forma de definição da similaridade bem como uma maneira de encontrar itens que sejam parecidos com o que o usuário pode gostar. Um caso que pode acontecer é de nenhum item casar exatamente com os dados repassados para a realização da 98 recomendação, mas existirem itens parecidos com o perfil do usuário. Ao aplicar a distância euclidiana estes itens não estariam exatamente próximos ao zero, que significa a menor distância, mas obteriam uma distância razoavelmente boa, suficiente para serem recomendados. Isso pode acontecer, por exemplo, para um usuário que seja muito fã de blues, a base pode não ter armazenado nenhum item especifico de blues, mas conter outros de jazz, rock, folk e estes agradarem ao usuário. Estes itens poderão ser indicados para o usuário devido à padronização dos códigos, eles não terão exatamente o código referente ao Blues, mas serão próximos, o que resulta em uma distância euclidiana menor. A Figura 17 apresenta alguns dados armazenados na base que estão padronizados para melhor entendimento. Figura 17 – Tabelas Religião, Região e Sexo padronizadas na base de dados Conforme pode ser observado na Figura 17, procurou-se identificar primeiramente quais valores possuíam similaridades e após isto atribuir aos mesmos códigos com valores próximos. No caso da tabela de sexo os dois códigos possuem valores consideravelmente distantes por representarem algo que não é semelhante, que caracteriza certa segmentação. Pois existem itens que são voltados para o público feminino e outros para o público masculino, por exemplo, um colar de pérolas é voltado para as mulheres enquanto um kit de barbear é direcionado ao público masculino. A tabela Região seguiu o mesmo raciocínio para agrupar pelas regiões mais próximas umas das outras, o que pode caracterizar que regiões mais próximas podem possuir características em comum. A mesma lógica foi aplicada na tabela de religião bem como em 99 todas as outras tabelas do banco de dados. Conforme apresentado até o momento o ato de escolher um presente possui diversos fatores que interferem na definição do item mais adequado. No entanto existem alguns fatores que são mais relevantes do que outros para a escolha do presente. Com base na pesquisa realizada por Pépece (2002) foi definido a relevância do fator na determinação da escolha de um presente. Para determinar a relevância os fatores foram pontuados de um a cinco. A Tabela 11 apresenta a relação de fatores considerados com as suas respectivas pontuações. Fator Ocasião Sexo Região Orientação Religiosa Faixa Etária Grau de amizade Áreas de Interesse Personalidade Estação do ano Pontuação 0.5 0.5 0.3 0.4 0.4 0.4 0.5 0.3 0.3 Tabela 11 – Pontuação de acordo com a relevância do fator na determinação de um presente Na aplicação do protótipo do sistema de recomendação de presentes, o cálculo da distância euclidiana foi alterado, objetivando retornar somente os itens que sejam realmente pertinentes para o usuário. A diferença está na utilização dos valores definidos na Tabela 11 para pontuar cada fator no cálculo da similaridade, para melhor compreensão do cálculo definido a Tabela 12 apresenta uma legenda com as variáveis utilizadas no exemplo da distância euclidiana aplicada no protótipo. As variáveis representam as características avaliadas nos itens, no perfil do usuário e nos fatores que influenciam a determinação de um presente ideal, como a ocasião e a estação do ano. Significado Sexo do item Sexo do usuário Ocasião da troca de presente Ocasião do item Região do usuário Região do item Orientação Religiosa do usuário Sigla SI SU O OI RegU RegI RU 100 Região do item Faixa etária do usuário Faixa etária do item Grau de amizade com o usuário Grau de amizade do item Área de interesse do usuário Área de interesse do item Personalidade do usuário Personalidade do item Estação do ano ocasião Estação do ano item RI FU FI GU GI AU AI PU PI EO EI Tabela 12 – Tabela legenda das características avaliadas no cálculo da distância euclidiana Utilizando todas as características elencadas foi definida a nova fórmula do cálculo da distância euclidiana aplicado no protótipo. A Figura 18 exibe a fórmula. Figura 18 – Fórmula da distância euclidiana aplicada no protótipo. Na fórmula da distância euclidiana é apenas calculada a distância entre dois pontos, elevado o valor obtido ao quadrado e depois calculado a raiz quadrada do valor. Para os cálculos de similaridade no protótipo foi criada uma nova maneira de calcular, a fórmula aplicada no protótipo se difere no cálculo ao aplicar o fator de relevância na fórmula. A definição desta fórmula pretende fazer com que itens que possuam uma distância pequena com o perfil do usuário em fatores não tão importantes na escolha de um presente não sejam recomendados caso possuam uma distância consideravelmente grande em fatores mais importantes na escolha de um presente. Por exemplo, caso um item consiga obter a distância zero no fator estação do ano, que é o melhor valor que pode ser obtido, mas nos fatores ocasião, sexo, faixa etária e grau de amizade, ele possui uma distância maior provavelmente este item não será recomendado. Isto porque através dos fatores de relevância que também podem ser entendidos como pesos, assegura-se que os fatores mais importantes serão levados em consideração com mais relevância na aplicação. A Figura 19 apresenta, em pseudo-código, o algoritmo de recomendação 101 implementado no protótipo. A recomendação no protótipo pode ser realizada para usuários cadastrados ou não, desta forma o protótipo busca os dados para realizar o processo de recomendação de maneira diferente nos dois casos. A Figura 19 ilustra as duas situações. Figura 19 – Esboço do funcionamento do algoritmo de recomendação aplicado ao protótipo A diferença existente entre as duas formas de recomendação está na busca dos dados que são utilizados no processo. No caso da recomendação com usuário cadastrado é necessário a verificação das avaliações realizadas pelo usuário presenteado sobre os itens da base de dados, isto para garantir que um item avaliado negativamente pelo usuário não lhe seja recomendado. 102 Segundo Lichtnow (2009), um sistema de recomendação deve ser capaz de prever o que pode ser de interesse do usuário, deve ir ao encontro do usuário sem que este necessariamente busque pela aplicação. No protótipo, o que foi implementado para assegurar essa capacidade exigida em um sistema de recomendação é o envio de recomendações por email para os usuários. Esta recomendação por email se difere daquelas oferecidas ao usuário no protótipo, pois não é necessária a participação do mesmo para que ela ocorra. Quando o usuário realiza o cadastro na aplicação é solicitado se o mesmo deseja receber recomendações por email, caso o usuário responda afirmativamente receberá emails com informações sobre amigos que estão de aniversário, sobre datas comemorativas próximas e junto destas informações recomendações para cada situação. Os emails são enviados com uma semana de antecedência para os usuários, toda meia noite de domingo é disparado um comando no protótipo que realiza algumas verificações e realiza as recomendações. A recomendação pode ser realizada através da busca por ocasiões que acontecerão nos próximos 7 dias ou através da busca por usuários que estejam de aniversário na próxima semana. Para melhor compreensão as Figuras 20 e 21 apresentam, em pseudo-código, como esse processo ocorre. Figura 20 – Esboço do processo para recomendar por email buscando por ocasiões 103 Figura 21 – Esboço de recomendação por email através da busca por aniversariantes Após expor algumas particularidades do funcionamento do protótipo serão exibidas as principais interfaces desenvolvidas para a aplicação. 6.6 TELAS DO PROTÓTIPO Tela de login: A tela inicial (Figura 22) do sistema traz a opção do login para usuários já cadastrados e a opção de cadastro para usuários que ainda não possuam perfil na aplicação. A tela exibe uma mensagem que objetiva demonstrar ao usuário a importância do ato de presentear e qual o objetivo do protótipo. 104 Figura 22 - Tela de login do protótipo Tela de cadastro de usuário A tela de cadastro do usuário (Figura 23) onde devem ser informados os dados do usuário. Todos os campos são de preenchimento obrigatório, isto se deve a importância desses dados no processo de recomendação. Os dados solicitados são nome, email, data de nascimento, estado civil, sexo, cidade, orientação religiosa, áreas de interesse, aspectos da personalidade, login, senha e uma foto. Após informar os seus dados pessoais o usuário deve realizar a avaliação de alguns itens para melhor definição de seu perfil. A tela de avaliação é exibida na Figura 23. 105 Figura 23 – Tela de cadastro de usuário na aplicação. Tela de avaliação de itens Os itens exibidos para o usuário avaliar são escolhidos através de uma pesquisa para retornar pelo menos um item de cada grupo de produtos cadastrados na base de dados. Por exemplo, retornar pelo menos um CD, um DVD, um livro, um artigo de uso pessoal, um artigo ligado a tecnologia, entre outros grupos. O usuário deve realizar obrigatoriamente a avaliação de pelo menos 5 itens ao criar o seu perfil. O usuário poderá depois de criado o perfil avaliar itens sempre que desejar através de opção no menu principal. A Figura 24 apresenta a tela onde são realizadas as avaliações. 106 Figura 24 – Tela de avaliação de itens Tela do perfil do usuário Os usuários cadastrados, ao realizarem o login, terão acesso tela de perfil (Figura 25). A tela de perfil do usuário exibe as informações cadastradas no seu perfil, bem como lista os amigos adicionados por ele no aplicativo, além de listar os novos itens adicionados a base de dados. As listagens dos amigos e dos novos itens da base de dados de forma destacada garantem uma facilidade de acesso a informações pertinentes para o usuário. Desta forma é poupado o tempo de pesquisa e o usuário tem acesso a informações mais rapidamente. A tela do perfil do usuário permite acesso a todas as outras funcionalidades do aplicativo através do menu exibido na parte superior da tela (Figura 26). 107 Figura 25 – Tela de perfil do usuário Menu da aplicação A opção Inicio leva o usuário para a primeira tela do sistema, onde são exibidos os seus dados pessoais, os amigos e os novos itens adicionados a base de dados. A interface é a mesma do perfil do usuário, no entanto existe uma pequena diferença no que diz respeito à edição dos dados do usuário que somente são permitidas ao utilizar a opção Perfil do menu. A opção Recomendação deve ser utilizada quando se deseja receber uma recomendação de presente, mas o usuário não está cadastrado na aplicação. Neste caso o usuário presenteador deverá informar os dados necessários para que a recomendação possa ser gerada. A opção Avaliar disponibiliza para o usuário o formulário de avaliações dos itens, a opção Amigos lista todos os amigos do usuário, a Pesquisar Amigos disponibiliza uma busca para o usuário procurar outros amigos cadastrados. 108 Figura 26 – Menu do aplicativo Tela de Recomendação sem usuário: Todas as opções exibidas na Figura 27 estão ligadas com os fatores que influenciam na escolha de um presente, (sexo do presenteado, faixa etária, orientação religiosa, região em que vive áreas de interesse, entre outras). Por representar aspectos muito relevantes na escolha de um presente todos os campos deveriam ser de preenchimento obrigatório, no entanto existem alguns dados que podem ser difíceis do usuário presenteador ter um conhecimento concreto, por exemplo, as áreas de interesse ou até mesmo a definição da personalidade do usuário presenteado. Além dos dados sobre o usuário presenteado e aspectos ligados a ocasião de troca presentes o usuário presenteador pode informar também uma faixa de valores que deseja pagar pelo presente. Esses dados dos valores não são obrigatórios, mas caso o usuário os informe a pesquisa é mais especifica, pois restringe a somente itens que possuírem valor entre a faixa informada. 109 Figura 27 – Interface da tela de recomendação sem usuário Após informar os dados o usuário deve clicar no botão Gerar Recomendação que ativa o formulário que retorna os itens compatíveis com os dados informados, a Figura 28 exibe a respectiva interface do formulário. Tela de itens recomendados: Os itens exibidos são os que retornaram as menores distâncias no cálculo de similaridade com os dados informados pelo usuário presenteador. Sempre serão exibidos os 6 primeiros colocados, no entanto o usuário é informado se a recomendação retornou mais dados, caso a recomendação possua outros itens o usuário pode visualizá-los. Após receber a recomendação o usuário deve avaliar a mesma, tendo como opções: Não gostei; Gostei; Gostei muito; 110 Desta forma é possível saber se as recomendações estão agradando ou não os usuários do aplicativo. Esta mesma interface é exibida caso a recomendação seja realizada para um usuário que já exista na base de dados, a única diferença é o modo como o usuário busca a recomendação. Figura 28 – Interface dos itens recomendados Tela de recomendação com amigo: Para recomendar para um amigo o usuário deve selecioná-lo e definir uma faixa de valores que deseja pagar pelo presente, além de indicar qual é a ocasião que será entregue o presente. A Figura 30 exibe parte da interface desta tela, a tela com o resultado da recomendação com os itens resultantes da pesquisa é a mesma da Figura 29. Figura 29 – Interface de recomendação com amigo cadastrado. 111 Tela pesquisar amigos: Caso o usuário deseje encontrar outros amigos na aplicação este pode utilizar a opção no menu Pesquisar Amigos. A opção disponibiliza ao usuário a tela representada na Figura 31, onde é exibida uma lista com todos os usuários cadastrados na aplicação e uma opção para pesquisa pelo nome do amigo. A tela possibilita ao usuário a opção para adicionar os usuários listados, a tela para adicionar amigos é exibida na Figura 30. Figura 30 – Interface de pesquisa de amigos. Tela para adicionar amigo: Quando o usuário vai adicionar o amigo é necessário que o mesmo informe qual é o grau de amizade entre ambos, esta informação é importante para a recomendação por isto é obrigatória. Figura 31 – Interface para adicionar amigos. 112 Tela de informações do amigo: Após adicionar um amigo o usuário pode ter acesso a apenas dois dados sobre o amigo adicionado: a data de aniversário e o grau de amizade . Os demais dados são disponibilizadas pois são particulares da pessoa cadastrada e são utilizados de maneira automática pelo protótipo. Optou-se por apenas exibir estas informações devido à questão de privacidade no aplicativo. A proposta do protótipo é realizar recomendações e não ser uma rede social que compartilhe os dados dos usuários. A Figura 32 exibe a interface do detalhamento dos dados do usuário. Figura 32- Interface com os dados detalhados de um amigo. Tela mais detalhada de avaliação de itens: Além de avaliar determinada quantidade de itens ao criar o cadastro na aplicação o usuário pode realizar avaliações sempre que desejar. Os novos itens adicionados na base de dados ficam disponíveis em todas as páginas e os demais itens podem ser acessados através do menu na opção Avaliar. Ao acessar esta opção serão disponibilizados todos os itens existentes na base de dados, o usuário pode pesquisar e avaliar somente o que desejar, a Figura 33 detalha as opções disponíveis na avaliação de um item. Figura 33 – Detalhe da interface de avaliação de itens. Após a explicação dos métodos definidos e implementados no protótipo e da exposição 113 das interfaces do sistema será descrito um estudo de caso para compreensão do funcionamento do sistema efetivamente. 6.7 ESTUDO DE CASO Suponha dois usuários do sistema: US1 e US2, respectivamente. US1 é do sexo feminino e já está cadastrado na aplicação, US2 gostaria de dar um presente para US1 e não está cadastrado. Então ele cria seu perfil no sistema informando todos os seus dados pessoais como sua idade, seus gostos e preferências, seu sexo, sua orientação religiosa, a cidade em que reside, entre outros dados. Logo após a criação da conta o usuário US2 deve realizar a avaliação de alguns itens armazenados na base de dados. As avaliações realizadas ajudarão na construção do perfil do usuário. Passada esta etapa, US2 poderá realizar uma busca de amigos que já estão cadastrados e ao encontrar US1 ele a adiciona em sua lista de amigos informando qual o grau de amizade entre eles. A definição do grau de amizade é importante, pois é um fator que influencia diretamente na escolha de um presente. Após adicionar a usuária US1, o usuário US2 pode solicitar uma recomendação de presentes para a nova amiga. Ao solicitar a recomendação US2 informa uma faixa de valores (mínimo - máximo) que deseja pagar pelo presente e qual a data comemorativa será entregue o presente. Com base no perfil da usuária US1, na ocasião informada e o grau de amizade entre US1 e US2, o sistema verificará quais os itens na base de dados que mais se adequam e os recomendará. Ao receber a recomendação o usuário US2 poderá avaliar a recomendação recebida, informando se gostou ou não gostou. Esta avaliação auxilia no aprimoramento das recomendações realizadas pelo sistema. 114 7. CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS Após a realização de toda pesquisa bibliográfica, planejamentos e implementação pode-se concluir que a relevância na escolha de um presente levando em consideração dados do perfil do usuário garante a eficácia da recomendação. Podendo ser destacado também a relevância de outros aspectos que o sistema utiliza para a determinação de um presente ideal, como a ocasião de troca do presente, o grau de amizade com o presenteado e o valor que deseja-se pagar. Ao utilizar todo o conjunto de fatores que influenciam para estabelecer a recomendação o sistema apresenta o seu diferencial. Diferencial este que o torna uma ferramenta confiável. Outro ponto que pode ser destacado na aplicação está relacionado ao calculo da similaridade desenvolvido para o sistema. A principio o mesmo pode ser compreendido como uma simples equação matemática, no entanto a modificação realizada na fórmula da distância euclidiana fazendo com que está trabalhasse com pesos e dessa forma aplicasse a relevância foi o que possibilitou que as recomendações apresentadas fossem satisfatórias. Destaca-se como a principal contribuição desta monografia para a área de Sistemas de Recomendação a definição de como determinar e incluir no processo de recomendação a autoridade (relevância), uma vez que muitos dos sistemas atuais não trabalham com este conceito. A aplicação não é um sistema completo, é apenas um protótipo de recomendação de presentes por isso existem diversos pontos que podem ser melhor explorados, expandidos. o Estudo de um método de filtragem hibrido para ser aplicado ao protótipo combinando o método que já está sendo utilizado com outro existente, objetivando a melhora nas recomendações; o Criar método de avaliação dos itens por comentários escritos pelos usuários e utilizar técnicas de text mining para obter dados interessantes para incrementar o perfil dos usuários; o Integração com outros aplicativos, por exemplo, redes sociais, sites de e-commerce e outras aplicações que possam se interessar pelo sistema de recomendação de presentes. Tornando assim o sistema 115 de recomendação parte de algum universo e não apenas um sistema isolado; o Melhoria da interface do protótipo, estudar mais profundamente aspectos para melhor apresentação do sistema; o Interagir com sites de e-commerce para buscar itens para recomendação; o Criar um Web Service para vender a solução para outros sistemas; 116 8. REFERÊNCIAS BIBLIOGRÁFICAS BARCELLOS, Carlos Duarte. Et al. Sistema de Recomendação Acadêmico para Apoio a Aprendizagem. In: XI Ciclo de Palestras Novas Tecnologias na Educação. Porto Alegre, 2007. BURIN, Paulo. Sistema de Recomendação Baseado na Arquitetura Multiagente. Universidade Luterana do Brasil, 2007. BRESSLER, Fábio. Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de uso do usuário. Universidade do Vale do Rio dos Sinos. São Leopoldo 2004. BEZERRA, Byron Leite Dantas. Uma Solução Em Filtragem de Informação Para Sistemas de Recomendação Baseada em Análise de Dados Simbólicos. Universidade Federal de Pernambuco. 2004. BISPO, Carlos Alberto Ferreira. CAZARINI, Edson Walmir. A nova geração de sistemas de apoio à decisão. 1998. CAZELLA, Sílvio César. Aplicando a relevância da opinião de usuários em sistema de recomendação para pesquisadores. Universidade Federal do Rio Grande do Sul. Programa de Pós-Graduação em Ciência da Computação, Porto Alegre, BR – RS, 2006. CAZELLA, Sílvio César; Mini-course: E-Commerce and Recommender Systmes. In: ERDB, 2008, Florianópolis, SC, Brasil. 2008. CERA, Márcia Cristina. Uso de redes neurais para o reconhecimento de padrões. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2005. COELHO, M. C. O valor das intenções: dádiva, emoção e identidade. Rio de Janeiro: Editora FGV, 2006. 108 p. COMPOLT, Luis Geandro. Sistemas de Informação Executiva Baseado em um Data Mining utilizando a técnica de árvores de decisão. Universidade Regional de Blumenau. Blumenau, 1999. DA SILVA, Wagner Teixeira. LADEIRA, Marcelo. Mineração de dados em redes bayesianas. IN: XXI Jornada de Atualização em Informática. Evento Integrante do XXII Congresso da SBC – SBC2002. Florianópolis, 2002. DE MAGALHÃES, Lúcia Helena. Uma Análise de ferramentas para mineração de conteúdo de páginas Web.. Dissertação (mestrado). Universidade Federal do Rio de Janeiro. Rio de Janeiro, 2008. DE SOUZA, Erick Nilsen Pereira. Explorer Fuzzy Tree: uma ferramenta para experimentação de técnicas de classificação baseadas em árvores de decisão fuzzy.Universidade Federal da Bahia. Salvador, 2007. DINIZ, Débora. Avaliação ética em pesquisa social: o caso do sangue Yanomami.In: Revista Bioética Volume 15 2007. Brasilia. FARIAS, Alencar de. Et al. O Comportamento de Presentear: Dimensões Motivacionais Relevantes para o Marketing. In: Encontro Nacional da ENAMPAD, 2001.São Paulo. FILHO, Valmir Macário. e-Recommender: Sistema Inteligente de Recomendação para Comércio Eletrônico. Universidade de Pernambuco, Recife, 2006. 117 GARCIA, Simone Carboni. O uso de árvores de decisão na descoberta de conhecimento na área da saúde. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2003. GONÇALVES, Alexandre L. PACHECO, Roberto C.S. MORALES, Aran Bey Tcholakian. A Utilização de técnicas de mineração de dados em bases de C&T: uma análise dos grupos de pesquisa do Brasil. Universidade Federal de Santa Catarina, Florianópolis, 2000. KAJIMOTO, Allan Panossian. Et al. Sistemas de recomendação de notícias na Internet baseados em filtragem colaborativa. Instituto de Matemática e Estatística, Universidade de São Paulo. São Paulo, 2008. LANNA, Marcos P.D. .A dívida divina:troca e patronagem no nordeste brasileiro.Campinas: FUCAMP Fundação de Desenvolvimento da UNICAMP, 1995. 249 p LELES, Andréia Damásio. Técnicas de record linkage e inteligência artificial para a construção de um data warehouse aplicado à área de Saúde. In: Revista Científica do IMAPES, 2004. LICHTNOW, D. O uso de Técnicas de Recomendação em um Sistema para Apoio à Aprendizagem Colaborativa. 2006. LOH, S. ; GARIN, Ramiro Saldaña .Web Intelligence: . In: V Oficina de Inteligência Artificial, 2001, Pelotas, RS. V Oficina de Inteligência Artificial. Pelotas : EDUCAT - Editora da UCPEL, 2001. p. 11-34. LOPES, Giseli Rabello. Sistema de Recomendação para bibliotecas digitais sob a perspectiva da Web Semântica. Dissertação (mestrado), Universidade Federal do Rio Grande do Sul – Porto Alegre, 2007. LOURENÇO, Cléria Donizete da Silva. Relações de troca sob a ótica do marketing de relacionamento e da teoria da dádiva. Dissertação (Mestrado). Universidade Federal de Lavras,2006. LOURENÇO, C. REZENDE, D. C. Vale-presente: Como Fica a Dimensão Simbólica do Ato de Presentear?. In: XI Seminários em Administração FEA-USP, 2008, São Paulo. XI SEMEAD. São Paulo-SP : FEA-USP, 2008. MACHADO, Nilton José. Notas para uma antropologia da dádiva. IN: Seminários Abertos de Pós-Graduação, Grupo de Estudos em Epistemologia e Didática. Universidade de São Paulo.2004. MARQUES, Roberto Ligeiro. DUTRA, Inês. Redes BAYESIANAS: o que são, para que servem, algoritmos e exemplos de aplicações. Universidade Federal do Rio de Janeiro. 2000. OLIVEIRA, Leonardo Gomes de. Sistemas de recomendação de meios de hospedagem: baseado em filtragem colaborativa e informações contextuais. Universidade Federal de Santa Catarina, 2007. Florianópolis. OLIVEIRA, Marcos Barbosa de. Mercadoria, mercantilização e mercado. Universidade de São Paulo. 2009. PELLEGRINI, G. F. COLLAZOS L.K. Extração de Conhecimento a partir dos Sistemas de Informação. UFSC. Florianópolis, 2000. PEPECE, Olga Maria Coutinho. O ato de presentear:o único capaz de transmitir mensagens sem utilizar palavras, de expressar carinho sem utilizar o toque. In: XXVV Congresso Brasileiro de Ciências da Comunicação-Salvador, 2002. PEREIRA, Diego. Uma aplicação em sistemas de recomendação: Sistema de Recomendação para pacotes GNU/Linux. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2007. 118 PRÊTO, Leneide Fátima. Et al. Comportamento do consumidor no ato de presentear.In: XI SEMEAD Seminários em Administração FEA/USP, 2008, São Paulo. Anais do XI SEMEAD-Seminários em Administração FEA/USP, 2008. REATEGUI, Eliseo Berni. CAZELLA, Sílvio César. Sistemas de Recomendação. IN: XXV Congresso da Sociedade Brasileira de Computação. A universalidade da computação: Um Agente de Inovação e Conhecimento UNISINOS - São Leopoldo - RS, 2005. REATEGUI, Eliseo. LORENZATTI, Alexandre. Um assistente virtual para resolução de dúvidas e recomendação de conteúdo. IN: XXV Congresso da Sociedade Brasileira de Computação. UNISINOS, São Leopoldo, 2005. REATEGUI, Eliseo Berni. BOFF, Elisa. CERON, Rafael Fernando. KURRUPAKO: Um agente animado sócioafetivo para ambientes de aprendizagem. In: CINTED, Novas Tecnologias na Educação. Universidade Federal do Rio Grande do Sul, Porto Alegre, 2006. REZENDE, Solange Oliveira. Mineração de Dados. In: XXV Congresso da Sociedade Brasileira de Computação. UNISINOS-São Leopoldo,RS.2005 REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicações. Barueri, São Paulo. 2003. Editora Manole LTDA. 1 edição. 517 pág. RUSSELL, Stuart J. NORVIG, Peter. Inteligência Artificial. Tradução da segunda edição, tradução de Publicare Consultoria. Rio de Janeiro. Elsevier, 2004 – 992 págs. 01 a 89 pág. SAMPAIO, Igor Azevedo. Aprendizagem Ativa em Sistemas de Filtragem Colaborativa.Universidade Federal de Pernambuco, 2006. SANTOS, Rafael. Conceitos de mineração de dados na Web. Instituto Nacional de pesquisas espaciais. 2009. SOMMERVILE, Ian; Sawyer, Pete. Requirements engineering: (a good practive guide). England: John Wiley & Sons, 1997. TEIXEIRA, I.R. 2002. Um Método de Aprendizagem Ativa em Sistemas de Filtragem Colaborativa. Dissertação de Mestrado, Universidade Federal de Pernambuco. THOMÉ, Antonio Carlos Gay. Redes Neurais - Uma Ferramenta para KDD e Data Mining. 2005. TORRES, R. Técnicas para desenvolver sistemas de recomendação na Web. Universidade Federal do Rio Grande do Sul, 2003. Trabalho individual I (Mestrado em Ciência da Computação) VARGAS, Heliana Comin. O caráter público da troca e a alma da mercadoria: Reflexões a partir da obra de Marcel Mauss. In: II Colóquio Internacional de comércio e cidade: uma relação de origem. Março, 2008. São Paulo. VENSON, Elaine. Um Modelo de Sistema de Recomendação Baseado em Filtragem Colaborativa e Correlação de Itens para Personalização no Comércio Eletrônico. Florianópolis : UFSC, 2002. VON ZUBEN, F.J. Rede Neural de Kohonen e Aprendizado Não-Supervisionado em Notas de Aula do Curso IA353, 1º semestre de 2005, capítulo 6, 2005.