1 UNIVERSIDADE COMUNITÁRIA DA REGIÃO DE

Propaganda
1
UNIVERSIDADE COMUNITÁRIA DA REGIÃO DE CHAPECÓ
UNOCHAPECÓ
Curso de Graduação Sistemas de Informação
Talita Rodrigues
PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES
BASEADO NO PERFIL DO USUÁRIO
Chapecó-SC, 2010
2
TALITA RODRIGUES
PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES BASEADO NO
PERFIL DO USUÁRIO
Monografia II apresentada à
UNOCHAPECÓ como parte dos
requisitos para a obtenção do grau
de
Bacharel
Sistemas
de
Informação.
Orientadora: Ana Márcia Debiasi
Duarte
Chapecó-SC, Jul. 2010
3
TALITA RODRIGUES
PROTÓTIPO DE UM SISTEMA DE RECOMENDAÇÃO DE PRESENTES BASEADO NO
PERFIL DO USUÁRIO
Esta Monografia foi julgada para obtenção do título de Bacharel em Sistemas
de Informação, no Curso de Graduação em Sistemas de Informação da
Universidade Comunitária da região de Chapecó - UNOCHAPECÓ – Campus
Chapecó, com a seguinte Banca Examinadora:
________________________________________________
Prof. Ana Márcia Debiasi Duarte
Professora Orientadora
________________________________________________
Prof. Denio Duarte – Membro
________________________________________________
Prof. Elton Luís Minetto – Membro
Chapecó (SC), Julho de 2010.
4
Dedicatória
Aos meus pais e meus irmãos que representam tudo o que sou e tenho de mais precioso,
que são a minha base e minha razão de continuar em busca de ser alguém melhor.
Aos meus queridos amigos que me deram força quando eu acreditava não mais
encontrar em lugar algum, que acreditaram no meu potencial quando até mesmo eu duvidava
do que eu conseguiria.
Dedico também a todas as mulheres que tem e tiveram a ousadia e a coragem de
escolher uma área em sua maioria dominada por homens, enfrentando os preconceitos típicos,
as desconfianças e ao final batendo de igual pra igual e provando que somos tão capazes
quanto qualquer homem.
5
Agradecimentos
Agradeço primeiramente a Deus por ter me dado a graça de chegar ao fim de mais uma
caminhada e ter permitido que eu encontrasse tantas pessoas especiais durante esta jornada.
Agradeço a minha família pelo apoio incondicional e pela compreensão nos momentos
em que estive ausente.
Agradeço aos meus amigos simplesmente por existirem, somente isto me basta para
continuar acreditando que sou capaz de conseguir tudo o que desejo.
Agradeço especialmente a uma pessoa incrível e única que tive o prazer de encontrar
neste período de faculdade que é muito mais que minha colega, é minha amiga do coração. Eli
muito obrigada pela companhia nos sábados e nas madrugadas de TCC, pela força, pela
confiança, pelos risos, sem as palavras de apoio talvez nada disso teria sido possível.
Agradeço também ao meu orientador o professor Denio, obrigada pela confiança
depositada no meu trabalho e as orientações que foram de suma importância para a realização
do mesmo. Este agradecimento se estende também a todos os mestres que eu encontrei no
período acadêmico.
Por fim agradeço a todos aqueles que fazem o bom e velho rock n'roll que foi a trilha
sonora de minhas madrugadas de TCC. \m/
6
“...The answer, my friend, is
blowin' in the wind …”(Bob Dylan)
7
Resumo
Existem determinados rituais ligados ao comportamento humano que mesmo com o
passar do tempo continuam sendo realizados, um deles é o ato de presentear. Registros da
troca de presentes datam de vários séculos atrás, no entanto mesmo sendo algo intrínseco no
comportamento humano a realização do mesmo não representa uma tarefa fácil para muitos
indivíduos.
A dificuldade apresentada na pratica deste ato refere-se à grande dúvida que paira
quando é necessário definir o que comprar, esta dúvida se tornou maior ainda devido ao vasto
numero de opções oferecidos atualmente no comércio convencional e eletrônico. A dúvida
também existe devido à falta de conhecimento que se tem sobre os gostos, preferências da
pessoa que será presenteada.
Objetivando a minimização da dificuldade na pratica deste ato tão bonito se propôs o
desenvolvimento de um protótipo de sistema de recomendação de presentes baseado no perfil
do usuário, que utiliza técnicas de inteligência artificial para realizar a determinação de um
presente ideal.
Palavras-chave: Ato de presentear, dificuldades, preferências, perfil, recomendação.
8
Abstract
There are certain rituals related to human behavior that even with the passage of time
continue to be made, one of them is the act of giving. Records of exchanging gifts date back
several centuries ago. Yet, even though it is inherent in human behavior, to achieve the same
is not an easy task for many individuals.
The practical difficulty presented in this act refers to the great doubt that hangs when it
is necessary to define what to buy, such doubts become even greater due to the vast number of
options currently offered in conventional and electronic commerce. Doubt also exists due to a
lack of knowledge we have about the tastes and preferences of the person we want to gift.
Aiming to minimize the difficulty in practicing this wonderful act is the proposed
development of a prototype system based on the recommendation to present the user profile,
which uses artificial intelligence techniques to make the determination of an ideal gift.
Keywords: The act of giving, difficulties, preferences, profile, and recommendation.
9
Lista de Figuras
Figura 1 – Processo de sistema de recomendação. Fonte Sampaio 2006 .............................................23
Figura 2 – Avaliação dos usuários sobre o álbum Elvis 30 # 1 hits .....................................................25
Figura 3 – Lista dos itens de informática mais vendidos no site da Americanas.com ..........................27
Figura 4 – Itens sugeridos a partir da visualização do CD ELVIS 30 # 1 HITS no site da
Americanas.com ...............................................................................................................................28
Figura 5 – Recomendações baseadas na pesquisa por Chuck Berry no site da Amazon.com ...............29
Figura 6 – Recomendação personalizada com base no perfil do usuário. ............... Fonte REATEGUI e
CAZELLA 2005 ...............................................................................................................................30
Figura 7 – Exemplo de identificação no servidor ...............................................................................31
Figura 8 – Identificação do cliente de forma implícita .......................................................................32
Figura 9 – Avaliação do serviço de ajuda oferecido pela Google.com ................................................33
Figura 10 – Tela de cadastro de usuário no Yahoo.com exemplo de abordagem explícita ...................33
Figura 11 – Fórmula do cálculo da distância euclidiana .....................................................................42
Figura 12 – Modelo da árvore de decisão de gostos musicais .............................................................59
Figura 13 – Modelagem desenvolvida para controle dos itens da base de dados .................................92
Figura 14– Modelagem desenvolvida para controle dos dados dos usuários .......................................94
Figura 15 – Modelagem referente as avaliações de itens por usuários ................................................95
Figura 16 – Fórmula da distância Euclidiana .....................................................................................96
Figura 17 – Tabelas Religião, Região e Sexo padronizadas na base de dados .....................................98
Figura 18 – Fórmula da distância euclidiana aplicada no protótipo. ................................................. 100
Figura 19 – Esboço do funcionamento do algoritmo de recomendação aplicado ao protótipo ........... 101
Figura 20 – Esboço do processo para recomendar por email buscando por ocasiões....... .................. 103
Figura 21 – Esboço de recomendação por email através da busca por aniversariantes ...................... 103
Figura 22 - Tela de login do protótipo.............................................................................................. 104
Figura 23 – Tela de cadastro de usuário na aplicação. ...................................................................... 105
Figura 24 – Tela de avaliação de itens ............................................................................................. 106
Figura 25 – Tela de perfil do usuário ............................................................................................... 107
10
Figura 26 – Menu do aplicativo ....................................................................................................... 108
Figura 27 – Interface da tela de recomendação sem usuário ............................................................. 109
Figura 28 – Interface dos itens recomendados ................................................................................. 110
Figura 29 – Interface de recomendação com amigo cadastrado. ....................................................... 110
Figura 30 – Interface de pesquisa de amigos ........................................................................................ .
111
Figura 31 – Interface para adicionar amigos. ................................................................................... 111
Figura 32- Interface com os dados detalhados de um amigo. ............................................................ 112
Figura 33 – Detalhe da interface de avaliação de itens. .................................................................... 112
Figura 34 – Fórmula aplicada ao protótipo. .......................................... Erro! Indicador não definido.
11
Lista de Tabelas
Tabela 1 – Áreas de Interesse x Forma de Coleta ...............................................................................34
Tabela 2 – Exemplo de disposição dos dados na avaliação de gêneros musicais .................................41
Tabela 3 – Comparativo entre as avaliações dos usuários vizinhos .....................................................43
Tabela 4 – Principais diferenças entre as duas abordagens que podem ser supridas na filtragem hibrida
45
Tabela 5 – Classificação dos sistemas de recomendação proposta por ADOMAVICIUS 2005 ............47
Tabela 6 – Graus de associação no exemplo de preferência musical de usuários de um sistema ..........55
Tabela 7- Dados para classificação de estilo musical .........................................................................58
Tabela 8 – Requisitos Funcionais do protótipo ...................................................................................90
Tabela 9 – Requisitos Não Funcionais do protótipo. ..........................................................................90
Tabela 10 – Aspectos envolvidos no ato de presentear .......................................................................91
Tabela 11 – Pontuação de acordo com a relevância do fator na determinação de um presente .............99
Tabela 12 – Tabela legenda das características avaliadas no cálculo da distância euclidiana ............. 100
Tabela 13 – Dados do usuário .............................................................................................................112
Tabela 14 – Dados da tabela Usuário x Personalidade........................................................................112
Tabela 15 – Dados da tabela Usuário x Área de Interesse ...................................... ...........................112
Tabela 16 – Usuários cadastrados na base de dados ...........................................................................113
Tabela 17 – Exemplo da tabela de amigos ..........................................................................................113
Tabela 18 – Dados do usuário .............................................................................................................113
Tabela 19 – Dados da tabela Usuário x Personalidade .......................................................................113
Tabela 20 – Dados da tabela Usuário x Área de Interesse ..................................................................113
Tabela 21 – Dados adicionais para a recomendação .............................. Erro! Indicador não definido.
Tabela 22 – Dados dos itens armazenados na base de dados.................. Erro! Indicador não definido.
Tabela 23 – Tabela legenda das características avaliadas no cálculo da distância euclidiana ......... Erro!
Indicador não definido.
Tabela 24 – Exemplo do cálculo de similaridade realizado pelo sistema Erro! Indicador não definido.
12
Lista de Abreviaturas
FBC
FC
FH
HTML
IA
PHP
Filtragem Baseada em Conteúdo
Filtragem Colaborativa
Filtragem Híbrida
Hypertext Markup Language
Inteligência Artificial
Hypertext Preprocessor
13
SUMÁRIO
1.
INTRODUÇÃO .......................................................................................................... 15
2.
SISTEMAS DE RECOMENDAÇÃO ........................................................................ 18
3.
2.1
INTRODUÇÃO ..................................................................................................... 18
2.2
SISTEMAS DE RECOMENDAÇÃO .................................................................... 21
2.3
TAREFAS DE UM SISTEMA DE RECOMENDAÇÃO ........................................ 24
2.4
COLETA DE DADOS ........................................................................................... 30
2.5
FILTRAGEM DE INFORMAÇÃO ........................................................................ 35
2.5.1
FILTRAGEM BASEADA EM CONTEÚDO .................................................. 36
2.5.2
FILTRAGEM COLABORATIVA ................................................................... 38
2.5.3
FILTRAGEM HÍBRIDA................................................................................. 44
2.6
TÉCNICAS DE RECOMENDAÇÃO .................................................................... 46
2.7
LIMITAÇÕES PRESENTES EM UM SISTEMA DE RECOMENDAÇÃO........... 47
2.8
CONSIDERAÇÕES FINAIS ................................................................................. 49
TÉCNICAS DE MINERAÇÃO DE DADOS COM INTELIGÊNCIA ARTIFICIAL
51
3.1
INTELIGÊNCIA ARTIFICIAL, A CIÊNCIA DO RACIOCÍNIO ........................... 51
3.2
TÉCNICAS DE MINERAÇÃO DE DADOS ......................................................... 53
3.2.1
ASSOCIAÇÃO ............................................................................................... 53
3.2.2
AGRUPAMENTO .......................................................................................... 55
3.2.3
CLASSIFICAÇÃO ......................................................................................... 57
3.3
3.3.1
ÁRVORES DE DECISÃO .............................................................................. 60
3.3.2
TD-IDF (Term Frequency / Inverse Document Frequency) ............................. 62
3.3.3
MODELOS PROBABILÍSTICOS .................................................................. 63
3.3.4
REDES BAYESIANAS .................................................................................. 64
3.4
4.
ALGORITMOS DE MINERAÇÃO DE DADOS .................................................. 60
CONSIDERAÇÕES FINAIS ................................................................................. 65
A ARTE DE PRESENTEAR ...................................................................................... 67
4.1
INTRODUÇÃO ..................................................................................................... 67
4.2
O PRESENTE EM DIFERENTES CULTURAS DA SOCIEDADE ....................... 67
4.3
PRESENTEAR ALGUÉM. O QUE SIGNIFICA ESTE ATO? ............................... 70
4.4
DIMENSÃO SIMBÓLICA .................................................................................... 73
4.5
DIMENSÃO EMOCIONAL .................................................................................. 74
4.6
DIMENSÃO PESSOAL E SOCIAL ...................................................................... 76
14
4.7
DIMENSÃO ECONÔMICA .................................................................................. 77
4.8
DIMENSÃO DA OBRIGAÇÃO ............................................................................ 78
4.9
MOTIVOS PARA PRESENTEAR ALGUÉM........................................................ 80
4.10
ETAPAS DO PROCESSO DE PRESENTEAR .................................................. 81
4.11 CONSIDERAÇÕES FINAIS ................................................................................. 82
5.
6.
ESTUDO DAS TECNOLOGIAS ............................................................................... 83
5.1
HTML (Hypertext Markup Language) ................................................................... 83
5.2
PHP (Hypertext PreProcessor) ............................................................................... 83
5.3
MYSQL ................................................................................................................. 83
IMPLEMENTAÇÃO ........................................................ Erro! Indicador não definido.
6.1
O ATO DE PRESENTEAR .................................................................................... 84
6.2
REQUISITOS DO SISTEMA ................................................................................ 87
6.3
MÉTODO DE FILTRAGEM DO PROTÓTIPO..................................................... 91
6.4
MODELAGEM DA BASE DE DADOS ................................................................ 91
6.5
MÉTODO DE DEFINIÇÃO DA SIMILARIDADE ............................................... 96
6.6
TELAS DO PROTÓTIPO.................................................................................... 103
6.7
ESTUDO DE CASO................................................................................................113
7. CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS ..................................1144
8.
REFERÊNCIAS BIBLIOGRÁFICAS .................................................................11616
15
1. INTRODUÇÃO
A era da informação trouxe consigo a democratização da tecnologia, a expansão das
telecomunicações e o acesso facilitado à informação. Estes avanços possibilitaram a difusão
do conhecimento nos mais diversos campos, proporcionando o crescimento intelectual e as
mudanças de comportamentos na sociedade.
No entanto, mesmo com o passar dos anos e os diversos avanços que aconteceram,
alguns aspectos que são inerentes ao comportamento humano não se modificaram em sua
essência. Um exemplo é o ato de presentear, que é praticado desde os tempos mais remotos e
ainda persiste de forma indispensável para manter os relacionamentos. Mas apesar de estar
associado ao comportamento humano, este ato ainda representa certa complexidade para
determinadas pessoas. Um dos motivos desta complexidade é a rotina que a vida moderna
proporciona, que ocasiona a falta de tempo hábil para se criar ou manter vínculos afetivos
entre os indivíduos.
Outro fator que ocasiona a dificuldade na escolha de um presente é o fato de que
atualmente os comércios convencionais e eletrônicos oferecem inúmeras opções de produtos e
serviços. Esta oferta demasiada de diferentes produtos ocasiona em um aumento na dúvida na
hora de determinar qual presente comprar. Uma forma encontrada para descobrir qual é o
presente ideal é a busca na web, afinal a democratização da internet permitiu que as mais
diversas classes tivessem acesso a rede e através dela obter as informações de que necessitam.
Porém, mesmo com todos os benefícios gerados com o livre acesso a informação criouse um novo problema, a sobrecarga de informações. Todos os dias milhões de informações
são armazenadas em páginas web espalhadas pela internet o que torna a busca por dados
significativos um processo lento e que nem sempre resulta em informações relevantes.
Segundo o escritor americano John Naisbitt “Estamos afogados em informação, mas
morrendo de fome por conhecimento.”, o problema que se observava há algum tempo com
acesso restrito e monopólio de informações é praticamente inimaginável se compararmos a
facilidade de acesso que se tem atualmente. Esta facilidade aumentou a busca pelo
conhecimento, mas a prejudicou justamente porque com esta disposição para qualquer
indivíduo armazenar informação na web ocasionou em um número incalculável de
informações sem credibilidade alguma, informações falsas, sem relevância.
Uma maneira encontrada para minimizar as dificuldades na busca por informações
pertinentes é a utilização de sites com mecanismos de “motores de busca” (por exemplo,
16
Google®, Altavista®) que possuem sistemas de recuperação da informação (CAZELLA,
2006).
Entretanto, a utilização destas ferramentas de busca não garante aos usuários a
relevância das informações encontradas, pois para realizar a procura, são utilizadas as
palavras-chaves, e caso o usuário não possua conhecimento suficiente sobre o que deseja
pesquisar, estará informando dados à ferramenta de busca que resultarão em informações
inesperadas e inúteis.
Uma prática utilizada há muito tempo pela humanidade para auxiliar na busca por
determinado item quando não se sabe exatamente o que se quer, é recorrer para as
recomendações. Dessa forma, o conhecimento adquirido é baseado em informações oriundas
de experiências vivenciadas por outros indivíduos. A recomendação também pode ser
utilizada com recursos tecnológicos, através dos chamados sistemas de recomendação. Estes
sistemas são responsáveis por associar produtos e/ou serviços aos usuários de acordo com as
preferências informadas em seus perfis.
Os recursos tecnológicos têm um papel fundamental na sociedade atual, promover a
melhoria da qualidade de vida das pessoas, sendo aplicada em grandes segmentos bem como
na resolução de problemas menores, mas não menos importantes, como no ato de presentear.
A dificuldade apresentada ao realizar o ato de presentear esta associada a diversos
motivos, porém a resolução ou minimização deste problema pode ser oferecida através da
utilização de um sistema de recomendação. A utilização de um sistema de recomendação de
presentes baseado no perfil do usuário poderá oferecer:
 O conhecimento das preferências do usuário pesquisado;
 Maior agilidade na procura por um item para presentear, pois o universo de pesquisa
fica restrito as preferências do usuário que se esta pesquisando;
 Aumento das chances de acerto na escolha do presente, pois o item escolhido será de
acordo com os gostos do presenteado e o número de opções possíveis será bem mais
limitado;
 A satisfação em escolher um presente correto e ter a certeza de que irá agradar.
Este sentimento de satisfação proporcionado quando se tem a certeza da escolha correta
de um presente é um dos principais objetivos quando se pretende presentear alguém e é
exatamente isto que o protótipo de sistema de recomendação de presentes proposto neste
trabalho pretende proporcionar aos seus usuários, tornar este ato mais prazeroso do que
17
problemático, evidenciando nele os benefícios que o mesmo proporciona e não mais
destacando seus pontos dificultosos.
Com a escolha correta de um presente o simbolismo que envolve este ato se torna mais
efetivo. O presente representa para quem o recebe uma imagem da pessoa que lhe ofereceu,
da mesma forma que ao oferecer um presente a alguém você esta projetando nele a imagem
da pessoa que irá recebê-lo. Esta extensão de ambos os indivíduos através de um presente é
que cria nestes um sentimento de união, afeto, admiração e reciprocidade tão essências na
vida de todo ser humano e atualmente tão difíceis de obter.
Portanto, no contexto apresentado, este trabalho tem como objetivo propor uma
abordagem para recomendação de presentes baseado no perfil do presenteado. A abordagem
aqui apresentada será implementada na forma de um protótipo para validar a mesma. Este
trabalho está organizado em 7 capítulos. Neste capítulo são apresentadas a motivação,
objetivos e contexto no qual esse trabalho está inserido.
No capítulo 2 são revisados alguns aspectos inerentes a sistemas de recomendação,
como os métodos de filtragem aplicados nos sistemas, vantagens e desvantagens de cada
método, problemas apresentados nos sistemas de recomendação, bem como as vantagens na
criação e aplicação de um sistema deste tipo.
No capítulo 3 são descritos conceitos referentes as técnicas de inteligência artificial
utilizadas para realizar a mineração de dados, no mesmo capítulo são apresentados alguns
exemplos de algoritmos que podem auxiliar nesta tarefa de mineração.
No capítulo 4 é apresentado um panorama referente ao ato de presentear, aspectos
importantes envolvidos neste ato, a importância do mesmo na vida das pessoas, na criação de
laços e o significado que lhe é atribuído pela sociedade.
O capítulo 5 traz uma breve descrição das tecnologias utilizadas para desenvolvimento
do protótipo, que foram respectivamente o HTML, o php e o banco de dados MySQL.
No capítulo 6 são descritos os aspectos referentes a implementação do protótipo, é
realizada uma descrição do problema estudado, são elencadas as técnicas definidas para
utilização no sistema, o método de filtragem, o método de cálculo da similaridade, aspectos
da base de dados bem como são exibidas as interfaces do protótipo desenvolvido.
No Capítulo 7 são discutidas as conclusões, principais contribuições e propostas
para trabalhos futuros.
18
2. SISTEMAS DE RECOMENDAÇÃO
O presente capítulo apresenta conceitos sobre sistemas de recomendação. Tais conceitos
são importantes para a base teórica deste trabalho, pois o propósito deste projeto é o
desenvolvimento de um protótipo de um sistema de recomendação de presentes.
2.1 INTRODUÇÃO
A expansão tecnológica possibilitou a sociedade inúmeros avanços nas mais diversas
áreas, fronteiras foram quebradas através do acesso fácil a comunicação, tempo foi ganho em
decorrência de tecnologias que auxiliam em tarefas que antes detinham muito esforço. Um
dos principais benefícios oferecidos por esta expansão foi à democratização da informação.
Uma das grandes responsáveis senão a principal responsável pela democratização da
informação é a Internet. Segundo Druker apud Bezerra 2004, a Internet está para a atual e
crescente revolução da informação assim como a estrada de ferro estava para a revolução
industrial do século XVII.
Uma das conseqüências desta democratização é a sobrecarga de informações:
diariamente as pessoas são submetidas a uma grande quantidade de informações,
principalmente aquelas oriundas na Internet. O problema da dificuldade de acesso a
informação foi substituído na era digital pela necessidade de filtrar as informações e
apresentá-las de acordo com a necessidade dos interessados.
A necessidade da filtragem surge a partir do momento que os interessados em obter
informação ficam perdidos em meio a tantas opções, sendo um número considerável destas
informações irrelevantes para o usuário (KAJIMOTO et.al. 2008). Por exemplo, suponha que
um usuário necessite pesquisar sobre o histórico do Grêmio Football Porto Alegrense. No
entanto ao realizar a pesquisa o usuário informa apenas a palavra Grêmio, o resultado da
pesquisa será relativamente grande e extenso o suficiente para deixar o usuário confuso em
meio a tantas informações. Até encontrar a informação que deseja o usuário despenderá tempo
na filtragem das opções que lhe foram disponibilizadas.
A produção de informação atualmente é maior do que um indivíduo poderia lidar
durante todo o seu tempo de existência. Filtrar o que é relevante se torna humanamente
impossível. Objetivando minimizar essa dificuldade vários pesquisadores desenvolveram
técnicas que auxiliam na pesquisa por informações (ZAIANE apud CAZELLA, 2006).
Uma das técnicas desenvolvidas mais empregadas em pesquisas é a recuperação de
19
informação (RI). Esta técnica está presente na maioria dos sites de pesquisa, ou motores de
busca como também são conhecidos. Exemplos destes sites são o Google.com, Altavista.com,
Cade.com, Yahoo.com, que fornecem um mecanismo de busca na Internet através de
palavras-chave informadas pelo usuário (CAZELLA, 2006).
Apesar de bastante difundida esta técnica não resolve todos os problemas da sobrecarga
de informações. Um problema na utilização deste tipo de ferramenta é que o usuário obriga-se
a explicitar o seu interesse, ou seja, deve saber apresentar as palavras-chave que são
relevantes para a consulta. Portanto para que esta técnica se torne eficiente é necessário que o
usuário tenha um conhecimento considerável sobre o que deseja pesquisar, senão o sistema
lhe retornará um universo grande de opções referentes à pesquisa realizada e a dúvida sobre
que informação é relevante permanecerá (CAZELLA, 2006). No exemplo anterior sobre a
pesquisa pelo histórico do clube de futebol Grêmio, uma maneira de diminuir o universo de
pesquisa poderia ser informar junto do nome do clube a palavra futebol, ou ainda incluir além
destas a palavra histórico. Assim o sistema de recuperação retornaria para o usuário somente
informações ligadas a estas três palavras-chave.
Outra técnica desenvolvida objetivando auxiliar na busca e obtenção de informações é a
filtragem de informação. A filtragem de informação é uma técnica que se baseia no perfil de
um usuário especifico para realizar as suas pesquisas. Normalmente os sistemas que utilizam
esta técnica mantém uma base com as preferências e interesses do usuário (BURIN, 2007).
Nessa técnica as informações que o usuário tem acesso são sempre baseadas em seu
perfil. A relevância em comparação com a técnica de recuperação de informação é muito
maior, já que nesta técnica o usuário recebe informações que são compatíveis com as suas
preferências.
As duas técnicas apresentadas atuam com um objetivo em comum, minimizar as
dificuldades encontradas pelos usuários na realização de pesquisas em meio a muitas
informações. Porém, as formas para atingir o objetivo a que estão propostas são diferentes nas
duas técnicas. Em RI é necessário que o usuário explicite o que deseja encontrar, já na
filtragem de informação o sistema define de acordo com o perfil do usuário o que pode ser do
interesse do usuário que pesquisa. Outro ponto importante diz respeito ao contexto em que
pode ser aplicada cada técnica, este aspecto também é distinto entre as duas (SAMPAIO,
2006). A RI é aplicada normalmente em sistemas que são baseados em conteúdos, são
aplicações mais genéricas não necessitam de personalização por perfil de usuário. Por
20
exemplo, em uma base de documentos grande de uma empresa, a utilização de um mecanismo
de RI pode ser interessante na busca por informações em meio há muitos dados.
Já a filtragem de informação é aplicada quando se deseja especialização, serviços
personalizados. A filtragem de informação poderia também ser aplicada ao exemplo citado
anteriormente, no entanto poderia oferecer uma funcionalidade de filtrar os documentos de
acordo com os setores, por funcionários, sem que para isto estes precisassem interagir
diretamente com o sistema.
Com a finalidade de melhorar o processo de busca de informações relevantes surgiu
uma nova categoria de sistemas de informação, os chamados sistemas de recomendação.
Sistemas de Recomendação podem ser definidos como sistemas que procuram
auxiliar indivíduos a identificarem conteúdos de interesse em um conjunto de
opções que poderiam caracterizar uma sobrecarga. São sistemas que procuram
facilitar a penosa atividade de busca por conteúdo interessante (CAZELLA, 2008,
página 1).
Para promover esta facilidade e oferecer uma pesquisa com informações relevantes aos
seus usuários, os sistemas de recomendação podem utilizar técnicas de filtragem de
informação e recuperação de informação dependendo do contexto e do objetivo em que o
sistema está submetido.
Segundo Bezerra (2004), os sistemas de recomendação podem ser vistos como sistemas
de informação que fornecem uma visão personalizada de acordo com a base de dados que está
submetido. Esta visão pode ser entendida como a resposta que o sistema informará ao usuário,
esta dependerá do objetivo ou tarefa que este sistema está proposto.
Lichtnow (2009), declara que o objetivo dos sistemas de recomendação não é apenas
apresentar aos usuários itens a partir de consultas que este pode realizar, mas que o sistema
seja capaz de prever o interesse de um usuário por determinado item sem a participação
explicita do usuário. Ainda segundo Lichtnow (2009), esta capacidade de prever pode ser uma
forma de tentar evitar a sobrecarga de informação.
A utilização de sistemas de recomendação pode aumentar a eficácia e a capacidade do
processo de recomendação bastante conhecido e praticado pelo homem há muito tempo.
(RESNICK e VARIAN apud REATEGUI e CAZELLA, 2005) .
21
2.2 SISTEMAS DE RECOMENDAÇÃO
Sistemas de Recomendação são atualmente utilizados nas mais diversas áreas, o início
de sua utilização se deu principalmente durante a década de 90. Um dos primeiros sistemas de
recomendação criados foi chamado de Tapestry desenvolvido em 1992(Goldberg apud
VENSON, 2002) por Goldberg e ainda hoje utilizado.
O sistema Tapestry não era automático e exigia que os usuários construíssem queries
(consultas) complexas em uma linguagem especificamente projetada para o sistema retornar
as suas recomendações. O termo filtragem colaborativa surgiu nesta época, Goldberg o
definiu como uma atividade na qual as pessoas auxiliam umas as outras a filtrar informações
através da sua opinião sobre cada documento lido. Era exatamente este o funcionamento do
Tapestry, cada usuário ao receber determinado documento informava sua opinião e depois
outros usuários poderiam utilizar esta opinião para identificar se gostariam ou não do
conteúdo do documento (VENSON, 2002). Foi a partir do desenvolvimento do Tapestry que
os sistemas de recomendações evoluíram e as técnicas de filtragem se tornaram mais
eficientes e refinadas.
Desde o inicio de sua utilização os sistemas de recomendação têm contribuído
significativamente com o crescimento intelectual de organizações empresariais bem como de
indivíduos particularmente.
A adequação e crescente utilização dos recursos oferecidos por estes sistemas
atualmente se deve há alguns fatores específicos, dentre eles podem ser destacados:
 Democratização da tecnologia e consequente sobrecarga de informações;
 Dificuldade na pesquisa por conteúdos relevantes em meio a muitas informações;
 Valorização da customização;
 Busca por ferramentas que auxiliem o processo de fidelização de clientes.
Os dois primeiros aspectos citados já foram abordados anteriormente, os dois seguintes
serão descritos a seguir.
A valorização da customização surgiu a partir do momento que as pessoas não adquirem
mais produtos somente para a sua sobrevivência. Nas sociedades mais desenvolvidas, o
problema das necessidades primárias foi resolvido, porém outro problema surgiu, o da
necessidade da representação social, problema solucionado atualmente através do consumo
simbólico (BAUDRILLARD apud PEPECE 2002, PEPECE 2002). Neste sentido, enquanto
em algumas sociedades os indivíduos não conseguem satisfazer as necessidades de
22
alimentação e vestuário, em outras, os indivíduos necessitam satisfazer seus status, com
roupas de marcas, entre outros.
As pessoas desejam ser tratadas com exclusividades e em meio a tantos outros
indivíduos, querem ser notadas como únicos, originais e por isso algumas vezes não desejam
adquirir produtos, itens ou informações de massa, mas sim informações exclusivas,
especificas para o seu perfil.
A dificuldade em oferecer somente indicações personalizadas está na imensa gama de
opções disponíveis. Isso pode ser percebido em sites de comércio eletrônico que oferecem
milhares de itens ou em lojas convencionais de departamentos.
Jeff Bezoz diretor executivo da Amazon.com citado em Venson (2002, 27) declarou que
“Se eu tenho dois milhões de clientes na Web, devo ter dois milhões de lojas virtuais”. A
declaração de Bezoz confirma o poder que a customização adquiriu atualmente.
Um sistema de recomendação pode ser a solução para a afirmação de Bezoz, e não será
necessária a criação de dois milhões de lojas virtuais para atender aos dois milhões de
clientes, mas apenas uma que seja adaptada a cada um deles a partir de seu perfil no sistema
de recomendação.
A utilização de um sistema de recomendação pode beneficiar empresas que possuem
site de comércio eletrônico, através das recomendações e informações fornecidas pelo sistema
a empresa pode trabalhar com diferentes estratégias de marketing, dentre elas(BEZERRA,
2004):
 Marketing segmentado: aquele voltado para um determinado grupo de usuários que
possuem preferências em comum;
 Marketing one-to-one: uma forma especifica e totalmente personalizada de
recomendação de produtos para determinado cliente;
A área de comércio eletrônico aderiu significativamente aos sistemas de recomendação,
mas existem outras áreas que também contam com diversos sistemas de recomendação.
Algumas delas são voltadas para a educação, para entretenimento, para a saúde, para áreas
profissionais, enfim atualmente existem diversas áreas para aplicação de um sistema de
recomendação.
Objetivando uma melhor compreensão do funcionamento de um sistema de
recomendação, será apresentado a seguir um estudo realizado por Terveen citado em Sampaio
(2006) sobre o processo de um sistema de recomendação.
23
Figura 1 – Processo de sistema de recomendação. Fonte Sampaio 2006
A Figura 1 apresenta diagramaticamente, o processo de recomendação contando com os
principais elementos que estão envolvidos neste processo (SAMPAIO, 2006):
 Alvo da recomendação: é o principal ator do processo e destinatário da recomendação.
Participa do processo fornecendo suas opiniões sobre os itens presentes na base de
informação ou apenas recebe as sugestões do sistema.
 Base de informação: depósito das informações referentes a todos os itens referentes ao
universo de recomendações possíveis do sistema.
 Provedor de recomendações: é o agente que seleciona e recomenda os itens da base de
informação que possuem maior compatibilidade e relevância para o alvo da
recomendação. Para definir quais são os itens mais relevantes o provedor pode se
basear em diferentes informações, como as preferências do próprio alvo da
recomendação, pelas recomendações de outros usuários do sistema ou ainda levar em
consideração o conteúdo dos itens da base.
 Provedores de preferência: podem ser entendidos como colaboradores do sistema de
recomendação. Colaboradores pois a partir das opiniões expostas sobre os itens da
base o provedor de recomendações poderá recomendar itens para outros usuários.
Para conseguir atingir uma recomendação de qualidade são utilizadas técnicas de
filtragem de informação e de inteligência computacional. Existem diversas técnicas que
podem ser aplicadas nos sistemas de recomendação (SAMPAIO, 2006). A escolha da técnica
24
depende do objetivo que o sistema está proposto a atingir bem como da etapa de
recomendação que irá empregar a técnica, algumas destas técnicas serão apresentadas no
decorrer do capítulo.
Um sistema de recomendação pode desempenhar e disponibilizar diferentes tarefas aos
seus usuários. Algumas destas tarefas serão apresentadas a seguir.
2.3 TAREFAS DE UM SISTEMA DE RECOMENDAÇÃO
As funcionalidades ou tarefas desempenhadas por um sistema de recomendação se
referem a sua comunicação com o usuário e como os objetivos do usuário são satisfeitos com
a sua utilização (SAMPAIO, 2006).
As tarefas também são definidas por alguns pesquisadores como estratégias de um
sistema de recomendação. As estratégias são os meios utilizados para atingir os objetivos
definidos, um destes objetivos é sempre o de garantir um serviço de recomendação eficiente e
de qualidade.
Algumas das principais tarefas desempenhadas e disponibilizadas pelos sistemas de
recomendação atuais serão elencadas a seguir (REATEGUI e CAZELLA 2005, BEZERRA
2004, TEIXEIRA 2002, SAMPAIO 2006):
Apresentar a avaliação dos usuários:
A opinião dos usuários sobre os itens oferecidos em um sistema de recomendação é
muito importante, esta é uma das fontes de informação utilizadas pelo sistema para selecionar
e definir uma melhor recomendação.
Esta estratégia de avaliação dos usuários é utilizada nos sistemas de recomendação
desde o primeiro sistema desenvolvido, o Tapestry. A grande utilização desta funcionalidade
se deve a importância da troca de informações em um processo de recomendação.
A Figura 2 apresenta um extrato de comentários e avaliações de usuários sobre o álbum
“Elvis 30 # 1 hits” do cantor Elvis Presley no site de comércio eletrônico Americanas.com.
25
Figura 2 – Avaliação dos usuários sobre o álbum Elvis 30 # 1 hits
As avaliações podem ser realizadas de diferentes formas dependendo do sistema de
recomendação. Abaixo são elencados alguns exemplos:
 Através de comentários, onde o usuário descreve sua experiência, seu conhecimento
sobre as funcionalidades, vantagens e desvantagens do item. Na Figura 2 os
comentários dos usuários do sistema referentes ao álbum refletem a sua experiência e
conhecimentos sobre o item, o que pode contribuir para a escolha deste item por outro
usuário que tenha acesso a estas informações;
 Através de notas com valores definidos pelo sistema;
 E através de escalas, como por exemplo, de ruim a ótimo, número de estrelas, entre
outros.
Além do sistema de recomendação utilizar estas avaliações para realizar suas
recomendações outros usuários podem embasar sua opinião a cerca de determinado item
através da opinião de outro usuário do sistema.
Apresentar a opinião de críticos conceituados;
Através da opinião de um usuário sobre determinado item é possível extrair
informações relevantes, assim como já foi mencionado esta informação pode ser utilizada
pelo sistema ou pelo usuário.
No entanto a veracidade e relevância da opinião deste usuário nem sempre pode ser
26
medida com certeza, pois suas avaliações podem ser falsas. Para minimizar este problema
alguns sistemas contam com a avaliação e opinião de críticos conceituados. Estes críticos
podem ser usuários que possuam uma relevância de opinião ou indivíduos que possuam
conhecimento considerável sobre o que está sendo avaliado.
Exibir listas de recomendação;
Esta funcionalidade está presente na maioria dos sistemas de recomendação bem como
de sistemas de comércio eletrônico que não possuam os recursos de recomendação. Por
não
necessitar de recursos de inteligência computacional e filtragem de informação esta
funcionalidade é aplicada a domínios diferentes dos sistemas de recomendação. As listas de
recomendação normalmente apresentam informações dos itens mais vendidos, de itens para
presentes, itens para listas de casamento, itens mais acessados, entre outras listas.
Mesmo sendo um recurso simples estas listas são importantes para os sistemas de
recomendação, pois apresentam as informações divididas em segmentos o que facilita uma
pesquisa. No entanto não existe uma ligação direta entre os itens exibidos e o perfil do usuário
que está acessando o sistema, a recomendação não é personalizada.
A Figura 3 apresenta um exemplo de uma lista presente no site de comércio eletrônico
Americanas.com. A lista exibe os itens mais vendidos no departamento de informática, o
usuário pode procurar pelos itens vendidos em outros departamentos da loja virtual. A
facilidade que está lista proporciona ao usuário está em poder tornar a pesquisa mais simples,
em vez de procurar diretamente entre todos os itens disponíveis do departamento pode se
procurar pelos mais vendidos pode ser que somente através desta lista o usuário já tenha o seu
desejo suprido e sem despender muito tempo em pesquisas.
27
Figura 3 – Lista dos itens de informática mais vendidos no site da Americanas.com
Listar os produtos ou itens que tenham um nível de semelhança significativo com o contexto
visualizado pelo usuário;
O recurso especificado nesta tarefa também é conhecido, segundo os especialistas em
marketing, como venda cruzada e consiste basicamente em oferecer ao usuário itens que
sejam similares ao o que ele está visualizando no momento, ou que esta comprando.
Variados sistemas oferecem esta funcionalidade, sistemas de recomendação de músicas
podem exibir uma lista com músicas que possuam o mesmo estilo, ou que sejam do mesmo
artista que o usuário está escutando no momento. Assim como em um sistema de
recomendação de livros, uma lista de títulos que sejam similares ao que se esta procurando
seja ofertados ao usuário procurando compreender o que este deseja.
A Figura 4 exibe um exemplo de sugestões de produtos que estão ligados ao produto
que está sendo visualizado pelo cliente. No exemplo da Figura 4, o usuário está visualizando
o CD Elvis 30 # 1 hits, através desta visualização o sistema disponibiliza ao usuário
informações sobre outros álbuns que podem ser do interesse do usuário. Esta definição de
outros produtos que podem ser interessantes para o usuário pode ser realizada através da
observação de diversos atributos existentes nos produtos.
28
Figura 4 – Itens sugeridos a partir da visualização do CD ELVIS 30 # 1 HITS no site da
Americanas.com
O site facilita a pesquisa do usuário ao elencar outros produtos que possuem ligação
com o produto que esta sendo visualizado. Desta maneira o usuário não despenderá tempo
pesquisando sobre outras informações que estão ligadas ao produto visualizado no momento.
No entanto um cuidado que deve ser tomado ao oferecer este tipo de recomendação aos
usuários é na definição da similaridade entre os itens “semelhantes”. A Figura 4 apresenta o
CD Paramore -Riot que supostamente é semelhante ao item CD Elvis 30 # 1 Hits, entretanto
se for realizada uma comparação entre os artistas será possível compreender que existe uma
grande diferença entre ambos.
Listar itens que estejam ligados ao o que o usuário esta visualizando e com o histórico da
comunidade;
Para disponibilizar esta funcionalidade em um sistema de recomendação é necessário
um trabalho bem específico e que demanda recursos de inteligência artificial associados à
mineração de dados para que o resultado seja o esperado.
Além de pesquisar itens compatíveis com o que o usuário está pesquisando esta
29
funcionalidade requer que o sistema exiba também itens que foram pesquisados por outros
usuários, quando estes realizavam uma pesquisa igual a que o usuário está realizando no
momento
Esta funcionalidade é importante devido ao número de possibilidades e opiniões que ela
pode disponibilizar para o usuário Através do conhecimento agregado por outros indivíduos
as chances de conhecer mais produtos ou itens que possuem ligação com o que se pesquisa
aumentam em comparação com uma busca somente baseada no perfil do usuário
Figura 5 – Recomendações baseadas na pesquisa por Chuck Berry no site da Amazon.com
Na Figura 5 pode-se visualizar o resultado de uma pesquisa por Chuck Berry no site da
Amazon.com. Perceba que diversos outros artistas foram recomendados, esta recomendação
se baseou na compatibilidade entre o artista pesquisado e os artistas sugeridos bem como em
outros aspectos, como o histórico de pesquisa de usuários que também já pesquisaram sobre
Chuck Berry.
Recomendação baseada no perfil;
A especialização do perfil e das recomendações se torna mais evidente através desta
tarefa. A recomendação é efetivamente personalizada, somente itens que forem compatíveis
com o perfil do usuário serão recomendados.
Esta customização proporciona às empresas a utilização do marketing one-to-one, onde
o cliente é único para a organização, somente serão ofertados produtos/serviços que estiverem
30
em sintonia com outros itens apresentados em seu perfil.
Na Figura 6 pode ser vista uma página do site Amazon.com que exibe uma
recomendação do site onde são levadas em consideração algumas informações do perfil do
usuário para recomendar estes itens expostos. Este sistema possui a capacidade de informar ao
usuário como chegou a esta recomendação, no alto da figura é informado que a partir de 13
elementos adquiridos pelo usuário o sistema decidiu por esta recomendação (REATEGUI e
CAZELLA, 2005).
Figura 6 – Recomendação personalizada com base no perfil do usuário. Fonte REATEGUI e
CAZELLA 2005
As estratégias citadas podem auxiliar um sistema de recomendação caso exista uma
forma de coletar os dados relevantes para a recomendação. A próxima seção apresenta as
maneiras (abordagens) para obter as informações mais utilizadas pelos sistemas de
recomendação atualmente.
2.4 COLETA DE DADOS
O processo de recomendação necessita ter um alvo de recomendação, que é o usuário do
sistema. Para oferecer um serviço de qualidade para o usuário é necessário se ter
31
conhecimento sobre quem é este usuário. A base de dados do sistema de recomendação deve
conter os dados pessoais e comportamentais dos usuários do sistema. A identificação e coleta
de dados dos usuários são fundamentais em um sistema de recomendação. A identificação do
usuário no sistema pode ser realizada de duas maneiras (REATEGUI e CAZELLA, 2005):
Identificação no servidor: ao realizar um cadastro no sistema são solicitados ao usuário
alguns dados pessoais, bem como um login e senha para identificá-lo. Estes dados são então
armazenados em um banco de dados no servidor. Sempre que o usuário acessar o sistema será
solicitado para que este informe o seu login e sua senha, desta forma o sistema consegue
identificar os usuários que estão acessando a sua aplicação. A Figura 7 apresenta a tela de
autenticação do usuário no site de comércio eletrônico MercadoLivre.com.
Figura 7 – Exemplo de identificação no servidor
Identificação no cliente: diferentemente da identificação no servidor onde o usuário é
obrigado a informar que está acessando o sistema, na identificação no cliente isto acontece
através de cookies automáticos. A identificação acontece através dos cookies gerados toda vez
que determinado computador se conecta ao web site. Um problema apresentado neste método
de identificação está na possibilidade de que nem sempre somente uma pessoa utiliza o
computador. Desta forma a identificação é de uma máquina acessando o sistema e não um
usuário em particular. A Figura 8 apresenta esta forma de identificação, onde foi identificado
que o usuário Talita se conectou ao site Submarino. O sistema identifica que é este usuário
sem que seja necessário que este informe o seu login e senha de autenticação no sistema, a
identificação foi realizada através da máquina que acessou o site.
32
Figura 8 – Identificação do cliente de forma implícita
Depois de identificado o usuário é necessário coletar os seus dados. Uma das principais
etapas em um sistema de recomendação é a coleta de dados. Os dados são a matéria-prima
para os sistemas de recomendação. É a partir dos dados que um sistema de recomendação
desempenha suas funções e oferece recomendações de qualidade.
A coleta de dados é um processo que possui certa complexidade, afinal os dados não são
obtidos facilmente. Normalmente, os usuários não gostam de preencher formulários ou
questionários porque isto demanda tempo e existem aqueles que não concordam com a
obtenção de dados de forma implícita alegando como invasão de privacidade esta abordagem
(BARCELLOS 2007, CAZELLA 2006).
A coleta de dados pode ser realizada utilizando duas abordagens:
Abordagem explícita: é feita normalmente utilizando questionários ou formulários.
Nesta abordagem o usuário interage diretamente fornecendo os seus dados. A veracidade dos
dados coletados através desta abordagem é alta, afinal reflete exatamente a opinião do
usuário. Esta técnica é bastante utilizada em coletas de dados, porém existe a resistência de
alguns usuários quanto a esta abordagem. Isto se deve ao tempo que é empregado para
responder aos questionamentos feitos, outro problema alegado por alguns usuários está em
definir se os seus dados serão utilizados de maneira confiável ou não (CAZELLA 2006,
BARCELLOS 2006, KAJIMOTO et.al. 2008).
A Figura 9 exibe um exemplo desta forma de abordagem onde o sistema deseja obter a
opinião do usuário sobre o serviço prestado. Neste caso o sistema solicita que o usuário
informe se a resposta dada por outro usuário sobre o mesmo serviço foi útil ou não. Através
desta informação o sistema pode aprimorar os serviços que presta, bem como descobrir
33
possíveis falhas existentes.
Figura 9 – Avaliação do serviço de ajuda oferecido pela Google.com
A Figura 10 apresenta outro exemplo de abordagem explícita onde o usuário informa
seus dados pessoais no site do Yahoo.com. Através do conhecimento do sexo, da idade, região
em que vive o sistema pode direcionar determinadas informações para o usuário. O serviço
poderá ser mais personalizado a partir das informações que o usuário disponibilizar sobre o
seu perfil. Na Figura 10 o sistema exibe uma mensagem que confirma estas informações. A
mensagem informa que através do CEP informado pelo usuário podem ser oferecidas notícias
relacionadas a este local.
Figura 10 – Tela de cadastro de usuário no Yahoo.com exemplo de abordagem explícita
Nos sistemas de recomendação normalmente as avaliações explícitas realizadas pelos
usuários se referem às notas, às opiniões e às preferências apresentadas pelos itens disponíveis
na base de dados (SAMPAIO, 2006). A forma explícita ainda é a mais utilizada em sistemas
de recomendação por oferecer dados claros e diretos sobre os usuários.
Abordagem implícita: os dados do usuário são adquiridos sem que este tenha
conhecimento sobre este processo. Esta coleta pode acontecer através do monitoramento da
34
navegação do usuário em sites, da interação dele com o sistema, através de logs gravados,
histórico de compras de consultas, entre outras formas. Assim como na abordagem explícita a
abordagem implícita apresenta a resistência de alguns usuários, isto se deve a falta de
privacidade que os usuários estão expostos utilizando os recursos tecnológicos (CAZELLA
2006, BARCELLOS 2006).
Algumas ações que podem ser utilizadas implicitamente são (i) colocar uma página nos
favoritos, (ii) tempo gasto lendo determinada página, (iii) scrolling utilização do scroll ou dos
botões de navegação , (iv)movimentos do mouse, (v) salvar e/ ou imprimir conteúdos, (vi)
apagar determinado item ou conteúdo, (vii) consultar por itens ou conteúdos, entre outras
ações que podem ser coletadas (NICHOLS 1997, CAZELLA 2008).
Um problema apresentado nesta abordagem diz respeito à formação das preferências de
um usuário baseando se em dados obtidos de forma implícita (SAMPAIO, 2006). A
dificuldade apresentada está em como medir a relevância destes dados que não são tão claros
e diretos como os obtidos de forma explicita (BEZERRA, 2004).
Em 2001 Claypool desenvolveu o primeiro protótipo batizado de Web browser
(Claypool et.al. 2001) que tem como meta a definição da relação entre os diversos dados
obtidos de forma implícita e as preferências de um usuário. Segundo os primeiros estudos de
Claypool existe uma relação entre o tempo de leitura gasto para uma página, a intensidade da
utilização do scroll ou ainda uma combinação de ambos com as preferências explícitas de um
usuário (BEZERRA, 2004).
Através da associação das duas formas de obtenção de dados o perfil do usuário poderá
ficar mais completo. A associação é uma boa alternativa para um sistema de recomendação
visto que alguns usuários não explicitam todas as suas preferências em uma abordagem
explícita. Desta forma ao combinar os dados implícitos com os explícitos deixa o perfil mais
específico e rico em detalhes. A Tabela 1 exemplifica a associação entre as duas abordagens,
utilizando como exemplo um usuário fictício de um sistema de recomendação de notícias.
Áreas de Interesse
Forma de Coleta
Futebol
Explícita
Música Eletrônica
Explícita
Basquete
Implícita
Reggae
Implícita
Tabela 1 – Áreas de Interesse x Forma de Coleta
35
Pode-se perceber através da Tabela 1 que duas informações são coletadas diretamente
com o usuário e duas coletadas de maneira implícita. As duas áreas de interesse baseadas no
método implícita foram obtidas através de consultas frequentes que este usuário realizava por
notícias de basquete e reggae.
A importância da associação destas duas abordagens está em oferecer recomendações
mais específicas para os usuários a partir das informações de seu perfil. Se o sistema de
recomendação de notícias não utiliza um método implícito de coleta, o usuário continuaria
desperdiçando seu tempo em pesquisas de notícias sobre basquete e reggae, mas como o
sistema detectou o seu interesse sobre estes assuntos as notícias chegarão até ele de maneira
automática.
Após esta etapa de identificação do usuário e coleta de dados é necessário determinar a
melhor técnica de filtragem a ser aplicada no sistema de recomendação. Esta técnica deve
possibilitar que o sistema atinja todos os objetivos que está proposto. A próxima seção aborda
este assunto com mais informações.
2.5 FILTRAGEM DE INFORMAÇÃO
Como citado anteriormente, a sobrecarga de informações tomou conta da era digital,
assim, para resolver esse problema surgiram técnicas para minimizar o trabalho humano na
extração do conhecimento. A filtragem de informação é uma destas técnicas utilizadas
atualmente e que fundamentam o funcionamento de um sistema de recomendação
(REATEGUI e CAZELLA, 2005).
O termo filtragem de informação pode ser compreendido como um nome utilizado para
descrever uma série de processos que estão ligados a entrega de informação para as pessoas
que realmente necessitam delas (BELVIN, 1992).
BELVIN (1992) salienta que um sistema de filtragem de informação apresenta algumas
características:
 Projetado para trabalhar com dados não estruturados ou semi-estruturados;
 Trabalha geralmente com informações textuais, bem como com imagens, vídeo e/ou
voz;
 Capaz de lidar com uma grande quantidade de dados, aplicações normalmente lidam
com gigabytes de textos ou com grandes quantidade de dados de outras mídias;
 É baseada em interesses de longa duração, nos perfis de indivíduos ou grupos.
36
Existem diversas técnicas de filtragem de informação atualmente, no entanto existem
três que são mais comumente utilizadas em aplicações de sistemas de recomendação:
filtragem baseada em conteúdo, filtragem colaborativa e filtragem híbrida (CAZELLA 2006,
OLIVEIRA 2009, BARCELLOS 2007, BEZERRA 2004, LOPES 2007).
Devido à importância destas três técnicas em aplicações de sistemas de recomendação,
todas serão descritas a seguir.
2.5.1
FILTRAGEM BASEADA EM CONTEÚDO
Também conhecida como filtragem cognitiva, esta técnica de filtragem é baseada no
conteúdo dos itens disponíveis no banco de dados comparando com os itens que o usuário
demonstra ou demonstrou interesse no passado (PEREIRA 2007, TORRES 2003, OLIVEIRA
2007).
O interesse por determinados tipos de conteúdos pode definir o perfil de um usuário
(TORRES 2003). Por exemplo, um usuário ao comprar ou pesquisar com frequência itens
esportivos está demonstrando sua preferência por itens relacionados a este assunto.
Através dos dados presentes no histórico de preferências do usuário por determinados
tipos de itens e a semelhança existente entre eles, o sistema de recomendação baseado em
filtragem por conteúdo é capaz de recomendar outros itens que podem ser do interesse do
usuário (OLIVEIRA 2007).
A recomendação baseada em conteúdo é definida pelas características presentes em
cada item da base de dados (BURKE, 2002). Um carro, por exemplo, pode ser representado
por seu modelo, por sua cor, por seu ano, por sua marca, por seu tipo de combustível entre
outros atributos, enquanto um artigo será representado pelo seu autor, título, conteúdo,
assunto, etc.
Os sistemas de recomendação devem encontrar caminhos para fazer com que seus
usuários avaliem os itens disponíveis Uma saída encontrada é solicitar que o usuário análise
certa quantidade de itens, informando se estes são de interesse ou não. Estas avaliações
obrigatórias são realizadas normalmente quando o usuário é novo no sistema e se faz
necessário que este indique suas preferências (CAZELLA, 2006).
Os maiores conhecimentos sobre os perfis dos usuários são adquiridos durante a
utilização do sistema. Através dos itens que o usuário adquire, consulta, consome, entre outras
ações que podem gerar conhecimento para o sistema (CAZELLA, 2006). Os sistemas
37
baseados em conteúdo mantêm perfis de longo prazo: o modelo de usuário se baseia nas
características dos itens avaliados por ele, sendo atualizado à medida que outros itens vão
sendo avaliados (BURKE, 2002).
Esta forma de recomendação tem sua origem nas técnicas de recuperação da informação
e nas pesquisas de filtragem de informação (OLIVEIRA, 2007). Por possuir uma ligação com
as técnicas de recuperação de informação, esta técnica de filtragem utiliza em variados
momentos a procura de itens através de palavras-chave.
Podem ser utilizadas ferramentas de busca booleana, filtragem probabilista ou técnicas
de indexação de freqüência de termos para determinar as relações entre itens e usuários. Esta
técnica trabalha da seguinte maneira: as informações sobre o conteúdo do item e do usuário
são armazenadas em vetores, onde cada palavra corresponde a uma posição. O conteúdo de
cada posição armazena o número de ocorrências para determinada palavra. Então é feita uma
comparação entre os vetores para determinar qual a proximidade de um item e um usuário
(KAJIMOTO et.al., 2008).
A filtragem baseada em conteúdo pode ser aplicada a qualquer domínio, porém na
prática ela tende a ser utilizada em domínios cujos itens possuam uma quantidade
considerável de informação armazenada de forma textual (PEREIRA, 2007). A necessidade
em possuir uma quantidade considerável de informação está na dependência que a filtragem
por conteúdo possui das informações dos itens.
A maioria dos sistemas de recomendação que utilizam a filtragem por conteúdo estão
voltados para a recomendação de documentos, artigos, páginas Web, notícias, entre outros. A
melhoria proporcionada pelos sistemas baseados em conteúdo, em relação à tradicional
recuperação de informação, vem da utilização de perfis de usuários que contém dados sobre
seus gostos, preferências e necessidades (ADOMAVICIUS e TUZHILIN (2005) apud
OLIVEIRA 2007).
Um exemplo é o sistema Krakatoa, desenvolvido por pesquisadores do Instituto de
Tecnologia da Geórgia e apresentado em 1995(TORRES, 2004). O sistema Krakatoa utiliza a
filtragem baseada em conteúdo para recomendar notícias. Diferentemente dos jornais
convencionais onde a ordem das notícias é definida pelo editor-chefe, no Krakatoa as notícias
são apresentadas de maneira diferente para cada usuário. O sistema leva em consideração a
similaridade com o perfil do usuário, realiza uma média entre as avaliações de todos os
usuários, avalia o tamanho da notícia e a composição dos artigos
38
Apesar de ser bastante utilizada em diversos sistemas de recomendação, a filtragem por
conteúdo apresenta alguns pontos fracos (PEREIRA 2007, BRESLER 2004, BEZERRA 2004,
REATEGUI e CAZELLA 2005):
 Superespecialização: itens que o usuário poderia se interessar, mas que não são
compatíveis com os itens presentes no histórico do usuário não serão recomendados
pelo sistema;
 Qualidade do item: a avaliação da qualidade dos itens somente é realizada se houver
alguma informação sobre isto no conteúdo do item. Podendo ser recomendado um
programa cheio de bugs no caso de um sistema de recomendação de downloads, se
este apresentar o mesmo conteúdo de um programa que não possua nenhum bug. A
chance de a recomendação ser de qualidade ou não é a mesma;
 Conteúdos não-estruturados: Esta filtragem não consegue trabalhar com arquivos de
multimídia, como imagens, músicas e vídeos por não se tratarem de dados
estruturados como um texto por exemplo.
 Sinônimos: análise de sinônimos, por normalmente trabalhar com arquivos que
possuam textos a análise das palavras pode ser prejudicada pela utilização de muitos
sinônimos, o que torna a filtragem mais difícil;
 Escalabilidade: Com o aumento das avaliações e com a adição de novos itens ao
sistema o tempo de pesquisa, filtragem e recomendação pode ser prejudicado. A
utilização da memória será cada vez maior;
2.5.2
FILTRAGEM COLABORATIVA
O termo filtragem colaborativa foi cunhado pela primeira vez por Goldberg
(GOLDBERG apud VENSON 2004) para explicar o mecanismo de funcionamento do
Tapestry. O termo filtragem colaborativa definido por Goldberg designa uma atividade na
qual as pessoas auxiliam umas as outras a filtrar informações. No caso do Tapestry, isto
acontecia através das anotações feitas pelos usuários sobre suas reações ao ler determinado
documento que posteriormente eram utilizadas pelos outros usuários do sistema (VENSON
2004, CAZELLA 2006).
A técnica de filtragem colaborativa ganhou espaço e atualmente diversos sistemas
utilizam as funcionalidades em suas aplicações, dentre estes sistemas pode ser citado o
39
RINGO sistema de recomendação de músicas e o BELLCORE sistema de recomendação de
vídeos. Existe uma grande aceitação desta técnica em sistemas que atuam na web (VENSON,
2004). Burke afirma que a recomendação colaborativa é provavelmente a mais familiar, a
mais utilizada e a que apresenta tecnologias mais consolidadas atualmente.
A técnica de filtragem colaborativa surgiu com a proposta de suprir os pontos falhos da
filtragem por conteúdo. A filtragem colaborativa se diferencia da filtragem por conteúdo
principalmente por não necessitar do conhecimento especifico de cada item, mas sim utilizar
das experiências dos usuários do sistema para predizer suas recomendações (CAZELLA 2006,
KAJIMOTO et.al. 2008).
Segundo Oliveira (2007) os sistemas colaborativos puros resolvem as principais
deficiências dos sistemas baseados em conteúdo. Isto se deve ao fato da recomendação
colaborativa trabalhar com as avaliações de outros usuários podendo tratar qualquer tipo de
conteúdo e recomendar itens, mesmo que esses não sejam semelhantes aos itens já avaliados
pelo usuário.
As pessoas frequentemente utilizam um mecanismo parecido com o da filtragem
colaborativa para tomar decisões. Através da opinião e recomendação de outros indivíduos
que possuam um gosto parecido são formadas opiniões e decididas algumas questões
cotidianamente. A técnica de filtragem colaborativa é a automatização deste processo
conhecido nas relações sociais humanas, como recomendação “boca-a-boca” (LICHTNOW
2006, BRESLLER 2004).
Assim como ocorre na recomendação “boca-a-boca”, a essência do método colaborativo
está na troca de experiências entre os usuários. Através da detecção de preferências
semelhantes entre os usuários são criados grupos, os membros destes grupos colaboram entre
si com as suas avaliações. O sistema então pode detectar itens que determinado usuário do
grupo possui e os demais não possuem e recomendar para estes usuários o item, julgando que
lhe poderá ser interessante (REATEGUI e CAZELLA 2005, FILHO 2006, VENSON 2004,
SAMPAIO 2006).
Portanto para que o sistema colaborativo ofereça um serviço de recomendações de
qualidade é necessária a participação dos usuários. A colaboração através das avaliações dos
itens é fundamental para um sistema de recomendação colaborativo. Normalmente o usuário
pontua o quanto determinado item é compatível com as suas preferências e assim colabora
com o sistema (REATEGUI e CAZELLA, 2005).
40
Segundo Kajimoto (2008), a abordagem colaborativa oferece um grau de surpresa maior
ao usuário do que na abordagem por conteúdo, com boas recomendações. A surpresa é fruto
da recomendação de itens algumas vezes não imaginados pelos usuários e que são
compatíveis com o seu perfil. Esta possibilidade só acontece devido ao conhecimento
agregado de diversos usuários, que torna o sistema apto a realizar recomendações inesperadas
e de qualidade.
Pode-se utilizar como exemplo a recomendação de músicas para download associado a
um usuário que pertença a um grupo do gênero do rock. Para realizar a recomendação o
sistema irá avaliar os itens que estão presentes no perfil dos usuários do grupo. Ao realizar a
pesquisa o sistema detecta que a música Moneytalks do grupo AC/DC está muito bem
avaliada pela maioria dos membros do grupo e não está presente no perfil do usuário alvo.
Desta forma o sistema recomenda esta música ao usuário, baseado nas opiniões dos outros
usuários considerando que a música sugerida é compatível com o perfil do usuário alvo.
Para adquirir informações sobre os usuários o sistema utiliza o aprendizado através das
ações desempenhadas pelo usuário no sistema ou ainda através das informações diretas
fornecidas pelo próprio usuário (KAJIMOTO et.al., 2008). A filtragem colaborativa reforça o
conceito de comunidade, na qual cada usuário contribui com suas avaliações para o
desempenho geral do sistema (CAZELLA, 2006).
Existem três fases no processo de recomendação colaborativa (CAZELLA 2006,
REATEGUI e CAZELLA 2005, KAJIMOTO et.al. 2008, VENSON 2004, SAMPAIO 2006):
 Representação dos dados de entrada: é a etapa correspondente as avaliações que o
usuário realiza dos itens disponíveis na base de dados. As avaliações podem ser
positivas ou negativas e serão utilizadas posteriormente nas recomendações.
 Formação de vizinhança: para realizar a recomendação o sistema avalia o perfil do
usuário alvo com os demais usuários da base de dados e define a similaridade
existente entre eles. Os usuários que possuem um perfil compatível com o do usuário
alvo são definidos como a sua vizinhança.
 Geração da recomendação: finalmente, com base nas avaliações feitas pelos
componentes da vizinhança aos itens de informação, o sistema gera a recomendação
para o usuário alvo. Esta etapa trata especificamente do problema de identificar os
produtos mais recomendados para um cliente a partir da sua vizinhança.
A primeira etapa que corresponde à representação dos dados de entrada pode ser
41
definida como a responsável pela organização das avaliações realizadas pelos usuários.
Normalmente, os dados são representados por uma matriz, onde as linhas representam os
usuários e as colunas são os itens disponíveis. Cada usuário realiza avaliação sobre o item que
desejar, estes valores serão preenchidos nas colunas referentes ao item avaliado. Após
realizadas as avaliações é necessário verificar as similaridades entre os usuários através das
pontuações que ele definiu para cada item.
Na Tabela 2 é exemplificado um caso de disposição dos dados referentes à avaliação de
quatro usuários quanto a quatro gêneros musicais com avaliações de zero a sete pontos:
Usuario1
Rock n' Roll
Sertanejo
Samba
Reggae
5
1
3
5
Usuario2
2
Usuario3
3
6
Usuario4
5
2
1
3
?
Tabela 2 – Exemplo de disposição dos dados na avaliação de gêneros musicais
A segunda etapa do processo da filtragem colaborativa é a definição da vizinhança.
Utilizando a Tabela 2, pode-se definir o Usuario4 como usuário alvo. Será preciso definir a
vizinhança para o Usuario4 com base nas suas avaliações e nas avaliações dos outros usuários
disponíveis.
Analisando as informações é necessário buscar itens que foram avaliados em comum
entre os usuários da pesquisa e o Usuario4. No exemplo existem dois usuários que podem ser
considerados vizinhos do Usuario4, são eles o Usuario1 que realizou respectivamente três
avaliações e o Usuario3 que realizou duas avaliações dos mesmos itens que o usuário alvo. A
próxima etapa após encontrar os usuários que avaliaram os mesmos itens é definir a
similaridade das avaliações existente entre estes usuários. No exemplo, o usuário que possui
as avaliações mais parecidas com o Usuario4 é o Usuario1, isto porque as notas que os dois
apresentaram para os itens estão mais próximas do que a comparação com o Usuario3.
Estas etapas são também comumente conhecidas como a técnica de “k-nearestneighbor” ou “user based”, que em português é conhecida a técnica do vizinho mais próximo
(ou do k vizinho mais próximo) (HERLOCKER 2000 apud CAZELLA, 2006).
A primeira etapa deste processo corresponde à definição da similaridade. Podem ser
utilizadas diferentes técnicas para definir o grau de similaridade entre os usuários, uma das
funções mais conhecidas para medir a similaridade é a distância euclidiana. A implementação
42
desta função não é considerada difícil, para provar isto tem-se um exemplo, uma empresa que
comercializa CDs e DVDs pela Internet deseja saber se o novo álbum da cantora Ivete
Sangalo agradará determinado cliente. Para realizar está avaliação é necessário avaliar o perfil
do usuário e os atributos do novo álbum da cantora. Estes dois grupos distintos, usuários e o
álbum em si podem ser considerados os dois vetores de comparação na fórmula da distância
euclidiana. A distância é dada através da comparação entre a similaridade destes dois vetores,
cada vetor pode por exemplo representar um usuário, e dentro desse vetor existir
características, no caso de dois usuários pode ser idade e gosto musical. Para definir a
similaridade entre estes dois usuários é aplicada a fórmula da distância euclidiana que
consiste em pegar uma característica de um dos usuários subtrair pela característica referente
do outro usuário e elevar o resultado ao quadrado, isto é feito para todos os atributos
existentes depois se soma o resultado da exponenciação de cada um e tira-se a raiz quadrada.
O resultado da fórmula é sempre um número positivo, quanto mais próximo de zero este
número estiver maior é a similaridade entre os usuários pesquisados. Para utilizar esta técnica
na definição da similaridade entre usuários é necessário discretizar as características dos
mesmos. A discretização seria, por exemplo, na característica gosto musical definir da
seguinte forma: 1- Sertanejo, 2-Pop, 3-Rock, 4-Blues, e utilizar os códigos definidos na
aplicação da fórmula. Esta discretização deve ser realizada em todos os atributos que serão
avaliados no perfil dos usuários. A Figura 11 exibe a fórmula da distância euclidiana.
Figura 11 – Fórmula do cálculo da distância euclidiana
Outra técnica utilizada para a definição da similaridade é o coeficiente de Pearson, que
mede a força de duas variáveis. Nesta técnica primeiramente é calculado o coeficiente para os
itens que ambos os usuários avaliaram depois é calculado a média das avaliações de todos os
coeficientes calculados, resultando em quanto um usuário é similar ao outro. O valor do
coeficiente de Pearson varia de -1, indicando ausência de correlação, a 1, indicando total
correlação. Esta forma de cálculo é considerada ideal quando existem avaliações positivas e
negativas para os itens disponíveis (FILHO 2006).
Após a definição da similaridade e da vizinhança é chegada à terceira etapa do processo
43
de recomendação colaborativa, a geração da recomendação. Através das informações
disponíveis o sistema deve predizer um valor que o usuário alvo da recomendação daria a
cada item candidato a recomendação que não foi avaliado por ele. Esta predição define qual
item é mais apropriado para a recomendação. As informações nas quais o sistema se baseia
para recomendar determinado item são os valores das avaliações que os usuários vizinhos
definiram para os itens passiveis de recomendação. A recomendação pode ser realizada
através de uma média ponderada entre as avaliações da vizinhança do usuário alvo
(PEREIRA, 2007).
Voltando ao exemplo dos usuários presentes na Tabela 3, depois de encontrar o vizinho
mais próximo do usuário alvo pode se partir para a última etapa, a geração da recomendação.
Neste caso o sistema poderia recomendar em algum momento para o Usuario4 um item que
estivesse ligado ao estilo musical Reggae.
Rock n' Roll
Sertanejo
Samba
Reggae
Usuario1
5
1
3
5
Usuario4
5
2
3
?
Tabela 3 – Comparativo entre as avaliações dos usuários vizinhos
Isto se deve ao fato de que mesmo o Usuario4 não tendo avaliado este estilo musical o
seu vizinho mais próximo realizou uma avaliação. Através da avaliação do vizinho mais
próximo e das demais avaliações realizadas por ambos os usuários o sistema definiu que o
estilo musical Reggae pode ser interessante para o Usuario4. Podendo assim em determinado
momento lhe recomendar itens e conteúdos ligados ao estilo musical Reggae.
Mesmo sendo umas das técnicas mais utilizadas nos sistemas de recomendação
atualmente, a filtragem colaborativa apresenta alguns problemas que serão brevemente
detalhados abaixo(FILHO 2006, BEZERRA 2004, TORRES 2004, OLIVEIRA 2007, LOPES
2007):
 First-rater problem (Item novo): problema do primeiro avaliador consiste no fato de
que enquanto um item não receber avaliações por nenhum usuário, ele não pode ser
recomendado, pois não estará relacionado a nenhum perfil;
 Startup problem (Sistema novo): diz respeito ao estado inicial do sistema, quando
existem poucos usuários Com menos usuários a dificuldade em encontrar
similaridades entre os perfis é bem maior.
 Usuário ovelha-negra: algumas vezes pode acontecer do sistema avaliar dois usuários
44
como pertencentes ao mesmo grupo, mas na verdade eles têm preferências distintas.
Isto ocorre porque quando os usuários possuem poucas avaliações o sistema entende
que as avaliações dos mesmos itens podem significar que os usuários são parecidos.
Os usuários ovelha-negra são aqueles que possuem um gosto distinto da maioria dos
membros do sistema, as recomendações neste caso se tornam pouco eficientes, pois
não existem usuários que possam colaborar para melhoria de sua qualidade;
 Formação dos grupos: o cálculo realizado para determinar os grupos de usuários
demanda um gasto computacional considerável no sistema. Para calcular os grupos é
necessário fazer diversos cálculos e verificações com todos os usuários do sistema,
isto se torna um processo demorado e caro computacionalmente
 Sparcity problem (Avaliações esparsas): Como normalmente as bases de dados são
muito grandes seria necessário que um usuário avaliasse muitos itens para que as
recomendações ganhassem em nível de qualidade. Um exemplo deste problema
acontece em sites de comércio eletrônico que possuem uma base de dados que pode
passar de 1 milhão de produtos. Para um usuário formar um perfil com 0,1% dos itens
disponíveis teria que avaliar ou comprar 1000 produtos.
 Escalabilidade: quanto maior o numero de usuários e de itens avaliados o consumo dos
recursos disponíveis para o sistema será maior. Isto pode refletir na qualidade do
serviço prestado aos usuários do sistema.
 ColdStart: “partida fria” quando não são inicialmente disponíveis dados sobre o perfil
do usuário;
2.5.3
FILTRAGEM HÍBRIDA
A filtragem híbrida é uma filtragem proveniente da combinação de dois ou mais tipos de
filtragem. Normalmente a maioria dos sistemas que implementam a filtragem hibrida utilizam
a filtragem baseada em conteúdo associada à filtragem colaborativa (CAZELLA, 2006). Na
Tabela 4 são exibidos alguns pontos distintos presentes nas duas formas de filtragem.
Filtragem Baseada em Conteúdo
Filtragem Colaborativa
Não consegue tratar itens que possuam conteúdo Pode oferecer a recomendação de itens
não – estruturados. Exemplo: Imagens, Filmes, estruturados normalmente.
Músicas;
não-
45
Recomenda itens novos sem apresentar nenhum Item novo na base é um dos pontos fracos da filtragem
problema.
colaborativa. Somente após receber algumas
avaliações um item poderá ser recomendado aos
usuários.
Superespecialização, um item somente é
recomendado para um usuário se este for
compatível com o seu perfil. Não acontecem
recomendações inesperadas.
Recomendações inesperadas, inusitadas, que causam
surpresa nos usuários. Através do conhecimento
agregado por outros usuários diversos itens
desconhecidos porém compatíveis com o seu perfil
podem lhe ser recomendados.
Boas recomendações mesmo para usuários com Usuários com gostos diferentes da maioria dos
gostos inusitados.
usuários do sistema tendem a receber recomendações
ineficientes ou nem mesmo receber recomendações.
Não leva em consideração a qualidade do Através das avaliações dos usuários é possível avaliar
produto, podendo recomendar item ou conteúdo a qualidade dos itens e conteúdos que serão
com problemas.
recomendados, garantindo assim a qualidade do
serviço de recomendação.
Tabela 4 – Principais diferenças entre as duas abordagens que podem ser supridas na filtragem hibrida
Todos os tipos de filtragens apresentam pontos positivos e negativos, algumas vezes
estes pontos se acentuam devido ao domínio em que estão aplicadas. A associação de
diferentes técnicas objetiva reduzir ou até mesmo eliminar as desvantagens apresentadas em
cada técnica e fortalecer as vantagens que cada uma possui. Para determinar uma abordagem
híbrida é necessário uma pesquisa sobre as técnicas que serão aplicadas, uma vez que cada
uma pode interferir de maneira diferente na qualidade das recomendações (TORRES, 2004).
Existem maneiras diferentes para aplicar a filtragem hibrida em um sistema: a
combinação da filtragem baseada em conteúdo com a colaborativa. A seguir são apresentadas
algumas formas de combinação (Adomavicius e Tuzhilin (2005) apud OLIVEIRA 2007):
 Implementar as duas técnicas de forma separada e combinar as suas predições. Desta
forma o sistema pode oferecer recomendações baseadas em diferentes técnicas. Pode
ser utilizado um mecanismo para medir a qualidade de recomendação oferecida por
cada uma das técnicas, aquela que apresentar o maior índice de qualidade é utilizado
naquele momento.
 Incorporar algumas características baseadas em conteúdo em uma sistema colaborativo.
Objetivando disponibilizar itens antes não recomendados através da utilização da
filtragem colaborativa;
 Incorporar características colaborativas em um sistema baseado em conteúdo O objetivo
é o de oferecer recomendações com maior qualidade e diminuir alguns problemas
possíveis na filtragem por conteúdo;
46
 Unificar as características das duas abordagens com o objetivo de obter recomendações
mais precisas;
Após a escolha da melhor forma de filtragem de informações é necessário decidir qual a
melhor técnica de recomendação para ser empregada no sistema proposto. Os sistemas de
recomendação se dividem em duas classes de técnicas de recomendação possíveis, que serão
apresentadas na próxima seção.
2.6 TÉCNICAS DE RECOMENDAÇÃO
Os algoritmos utilizados nas técnicas de filtragem de informação, baseadas em conteúdo
e colaborativa podem ser divididos em duas classes distintas: aqueles baseados em memória e
aqueles baseados em modelo.
A diferença existente entre estas duas classes está na forma de funcionamento. Os
algoritmos baseados em memória mantêm uma base de dados com todos os usuários e suas
preferências, e sempre que fazem uma recomendação operam sobre toda a base de usuários ou
itens. Enquanto os algoritmos baseados em modelo primeiro compilam todas as preferências
do usuário gerando um modelo, e depois disso realizam as predições a partir do modelo
gerado (PENNOCK et.al., 2000 apud OLIVEIRA 2007, ADOMAVICIUS apud CAZELLA,
2006).
Os algoritmos baseados em memória tendem a produzir recomendações de melhor
qualidade do que os baseados em modelo, isto se deve ao fato da predição ser realizada em
toda a base. No entanto esta qualidade de recomendação acarreta em uma utilização maior dos
recursos computacionais, visto que toda a base de dados será avaliada (OLIVEIRA, 2007).
Diferentemente dos algoritmos baseados em memória os algoritmos baseados em
conteúdo não utilizam toda a base de dados. Por este fato suas recomendações são mais
rápidas, o universo de itens avaliados é bem menor neste caso. Entretanto a qualidade da
recomendação pode ser afetada por se levar em consideração apenas um modelo e não base
inteira de itens disponíveis (OLIVEIRA, 2007).
A Tabela 5 representa a classificação de técnicas aplicadas a sistemas de recomendação
desenvolvida por Adomavicius e extraída de Cazella 2006. Esta tabela classifica os sistemas
de recomendação por técnicas de recomendação (método de filtragem da informação) e
técnicas aplicadas (algoritmos baseadas em memória ou modelo). São apresentadas diversas
47
técnicas que são utilizadas no desenvolvimento dos sistemas de recomendação atualmente,
como redes bayesianas, redes neurais, árvores de decisão, entre outras.
Técnicas
Recomendação
de Técnicas Aplicadas
Baseada em Memória
Baseada em Modelo
Baseada em Conteúdo
Técnicas mais utilizadas:
TF-IDF (recuperação de informação)
Agrupamento
Técnicas mais utilizadas:
Classificadores Bayesianos
Agrupamento
Árvores de Decisão
Redes Neurais
Colaborativa
Técnicas mais utilizadas:
Vizinhança mais próxima (cosseno,
correlação)
Teoria dos Grafos
Técnicas mais utilizadas:
Redes Bayesianas
Agrupamento
Redes Neurais
Regressão Linear
Modelos Probabilísticos
Hibrida
Combinando componentes
baseados em conteúdo e
colaborativos:
Combinação linear de avaliação
previstas
Esquemas variados de votação
Incorporando um componente
como parte da heurística de outro.
Combinando componentes
baseados em conteúdo e
colaborativos:
Incorporando um componente
como parte de um modelo em
outro
Construindo um modelo unificado
Tabela 5 – Classificação dos sistemas de recomendação proposta por ADOMAVICIUS 2005
Ao analisar a Tabela 5 pode se perceber a quantidade considerável de pesquisas
realizadas na área de sistemas de recomendação. Este estudo frequente sobre as melhores
técnicas a serem aplicadas é que impulsiona o crescimento no desenvolvimento e utilização
destes sistemas. A próxima seção apresenta algumas limitações encontradas atualmente nos
sistemas de recomendação.
2.7 LIMITAÇÕES PRESENTES EM UM SISTEMA DE RECOMENDAÇÃO
Os sistemas de recomendação apresentam algumas limitações. Os problemas
apresentados em um sistema de recomendação estão baseados desde a sua estruturação até
problemas relativos ao domínio em que esta estabelecida a aplicação (BEZERRA, 2004).
Existem alguns problemas que podem ser considerados mais graves, pois não existe um
número significativo de estudos que objetivam solucioná-los, estes problemas estão
relacionados à: (i) aspectos de escalabilidade, (ii) esparsidade, (iii) uso de memória,
48
(iv)desempenho em tempo real, (v)explicação e (vi)apresentação de recomendações
(BEZERRA, 2004). Alguns destes problemas já foram apresentados no decorrer do capítulo e
em sua maioria estão relacionados ao método de filtragem escolhido. Outras limitações
encontradas na utilização de um sistema de recomendação serão elencadas a seguir:
Problema de ausência ou descaso das dimensões temporal e espacial: em um sistema de
recomendação várias informações do perfil do usuário são levadas em consideração para
realizar uma recomendação adequada e com qualidade, porém existe uma variável importante
que normalmente não é analisada nos sistemas de recomendação atuais. Esta variável se refere
à localização do usuário, seja esta geograficamente ou temporalmente. A importância em
avaliar esta informação esta nas diferenças apresentadas no perfil dos indivíduos de acordo
com a sua região.
Por exemplo, uma recomendação realizada em determinado período do ano, durante o
inverno. Se por acaso o usuário que estiver realizando esta pesquisa residir na região sul do
país o sistema deve ser capaz de compreender que não pode recomendar artigos de verão. Esta
lógica deve ser aplicada devido ao inverno rigoroso da região sul. No entanto se o usuário
estiver localizado na região nordeste, o sistema não deveria lhe recomendar artigos de
inverno, visto que a região apresenta temperaturas elevadas em todas as épocas do ano.
Esta forma de recomendação é mais complexa devido ao grau de comparações,
verificações e pesquisas que o sistema precisa realizar para indicar uma recomendação
satisfatória.
Problema de dificuldade de explicação e apresentação das recomendações: a dificuldade
apresentada neste caso se refere à descoberta de uma maneira de convencer o usuário de que o
produto que esta sendo recomendado é realmente o que este necessita ou deseja. Alguns
usuários encaram as recomendações somente como uma forma das empresas aumentarem os
seus lucros. No entanto várias organizações procuram formas de demonstrar que a satisfação
do cliente com os serviços por ela prestados é um dos principais objetivos da empresa.
Uma alternativa é utilizar formas de comunicação com o cliente, (i) explicando o porquê do
produto recomendado, (ii) quais as vantagens deste, (iii) como o sistema chegou a esta
conclusão, (iv) apresentar opinião de outros usuários sobre o produto recomendado. Enfim
realizar um serviço que normalmente é realizado em uma recomendação “boca-a-boca”. Onde
o recomendador convence através da explicação dos fatores que leva ele a ter determinada
49
opinião sobre o produto e o faz recomendá-lo.
Problema de ausência de informações de negócio e integração com outros sistemas: as
informações presentes e filtradas através de um sistema de recomendação são muito valiosas
para as empresas que detém de uma tecnologia deste porte. Estas informações, no entanto na
maioria dos sistemas de recomendações são utilizadas apenas na sua aplicação não fazendo
uma integração com sistemas de informações gerenciais ou de apoio a decisão.
Além da falta de integração com outros sistemas existe a ausência de informações de
negócios, que representam as regras que regem a empresa que possui o sistema de
recomendação. Um exemplo conhecido é a oferta promocional de produtos quando estes
estão com o prazo de validade próximo. Estas promoções são determinadas de acordo com a
empresa e representam regras de negócio.
A integração das funcionalidades usuais de um sistema de recomendação com as regras de
negócio da empresa representam um aumento no valor agregado dos serviços prestados.
2.8 CONSIDERAÇÕES FINAIS
Conforme foi visto no presente capítulo os sistemas de recomendação objetivam
resolver ou ao menos minimizar um problema que a maioria das pessoas enfrenta com
freqüência, decidir ou encontrar algo em meio a uma quantidade de possibilidades muito
extensa.
A principal tarefa de um sistema de recomendação é oferecer a informação correta para
o usuário que dela necessita, sem que para isto este usuário precise despender de seu tempo e
raciocínio.
O processo de desenvolvimento de um sistema de recomendação é complexo. São
diversas as etapas no decorrer do seu desenvolvimento. Cada uma possui o seu grau de
importância para o sistema como um todo, e o resultado final pode ser influenciado por
decisões tomadas em todas as etapas. Desde as escolhas do (i) método para coletar os dados
do usuário, (ii) das formas de identificar o cliente no sistema, (iii) da técnica de filtragem, (iv)
da determinação da classe de algoritmos utilizada.
As limitações apresentadas em um sistema de recomendação são variadas e estão
ligadas desde o seu desenvolvimento até a aplicação final. Ao invés de se encarar estas
50
limitações como obstáculos intransponíveis elas devem ser vistas como incentivo. Através de
pesquisas podem-se encontrar as soluções ou pelo menos métodos para minimizar estes
problemas. Fazendo isto a qualidade oferecida em um sistema de recomendação será cada vez
maior e a satisfação dos usuários crescerá na mesma medida.
Os sistemas de recomendação possuem algumas limitações especificas, no entanto os
benefícios e funcionalidades que são oferecidas aos usuários superam estas limitações. A
capacidade de auxiliar os usuários em diversos domínios e estimular a colaboração entre os
indivíduos são pontos fortes destas aplicações.
A proposta de aplicação de um sistema de recomendação de presentes objetiva
exatamente a minimização das dificuldades dos usuários ao desempenhar esta função através
do auxílio do sistema. A recomendação que é um processo já conhecido da humanidade aliado
a tecnologia pode representar um diferencial e trazer diversos benefícios para aqueles que
utilizam as aplicações de sistemas de recomendações.
O próximo capítulo tratará especificamente de técnicas e métodos baseados em
Inteligência Artificial (IA) que podem ser aplicados em sistemas de recomendação. Alguns
destes métodos já foram citados no presente capítulo, porém de forma superficial.
51
3.TÉCNICAS DE MINERAÇÃO DE DADOS COM INTELIGÊNCIA ARTIFICIAL
Atualmente a escassez e a dificuldade de acesso as informações foram substituídas pela
sobrecarga de informações nos mais diversos locais (KAJIMOTO et al. 2008). Filtrar o que é
realmente relevante em meio à grande quantidade de dados disponíveis é quase impossível
sem o auxílio de técnicas de filtragem e mineração de dados. A partir dessa necessidade foram
desenvolvidas técnicas que objetivam auxiliar neste processo.
A mineração de dados consiste na tarefa de explorar grandes quantidades de dados a
procura de padrões consistentes. Através da descoberta destes padrões pode se extrair
conhecimento (DE SOUZA 2007).
A definição do correto método de mineração de dados é importante, pois dependendo do
objetivo da aplicação algumas técnicas são mais eficientes que outras (REATEGUI e
CAZELLA 2005). Muitas das técnicas atualmente utilizadas na mineração de dados foram
desenvolvidas durante a década de 80 e 90 pela área de Inteligência Artificial (DE SOUZA
2007).
O presente capítulo objetiva demonstrar algumas das principais técnicas de mineração
de dados utilizadas atualmente em sistemas de recomendação. A seguir será apresentada uma
breve explicação sobre o campo da inteligência artificial que é uma das ciências que mais
contribui com estudos e pesquisas em mineração de dados e posteriormente as técnicas
individualmente.
3.1 INTELIGÊNCIA ARTIFICIAL, A CIÊNCIA DO RACIOCÍNIO
A espécie humana possui inúmeras particularidades com relação às outras espécies
animais, porém a que pode ser considerada a mais significativa é a sua capacidade de
raciocinar. Através desta capacidade o homem conseguiu sobreviver à ambientes e situações
adversas ao longo de sua evolução, aprendendo, prevendo, manipulando e de certa forma
controlando um ambiente muito maior que ele próprio (RUSSEL, NORVIG, 2006).
O estudo desta aptidão humana teve inicio há muito tempo, diversas áreas do
conhecimento procuram entender como a mente humana atua. Dentre estas áreas estão à
filosofia, a psicologia, a matemática mais tarde contando também com a economia, a
neurociência entre outras (RUSSEL, NORVIG, 2006).
52
A inteligência artificial é fundamentada nas teorias e pesquisas cientificas realizadas por
outras ciências, devido a este fato, a inteligência artificial pode ser entendida como um ciência
antiga e atual ao mesmo tempo. Atual porque se compararmos com o tempo de vida de outras
ciências esta é muito jovem, tendo seu nascimento oficial no ano de 1956 quando foi criado o
termo inteligência artificial. Porém como a sua base de fundamentação contém estudos e
pesquisas de ciências muito antigas alguns estudiosos defendem a idéia de que esta ciência é
tão antiga quanto às ciências em que se fundamentou (BITTENCOURT, 2006).
Mesmo tendo sua base de conhecimentos em parte por intermédio de outras ciências, o
que diferencia a inteligência artificial das demais ciências que estudam o comportamento
humano é que a primeira não objetiva apenas compreender os fatores que influenciam o ser
humano a tomar decisões ou agir racionalmente, mas também construir modelos inteligentes a
partir destas informações.
“A Inteligência Artificial sistematiza e automatiza tarefas intelectuais e, portanto é
potencialmente relevante para qualquer esfera da atividade intelectual humana.
Neste sentido, ela é verdadeiramente um campo universal ”(RUSSEL, NORVIG,
2006).
Na busca pela simplificação de problemas complexos ligados ao comportamento
humano a inteligência artificial possibilita a abordagem de quatro métodos para se obter
informações que caracterizem o comportamento de uma pessoa e depois reproduzi-las em
entidades artificiais. Estas abordagens se baseiam em agir de forma humana, pensar de forma
humana, pensar racionalmente e agir racionalmente (RUSSEL, NORVIG 2006).
Com o decorrer do tempo o campo de inteligência artificial desenvolveu inúmeras
técnicas que atualmente são utilizadas com o objetivo de reproduzir o comportamento
humano de alguma maneira. Algumas destas técnicas estão ligadas ao processo de tomada de
decisão ou ainda a descoberta de conhecimento. O estudo de como o homem chega a
determinadas conclusões e realiza escolhas possibilitou o desenvolvimento de técnicas para a
descoberta de conhecimento em fontes de dados. Algumas das principais técnicas são
apresentadas no decorrer deste capítulo, primeiramente serão definidas as técnicas de
mineração de dados, após esta definição serão exemplificadas as técnicas de inteligência
artificial que podem ser utilizadas em cada uma das técnicas de mineração de dados.
53
3.2 TÉCNICAS DE MINERAÇÃO DE DADOS
O maior desafio da mineração de dados se encontra na tarefa de extrair conhecimento
que está embutido ou escondido nas bases de dados. O conhecimento pode ser adquirido até
mesmo sem a utilização de qualquer técnica. No entanto uma grande parte do conhecimento
fica implícita, para extrair este conhecimento são criadas técnicas especiais, as quais
objetivam descobrir conhecimento em meio a coleções de dados (REZENDE 2005).
Através dos diversos estudos e pesquisas realizados pela área de inteligência artificial
tem se proporcionado aos pesquisadores a possibilidade de utilizar diferentes técnicas de
reconhecimento e extração de dados (REZENDE 2005).
Existem quatro técnicas que se destacam em meio às outras abordagens que podem ser
utilizadas, são elas associação, classificação, agrupamento ou clusterização, e regressão. A
seguir serão apresentadas três destas técnicas que respectivamente podem ser utilizadas em
aplicações de sistemas de recomendação. Estas técnicas podem funcionar baseadas em dois
tipos de aprendizado, sendo estes o aprendizado supervisionado e o aprendizado nãosupervisionado. O aprendizado supervisionado é aquele no qual existem padrões definidos
para os dados serem classificados enquanto o aprendizado não-supervisionado realiza a
classificação de acordo com os padrões que ele encontra durante a mineração dos dados.
3.2.1
ASSOCIAÇÃO
A associação é uma das mais conhecidas técnicas de mineração de dados, algumas
vezes sendo até mesmo confundida com o processo de mineração. Este método de extração de
conhecimento foi o responsável por uma das descobertas mais famosas na cadeia de
supermercados Wal-Mart: “nas sextas-feiras, quem comprava fraldas também comprava
cerveja” (LOH e GARIN 2001). A capacidade que esta técnica possui em extrair
conhecimento em meio a uma vasta gama de dados é um dos principais motivos de sua
popularidade em meio aos métodos de mineração de dados.
Esta técnica tem por objetivo encontrar associações entre os atributos existentes e a
partir disto, gerar regras que representem estas associações. As regras descobertas são
conhecidas como regras de associação (BRESSLER 2004).
Desse modo, o objetivo das regras de associação é encontrar tendências que possam ser
usadas para entender e explorar padrões de comportamento dos dados (REZENDE 2005). Por
54
exemplo, observando as preferências musicais de determinado grupo de usuários percebe-se
que 85 % dos usuários que gostam da banda Oasis também gostam da banda inglesa The
Beatles. Esse exemplo é a identificação de uma tendência. As associações são realizadas com
base na freqüência que um item aparece em um conjunto de dados, como estas avaliações são
realizadas em toda a base de dados, os resultados com ela obtidos possuem um grau de
confiabilidade alto.
A regra de associação dos dados pode ser utilizada em diferentes domínios, uma área
que apresenta uma considerável utilização desta técnica é a de negócios. Por exemplo, através
das informações presentes no histórico de compras dos clientes varias associações podem ser
realizadas. Muito conhecimento está implícito nestes dados, com a extração deste
conhecimento a organização pode receber diversos benefícios. Obtendo por exemplo o
conhecimento dos produtos que possuem ligação, isto é, que são mais frequentemente
comprados em conjunto a empresa pode oferecer promoções direcionadas, pode modificar a
disposição dos produtos na empresa, entre outras modificações que podem acontecer.
Esta descoberta de conhecimento em históricos ou listas de compras é conhecida
também como “carrinho de compras”, do qual o objetivo é descobrir, em uma lista de
compras feitas em um mesmo carrinho, quais são os objetos que são comprados em conjunto
(SANTOS 1999).
As regras de associação possuem dois graus: a confiança e o suporte. O suporte é o
número de casos onde a regra foi encontrada (onde X e Y aparecem juntos). A confiança é a
probabilidade condicional da regra, ou seja, quais as chances do segundo elemento estar
presente. A confiança é calculada pela divisão do número de casos onde X e Y aparecem
juntos (o suporte absoluto), pelo número de casos onde somente X aparece, este cálculo indica
o quanto Y é relacionado com X (LOH e GARIN 2001, SAMPAIO 2006).
Na Tabela 6 é exibido o exemplo citado das preferências musicais, usuários que gostam
da banda Oasis e também gostam de The Beatles. Através desta associação pode se direcionar
notícias, informações ou promoções que possuam as duas bandas ligadas. Por exemplo, ao
adquirir o último álbum do Oasis o usuário ganha desconto no álbum Revolver dos Beatles,
ou em outro produto disponível da banda.
A Tabela 6 apresenta os valores calculados, onde em uma base com 300 usuários, 68
admitem gostar de Oasis e The Beatles, este valor reflete o suporte da associação. No entanto
para garantir que existe realmente uma ligação entre estas duas bandas é preciso calcular a
55
confiança existente entre ambas. Este cálculo é importante, pois em uma base com 300
usuários como a do exemplo o número de 68 que foi obtido com a associação entre estas duas
bandas pode ser inferior, por exemplo, se a banda Oasis aparecer mais 200 vezes associada a
outro artista, a confiança garante que o item que esta sendo avaliado possui realmente uma
ligação com o outro. No exemplo a banda Oasis aparece somente 4 vezes em perfis de
usuários que não gostam de Beatles o que pode deixar subentendido que existe uma forte
ligação entre estas duas bandas na base de dados.
Grau
associação
de Base para a Associação
Valor
Suporte
Número de vezes em que a banda Oasis e The Beatles aparecem 68
juntos na preferência dos usuários
Confiança
Total de vezes que as duas bandas aparecem juntas, dividido pelo 68/4 = 17
numero de vezes em que somente aparece a banda Oasis nas
preferências dos usuários
Tabela 6 – Graus de associação no exemplo de preferência musical de usuários de um sistema
Um dos algoritmos mais conhecidos e utilizados para realizar associações é o chamado
a priori. Através deste algoritmo é possível descobrir novos conhecimentos utilizando os
conceitos de suporte e confiança para validar e verificar a qualidade das regras, ou seja, dos
padrões encontrados. O funcionamento básico deste algoritmo se fixa na condição ( SE ,
ENTÃO). Por exemplo, se o usuário gosta de Oasis então também gosta de The Beatles. Estas
combinações são a base das associações (BRESSLER 2004, SANTOS 1999). A
implementação e uso do algoritmo a priori requer preparo especial dos dados para que possam
ser representados adequadamente (SANTOS 1999).
A técnica de regras de associação pode apresentar alguns problemas em sua
implementação, são eles (TAN 2000 apud CAZZELA 2006, VENSON 2002):
 Um número muito grande de regras é gerado dificultando a seleção das mesmas;
 Nem todas as regras geradas são interessantes;
 Pode não ser possível gerar regras de associação fortes suficientes se o número de dados
consultados não for considerável;
3.2.2
AGRUPAMENTO
Os algoritmos de agrupamento ou clustering estão associados aos sistemas baseados em
56
aprendizagem não-supervisionada. As classes e padrões somente são definidos avaliando a
similaridade entre os elementos e dividindo estes em grupos (OLIVEIRA 2007, LOH E
GARIN 2001).
A técnica de agrupamento é considerada uma forma de descoberta natural, pois as
similaridades próprias de cada elemento é que definem a sua classificação e não um modelo
externo proposto. Dados agrupados em um mesmo grupo podem ser considerados parecidos o
suficiente, e dados em grupos diferentes são considerados diferentes entre si (SANTOS 1999).
A forma de agrupamento pode ser comparada com a maneira como as pessoas escolhem
seus amigos. Não existe uma regra estabelecida que determine qual pessoa cada indivíduo
deve escolher para ser amigo, esta escolha é definida a partir de diversos atributos existentes
em cada indivíduo que podem ou não ser interessantes para a outra pessoa. Por exemplo, na
maioria das vezes os indivíduos procuram nos amigos algo que seja compatível com o seu
perfil mesmo que a primeira impressão seja a de total distinção entre ambos existe a
possibilidade de em algum ponto surgir uma semelhança. Um grupo de indivíduos pode ser
agrupado por possuir um mesmo gosto em comum, por exemplo, gostar de futebol, no entanto
outros gostos podem ser bem diferentes como o estilo musical por exemplo. O ideal na
utilização de um método de agrupamento é que a similaridade definida seja resultado da
verificação de diversos atributos, para criar grupos mais específicos. Esta preocupação se
deve ao fato de um mesmo indivíduo possuir muitas características podendo ser encaixado em
diversos grupos, o agrupamento deve garantir que o indivíduo fique no grupo mais especifico
com o seu perfil.
Para identificar a similaridades entre os elementos de um universo de pesquisa é
definida uma função para medida de similaridade. Esta função deve levar em consideração as
características que representam os elementos. O agrupamento auxilia o processo de
descoberta de conhecimento, facilitando a identificação de padrões (características comuns
dos elementos) nas classes (LOH E GARIN 2001).
Os algoritmos baseados em agrupamentos objetivam aumentar a similaridade intragrupo e diminuir a similaridade inter-grupo (BEZERRA 2004). Os grupos devem ser cada vez
mais parecidos e compatíveis, com um grau de agrupamento maior o conhecimento extraído
pode ser melhor e mais facilmente interpretado.
Alguns exemplos de algoritmos que podem ser utilizados para desenvolver a técnica de
agrupamento são o algoritmo K-Médias, o algoritmo Fuzzy C-Médias e o algoritmo de mapas
57
auto-organizáveis de Kohonen.
Mesmo que a técnica de agrupamento seja menos precisa do que outros métodos de
descoberta de conhecimento a sua utilização tem crescido constantemente, aplicações de
comércio eletrônico normalmente utilizam esta técnica para a descoberta de conhecimento.
Uma vantagem apresentada por este método em comparação com os demais se refere ao seu
consumo de recursos computacionais ser mais baixo que o de outras técnicas. Esta vantagem
é muito considerável quando se trata de aplicações de e-commerce devido ao alto número de
usuários conectados ao sistema e a grande quantidade de itens disponíveis na base de dados
(BEZERRA 2004).
A maioria dos algoritmos clássicos de agrupamento somente permite o uso de atributos
numéricos, já que uma função de distância é usada para determinar a pertinência de um
determinado dado à um grupo, mas extensões que consideram dados numéricos e não
numéricos de forma separada podem ser criadas (SANTOS 1999).
3.2.3
CLASSIFICAÇÃO
Ao contrário do método de agrupamento que consiste em um aprendizado nãosupervisionado a técnica de classificação é supervisionada. Neste método são definidas as
classes as quais os dados presentes no banco de dados poderão ser classificados (CABENA
1997 apud REATEGUI e CAZZELA 2005).
Utilizando o mesmo exemplo citado na técnica de agrupamento, da formação das
amizades. Neste caso existiriam classes definidas, de acordo com as características de cada
indivíduo as suas possíveis amizades seriam definidas. Características como classe social,
raça, religião, poderiam definir que indivíduos podem ter laços de amizade, por exemplo
pessoas de classe social A somente podem ter laços de amizade com indivíduos de mesma
classe.
Segundo Lopes (1999) apud BRESSLER 2004, a classificação tem como função
descobrir uma relação entre vários atributos preditivos e um atributo objetivo. O objetivo da
classificação é descobrir determinado conhecimento que possa ser utilizado posteriormente
para classificar itens desconhecidos, que ainda não possuem uma classificação (REATEGUI E
CAZELLA, 2006).
Por exemplo, um usuário novo no sistema não informou o seu estilo musical favorito,
através da técnica de classificação o sistema pode tentar definir a qual grupo de gêneros
58
musicais o usuário é compatível. Esta capacidade somente é possível se for analisado alguns
atributos que possam induzir a uma classificação. Algumas características que podem ser
levadas em consideração neste exemplo são o sexo do usuário, a idade e o estilo musical
definido. A Tabela 7 apresenta de melhor forma estes dados.
Sexo
Região do País
Estilo Musical
Feminino
Sul
Reggae
Masculino
Sudeste
Reggae
Masculino
Sudeste
Reggae
Masculino
Sul
Rock
Masculino
Sul
Rock
Feminino
Centroeste
Sertanejo
Feminino
Centroeste
Sertanejo
Masculino
Sul
Rock
Feminino
Sul
Reggae
Feminino
Sul
Reggae
Masculino
Sudeste
Reggae
Tabela 7- Dados para classificação de estilo musical
A partir das informações coletadas é feita uma classificação dos dados através dos
atributos especificados, neste caso a classificação leva em consideração o atributo Sexo, a
Região do País em que o usuário reside e o Estilo Musical definido em seu perfil. Com base
nestas informações o usuário que não definiu o seu estilo musical pode ser incluído em algum
grupo. Por exemplo, com base nas informações presentes na Tabela 7 pode se concluir que:
 Se o usuário é do sexo feminino e reside na região Centroeste o seu estilo musical
preferido pode ser o sertanejo;
 Se o usuário é do sexo masculino e reside na região Sudeste o seu estilo musical
preferido pode ser o Reggae;
 Se o usuário é do sexo feminino e reside na região Sul o seu estilo musical preferido
pode ser o Reggae;
 Se o usuário é do sexo masculino e reside na região Sul o seu estilo musical preferido
pode ser o Rock;
O exemplo possui poucos dados e certamente que para extrair conhecimento das
59
classificações de forma eficiente o universo de dados deve ser consideravelmente grande.
Em um sistema de recomendação este método de classificação pode ser muito válido
para recomendações para usuários novos no sistema. Com a análise dos dados de outros
usuários pode se fazer recomendações, isto através da comparação dos atributos do novo
usuário com os já existentes no sistema (REATEGUI e CAZELLA 2005).
As árvores de decisão são um dos algoritmos mais utilizados para determinar a
classificação de dados. Segundo Bressler (2004), os métodos de classificação tiveram sua
origem baseados nas árvores de decisão. A principal diferença existente entre estes dois
métodos está no número de regras que são utilizas para realizar a classificação. Enquanto as
árvores de decisão possuem um número pequeno de regras, os algoritmos de classificação
puros possuem um número muito superior. Quinlan (1993) apud Bressler (2004) afirma que as
árvores de decisão são formas simples para representar a classificação de uma base de dados,
mas quando são muito extensas, tornam-se difíceis de serem compreendidas.
Figura 12 – Modelo da árvore de decisão de gostos musicais
A seguir são apresentados alguns exemplos de algoritmos que podem ser utilizados na
etapa de mineração de dados. Estes algoritmos devem ser escolhidos principalmente de
acordo com a técnica de mineração definida para a aplicação, por exemplo, a utilização de um
algoritmo de árvore de decisão é apropriado somente para aplicações baseadas em
classificação.
60
3.3 ALGORITMOS DE MINERAÇÃO DE DADOS
A utilização de técnicas de mineração de dados desenvolvidas pela ciência da
inteligência artificial passou a ser mais frequente a partir do momento que a informação
passou a ter um valor maior nas organizações. A informação tem valor competitivo no mundo
atual, qualquer ferramenta que possibilite a extração de conhecimento passa a ser encarada
como um possível aliado na conquista de um diferencial (COMPOLT 1999).
A seguir serão apresentados alguns dos algoritmos mais utilizados para a mineração de
dados. A maioria destes algoritmos foi desenvolvida há algum tempo, porém sua utilização é
recente devido à importância que a mineração dos dados obteve nos últimos anos (COMPOLT
1999).
3.3.1
ÁRVORES DE DECISÃO
As árvores de decisão são uma forma simples de lógica condicional que buscam a
representação de uma série de questões que estão subentendidas sobre a base de dados, são
utilizadas em aplicações que são baseadas em métodos de classificação. O funcionamento de
uma árvore de decisão esta fundamentado em dois tipos de atributos, são eles o decisivo e o
não-decisivo. Os atributos decisivos são aqueles que contêm o resultado que se deseja obter
enquanto os atributos não-decisivos são aqueles que conduzem a uma decisão, fazem o
intermédio até o resultado final (COMPOLT 1999).
A utilização de árvores de decisão é vantajosa quando o desejo é de classificar ou
predizer saídas. A facilidade de compreensão das regras geradas por uma árvore também pode
ser considerado uma vantagem, visto que o entendimento do processo de obtenção do
conhecimento é fundamental para o desenvolvimento de uma aplicação (PELLEGRINI e
COLLAZOS 2000).
A idéia principal envolvida em uma árvore é identificar características que existam em
alguma classe e não em outras. Também podem ser usados exemplos negativos, que servem
para a identificação de características que afastem elementos de uma classe (LOH e GARIN
2001).
A criação de uma árvore de decisão é realizada através da fórmula matemática
denominada de entropia. Entropia é uma medida bem-definida da desordem ou da informação
encontrada nos dados. A construção de uma árvore de decisão é guiada pelo objetivo de
61
diminuir a entropia. No processo de criação são realizados cálculos sobre os atributos não
decisivos, denominados classes, onde é escolhido um nó inicial também chamado de raiz. A
partir deste nó será realizada uma série de novos cálculos com o objetivo de decidir a
estrutura de formação da árvore a ser gerada. Com base nos cálculos que são gerados durante
o processo de criação da árvore são definidas as classificações possíveis que um atributo pode
ter ao ser classificado através da árvore (COMPOLT 1999).
Por exemplo, um empresário resolve investir em uma casa de shows em determinada
cidade, no entanto ele não possui conhecimento sobre as preferências musicais dos habitantes
deste local. Para definir qual seria o melhor estilo da casa de shows é necessário avaliar os
dados dos indivíduos que moram na cidade e classificá-los. Como não se tem conhecimento
sobre as preferências dos habitantes podem ser definidas as mais conhecidas como saídas da
árvore, por exemplo, sertanejo, pagode, rock, tradicionalista, forró entre outros. Os nós
intermediários desta árvore que serão os responsáveis pela classificação até o resultado final,
podem conter informações como o sexo do pesquisado, faixa etária, área de trabalho, faixa
salarial, nível de ensino, entre outras informações. A definição destas informações é
importante, pois serão elas que irão classificar os indivíduos pesquisados e ao final da
pesquisa demonstraram qual o melhor estilo para se investir.
O objetivo da classificação com árvores de decisão é criar grupos distintos a partir de
uma mesma base de dados. Através das ramificações existentes na árvore podem ser obtidos
diversos resultados. A utilização do mecanismo de entropia objetiva reunir nos galhos da
árvore dados que pertençam a uma mesma classe, assim as classificações podem ser
consideradas eficientes (SANTOS 1999).
Um dos primeiros algoritmos de árvore de decisão foi criado no final dos anos 70. O
IDE 3 como foi batizado pelo seu criador o cientista Ross Quinlan, era baseado em sistemas
de inferência e em conceitos de sistemas de aprendizagem. A principio o algoritmo foi
aplicado em tarefas de aprendizagem, como o jogo de xadrez, atualmente este algoritmo é um
dos mais conhecidos e aplicados em uma grande variedade de situações acadêmicas e
industriais (GARCIA 2003).
Além do IDE 3 existem outros dois algoritmos que são bastante disseminados quando se
trata da utilização de árvores de decisão, o C4.5 e o PERT. Estes dois algoritmos são
aperfeiçoamentos do IDE 3, alguns problemas encontrados com o IDE 3 foram solucionados
ou ao menos minimizados nestes dois algoritmos (COMPOLT 1999).
62
Uma das mudanças realizadas com relação ao IDE 3 refere se a capacidade de poda
deste algoritmo. A poda é um recurso utilizado nas árvores de decisão quando estas estão com
uma dimensão muito grande comprometendo assim o seu desempenho. Quando a árvore
atinge uma dimensão elevada alguns dos nós presentes são inúteis, prejudicando o processo
de classificação. A poda é um recurso importante nas árvores de decisão, pois permite
controlar as dimensões da árvore, assim deixando a sua compreensão mais facilitada e as suas
classificações mais eficientes (COMPOLT 1999).
Um exemplo de uma aplicação conhecida na Internet que pode ter o seu mecanismo de
funcionamento baseado na utilização de uma árvore de decisão é o site do gênio Akinator. O
geniosinho promete adivinhar em que pessoa o usuário está pensando somente a partir das
respostas dadas ao sistema. O mecanismo de funcionamento da aplicação é baseado em
perguntas que possuem cinco alternativas de respostas. Conforme o usuário vai respondendo
as perguntas vão sendo direcionadas para um caminho do qual a aplicação pressupõe que
possa ser a pessoa que o usuário esta pensando. Por exemplo, através da resposta obtida ao
perguntar para o usuário se a pessoa em que ele está pensando é do sexo feminino o sistema já
consegue descartar metade de suas possíveis alternativas. A cada pergunta o sistema filtra a
base de dados até chegar à possível pessoa que o usuário estava pensando.
3.3.2
TD-IDF (Term Frequency / Inverse Document Frequency)
A TD-IDF é uma técnica baseada na recuperação da informação. Esta técnica é uma das
mais conhecidas para especificar o peso das palavras em sistemas de recuperação da
informação. A TF-IDF é mais comumente utilizada em aplicações baseadas em técnicas de
agrupamento de dados (OLIVEIRA 2007).
A técnica se baseia em duas abordagens para um melhor funcionamento. Calcula o
número de vezes que uma palavra aparece em um documento (term frequency) e calcula
também a medida inversa da freqüência de uma palavra em um documento (inverse document
frequency). Através destes valores encontrados nestes dois cálculos é verificado o peso da
palavra no documento. A medida inversa é importante devido a probabilidade de palavras
comuns aparecerem muitas vezes em diversos documentos, assim tornando-se pouco úteis
para distinguir o conteúdo do documento (OLIVEIRA 2007).
O peso de uma palavra em um dado documento é calculado como sendo o produto das
63
duas medidas (TF-IDF). Assim, o documento pode ser representado como um vetor de
palavras e seus pesos. Por se tratar de uma pesquisa por palavras esta técnica é utilizada em
sistemas baseados em conteúdo, onde as descrições dos itens e dos usuários do sistema são a
base de dados. Com o usuário e o documento representados como vetores é possível medir a
similaridade, calculando o cosseno entre eles (OLIVEIRA 2007).
Uma limitação apresentada nesta técnica está em não conseguir trabalhar com dados
não-estruturados, a base de pesquisa precisa sempre ser estruturada. O tratamento e
classificação de dados não-estruturados como, por exemplo, uma música, ou um filme
somente podem ser realizados se estes itens possuírem um campo de observação onde estejam
armazenadas informações sobre o produto. Por exemplo, ao pesquisar sobre determinado
estilo musical, somente será possível receber a indicação de determinado arquivo de mp3, se
este contiver a especificação do estilo pesquisado (OLIVEIRA 2007).
3.3.3
MODELOS PROBABILÍSTICOS
O modelo probabilístico é uma técnica bastante difundida de recuperação de
informação. A sua base de funcionamento está fixada em teorias estatísticas e de interpretação
da informação (DE MAGALHÃES, 2008).
Este método é difuso principalmente em sistemas que tratam diretamente da
recuperação da informação em arquivos estruturados, como documentos de textos, planilhas
eletrônicas, entre outros. A pesquisa na base de dados é realizada levando em consideração
um termo chave informado pelo usuário ou pelo sistema. Através deste termo é feito uma
varredura na base de dados identificando a probabilidade dos documentos ali armazenados
possuir ligação com a palavra-chave de pesquisa (DE MAGALHÃES, 2008).
A busca e definição da similaridade entre a palavra-chave e os documentos da base são
realizadas através da utilização de vetores de probabilidade. Estes vetores de probabilidade
utilizam a notação binária para classificar os documentos. Se for encontrado o termo
pesquisado no documento este recebe o valor 1, que corresponde a probabilidade deste
documento ser similar ao termo de pesquisa. Quando o documento não possui nenhuma
ligação com o termo de pesquisa recebe o valor 0 que indica ausência de similaridade com a
pesquisa (CARDOSO 2008 apud DE MAGALHÃES 2008, LOPES 2007).
A praticidade encontrada na utilização de um método de recuperação de pesquisa como
o modelo probabilístico é um ponto a favor desta técnica. No entanto existem alguns pontos
64
fracos na escolha deste método de recuperação de informação como (i) dependência de uma
palavra-chave bem definida, (ii) não considerar a freqüência do termo no documento para
definir a sua similaridade, (iii) não levar em consideração o problema de filtragem da
informação, (iv) ou ainda se tornar uma procura lenta e ineficiente em uma base de dados
muito grande (CARDOSO 2008 apud DE MAGALHÃES 2008, LELES 2004).
Um exemplo de aplicação
do
modelo probabilístico
está
concentrado no
armazenamento de informações da relação de interatividade entre usuários e sistemas. O
trabalho realizado pelo método probabilístico nestas aplicações consiste em guardar as
informações referentes as respostas que o usuário dá ao sistema. Por exemplo, em uma
aplicação de jogos eletrônicos, através dos movimentos realizados pelo usuário ou através dos
aplicativos que acessou o método cria um modelo especifico do usuário. Munido destas
informações é possível oferecer um serviço mais personalizado aos usuários e descobrir falhas
ou problemas no sistema.
O agente interativo Kurupako desenvolvido por estudantes e pesquisadores da
Universidade de Caxias do Sul é um exemplo de aplicação do método probabilístico.
(REATEGUI e LORENZATTI 2005). O Kurupako é um agente interativo que objetiva o
auxílio na aprendizagem de alunos da disciplina de algoritmos do departamento de
informática da universidade. O modelo probabilístico auxilia o agente na descoberta do nível
de conhecimento que determinado aluno possui, como já foi mencionado somente através das
interações realizadas pelo usuário com a aplicação.
3.3.4
REDES BAYESIANAS
As redes bayesianas são um exemplo de representação de dados baseados em modelos
probabilísticos. Devido aos problemas encontrados em métodos que somente definem as
pesquisas através de respostas booleanas como sim e não, ou binárias 0 e 1, desenvolveram se
estudos e pesquisas que objetivaram o melhoramento destas pesquisas de recuperação de
informação. A capacidade de trabalhar com níveis de certeza além de valores booleanos é uma
das propostas das redes bayesianas. Segundo especialistas as redes bayesianas representam de
formas simples as complexidades encontradas no universo de um problema. A simplificação
ocorre através da utilização de variáveis que representam os agentes envolvidos no universo
escolhido (MARQUES e DUTRA 2000).
65
Uma rede bayesiana representa um modelo do domínio que esta aplicada, é uma
simplificação da realidade. Para não comprometer o funcionamento e a escalabilidade de
aplicação de uma rede bayesiana em um domínio que possua muitas variáveis, não se faz
necessário que todas as variáveis existentes sejam modeladas. Mesmo com poucas variáveis
aleatórias pode se trabalhar com um universo complexo, os resultados podem perder um
pouco em credibilidade, no entanto serão aproximados (DA SILVA e LADEIRA 2002).
As redes bayesianas têm sido aplicadas em diversas áreas, no entanto a área de
diagnósticos médicos é uma que merece uma atenção especial por aderir mais solidamente a
esta técnica. Mesmo com as restrições éticas existentes com relação a utilização de
prontuários médicos em ambientes que não representem um consultório a tecnologia
conseguiu conquistar este domínio. Os benefícios que podem ser oferecidos por sistemas
inteligentes baseados em redes bayesianas são os responsáveis pela disseminação desta
técnica neste meio médico (DA SILVA e LADEIRA 2002, MARQUES e DUTRA 2000).
Na área médica as redes bayesianas além de contar com os prontuários dos pacientes,
podem utilizar do conhecimento sobre patologias que estão armazenados em livros e
enciclopédias para realizar as suas inferências e descobertas. Através da análise de diferentes
fontes de dados o resultado tende a ganhar em qualidade e eficiência.
Mesmo com toda a capacidade de descoberta de conhecimentos de uma rede bayesiana
o conhecimento humano dos especialistas não deve ser descartado nos diagnósticos. Aliar a
capacidade humana com os artifícios e benefícios de uma ferramenta computacional parece
ser o melhor caminho neste caso. Um exemplo é o diagnóstico em exames de mamografia,
onde o conhecimento técnico do médico aliado as informações precisas e detalhadas de um
sistema de informação garantem a precisão do diagnóstico.
3.4 CONSIDERAÇÕES FINAIS
A ciência da inteligência artificial atua principalmente com o objetivo de melhorar a
qualidade de vida dos indivíduos. Através dos estudos do comportamento humano e dos
eventos naturais que influenciam diretamente a vida da espécie humana, diversos problemas
já foram solucionados ou minimizados, diversas soluções foram propostas e muitas ainda
estão sendo pesquisadas e desenvolvidas.
Uma tarefa que foi muito beneficiada com os estudos e pesquisas da inteligência
66
artificial é a de mineração de dados. Devido a quantidade de dados que são diariamente
gerados por empresas, governo e por indivíduos individualmente perdeu se a capacidade de
filtrar o que é relevante do que não é com certeza do que se esta fazendo.
A pesquisa por dados importantes se torna cansativa, estressante e em alguns casos
frustrante. Quando não se dispõe de um meio computacional para pesquisar estas sensações
ficam ainda mais afloradas, no entanto mesmo contando com o auxílio de tecnologias os
usuários por vezes se sentem desta forma. Para minimizar esta dificuldade na pesquisa por
dados relevantes deve se escolher o método mais adequado para o meio que será aplicado. A
determinação deste método depende exclusivamente do objetivo da aplicação em que este
será utilizado. O usuário deve ter a qualidade de serviços a ele prestados garantida.
Conforme foi salientado neste capítulo, as técnicas de mineração e de inteligência
artificial possuem particularidades que as tornam aptas para determinadas aplicações. A
escolha e determinação da melhor, mais eficiente e mais eficaz técnica depende de um estudo
aprofundado da aplicação que será desenvolvida. O tempo disposto na escolha da melhor
técnica pode representar o diferencial na aplicação.
A determinação da técnica de mineração em um sistema de recomendação representa
um dos pontos mais importantes no processo de desenvolvimento do sistema. O sucesso ou o
fracasso das recomendações podem ser definidos pela técnica de mineração escolhida.
Estudar e pesquisar as vantagens e desvantagens de cada uma de acordo com o objetivo e
universo que será aplicado o sistema pode auxiliar na escolha da melhor ferramenta.
O próximo capítulo apresenta os aspectos ligados ao ato de presentear já que este é o
foco do presente trabalho, o desenvolvimento de um protótipo de um sistema de
recomendação de presentes. São explicados aspectos que estão diretamente ligados a troca de
presentes, bem como aspectos históricos e sociais envolvidos neste ato.
67
4. A ARTE DE PRESENTEAR
Este capítulo apresenta conceitos que são inerentes ao ato de presentear, descrevendo
um breve histórico deste ato nas relações humanas, dos significados e dimensões que podem
ser encontradas bem como das funções que este ato desempenha na construção de laços entre
os indivíduos. O estudo mais aprofundado deste assunto é interessante neste trabalho pois
presentear é o foco do mesmo. Através de um estudo mais especifico sobre o universo
envolvido neste ato se obtém maior respaldo para desenvolver uma aplicação que auxilie no
processo de presentear alguém.
4.1 INTRODUÇÃO
Diariamente o ser humano desempenha diversas atividades e ações naturalmente. A
facilidade em realizar estas atividades se encontra principalmente devido ao número de vezes
em que estas são desempenhadas, o que as torna rotineiras e, portanto fáceis. No entanto
existem algumas atividades que mesmo sendo desempenhadas várias vezes ainda assim
podem representar um “problema” para quem as realiza.
O ato de presentear pode ser considerado uma atividade pertencente ao grupo das
“atividades problema”. O grau de dificuldade em sua realização é maior do que em outras
atividades devido aos diversos fatores envolvidos na sua prática e ao simbolismo que este ato
representa (MACHADO, 2004).
Alguns fatores implícitos e explícitos neste processo complexo e natural presente há
tanto tempo na vida em sociedade são apresentados no presente capítulo, objetivando uma
maior compreensão do significado, da história, dos motivos, das funções, e de outros assuntos
inerentes ao ato de presentear.
4.2 O PRESENTE EM DIFERENTES CULTURAS DA SOCIEDADE
O ato de presentear é praticado pelo homem há muito tempo. São diversos relatos
históricos que comprovam a prática da troca de objetos envolvendo um simbolismo implícito
Uma das passagens mais conhecidas mundialmente esta ligada a religião, a oferta de
presentes ao menino Jesus realizada pelos três reis magos citada na Bíblia esta passagem é
68
capaz de demonstrar os aspectos sentimentais envolvidos no ato de presentear como o
respeito,o afeto,a admiração,a servidão, entre outros.
A complexidade do ato de presentear pode ser percebida pelas inúmeras reações,
sensações e ações que este ato pode causar. Este ato praticado há tanto tempo possui aspectos
implícitos que modificam o relacionamento entre os indivíduos envolvidos de diferentes
maneiras.
A capacidade que o ato de presentear possui em influenciar e modificar as relações entre
os indivíduos é visível em diversos povos. Vários estudos foram realizados em sociedades
primitivas objetivando compreender o que este ato representava na vida destas sociedades.
Um dos estudiosos mais famosos com relação ao sistema de trocas em sociedades, é o
antropólogo Marcel Mauss. No ano de 1923, este francês públicou o seu famoso Ensaio sobre
a dádiva: forma e razão de troca nas sociedades arcaicas. Mauss estudou o sistema de trocas
em sociedades da Melanésia (ilha Trobriand), da Polinésia e do Noroeste americano (culturas
indígenas) (LOURENÇO, 2006).
A dádiva para Mauss assumia um caráter bastante amplo, incluindo festas, casamentos,
patrimônio, esmolas, troca de presentes e até mesmo os tributos pagos pelos grupos a um
poder centralizador (LANNA, 2000). Mauss procurou compreender o que estas trocas
representavam para as sociedades arcaicas, e que conseqüências estes atos teriam na vida
destas sociedades.
O sistema de trocas dos indígenas do noroeste americano estudados por Mauss funciona
de forma desinteressada e obrigatória segundo o pesquisador. Essa obrigação se exprime de
maneira simbólica e coletiva: ela assume o aspecto do interesse ligado às coisas trocadas. As
coisas jamais se separam completamente de quem as troca; a comunhão e a aliança que elas
estabelecem são relativamente indissolúveis (MAUSS, 2003 apud LOURENÇO, 2006). As
trocas acontecem entre tribos vizinhas e o cacique que oferecer mais presentes é visto com
melhor status que os demais. Os presentes podem ser alimentos e bens preciosos. O
simbolismo em criar laços com outros indígenas através deste ritual chamado de potlach é
apenas um dos ganhos. Neste ritual dependendo das trocas realizadas, podem se acertar
casamentos, ganhar status político, entre outras coisas (GODBOUT 1999 apud LOURENÇO,
2006).
Assim, o ato de presentear para as tribos indígenas do noroeste americano representa
um evento muito importante, podendo este modificar as definições de status social na tribo, a
69
criação de alianças com outras tribos. Enfim o ritual do potlach tem a capacidade de modificar
a vida dos membros que dele participam.
Outro antropólogo que realizou estudos sobre as trocas simbólicas em sociedades
primitivas foi Bronislaw Malinowski. Um dos seus estudos foi baseado no ritual do Kula, um
sistema de trocas praticado pelos habitantes das ilhas de Trobriand, este ritual também foi
pesquisado por Mauss. Neste sistema assim como no Potlach as trocas são realizadas com
tribos vizinhas (LOURENÇO, 2006). O Kula seria um sistema de obtenção de prestígio e
renome, por meio de trocas materiais (COELHO, 2006).
A troca de objetos simbólicos pode envolver diversos objetivos, isto é relativo a cultura
do povo que realiza este ritual. Enquanto para alguns a troca pode apenas representar a
criação de um laço, para outros pode representar a sua superioridade, ou o seu poder, ou ainda
a sua inserção em determinada classe social.
Durante uma época a troca de presentes foi uma maneira encontrada para garantir a paz
entre os povos. Através da oferta de presentes para outro povo, se criava uma aliança. Já a
recusa de um presente ou a não retribuição de um presente recebido equivalia a recusar a
aliança criada, demonstrar inimizade e uma possível guerra.
Um exemplo conhecido na história da troca de presentes entre povos inimigos é o
presente oferecido pelos gregos aos troianos, durante a guerra de Tróia. Os troianos ao receber
o presente dos seus inimigos acreditaram que este era um sinal de paz, o fim da guerra. No
entanto tudo não passou de uma estratégia inteligente dos gregos para tomar a cidade inteira.
Os troianos foram traídos pelo simbolismo que um presente representava para as sociedades
da época.
No Brasil a prática da troca de presentes é feita há muito tempo. Mesmo antes do
descobrimento do país pelos portugueses os povos indígenas já realizavam trocas de presentes
entre os membros das tribos e ofertas de objetos simbólicos para seus deuses.
Segundo um estudo antropológico com índios da tribo Krahó realizado pelo pesquisador
Júlio César Melatti publicado em 1973, o ato de presentear é praticado normalmente e está
incluso em regras que regem a tribo. Na tribo o marido tem o dever de presentear os parentes
de sua mulher, bem como realizar agrados com presentes para a sua esposa sempre que
possível. A realização deste ato além de criar laços, mantêm o status social do indivíduo
perante os outros índios.
Um estudo publicado pela antropóloga Débora Diniz com índios da tribo Yanomami
70
concluiu que atualmente é praticamente impossível fazer contato com determinadas tribos
indígenas sem lhes oferecer presentes em troca. Os yanomamis representam uma destas
tribos, o contato deve sempre ser feito com a oferta de presentes a tribo. Alguns pesquisadores
encaram esta exigência como forma de garantir e contribuir para o bem-estar da comunidade
durante o trabalho de pesquisa. Outros, alegam que esta prática é comum pois é uma forma de
ser bem aceito na comunidade, uma prática que os missionários e colonizadores praticavam
(DINIZ, 2007).
Segundo Mauss (apud Lourenço, 2006), por trás do caráter voluntário do ato de
presentear esta implícita o formalismo, a mentira e a ficção social e ligados a estes a
obrigação e o interesse.
A ficção social talvez seja um dos grandes responsáveis pela difusão deste ato em
diferentes culturas da sociedade. Isto porque através da prática da troca de presentes pode se
(i) ser aceito em uma comunidade ou grupo, (ii) receber um melhor status social, (iii) ganhar a
confiança de outras pessoas, (iv) obter satisfação pessoal ou ainda (v)promover a satisfação
em outras pessoas.
Após um breve histórico da troca de presentes em diferentes culturas é necessário
entender os significados deste ato. A próxima seção objetiva elenca algumas definições para o
ato de presentear.
4.3 PRESENTEAR ALGUÉM. O QUE SIGNIFICA ESTE ATO?
Independentemente de raça, religião, cultura ou localização o ato de presentear se faz
presente há muito tempo. Compreender os significados que este ato pode possuir é importante
para compreender as conseqüências que ele pode desencadear nas relações sociais humanas.
Atualmente pesquisas sobre o comportamento de presentear e dos fatores que estão
ligados a prática são desenvolvidas por diferentes áreas como, a psicologia, a antropologia, o
marketing e também a sociologia. A maioria dos estudos publicados são referentes a
pesquisadores estrangeiros, em sua maioria norte americana. O Brasil é carente de estudos
nesta área há algum tempo (LOURENÇO e REZENDE 2008, FARIAS 2001).
O estudo da troca de presentes é importante devido ao seu valor representativo na
economia, quanto pela sua representatividade em criar e manter relacionamentos
interpessoais. A troca como instituição social desempenha um papel na economia e na vida
71
social como um todo muito maior do que normalmente se imagina. Estas influências estão
presentes desde muito tempo antes do capitalismo, quanto hoje em dia durante o regime
capitalista (SHERRY apud LOURENÇO e REZENDE 2008, OLIVEIRA 2009, PEPECE
2002).
São variadas as definições sobre o ato de presentear. Segundo salientou Bourdieu citado
em Coelho (2006), a diferença na definição sobre a troca de presentes pode acontecer apenas
devido a diferentes postos e tempos de observação. Bourdieu chegou a esta conclusão após
avaliar as definições feitas por dois estudiosos da área, Marcel Mauss e Lévi-Strauss
(COELHO, 2006).
Mauss definia a troca de dádivas ou presentes como estas eram vivenciadas, segundo o
antropólogo o presente era espontâneo e desinteressado. Enquanto para Lévi-Strauss que
examinava o presente fora de sua inserção cotidiana o definia como algo forçado e motivado
pelo interesse (COELHO, 2006).
A observação de Bourdieu proporciona a compreensão de que um mesmo ato pode ser
interpretado de maneiras distintas visto que diversos fatores podem ocasionar a sua definição.
As discrepâncias nas definições do ato de presentear se acentuam também devido às
diferentes áreas que atualmente objetivam estudá-lo. A definição que um antropólogo possui
deste ato pode ser totalmente distinta da definição de um especialista em marketing por
exemplo.
Em um dos primeiros estudos realizados nesta área Mauss propôs o sistema de trocas de
presentes como um “fato social total”. Este fato social total sugerido por Mauss é algo maior
do que os aspectos religiosos, políticos, judiciários e estéticos É uma junção de tudo isso, uma
mistura de alma e coisas. Algo que possui uma dupla verdade, podendo ser caracterizado por
transações voluntárias ou por movimentos obrigatórios (COELHO 2006, LOURENÇO 2006).
A troca de presentes pode ser vista como um ato de comunicação. Através da troca de
um presente são trocados sentimentos, sensações, conhecimentos (COELHO, 2006). O ato de
presentear pode ser encarado como o único capaz de transmitir mensagens sem utilizar
palavras e de expressar carinho sem utilizar o toque (PEPECE, 2002). A capacidade que um
presente possui em transmitir mensagens ao receptor é fruto do simbolismo envolvido neste
ato. Para Mauss as coisas dadas são “animadas”, presentear alguém com alguma coisa seria
presentear algo de si (COELHO 2006, LOURENÇO 2006). O presente, portanto teria vida, a
vida de quem está lhe ofertando.
72
A valorização das trocas simbólicas nas sociedades depende muito da cultura do seu
povo. O que pode ser percebido atualmente é que o consumo simbólico ganhou espaço na
sociedade moderna. Isto se deve ao fato do consumo simbólico ser capaz de influenciar o
status social dos indivíduos (PEPECE, 2002).
O presente é o melhor exemplo da troca simbólica, pois um objeto, quando é dado
(qualquer que seja ele, contanto que seja dado), sela um pacto transferencional entre duas
pessoas (PEPECE, 2002). A troca simbólica também pode ser chamada de valor de vínculo. O
ato de presentear pode ter três valores implícitos - o valor de uso, valor econômico e valor de
vínculo. Sendo o valor de vínculo o mais importante neste ato, que representa a manutenção,
o estabelecimento ou a reconstrução de um vínculo ou relação social (LOURENÇO, 2006).
Para um vínculo ser criado é necessário a existência de mais de um indivíduo. Através
deste vínculo é criada uma relação de reciprocidade entre os indivíduos O ato de presentear
pode então ser encarado como uma ferramenta de integração entre as pessoas. Quando um
presente é ofertado a alguém, esta pessoa precisa aceitar recebê-lo. Ao receber o presente está
criado um vínculo entre ambas as partes (PEPECE, 2002). O receptor do presente se vê então
“obrigado” a retribuir este ato, o que evidencia as três etapas existentes no ato de presentear,
dar, receber e retribuir. Mauss foi o primeiro estudioso a propor teoricamente este processo no
ato de presentear (LOURENÇO 2006, COELHO 2006).
Existem algumas diferenças entre uma troca mercantil e a troca de presentes uma delas
está no tipo do vínculo criado no processo de troca. Enquanto em uma troca mercantil é feito
um contrato onde a outra parte é obrigada a retribuir, na troca de presentes não existe essa
cobrança. Não se pode processar um amigo por não ter retribuído um presente dado. A
retribuição deve ser espontânea assim como o ato de presentear. Outra diferença existente
entre as trocas de mercadorias e as trocas de presentes está na maneira como são ofertados os
objetos. Em uma troca mercantil o vendedor exalta as qualidades da mercadoria, e o
comprador as desmerece. No processo de troca de um presente acontece o contrário quem esta
ofertando o presente tende a diminuir o que esta oferecendo, normalmente dizendo “- É só
uma lembrancinha”, enquanto o presenteado exalta as suas qualidades ao receber o objeto
(OLIVEIRA, 2009).
Outro aspecto citado que diferencia a troca de presentes da troca mercantil se refere ao
preço do produto oferecido ficar sempre implícito. Nicolas apud Lourenço 2006 afirma que o
valor do presente não é o aspecto mais importante, mas a intenção e o rito conhecido.
73
Informando o valor pago pelo produto perde se a magia envolvida no ritual de presentear
(LOURENÇO, 2006).
Além de ser considerado um instrumento de integração o ato de presentear pode ser
considerado um instrumento de individualidade. Pois cada presente é único, é a imagem do
presenteador e é marcado pelo momento da entrega do presente, que não será repetido em
nenhuma outra troca de presentes (PEPECE, 2002).
Presentear alguém pode representar uma atividade arriscada para algumas pessoas. Esta
tensão envolvida neste ato está ligada a possibilidade do presente ofertado ser recusado ou
não apresentar os resultados planejados. A recusa de um presente envenena uma relação, ao
invés de criar laços eles são destruídos. É como se o ato de doar fizesse o indivíduo andar
sobre o fio de uma navalha: a pessoa se doa para o outro, se está não a acolher, o sentimento
será de traição, de decepção, engano (OLIVEIRA, 2009).
A complexidade do ato de presentear pode ser mais bem entendida dividindo esta
prática em algumas dimensões. As dimensões definidas para o ato de presentear são referentes
aos objetivos que este ato pode ter, aos fatores que podem influenciar a sua prática bem como
as conseqüências que ele terá. A dimensão simbólica já mencionada em alguns aspectos é
reconhecida como a predominante diante das demais dimensões (LOURENÇO E REZENDE
2008). Isto comprova que mesmo com os aspectos econômicos ganhando espaço o
simbolismo ainda persiste nas relações de trocas entre os indivíduos
Algumas das principais dimensões são definidas a seguir, objetivando o entendimento
dos diferentes aspectos envoltos no ato de presentear.
4.4 DIMENSÃO SIMBÓLICA
A dimensão simbólica é uma das mais importantes dentre todas as existentes na prática
da troca de presentes, sendo considerada por alguns pesquisadores como a predominante neste
ato.
Os presentes possuem um valor muito maior do que o seu valor financeiro, o
simbolismo envolvido sobressai os benefícios proporcionados pela troca material
(WOLFINBARGER (1990) apud FARIAS 2001). “Os presentes não são tão sagrados quanto
as conexões que eles simbolizam entre as pessoas” (BELK apud LOURENÇO E REZENDE,
2008). O valor de vínculo que representa o simbolismo do presente é o que há de mais valioso
74
em uma troca de presentes. A ligação criada através de um presente não possui valor
econômico.
O simbolismo envolvido na troca de presentes está ligado a doação não somente de algo
material entre ambas as partes, mas a doação de si para o outro indivíduo. As trocas de
presentes são compostas de elementos simbólicos como a reciprocidade, a sociabilidade e a
espontaneidade (LOURENÇO, 2006).
O simbolismo envolvido no ato de presentear foi classificado em quatro categorias
distintas, sendo elas (WOLFINBARGER 1990 apud FARIAS 2001):
 Presentes que simbolizam o próprio doador;
 Presentes que simbolizam a percepção que o doador tem sobre o receptor;
 Presentes que simbolizam uma convenção;
 Presentes que são expressivos e possuem muitos significados atrelados a eles.
Normalmente os presentes são escolhidos com base na imagem do próprio doador. Isto
foi comprovado em um estudo qualitativo realizado por Sherry e McGrath em 1989. As
pessoas compram produtos para presente que representem a sua imagem objetivando ser
incluída na vida da outra pessoa. Ao ofertar um presente que possua as características pessoais
do presenteador este faz com que o presenteado ao entrar em contato com o presente, tenha a
lembrança do seu presenteador (PEPECE 2002, FARIAS 2001).
Além dos presentes que simbolizam o próprio doador existem aqueles que simbolizam
uma percepção que o doador possui do receptor. A escolha de um presente que reflita o
receptor é mais arriscada. Para escolher um presente que seja compatível com o perfil do
receptor é necessário certo conhecimento sobre as preferências do presenteado. É preciso
lembrar que um presente mal escolhido pode ocasionar um abalo na relação entre os
envolvidos na troca de presentes. Este abalo pode ser momentâneo ou representar a ruptura
dos vínculos (OLIVEIRA, 2009).
O simbolismo envolvido no presente é a sua essência, relacionamentos podem ser
criados, mantidos ou até mesmo rompidos através da troca de presentes. A doação conjunta
existente neste ato deve ser realizada de modo que ambas as partes envolvidas sejam
beneficiadas. Desta forma fortalecendo ainda mais seus laços de ligação.
4.5 DIMENSÃO EMOCIONAL
A dimensão emocional envolvida no ato de presentear está também ligada a dimensão
75
simbólica. Os aspectos emocionais envolvidos neste processo contribuem para o simbolismo
existente na prática do ato de presentear.
Farias (2001), aponta uma questão relevante no estudo do ato de presentear, “porque um
ritual considerado relaxante e prazeroso deve ser tão torturante?”. A complexidade em
compreender o real significado da troca de presentes pode ser visto como um dos motivos
para a dificuldade na realização deste ato. A ambigüidade de sentimentos e definições
envolvidos neste ato provocam a dificuldade de sua realização (Caillé (1998) e Godbout
(1999) apud LOURENÇO, 2006).
O processo de troca de presentes esta envolto em um universo de sentimentos. São
sentimentos individuais, sentimentos compartilhados, sentimentos trocados. A capacidade que
este ato tem de influenciar o aspecto emocional dos indivíduos talvez seja o seu grande
segredo. Segredo este que pode proporcionar prazeres e danos (LOURENÇO, 2006).
As emoções estão tão presentes na realização deste ato que podem extrapolar o valor do
presente. Os sentimentos que são desencadeados ao longo do processo de troca de presentes
podem ter consequências diversas em cada indivíduo. Um estudo publicado por Wooten
(2000) apud Farias (2001) salientou que as pessoas ficam mais ansiosas quando estão
motivadas a induzir reações desejadas em outro indivíduo, mas estão em dúvida se obterão
sucesso. Quando alguém compra um presente para outra pessoa normalmente deseja que esta
pessoa fique feliz ao receber o presente. Quando a reação do presenteado não é a que se
imaginou um sentimento de insatisfação é desencadeado, podendo ter conseqüências no
relacionamento dos indivíduos envolvidos.
Outros aspectos que podem aumentar a dificuldade no ato de presentear são pertinentes
a decisão do que comprar. A escolha do presente ideal é feita através do estudo de diversas
variáveis. Podendo ser citados (i) o perfil do presenteado, (ii) a ocasião em que irá se
presentear, (iii) o grau de intimidade entre os dois, (iv) o valor do presente, além de diversos
outros fatores que podem ser utilizados para a determinação de um presente ideal. Esta
decisão de compra pode representar para algumas pessoas a etapa mais difícil e torturante no
ato de presentear.
Sheth, Mittal e Newman (2001) citados em Prêto (2008), classificam o ato de presentear
como um “consumo hedonista”, aquele que visa práticar o consumo de produtos ou serviços e
a partir destes obter prazer, sensação de bem estar e não para resolver problemas no ambiente
físico
76
O custo psíquico do presente é mais valioso do que o valor monetário pago pelo objeto.
O custo psíquico envolve toda a pesquisa, toda a escolha, as dúvidas envolvidas na decisão
pela compra de um presente que agrade o receptor. Este tempo gasto é valorizado no ato de
presentear, pois representa a dedicação que o presenteador teve para com o presente do
presenteado (PRÊTO, 2008). O que pode se perceber muitas vezes é que o presente pode ser
apenas uma lembrancinha, o seu valor monetário pode ser baixo, porém o valor emocional
transcende tudo isto. A satisfação em ser lembrado sobressai os aspectos financeiros
envolvidos neste processo de troca.
Os presentes diferem se de outros produtos normais de uma loja de departamentos
justamente por estes objetos conter agregados a eles sentimentos, emoções, os valores
sentimentais transcendem qualquer valor econômico (PRÊTO, 2008). Os presentes podem ser
definidos como “objetos de amor”. Através de um presente sentimentos podem ser
transmitidos, mensagens de carinho e afeto estão implícitas na prática deste ato em muitos
casos( Belk e Coon citados em Prêto, 2008).
Qualquer pessoa pode comprar algo, mas não é qualquer pessoa que pode dar algo (Belk
e Coon apud Prêto, 2008). Este fato se deve as regras implícitas existentes na prática da troca
de presentes. São diversos fatores implícitos e explícitos que podem definir o presente
escolhido e o indivíduo que pode ser presenteado.
A complexidade na compreensão da troca de presentes pode ser mais claramente
percebida quando se leva em consideração os valores envolvidos na prática deste ato. Alguns
valores foram elencados por Lourenço 2006 com base em diversos estudiosos que pesquisam
o sistema de trocas simbólicas, sendo que alguns destes valores são a amizade, a
benevolência, o caráter, a ética, o comprometimento, a confiança, a emoção, a estima, o
respeito, a honra, entre outros valores.
4.6 DIMENSÃO PESSOAL E SOCIAL
A troca de presentes é uma forma de doação de si realizada pelo presenteador para com
o receptor do presente. A doação se efetiva quando o receptor aceita o presente e desta forma
recebe a “essência espiritual” do doador. Esta troca e doação é a base para a criação, para
manter e para acabar com laços de ligação entre os indivíduos (Belk e Coon (1993) apud
PRÊTO, 2008).
Os presentes contribuem para a socialização dos indivíduos, através da prática desde ato
77
as pessoas ficam mais propensas a serem incluídas em comunidades ou participar de
determinados grupos. Os valores dos presentes ofertados já foi uma maneira encontrada para
definir o poder que a pessoa possuía. Ofertas de presentes para reis, rainhas, para a nobreza,
para membros da igreja, definiam o poder e a classe que estes teriam perante a sociedade.
A troca de presentes como instituição social, desempenha um papel na economia e na
vida social como um todo muito maior do que normalmente se imagina. Tanto em formações
sociais anteriores ao capitalismo, quanto no próprio capitalismo. Os aspectos ligados a este
ato influenciam as relações sociais, pessoais, políticas, econômicas entre outras esferas da
sociedade (OLIVEIRA, 2009).
O ser humano constitui-se como um feixe de relações, desempenhando múltiplos papéis
e caracterizando-se por meio dos laços que estabelece, na família, no trabalho, nas diversas
instâncias da organização social. E a ação de doar, a doação, seria o motor principal dessa
constituição de laços (MAUSS apud MACHADO, 2004).
As coisas jamais se separam completamente de quem as troca, a comunhão e a aliança
que elas estabelecem no ato de trocar um objeto simbólico são relativamente indissolúveis. A
permanência da influência das coisas trocadas é um símbolo da vida social que demonstra a
maneira pela qual os subgrupos das sociedades tradicionais estão constantemente imbricados
uns nos outros (LOURENÇO 2006, MAUSS apud LOURENÇO 2006). Através dos laços
criados com outros indivíduos é que um ser humano se torna um ser social, que faz parte de
algo maior, de um grupo, uma comunidade. A doação é um convite a fazer parte da vida de
outra pessoa, como alguns estudiosos afirmam é uma doação de si para o outro.
4.7 DIMENSÃO ECONÔMICA
A dimensão econômica atualmente está muito valorizada em nossa sociedade. Desde o
trabalho ao lazer, das artes aos esportes, em tudo parece se encaixar a dimensão econômica.
As relações humanas são fortemente influenciadas por aspectos desta dimensão
(MACHADO, 2004).
O ato de presentear também está ligado à economia, seja por questões de mercado, de
lucros empresariais, como de aspectos do materialismo individual. A auto-afirmação pessoal
através dos bens que são adquiridos, a busca da felicidade através de artigos comprados, são
exemplos da dimensão econômica que um presente pode tomar.
Alem das funções de auto-afirmação e de busca da felicidade através da compra de
78
presentes, existem os consumidores que adquirem presentes que possuem funções utilitárias,
creditando a compra de presentes pelas suas vantagens funcionais (PRÊTO, 2008).
A estrutura familiar, tamanho da família, ciclo de vida, educação e renda influenciam na
probabilidade de dar presentes e nos valores gastos com este tipo de despesa (GARNER e
WAGNER (1991) apud PRÊTO, 2008).
Solomon (apud Farias 2001) expõe que para alguns pesquisadores a troca de presentes é
tida como uma forma de troca econômica onde um doador realiza a transferência de um item
de valor a determinado receptor, e este receptor de algum modo é obrigado a retribuir.
A área de marketing tem dado enfoque especial para os aspectos econômicos envolvidos
no ato de presentear objetivando com isto garantir cada vez mais o aumento nas vendas de
presentes e principalmente o aumento na satisfação dos clientes que realizam as trocas de
presentes.
O percentual econômico envolvido na compra de presentes anualmente no comércio
mundial representa um montante muito alto. Machado (2004), alerta que se por acaso fossem
eliminados os motivos apresentados no calendário anual para a circulação de presentes, como
são as datas comemorativas todos os setores da atividade econômica sofreriam um impacto
brutal.
4.8 DIMENSÃO DA OBRIGAÇÃO
A troca de presentes apesar de apresentar um caráter espontâneo e livre em sua
realização também denota um caráter de obrigação. Os dois aspectos que este ato pode
apresentar podem ser considerados duas posições distintas e não opostas de um mesmo
espectro (PRÊTO, 2008).
A troca de presentes apresenta um sentido de obrigação por conter implicitamente
obrigações. Ao ofertar um presente a alguém, um processo é desencadeado que não termina
na entrega do presente ao receptor. Existe uma tripla obrigação no processo de realização
deste ato: dar, receber e retribuir. A retribuição talvez seja o aspecto que represente a maior
obrigação neste ato, aquele que não retribui se sente em dívida com o seu presenteador e se vê
obrigado a retribuí-lo em algum momento (MAUSS apud TAVARES 2006, FARIAS 2001).
O ato de presentear pode ser entendido como algo espontâneo e obrigatório. Mesmo
quando não se deseja explicitamente receber algo em troca com a oferta de um presente este
sentimento fica implícito. No caso do receptor mesmo ele sabendo que não existe algo
79
formalizado que o obrigue a retribuir existe a regra implícita no ato (LANNA, 2000). Aqueles
que se sentem obrigados a presentear experimentam um sentimento de culpa se não o fazem e
presenteiam simplesmente para atender às expectativas dos outros, sentindo-se obrigados a
retribuir por um presente recebido (FARIAS, 2001).
Segundo Wolfinbarger (1990) apud Farias (2001), o comportamento de presentear por
obrigação é motivado pela concordância com as normas sociais. Para não infringir as regras
que regem este ato as pessoas retribuem mesmo que este ato não seja espontâneo.
Mauss (2003) citado em Lourenço e Rezende (2008) afirma em seu Ensaio sobre a
dádiva publicado em 1923, que nas sociedades mais tradicionais os presentes são formas de
trocas e contratos, que em teoria são voluntários, mas na verdade são obrigatoriamente dados
e retribuídos. Estudiosos do comportamento humano unidos a outros pesquisadores
concluíram que presentes são “objetos de luxo” e que estes são utilizados como ferramentas
para “comprar” interações sociais (FARIAS, 2001). Enquanto na dimensão simbólica os
presentes são vistos como “objetos de amor” na dimensão de obrigação estes apresentam se
como “objetos de luxo”. Esta visão distinta que pode se ter de um mesmo objeto por
dimensões diferentes comprova a complexidade do ato de presentear. Dependendo do prisma
que se observa as conclusões podem ser completamente divergentes.
Em uma pesquisa realizada com 200 entrevistados em uma região metropolitana do
Brasil (FARIAS, 2001), Farias comprovou que no Brasil a dimensão de obrigação em realizar
uma troca de presentes representou apenas 3% do total pesquisado. Aspectos como
demonstração de afeto, respeito, para obter satisfação, para proporcionar prazer receberam
percentuais muito superiores.
Farias (2001) salienta que este sentimento de obrigação em retribuir pode estar ligado a
manutenção da relação. A troca de presentes cria um ciclo, o doador presenteia alguém, esta
pessoa retribui o doador, o doador deseja retribuir pelo presente recebido e assim segue o
ciclo, fortalecendo o laço afetivo existente entre os envolvidos.
O ato de presentear pode ser obrigatório e desinteressado ao mesmo tempo. Mesmo
sendo oposto o sentido de obrigação e liberdade se misturam na troca de presentes. Esta
obrigação se exprime de maneira simbólica e coletiva (MAUSS 2003 apud LOURENÇO
2006).
Após compreender melhor as dimensões envolvidas e existentes no ato de presentear,
outro ponto a ser estudado é o entendimento dos motivos pelos quais alguém presenteia outra
80
pessoa. A compreensão desta etapa do processo de presentear é importante, pois poderão
influenciar nas demais etapas.
4.9 MOTIVOS PARA PRESENTEAR ALGUÉM
Os motivos pelos quais uma pessoa presenteia outra representam um ponto importante
neste processo como um todo. A importância na determinação do motivo que induz um
indivíduo a presentear é relevante, pois dependendo deste, a dificuldade na escolha do
presente, os objetivos implícitos no ato e as conseqüências que este ato ocasionará sofrerão
influencia. Beatty citado em Pepece elenca três motivos pelos quais normalmente uma pessoa
presenteia outra:
 Para dar prazer;
 Para obter prazer;
 Ou somente por obrigação;
A escolha de um presente objetivando proporcionar prazer para o outro ou para obter
prazer pessoal são mais minuciosas do que aquela que é realizada somente por obrigação.
Normalmente as trocas por obrigação estão mais ligadas a somente cumprir a função de
oferecer um presente. Enquanto os presentes oferecidos objetivando o bem do próximo ou
mesmo pessoais envolvem um processo mais complexo até a definição do presente ideal.
Para Macklin e Walker (1988) citados em Lourenço e Rezende 2008 o ato de presentear
é definido como a avaliação, a seleção e a transferência de objetos tangíveis ou não de uma
maneira espontânea ou que caracterize uma obrigação.
A caracterização espontânea de presentear envolve normalmente familiares, amigos,
pessoas mais próximas ao indivíduo que oferecerá o presente. Estas trocas normalmente
possuem um percentual de realizações superior ao das ofertas de presentes para pessoas com
que não se tem tanta intimidade e afeto (LOURENÇO e REZENDE, 2008).
A obrigação em presentear normalmente esta ligada a indivíduos com que não se tem
um relacionamento íntimo, não existe afeto entre as partes, mas existem interesses em manter
a relação existente. Um exemplo pode ser o convite para a festa de um colega de trabalho ou
mesmo o seu chefe com quem você não possui tanta afinidade, mas deverá presentear pois o
evento e as regras exigem isto.
Outros pesquisadores elencam diferentes motivos pelos quais um indivíduo pode ser
engajado no ato de presentear o seu próximo. Segundo Webster e Nottingham (2000) apud
81
Prêto 2008 o comportamento de presentear pode ser baseado em recompensas sentimentais,
experimentais e subjetivas ou em desejos que visam alcançar benefícios funcionais.
4.10 ETAPAS DO PROCESSO DE PRESENTEAR
Com a finalidade de diminuir a complexidade na compreensão do processo de
presentear e proporcionar o conhecimento sobre as etapas envolvidas neste ato o pesquisador
Sherry desenvolveu um modelo que oferece uma visão completa sobre a estrutura do processo
de troca de presentes (SHERRY apud PRÊTO, 2008).
Na teoria de Sherry o processo contém três fases:
 Gestação;
 Prestação;
 E reFórmulação.
A primeira etapa conhecida como a fase da gestação corresponde a todo comportamento
antecedente à real troca de presentes. Esta etapa envolve as definições do que poderia ser um
presente bom para o presenteado. Estas definições podem ser obtidas através do
conhecimento que o presenteador tem do receptor, tem de si mesmo e dos presentes que
julgam apropriados para a ocasião. Além da definição do que comprar, o presente é adquirido
nesta etapa. Então além de pesquisas particulares o presenteador realiza buscas externamente,
no comércio, na internet ou através de recomendações de outras pessoas.
A fase da prestação envolve a troca real do presente, nesta etapa serão conhecidas as
sensações que o presente escolhido gera no presenteado bem como no presenteador. Os
sentimentos desencadeados nesta etapa podem ser variados e acarretar em conseqüências
completamente distintas. O resultado afetivo da troca de presentes pode variar entre
satisfação, reconhecimento, descaso até decepção, entre outros resultados.
As fases de gestação e prestação podem ser definidas como as etapas onde o custo
psíquico definido por Prêto (2008) se torna mais evidentes. O custo psíquico conforme já
explicitado é equivalente aos esforços despendidos em busca do presente ideal durante o
processo de escolha, bem como durante o ato de entrega. Normalmente quando um indivíduo
deseja presentear alguém especial planeja todos os detalhes possíveis, exatamente nestes
planejamentos e na execução do plano se encontra o custo psíquico de um presente.
A fase da reFórmulação é a fase final do processo em que através dos resultados obtidos
com a troca influenciaram diretamente na realimentação e na reFórmulação da relação
82
existente entre as partes envolvidas. A etapa da reFórmulação compreende a etapa após a
entrega do presente, onde já se sabe se o presente agradou ou não. A partir dos resultados
obtidos nesta etapa que a ligação entre os envolvidos será mais influenciada.
4.11CONSIDERAÇÕES FINAIS
A troca de presentes é um ato universal que influencia a vida do ser humano de diversas
maneiras. Há muito tempo a prática deste ato é realizada em diferentes lugares do mundo,
independentemente de raça e cultura.
O simbolismo existente na troca de presentes é um dos principais responsáveis pela sua
prática ao longo dos tempos e contínua realização. O fortalecimento dos laços afetivos entre
os indivíduos envolvidos no ato de presentear é apenas um dos vários resultados que podem
ser obtidos com esta prática.
A capacidade de envolver diferentes dimensões em um único ato é uma das
características da troca de presentes. Esta capacidade faz com que sejam diversas as
definições sobre o significado do presente e da troca de objetos simbólicos As pesquisas nesta
área estão crescendo devido a dimensão alcançada pela prática deste ato. São estudos nas mais
diversas áreas que objetivam compreender como um ato tão contraditório em sua essência
pode ser tão difundido na sociedade.
A contradição existente nesta prática pode ser o segredo de seu sucesso, a liberdade e a
obrigação, a felicidade e a decepção, a aflição e a tranqüilidade, a preocupação e o descaso,
são apenas alguns exemplos das distinções que estão envolvidos em um mesmo processo.
A essência existente na troca de presentes está na troca de sentimentos, o valor
monetário gasto no presente é o que menos importa. O presente é um meio de fazer o bem
para o próximo, por mais que existam diferentes objetivos implícitos ao presentear alguém, o
que prevalece é o desejo de fazer o bem. Um presente é um objeto de amor.
O que mais se prioriza no desenvolvimento de um protótipo de um sistema de
recomendação de presentes é proporcionar uma maior facilidade na escolha do presente ideal.
O próximo capítulo explica brevemente quais foram as tecnologias utilizadas no
desenvolvimento do protótipo do sistema de recomendação.
83
5. ESTUDO DAS TECNOLOGIAS
O presente capítulo objetiva contextualizar de forma breve as tecnologias utilizadas no
desenvolvimento do protótipo do sistema de recomendação de presentes, posteriormente o
próximo capítulo abordará os aspectos específicos da implementação.
5.1 HTML (Hypertext Markup Language)
Segundo Graham (1998), o HTML é uma linguagem de marcação de hipertexto, que é
usada para produzir páginas web. O HTML é a linguagem usada pelos navegadores para
mostrar as páginas webs ao usuário, sendo hoje em dia a interface mais extensa na rede.
5.2 PHP (Hypertext PreProcessor)
Segundo GUTMANS (2005), o PHP é uma linguagem de criação de scripts, que permite
embutir fragmentos de códigos de páginas de HTML, código este que é interpretado e
fornecido aos usuários finais.
O PHP é uma linguagem de alto nível, livre, interpretada, possui tipagem fraca, oferece
suporte a programação estruturada e orientada a objetos, multiplataforma, além de possuir
capacidade de conexão com inúmeros bancos de dados.
5.3 MYSQL
“O MySQL é um banco de dados compatível com a linguagem SQL Ansi. Ele oferece
uma plataforma prática, rápida, eficiente, de fácil manuseio e extremamente confiável. Sua
instalação pode ser obtida gratuitamente na Internet. Existem várias versões para as mais
diversas plataformas.”(ZAGO, 2001).
O MySQL é um banco de dados gratuito e bastante utilizado mundialmente. Para usá-lo,
basta baixar o gerenciador para o sistema operacional desejado (site www.MySQL.com),
instalá-lo. Segundo ZAGO (2001), o MySQL nasceu da insatisfação de algumas pessoas com
o gerenciador msql. Essas pessoas desenvolveram novas interfaces com o banco e chamaramno de MySQL.
84
6. IMPLEMENTAÇÃO
O presente capítulo apresenta as particularidades envolvidas na implementação de um
protótipo de sistema de recomendação de presentes. Obter o conhecimento destas
particularidades é importante, pois estes detalhes englobam os requisitos do sistema, o método
de recomendação utilizado, a modelagem definida da base de dados. Primeiramente é
realizada uma contextualização do problema estudado para melhor compreensão das
dificuldades envolvidas.
6.1 O ATO DE PRESENTEAR
A escolha de um presente pode representar um ato simples se for levado em
consideração o fato de que ele é realizado com certa frequencia pelas pessoas. E normalmente
atividades que possuem uma realização frequente tendem a ser mais fáceis. No entanto, o ato
de presentear mesmo possuindo esta característica apresenta certas dificuldades no momento
de sua realização.
Uma das possíveis causas para estas dificuldades pode ser a existência de diversos
aspectos que podem influenciar na escolha de um presente. Alguns destes aspectos são
elencados a seguir:
 A ocasião
O
em que será entregue o presente;
grau de intimidade com a pessoa que receberá o presente;
Os
gostos e preferências do receptor;
A orientação
religiosa do receptor;
A localização
A estação
A idade
geográfica do receptor;
do ano em que ocorrerá o evento no qual será entregue o presente;
do receptor;
O
sexo do receptor;
E
o valor que deseja se pagar pelo item para presentear;
85
Os itens acima devem ser considerados no momento da compra do presente, pois
negligenciar um deles pode resultar em uma experiência desagradável tanto para o
presenteado quanto para o presenteador. Um presente é a representação de uma relação entre
duas pessoas, por isso errar na escolha pode ser algo prejudicial para o relacionamento dos
indivíduos envolvidos. Segundo Oliveira (2009), é como se o ato de doar fizesse o indivíduo
andar sobre o fio de uma navalha: a pessoa se doa para o outro, se está não a acolher, o
sentimento será de traição, de decepção, engano.
Além destes itens elencados existem outros que interferem na escolha de um presente, no
entanto foram definidos somente estes para utilização no protótipo, pois com base em
pesquisas realizadas estes foram considerados os mais relevantes. Uma das pesquisas na qual
foi baseada a extração destes itens é a pesquisa de Pepece realizada em 2002 (PEPECE,
2002), no qual foram extraídos vários aspectos referentes ao ato de presentear. Para melhor
assimilar a importância dos itens definidos com o ato de presentear cada um será descrito a
seguir.
A ocasião em que será realizada a entrega do presente é importante, pois dependendo da
mesma, existem determinados itens que não são muito indicados. Por exemplo, em uma festa
de 15 anos escolher um refrigerador como item para presentear a aniversariante não seria a
melhor escolha, isto porque em uma ocasião destas normalmente presenteia-se a
aniversariante com artigos mais de uso pessoal, como perfumes, jóias, uma roupa que seja
parecida com o estilo da aniversariante, entre outros itens. O refrigerador poderia ser ofertado
a alguém em um casamento, pois usualmente em casamentos os presentes são dados para o
casal, não são artigos pessoais e como o novo casal está construindo uma nova vida, móveis,
eletrodomésticos e eletrônicos podem ser bons presentes.
Além da ocasião existem outros fatores que podem influenciar a escolha do presente, um
deles é o grau de intimidade que se tem com a pessoa que o receberá. Se for considerada a
situação onde deverá se presentear um colega de trabalho e outra onde o presente será
entregue para o cônjuge, estas duas situações podem estar presentes em uma mesma ocasião,
uma festa de aniversario, por exemplo, no entanto os itens para presentear um indivíduo que é
apenas seu conhecido e os itens para presentear o seu cônjuge que é alguém mais próximo são
diferentes.
Outro fator importante que pode significar uma barreira na escolha de determinados itens
para presentear é o gosto e as preferências do presenteado. Este aspecto representa uma
86
dificuldade porque pode-se não conhecer exatamente o gosto da pessoa e presentear com algo
que a pessoa deteste. Por exemplo, o que se sabe sobre o gosto do presenteado é que o mesmo
adora música, mas não se tem conhecimento de que estilos musicais ele prefere. Esta
informação incompleta pode causar a escolha de um presente errado, seguindo com o
exemplo o presenteado é um apaixonado por Elvis Presley, Bob Dylan, Beatles entre outros
artistas neste estilo, no entanto o presenteador escolhe para presenteá-lo, o novo CD do
Parangolé, uma banda baiana que não tem nada a ver com o gosto musical do presenteado.
As chances de acertar o presente para alguém quando se conhece pelo menos algumas
informações sobre os seus gostos e preferências auxilia muito na escolha de um presente
ideal.
Um aspecto que pode passar despercebido, mas que possui um alto grau de importância na
escolha de um presente é a orientação religiosa do presenteado. Da mesma maneira como é
inoportuno presentear um roqueiro com um CD de axé, é inconveniente presentear um
evangélico com algum item que contenha imagens de santos, por exemplo, ou com um CD de
funk. Dessa forma, é possível afirmar que existem alguns itens que não são convenientes para
presentear de acordo com a orientação religiosa.
Além da orientação religiosa, existe a localização geográfica da pessoa que será
presenteada, o local onde ela vive. Cada local possui uma cultura, tradições, presentear
alguém com um item que seja totalmente fora do contexto do local onde vive pode representar
um constrangimento. Por exemplo, presentear um baiano com uma pala gaúcho, além de não
representar um item comum no vestuário baiano o presente estaria em desacordo com outro
aspecto que é a localização temporal. A localização temporal leva em consideração a estação
do ano em que a troca de presentes se dará associada à localização geográfica. Na Bahia
normalmente o clima é quente, mesmo nos meses em que a temperatura deveria cair, já no sul
do Brasil o clima varia muito de acordo com a estação do ano. O pala gaúcho utilizado no
exemplo poderia representar um bom presente se a região em que o presenteado morasse
fosse o sul do país e ainda mais conveniente caso a estação do ano fosse o inverno ou outono.
Neste contexto, um pala gaúcho poderia servir como um presente para o baiano ter como
decorativo e não como um vestimenta de inverno.
Um aspecto que determina um agrupamento e classifica os itens que podem ser utilizados
para presentear ou não, é a idade. Baseado neste aspecto pode-se procurar o presente em
determinados grupos específicos de itens, um exemplo claro disto são as crianças, é possível
87
identificar que o presenteado é uma criança pela idade e a partir disto verificar que
brinquedos, artigos educacionais e vestuário são os melhores itens para presentear.
Outro fator determinante na escolha de um presente é o sexo da pessoa que será
presenteada, as diferenças entre os itens para os dois sexos são consideráveis. Segundo
pesquisa realizada por PEPECE em 2002 (PEPECE, 2002), homens normalmente costumam
ganhar itens que estejam ligados a produtos culturais e de lazer como CDs, livros, artigos
esportivos, enquanto as mulheres são mais presenteadas com artigos de uso pessoal como
roupas, calçados, cosméticos, jóias, perfumes. Isto pode ser verificado em um amigo secreto
onde primeiro se compra o presente e depois é sorteado quem será o presenteado, desta
maneira os presentes são artigos unissex, para garantir que não ocorrerá um constrangimento
ao entregar, por exemplo, um par de brincos hippies para o cara mais machão da turma.
Além de todos estes fatores já elencados, existe um que também faz a diferença na
determinação de um presente, este aspecto é o valor que se pretende pagar. Ao possuir um
valor pré- estabelecido o universo de possibilidades para escolha diminui, o que pode
representar uma vantagem, pois quando não se trabalha com um valor especifico, existe uma
quantidade maior de opções.
Com base nestas informações pode-se dimensionar a complexidade envolvida na
realização do ato de presentear. O protótipo proposto tenta gerenciar essas particularidades
para assim realizar uma recomendação satisfatória para os usuários.
A maneira pela qual o protótipo utiliza estes itens na definição de um presente ideal será
melhor esclarecida no decorrer do capítulo. Baseado na descrição do problema estudado é
apresentado os requisitos para a implementação do protótipo de sistema de recomendação de
presentes.
6.2 REQUISITOS DO SISTEMA
Segundo Sommervile (1997), requisitos são descrições de como o sistema poderá
comportar-se, informações do domínio da aplicação, condições sobre operação de sistema ou,
especificações de uma propriedade ou atributo de sistema. Os requisitos de um software
podem ser divididos em dois, são eles os requisitos funcionais e os requisitos não funcionais.
Sommerville (1997) define requisitos funcionais e não funcionais da seguinte maneira:

Requisitos funcionais: entendem-se os fenômenos ambientais referentes ao negócio e
domínio da aplicação que se queira conhecer e estudar, ou seja, o que fazer. São
88
escritos do ponto de vista do cliente. Normalmente são expressos em linguagem
natural, diagrama informal ou usando alguma notação que é apropriada para o
entendimento do problema.

Requisitos não-funcionais ou especificações: entendem-se as especificações técnicas
de como melhor adequar a solução do problema para responder ao cliente.
A Tabela 8 apresenta os requisitos funcionais identificados na aplicação do protótipo. Já
a Tabela 9 apresenta os requisitos não-funcionais.
Requisitos Funcionais
RF1 - O sistema deverá permitir o cadastro dos usuários no sistema;
RF2 - Somente usuários cadastrados poderão buscar recomendações no sistema.
RF3 - Obrigar o preenchimento de informações que são necessárias para realizar a
recomendação. Como data de nascimento, sexo, algumas áreas de interesse,
orientação religiosa, a cidade onde vive e algumas informações sobre sua
personalidade.
RF4 - Permitir que além dos dados que influenciam diretamente na escolha de um
presente, o usuário cadastre seu nome, login e senha que será utilizado para permitir
acesso ao sistema.
RF5 - O sistema deverá solicitar que o usuário realize avaliação de alguns existentes
na base de dados, com o intuito de saber mais sobre as preferências relacionadas ao
usuário.
RF6 - O sistema deverá permitir que o usuário realize constantemente as avaliações
de itens e não apenas no momento de criação do perfil.
RF7 - Permitir que as avaliações sejam realizadas pelo usuário, utilizando uma das
quatro opções: “Não gosto”, “Gosto Pouco”, “Gosto” e “Gosto Muito”.
RF8 - Os itens armazenados na base de dados possuirão características especificas,
dentre elas um grupo e um subgrupo, por exemplo, o CD do ColdPlay está
vinculado ao grupo CD subgrupo Rock.
RF9 - O sistema deverá gerar uma lista com alguns itens para serem avaliados
randomicamente, garantindo assim, que todos os itens das diversas categorias
tenham avaliações.
RF10 - O sistema deverá permitir que um usuário adicione amigos ao seu perfil.
RF11 - Ao adicionar um amigo o sistema deverá controlar quando este indivíduo
89
está de aniversário e quando estiver próximo deste dia, sete dias antes disparar uma
recomendação para o usuário que é amigo do aniversariante;
RF12 - A recomendação poderá ser automática como no caso de um amigo
aniversariante ou o usuário poderá buscar uma recomendação manualmente; A
recomendação automática é efetivada da seguinte maneira, o protótipo controla
quando o amigo vai fazer aniversario, quando o dia do aniversario estiver próximo é
enviado um email para o usuário que é amigo do aniversariante informando sobre o
aniversário e já contendo uma recomendação de presente. A definição de quantos
dias antes da data festiva o email deve ser enviado será um dado definido pelo
usuário no momento do cadastro. Já a manual, o usuário informa os dados
necessários para a recomendação.
RF13 - Os itens possuem características especificas: sexo, faixa etária, grau de
amizade, áreas de interesse, estação do ano, região, orientação religiosa e ocasião.
Estes dados permitem que seja criado cluster de itens, pois itens com características
semelhantes serão mais indicados para determinado tipo de ocasião, ou para
determinado sexo, determinada faixa etária assim com todas as demais
características.
RF14 - A definição da similaridade deverá ser realizada através do cálculo da
distância euclidiana entre os itens da base de dados com os dados da ocasião de
troca de presentes que são respectivamente: ocasião da troca de presentes, sexo do
presenteado, faixa etária do presenteado, grau de amizade com o presenteado,
cidade do presenteado, orientação religiosa do presenteado, áreas de interesse do
presenteado, traços de personalidade do presenteado e a estação do ano em que
ocorrerá a troca de presentes. Aqueles itens que obterem as menores distâncias serão
recomendados para o usuário presenteador. O método da similaridade e o cálculo da
distância euclidiana aplicados são apresentados no próximo tópico do capítulo.
RF15 - Deverão ser definidos pesos para cada característica avaliada no cálculo da
distância euclidiana, sendo que as particularidades levadas em consideração são as
seguintes: ocasião da troca de presentes, sexo do presenteado, faixa etária do
presenteado, grau de amizade com o presenteado, cidade do presenteado, orientação
religiosa do presenteado, áreas de interesse do presenteado, traços de personalidade
do presenteado e a estação do ano em que ocorrerá a troca de presentes.
90
RF16 - Após enviar a recomendação para o usuário o sistema devera solicitar que
este avalie a recomendação que recebeu desta forma o sistema realizará
recomendações de melhor qualidade;
RF17 - O sistema deve permitir que seja realizada recomendação tanto para amigos
do usuário, quanto para indivíduos que não estão cadastrados, neste caso o usuário
presenteador devera preencher todas as informações necessárias para a realização da
recomendação que são: ocasião da troca de presentes, sexo do presenteado, faixa
etária do presenteado, grau de amizade com o presenteado, cidade do presenteado,
orientação religiosa do presenteado, áreas de interesse do presenteado, traços de
personalidade do presenteado e a estação do ano em que ocorrerá a troca de
presentes.
RF18 - O usuário poderá pesquisar por outros usuários do sistema para poder
adicioná-los a seu perfil, a busca é efetuada pelo nome do usuário que se deseja
encontrar;
RF19 - O usuário poderá editar o seu perfil, caso ache necessário a atualização de
alguma informação;
RF20 - O sistema deverá buscar informações da tabela de compras do usuário para
melhor definir o seu perfil na aplicação e melhorar as recomendações para este;
RF21 - O sistema deverá permitir que o usuário avalie quantos itens quiser, sempre
que tiver vontade;
Tabela 8 – Requisitos Funcionais do protótipo
Requisitos Não funcionais
RNF1 - Interface amigável, utilizando conceitos de ergonomia e usabilidade.
RNF2 - Para gerar as recomendações de itens com base no perfil do usuário, o
sistema deverá possuir um mecanismo de similaridade entre itens, o perfil do
usuário e os dados da ocasião de troca de presentes. Esta similaridade será buscada
através das características que cada item possui.
Tabela 9 – Requisitos Não Funcionais do protótipo.
As particularidades existentes na modelagem do projeto, bem como os métodos de
filtragem, de definição de similaridade e o cálculo aplicado para determinar a escolha dos
presentes ideais são descritos a seguir.
91
6.3 MÉTODO DE FILTRAGEM DO PROTÓTIPO
Segundo Albuquerque (2008), a principal diferença encontrada entre os sistemas de
recomendação é a técnica utilizada para realizar a recomendação. Dentre as três técnicas
existentes, filtragem baseada em conteúdo, filtragem colaborativa e filtragem híbrida (para
maiores detalhes veja Capítulo 2) a escolhida para o desenvolvimento do protótipo de
recomendação de presentes foi a FBC – Filtragem baseada em conteúdo.
Levando em consideração que está técnica trabalha com o relacionamento entre as
características existentes entre os itens e o perfil do usuário, optou-se pela mesma no
protótipo proposto. Isto porque após realizado o levantamento de requisitos foram
identificadas características que relacionam os indivíduos aos itens utilizados para presentear.
Além da verificação das características entre os itens e os usuários o protótipo também
leva em consideração outros fatores que influenciam diretamente a escolha de um presente,
como por exemplo, a ocasião em que será entregue o presente. Este é um fator que não é
pertinente ao usuário, mas sim ao ato de presentear e por isto deve ser relacionado aos itens da
base de dados. Essas características foram modeladas para um banco de dados relacional que
será apresentado a seguir.
6.4 MODELAGEM DA BASE DE DADOS
Algumas das variáveis envolvidas no ato de presentear já foram anteriormente
elencadas e na base de dados essas variáveis se tornaram tabelas apresentadas na Tabela 10.
Área de interesse
Personalidade
Faixa etária
Sexo
Orientação religiosa
Região
Grau de amizade
Ocasião
Estação do ano
Tabela 10 – Aspectos envolvidos no ato de presentear
Todas as tabelas elencadas na Tabela 10 possuem ligação com as tabelas de item e
usuário respectivamente, isto porque é através dos dados armazenados nestas tabelas que o
92
protótipo irá realizar as inferências para gerar a melhor recomendação possível.
No caso da tabela de Produtos que na base de dados foi nomeada de Item, a
modelagem está representada na Figura 13.
Figura 13 – Modelagem desenvolvida para controle dos itens da base de dados
Como pode-se perceber na Figura 13, a modelagem da tabela Itens possui nove
tabelas associativas, justificadas pela possibilidade que os itens possuem de preencher mais
de uma característica armazenada em cada uma das tabelas. Por exemplo, um item pode estar
relacionado com mais de uma orientação religiosa, com mais de uma faixa etária, mais de
uma região, da mesma forma com as outras tabelas das quais foi criado uma associativa.
A modelagem definida objetiva abranger todos os pontos levantados sobre os aspectos que
interferem na escolha de um presente,segue uma breve explicação sobre algumas das tabelas
criadas e apresentadas na Figura 13.

Tabela item_areainteresse: armazena quais são as áreas de interesse relacionadas ao
referido item, por exemplo o livro “Dylan – A Biografia” pode ser associado à área de
interesse música, rock, blues, folk, arte entre outras áreas. Através destes dados
relacionados a este item ao realizar uma recomendação para um usuário que possua
93
áreas de interesse iguais as armazenadas no livro as chances desse item ser
recomendado aumentam com relação aos outros itens.
 Tabela item_religião: devido à existência de certas restrições no consumo de
determinados produtos para algumas religiões especificas se faz necessária a
identificação da orientação religiosa que o item possui uma ligação. Um exemplo
simples e de fácil compreensão é a oferta de um item que possua imagem de alguma
entidade santificada pela igreja católica para um indivíduo evangélico. O problema
neste caso está exatamente na ligação existente entre o item e o indivíduo que lhe
recebe, evangélicos não crêem em santos, isto é algo próprio dos católicos.

Tabela item_região: segundo Bezerra (2004) um problema existente nas aplicações de
sistemas de recomendação é o fato de não ser levado em consideração à localização
geográfica do usuário. Este dado é importante para a recomendação porque pode
interferir diretamente no resultado, mais ainda quando se trata da escolha de um
presente. Um baiano poderia se sentir frustrado ao receber de presente um kit
chimarrão, pois é algo que não está ligado a cultura e as tradições do local em que ele
vive, ao contrário de um gaúcho onde a probabilidade de agradar ofertando um
presente destes é bem maior.

Tabela item_estacaoano: Bezerra (2004) ressaltou , também, a falta de controle sobre
os aspectos ligados as dimensões temporais nos sistemas de recomendação. No
protótipo foi utilizado como aspecto de avaliação a estação de ano em que ocorrerá a
troca de presentes. A estação do ano engloba a dimensão temporal pois refere-se a um
período especifico. A principio pode parecer algo irrelevante, mas se for analisado este
aspecto influencia na escolha de um presente principalmente nos casos em que o
presente é dado objetivando que este seja útil. Um exemplo disto pode ser quando se
escolhe como presente um cobertor térmico no inverno, é possível dizer que a escolha
objetivou suprir uma necessidade da estação e proporcionar conforto ao indivíduo que
recebeu, no entanto se este mesmo produto fosse oferecido no verão à percepção
poderia ser de descaso, pois não foi levado em consideração a utilidade daquele item
no momento.
Este controle acontece com as demais tabelas associativas criadas na modelagem pois é
necessário identificar que características são pertinentes ao item e armazenar estes valores na
94
tabela associativa para posterior utilização no processo de recomendação.
Um questionamento que pode ser levantado quanto à efetivação da modelagem desta
maneira normalizada refere-se ao desempenho da aplicação. Devido ao número considerável
de tabelas associativas e a conseqüente necessidade da utilização de junções nas consultas à
aplicação pode pecar em desempenho. No entanto mesmo com o conhecimento sobre esta
problemática optou-se por não desnormalizar a tabela de itens por se tratar de um protótipo de
ambiente acadêmico e não comercial e, a princípio, as consultas ao banco não irão afetar tanto
a aplicação. Outro ponto levado em consideração ligado ao ambiente acadêmico que justifica
esta normalização é de que esta formalização da base é um principio defendido por diversos
professores da área de banco de dados, mesmo que um número considerável de profissionais
defendam que na “realidade” isso não se aplica a todas as bases. A Figura 14 apresenta a
modelagem referente aos aspectos do usuário.
Figura 14– Modelagem desenvolvida para controle dos dados dos usuários
95
A Figura 14 apresenta a modelagem para controle de usuários, quase todas as tabelas
que estão relacionadas aos itens também estão ligadas a tabela Usuário, isto porque é através
da definição da similaridade entre os itens e o perfil do usuário que o processo de
recomendação realiza suas tarefas. As únicas tabelas que não estão relacionadas no usuário e
aparecem nos itens são a Estação do ano, a ocasião e a faixa etária. A tabela Faixa Etária não
foi relacionada ao usuário diretamente, pois através da data de nascimento o sistema obtém a
idade do usuário e pode comparar com a faixa etária do item, as outras duas tabelas não são
relacionadas porque não possuem ligação com perfis de usuários. São dados importantes que
necessitam apenas serem correlacionados aos itens da base de dados.
Além da definição da similaridade entre as características dos itens com o perfil do
usuário existe outro dado que pode definir se o item irá agradar ou não ao usuário que irá
receber o presente: a avaliação que o usuário realizou dos itens da base de dados. A Figura 15
ilustra como foi modelado o mecanismo de avaliação de itens na base de dados do protótipo.
Figura 15 – Modelagem referente as avaliações de itens por usuários
O usuário pode avaliar o item escolhendo entre uma das opções cadastradas na tabela
Avaliação que são: não gosto, gosto pouco, gosto e gosto muito ou atribuir uma nota para o
item que pode variar entre zero e 10. Através das avaliações do usuário pode-se ter o controle,
96
por exemplo, em uma situação onde o item que resultou na recomendação é um que o usuário
demonstrou não gostar o sistema já retira este da lista de recomendados.
Após definir a modelagem de toda a base de dados é necessário popular as tabelas, o que pode
parecer uma tarefa simples somente de inserção de dados é algo mais complexo, pois envolve
os dados que serão utilizados para definição das similaridades no protótipo. A seguir é melhor
explanado sobre a definição do método escolhido para o cálculo das similaridades entre os
itens da base de dados.
6.5 MÉTODO DE DEFINIÇÃO DA SIMILARIDADE
A definição da similaridade é algo essencial em um sistema de recomendação. A
definição do método a ser utilizado na aplicação influência na maneira como os dados devem
ser armazenados na base.
No presente trabalho o método escolhido é o da distância euclidiana. A distância
euclidiana é um método bastante conhecido para calcular a distância entre dois pontos A e B
em um espaço n-dimensional. (Neto, Moita, 97). A fórmula do cálculo da distância euclidiana
é o seguinte:
Figura 16 – Fórmula da distância Euclidiana
Para definir a similaridade entre estes dois pontos é aplicada a fórmula da distância
euclidiana que consiste em obter uma coordenada de um dos pontos (p) subtrair pela
coordenada referente do outro ponto (q) e elevar o resultado ao quadrado. Isto é feito para
todos os atributos existentes, depois se soma o resultado da exponenciação de cada um e tirase a raiz quadrada. O resultado da fórmula é sempre um número positivo, quanto mais
próximo de zero este número estiver maior é a similaridade entre os dados pesquisados.
Para melhor compreensão de como esta fórmula será utilizada no protótipo será exemplificada
uma situação. Por exemplo, para medir a similaridade entre um usuário e o novo CD do
cantor Benjamin Del Shreve, será utilizado no cálculo dois atributos presentes no CD que
também existem no perfil do usuário, são eles a área de interesse e a faixa etária. O valor do
atributo área de interesse no CD equivale ao valor 7 que representa Folk Rock, já no perfil do
usuário este mesmo atributo possui o valor 2 que representa a área de interesse Música Pop.
97
Quanto à faixa etária o usuário possui 8 cadastrado em seu perfil que equivale a idades de 15
a 20 anos, o CD de Benjamin possui o valor 12, equivalente a idades acima de 40 anos. A
partir dessas informações será calculada a distância entre esses dois pontos referentes ao CD e
ao perfil do usuário. O resultado final depois de aplicada a fórmula foi de 6.40, o que
representa uma distância considerável entre o item calculado e o perfil do usuário. Boas
distâncias para recomendar são aquelas que se aproximam mais do valor 0 até o valor 3. Isto
porque esses valores demonstram que existe uma similaridade entre os itens avaliados,
portanto pode ser interessante a recomendação dos mesmos.
Conforme mencionado a determinação do método de cálculo da similaridade pode
implicar em algumas restrições ou exigências na modelagem ou inserção de dados na base.
No caso do protótipo o método escolhido foi o da distância euclidiana, como visto
anteriormente a fórmula trabalha com valores numéricos, portanto os dados de todos os
elementos utilizados no protótipo que vão determinar a recomendação devem ser
transformados em números.
A transformação dos dados da base em atributos numéricos pode ser chamada de
discretização. A discretização de dados converte um atributo contínuo da base de dados em
um atributo discreto. Esta transformação é necessária para garantir que a similaridade possa
retornar valores realmente pertinentes e reais. Voltolini (2007) defende que a discretização de
dados proporciona um pré-processamento em bases de dados que serão utilizadas em
aplicações de mineração de dados, pois promove uma compreensão mais rápida dos itens nela
armazenados.
No protótipo, a discretização dos dados é aplicada no atributo código das tabelas da
base de dados. A discretização aplicada deve ser efetivada da seguinte maneira, por exemplo,
na tabela de áreas de interesse armazenar os dados que são mais semelhantes como música,
arte, cinema com códigos próximos, outro exemplo também referente à área de interesse
armazenar rock, folk, blues, jazz com códigos mais próximos e distantes por exemplo de axé,
pagode, samba. Desta maneira deve ser a inserção em todas as tabelas da base de dados
seguindo esta padronização.
O que objetiva-se com esta forma de inserção é um melhor desempenho na aplicação
da distância euclidiana como forma de definição da similaridade bem como uma maneira de
encontrar itens que sejam parecidos com o que o usuário pode gostar. Um caso que pode
acontecer é de nenhum item casar exatamente com os dados repassados para a realização da
98
recomendação, mas existirem itens parecidos com o perfil do usuário. Ao aplicar a distância
euclidiana estes itens não estariam exatamente próximos ao zero, que significa a menor
distância, mas obteriam uma distância razoavelmente boa, suficiente para serem
recomendados. Isso pode acontecer, por exemplo, para um usuário que seja muito fã de blues,
a base pode não ter armazenado nenhum item especifico de blues, mas conter outros de jazz,
rock, folk e estes agradarem ao usuário. Estes itens poderão ser indicados para o usuário
devido à padronização dos códigos, eles não terão exatamente o código referente ao Blues,
mas serão próximos, o que resulta em uma distância euclidiana menor.
A Figura 17 apresenta alguns dados armazenados na base que estão padronizados para
melhor entendimento.
Figura 17 – Tabelas Religião, Região e Sexo padronizadas na base de dados
Conforme pode ser observado na Figura 17, procurou-se identificar primeiramente
quais valores possuíam similaridades e após isto atribuir aos mesmos códigos com valores
próximos. No caso da tabela de sexo os dois códigos possuem valores consideravelmente
distantes por representarem algo que não é semelhante, que caracteriza certa segmentação.
Pois existem itens que são voltados para o público feminino e outros para o público
masculino, por exemplo, um colar de pérolas é voltado para as mulheres enquanto um kit de
barbear é direcionado ao público masculino.
A tabela Região seguiu o mesmo raciocínio para agrupar pelas regiões mais próximas
umas das outras, o que pode caracterizar que regiões mais próximas podem possuir
características em comum. A mesma lógica foi aplicada na tabela de religião bem como em
99
todas as outras tabelas do banco de dados.
Conforme apresentado até o momento o ato de escolher um presente possui diversos
fatores que interferem na definição do item mais adequado. No entanto existem alguns fatores
que são mais relevantes do que outros para a escolha do presente.
Com base na pesquisa realizada por Pépece (2002) foi definido a relevância do fator
na determinação da escolha de um presente. Para determinar a relevância os fatores foram
pontuados de um a cinco. A Tabela 11 apresenta a relação de fatores considerados com as suas
respectivas pontuações.
Fator
Ocasião
Sexo
Região
Orientação Religiosa
Faixa Etária
Grau de amizade
Áreas de Interesse
Personalidade
Estação do ano
Pontuação
0.5
0.5
0.3
0.4
0.4
0.4
0.5
0.3
0.3
Tabela 11 – Pontuação de acordo com a relevância do fator na determinação de um presente
Na aplicação do protótipo do sistema de recomendação de presentes, o cálculo da
distância euclidiana foi alterado, objetivando retornar somente os itens que sejam realmente
pertinentes para o usuário. A diferença está na utilização dos valores definidos na Tabela 11
para pontuar cada fator no cálculo da similaridade, para melhor compreensão do cálculo
definido a Tabela 12 apresenta uma legenda com as variáveis utilizadas no exemplo da
distância euclidiana aplicada no protótipo. As variáveis representam as características
avaliadas nos itens, no perfil do usuário e nos fatores que influenciam a determinação de um
presente ideal, como a ocasião e a estação do ano.
Significado
Sexo do item
Sexo do usuário
Ocasião da troca de presente
Ocasião do item
Região do usuário
Região do item
Orientação Religiosa do usuário
Sigla
SI
SU
O
OI
RegU
RegI
RU
100
Região do item
Faixa etária do usuário
Faixa etária do item
Grau de amizade com o usuário
Grau de amizade do item
Área de interesse do usuário
Área de interesse do item
Personalidade do usuário
Personalidade do item
Estação do ano ocasião
Estação do ano item
RI
FU
FI
GU
GI
AU
AI
PU
PI
EO
EI
Tabela 12 – Tabela legenda das características avaliadas no cálculo da distância euclidiana
Utilizando todas as características elencadas foi definida a nova fórmula do cálculo da
distância euclidiana aplicado no protótipo. A Figura 18 exibe a fórmula.
Figura 18 – Fórmula da distância euclidiana aplicada no protótipo.
Na fórmula da distância euclidiana é apenas calculada a distância entre dois pontos,
elevado o valor obtido ao quadrado e depois calculado a raiz quadrada do valor. Para os
cálculos de similaridade no protótipo foi criada uma nova maneira de calcular, a fórmula
aplicada no protótipo se difere no cálculo ao aplicar o fator de relevância na fórmula.
A definição desta fórmula pretende fazer com que itens que possuam uma
distância pequena com o perfil do usuário em fatores não tão importantes na escolha de um
presente não sejam recomendados caso possuam uma distância consideravelmente grande em
fatores mais importantes na escolha de um presente. Por exemplo, caso um item consiga obter
a distância zero no fator estação do ano, que é o melhor valor que pode ser obtido, mas nos
fatores ocasião, sexo, faixa etária e grau de amizade, ele possui uma distância maior
provavelmente este item não será recomendado. Isto porque através dos fatores de relevância
que também podem ser entendidos como pesos, assegura-se que os fatores mais importantes
serão levados em consideração com mais relevância na aplicação.
A Figura 19 apresenta, em pseudo-código, o algoritmo de recomendação
101
implementado no protótipo. A recomendação no protótipo pode ser realizada para usuários
cadastrados ou não, desta forma o protótipo busca os dados para realizar o processo de
recomendação de maneira diferente nos dois casos. A Figura 19 ilustra as duas situações.
Figura 19 – Esboço do funcionamento do algoritmo de recomendação aplicado ao protótipo
A diferença existente entre as duas formas de recomendação está na busca dos dados
que são utilizados no processo. No caso da recomendação com usuário cadastrado é
necessário a verificação das avaliações realizadas pelo usuário presenteado sobre os itens da
base de dados, isto para garantir que um item avaliado negativamente pelo usuário não lhe
seja recomendado.
102
Segundo Lichtnow (2009), um sistema de recomendação deve ser capaz de prever o que
pode ser de interesse do usuário, deve ir ao encontro do usuário sem que este necessariamente
busque pela aplicação. No protótipo, o que foi implementado para assegurar essa capacidade
exigida em um sistema de recomendação é o envio de recomendações por email para os
usuários.
Esta recomendação por email se difere daquelas oferecidas ao usuário no protótipo, pois
não é necessária a participação do mesmo para que ela ocorra. Quando o usuário realiza o
cadastro na aplicação é solicitado se o mesmo deseja receber recomendações por email, caso o
usuário responda afirmativamente receberá emails com informações sobre amigos que estão
de aniversário, sobre datas comemorativas próximas e junto destas informações
recomendações para cada situação.
Os emails são enviados com uma semana de antecedência para os usuários, toda meia
noite de domingo é disparado um comando no protótipo que realiza algumas verificações e
realiza as recomendações. A recomendação pode ser realizada através da busca por ocasiões
que acontecerão nos próximos 7 dias ou através da busca por usuários que estejam de
aniversário na próxima semana. Para melhor compreensão as Figuras 20 e 21 apresentam, em
pseudo-código, como esse processo ocorre.
Figura 20 – Esboço do processo para recomendar por email buscando por ocasiões
103
Figura 21 – Esboço de recomendação por email através da busca por aniversariantes
Após expor algumas particularidades do funcionamento do protótipo serão exibidas as
principais interfaces desenvolvidas para a aplicação.
6.6 TELAS DO PROTÓTIPO
 Tela de login:
A tela inicial (Figura 22) do sistema traz a opção do login para usuários já cadastrados e
a opção de cadastro para usuários que ainda não possuam perfil na aplicação. A tela exibe uma
mensagem que objetiva demonstrar ao usuário a importância do ato de presentear e qual o
objetivo do protótipo.
104
Figura 22 - Tela de login do protótipo

Tela de cadastro de usuário
A tela de cadastro do usuário (Figura 23) onde devem ser informados os dados do
usuário. Todos os campos são de preenchimento obrigatório, isto se deve a importância desses
dados no processo de recomendação. Os dados solicitados são nome, email, data de
nascimento, estado civil, sexo, cidade, orientação religiosa, áreas de interesse, aspectos da
personalidade, login, senha e uma foto. Após informar os seus dados pessoais o usuário deve
realizar a avaliação de alguns itens para melhor definição de seu perfil. A tela de avaliação é
exibida na Figura 23.
105
Figura 23 – Tela de cadastro de usuário na aplicação.

Tela de avaliação de itens
Os itens exibidos para o usuário avaliar são escolhidos através de uma pesquisa para
retornar pelo menos um item de cada grupo de produtos cadastrados na base de dados. Por
exemplo, retornar pelo menos um CD, um DVD, um livro, um artigo de uso pessoal, um
artigo ligado a tecnologia, entre outros grupos. O usuário deve realizar obrigatoriamente a
avaliação de pelo menos 5 itens ao criar o seu perfil. O usuário poderá depois de criado o
perfil avaliar itens sempre que desejar através de opção no menu principal. A Figura 24
apresenta a tela onde são realizadas as avaliações.
106
Figura 24 – Tela de avaliação de itens
 Tela do perfil do usuário
Os usuários cadastrados, ao realizarem o login, terão acesso tela de perfil (Figura 25). A
tela de perfil do usuário exibe as informações cadastradas no seu perfil, bem como lista os
amigos adicionados por ele no aplicativo, além de listar os novos itens adicionados a base de
dados.
As listagens dos amigos e dos novos itens da base de dados de forma destacada
garantem uma facilidade de acesso a informações pertinentes para o usuário. Desta forma é
poupado o tempo de pesquisa e o usuário tem acesso a informações mais rapidamente.
A tela do perfil do usuário permite acesso a todas as outras funcionalidades do
aplicativo através do menu exibido na parte superior da tela (Figura 26).
107
Figura 25 – Tela de perfil do usuário
 Menu da aplicação
A opção Inicio leva o usuário para a primeira tela do sistema, onde são exibidos os seus
dados pessoais, os amigos e os novos itens adicionados a base de dados. A interface é a
mesma do perfil do usuário, no entanto existe uma pequena diferença no que diz respeito à
edição dos dados do usuário que somente são permitidas ao utilizar a opção Perfil do menu.
A opção Recomendação deve ser utilizada quando se deseja receber uma recomendação
de presente, mas o usuário não está cadastrado na aplicação. Neste caso o usuário
presenteador deverá informar os dados necessários para que a recomendação possa ser gerada.
A opção Avaliar disponibiliza para o usuário o formulário de avaliações dos itens, a
opção Amigos lista todos os amigos do usuário, a Pesquisar Amigos disponibiliza uma busca
para o usuário procurar outros amigos cadastrados.
108
Figura 26 – Menu do aplicativo
 Tela de Recomendação sem usuário:
Todas as opções exibidas na Figura 27 estão ligadas com os fatores que influenciam na
escolha de um presente, (sexo do presenteado, faixa etária, orientação religiosa, região em que
vive áreas de interesse, entre outras). Por representar aspectos muito relevantes na escolha de
um presente todos os campos deveriam ser de preenchimento obrigatório, no entanto existem
alguns dados que podem ser difíceis do usuário presenteador ter um conhecimento concreto,
por exemplo, as áreas de interesse ou até mesmo a definição da personalidade do usuário
presenteado.
Além dos dados sobre o usuário presenteado e aspectos ligados a ocasião de troca
presentes o usuário presenteador pode informar também uma faixa de valores que deseja
pagar pelo presente. Esses dados dos valores não são obrigatórios, mas caso o usuário os
informe a pesquisa é mais especifica, pois restringe a somente itens que possuírem valor entre
a faixa informada.
109
Figura 27 – Interface da tela de recomendação sem usuário
Após informar os dados o usuário deve clicar no botão Gerar Recomendação que ativa o
formulário que retorna os itens compatíveis com os dados informados, a Figura 28 exibe a
respectiva interface do formulário.
 Tela de itens recomendados:
Os itens exibidos são os que retornaram as menores distâncias no cálculo de
similaridade com os dados informados pelo usuário presenteador. Sempre serão exibidos os 6
primeiros colocados, no entanto o usuário é informado se a recomendação retornou mais
dados, caso a recomendação possua outros itens o usuário pode visualizá-los. Após receber a
recomendação o usuário deve avaliar a mesma, tendo como opções:
 Não gostei;
 Gostei;
 Gostei muito;
110
Desta forma é possível saber se as recomendações estão agradando ou não os usuários
do aplicativo. Esta mesma interface é exibida caso a recomendação seja realizada para um
usuário que já exista na base de dados, a única diferença é o modo como o usuário busca a
recomendação.
Figura 28 – Interface dos itens recomendados
 Tela de recomendação com amigo:
Para recomendar para um amigo o usuário deve selecioná-lo e definir uma faixa de
valores que deseja pagar pelo presente, além de indicar qual é a ocasião que será entregue o
presente. A Figura 30 exibe parte da interface desta tela, a tela com o resultado da
recomendação com os itens resultantes da pesquisa é a mesma da Figura 29.
Figura 29 – Interface de recomendação com amigo cadastrado.
111
 Tela pesquisar amigos:
Caso o usuário deseje encontrar outros amigos na aplicação este pode utilizar a opção
no menu Pesquisar Amigos. A opção disponibiliza ao usuário a tela representada na Figura
31, onde é exibida uma lista com todos os usuários cadastrados na aplicação e uma opção para
pesquisa pelo nome do amigo. A tela possibilita ao usuário a opção para adicionar os usuários
listados, a tela para adicionar amigos é exibida na Figura 30.
Figura 30 – Interface de pesquisa de amigos.
 Tela para adicionar amigo:
Quando o usuário vai adicionar o amigo é necessário que o mesmo informe qual é o
grau de amizade entre ambos, esta informação é importante para a recomendação por isto é
obrigatória.
Figura 31 – Interface para adicionar amigos.
112
 Tela de informações do amigo:
Após adicionar um amigo o usuário pode ter acesso a apenas dois dados sobre o amigo
adicionado: a data de aniversário e o grau de amizade . Os demais dados são disponibilizadas
pois são particulares da pessoa cadastrada e são utilizados de maneira automática pelo
protótipo. Optou-se por apenas exibir estas informações devido à questão de privacidade no
aplicativo. A proposta do protótipo é realizar recomendações e não ser uma rede social que
compartilhe os dados dos usuários. A Figura 32 exibe a interface do detalhamento dos dados
do usuário.
Figura 32- Interface com os dados detalhados de um amigo.
 Tela mais detalhada de avaliação de itens:
Além de avaliar determinada quantidade de itens ao criar o cadastro na aplicação o
usuário pode realizar avaliações sempre que desejar. Os novos itens adicionados na base de
dados ficam disponíveis em todas as páginas e os demais itens podem ser acessados através
do menu na opção Avaliar. Ao acessar esta opção serão disponibilizados todos os itens
existentes na base de dados, o usuário pode pesquisar e avaliar somente o que desejar, a
Figura 33 detalha as opções disponíveis na avaliação de um item.
Figura 33 – Detalhe da interface de avaliação de itens.
Após a explicação dos métodos definidos e implementados no protótipo e da exposição
113
das interfaces do sistema será descrito um estudo de caso para compreensão do
funcionamento do sistema efetivamente.
6.7 ESTUDO DE CASO
Suponha dois usuários do sistema: US1 e US2, respectivamente. US1 é do sexo
feminino e já está cadastrado na aplicação, US2 gostaria de dar um presente para US1 e não
está cadastrado. Então ele cria seu perfil no sistema informando todos os seus dados pessoais
como sua idade, seus gostos e preferências, seu sexo, sua orientação religiosa, a cidade em
que reside, entre outros dados.
Logo após a criação da conta o usuário US2 deve realizar a avaliação de alguns itens
armazenados na base de dados. As avaliações realizadas ajudarão na construção do perfil do
usuário.
Passada esta etapa, US2 poderá realizar uma busca de amigos que já estão cadastrados e
ao encontrar US1 ele a adiciona em sua lista de amigos informando qual o grau de amizade
entre eles. A definição do grau de amizade é importante, pois é um fator que influencia
diretamente na escolha de um presente.
Após adicionar a usuária US1, o usuário US2 pode solicitar uma recomendação de
presentes para a nova amiga. Ao solicitar a recomendação US2 informa uma faixa de valores
(mínimo - máximo) que deseja pagar pelo presente e qual a data comemorativa será entregue
o presente.
Com base no perfil da usuária US1, na ocasião informada e o grau de amizade entre
US1 e US2, o sistema verificará quais os itens na base de dados que mais se adequam e os
recomendará.
Ao receber a recomendação o usuário US2 poderá avaliar a recomendação recebida,
informando se gostou ou não gostou. Esta avaliação auxilia no aprimoramento das
recomendações realizadas pelo sistema.
114
7. CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
Após a realização de toda pesquisa bibliográfica, planejamentos e implementação
pode-se concluir que a relevância na escolha de um presente levando em consideração dados
do perfil do usuário garante a eficácia da recomendação. Podendo ser destacado também a
relevância de outros aspectos que o sistema utiliza para a determinação de um presente ideal,
como a ocasião de troca do presente, o grau de amizade com o presenteado e o valor que
deseja-se pagar.
Ao utilizar todo o conjunto de fatores que influenciam para estabelecer a
recomendação o sistema apresenta o seu diferencial. Diferencial este que o torna uma
ferramenta confiável.
Outro ponto que pode ser destacado na aplicação está relacionado ao calculo da
similaridade desenvolvido para o sistema. A principio o mesmo pode ser compreendido como
uma simples equação matemática, no entanto a modificação realizada na fórmula da distância
euclidiana fazendo com que está trabalhasse com pesos e dessa forma aplicasse a relevância
foi o que possibilitou que as recomendações apresentadas fossem satisfatórias.
Destaca-se como a principal contribuição desta monografia para a área de Sistemas de
Recomendação a definição de como determinar e incluir no processo de recomendação a
autoridade (relevância), uma vez que muitos dos sistemas atuais não trabalham com este
conceito.
A aplicação não é um sistema completo, é apenas um protótipo de recomendação de
presentes por isso existem diversos pontos que podem ser melhor explorados, expandidos.
o Estudo de um método de filtragem hibrido para ser aplicado ao
protótipo combinando o método que já está sendo utilizado com
outro existente, objetivando a melhora nas recomendações;
o Criar método de avaliação dos itens por comentários escritos pelos
usuários e utilizar técnicas de text mining para obter dados
interessantes para incrementar o perfil dos usuários;
o Integração com outros aplicativos, por exemplo, redes sociais, sites
de e-commerce e outras aplicações que possam se interessar pelo
sistema de recomendação de presentes. Tornando assim o sistema
115
de recomendação parte de algum universo e não apenas um sistema
isolado;
o Melhoria da interface do protótipo, estudar mais profundamente
aspectos para melhor apresentação do sistema;
o Interagir com sites de e-commerce para buscar itens para
recomendação;
o Criar um Web Service para vender a solução para outros sistemas;
116
8. REFERÊNCIAS BIBLIOGRÁFICAS
BARCELLOS, Carlos Duarte. Et al. Sistema de Recomendação Acadêmico para Apoio a Aprendizagem. In: XI
Ciclo de Palestras Novas Tecnologias na Educação. Porto Alegre, 2007.
BURIN, Paulo. Sistema de Recomendação Baseado na Arquitetura Multiagente. Universidade Luterana do
Brasil, 2007.
BRESSLER, Fábio. Um protótipo de aplicação para recomendação de produtos baseado no interesse e
comportamento de uso do usuário. Universidade do Vale do Rio dos Sinos. São Leopoldo 2004.
BEZERRA, Byron Leite Dantas. Uma Solução Em Filtragem de Informação Para Sistemas de Recomendação
Baseada em Análise de Dados Simbólicos. Universidade Federal de Pernambuco. 2004.
BISPO, Carlos Alberto Ferreira. CAZARINI, Edson Walmir. A nova geração de sistemas de apoio à decisão.
1998.
CAZELLA, Sílvio César. Aplicando a relevância da opinião de usuários em sistema de recomendação para
pesquisadores. Universidade Federal do Rio Grande do Sul. Programa de Pós-Graduação em Ciência da
Computação, Porto Alegre, BR – RS, 2006.
CAZELLA, Sílvio César; Mini-course: E-Commerce and Recommender Systmes. In: ERDB, 2008,
Florianópolis, SC, Brasil. 2008.
CERA, Márcia Cristina. Uso de redes neurais para o reconhecimento de padrões. Universidade Federal do Rio
Grande do Sul. Porto Alegre, 2005.
COELHO, M. C. O valor das intenções: dádiva, emoção e identidade. Rio de Janeiro: Editora FGV, 2006. 108 p.
COMPOLT, Luis Geandro. Sistemas de Informação Executiva Baseado em um Data Mining utilizando a técnica
de árvores de decisão. Universidade Regional de Blumenau. Blumenau, 1999.
DA SILVA, Wagner Teixeira. LADEIRA, Marcelo. Mineração de dados em redes bayesianas. IN: XXI Jornada
de Atualização em Informática. Evento Integrante do XXII Congresso da SBC – SBC2002. Florianópolis, 2002.
DE MAGALHÃES, Lúcia Helena. Uma Análise de ferramentas para mineração de conteúdo de páginas Web..
Dissertação (mestrado). Universidade Federal do Rio de Janeiro. Rio de Janeiro, 2008.
DE SOUZA, Erick Nilsen Pereira. Explorer Fuzzy Tree: uma ferramenta para experimentação de técnicas de
classificação baseadas em árvores de decisão fuzzy.Universidade Federal da Bahia. Salvador, 2007.
DINIZ, Débora. Avaliação ética em pesquisa social: o caso do sangue Yanomami.In: Revista Bioética Volume 15
2007. Brasilia.
FARIAS, Alencar de. Et al. O Comportamento de Presentear: Dimensões Motivacionais Relevantes para o
Marketing. In: Encontro Nacional da ENAMPAD, 2001.São Paulo.
FILHO, Valmir Macário. e-Recommender: Sistema Inteligente de Recomendação para Comércio Eletrônico.
Universidade de Pernambuco, Recife, 2006.
117
GARCIA, Simone Carboni. O uso de árvores de decisão na descoberta de conhecimento na área da saúde.
Universidade Federal do Rio Grande do Sul. Porto Alegre, 2003.
GONÇALVES, Alexandre L. PACHECO, Roberto C.S. MORALES, Aran Bey Tcholakian. A Utilização de
técnicas de mineração de dados em bases de C&T: uma análise dos grupos de pesquisa do Brasil. Universidade
Federal de Santa Catarina, Florianópolis, 2000.
KAJIMOTO, Allan Panossian. Et al. Sistemas de recomendação de notícias na Internet baseados em filtragem
colaborativa. Instituto de Matemática e Estatística, Universidade de São Paulo. São Paulo, 2008.
LANNA, Marcos P.D. .A dívida divina:troca e patronagem no nordeste brasileiro.Campinas: FUCAMP Fundação de Desenvolvimento da UNICAMP, 1995. 249 p
LELES, Andréia Damásio. Técnicas de record linkage e inteligência artificial para a construção de um data
warehouse aplicado à área de Saúde. In: Revista Científica do IMAPES, 2004.
LICHTNOW, D. O uso de Técnicas de Recomendação em um Sistema para Apoio à Aprendizagem
Colaborativa. 2006.
LOH, S. ; GARIN, Ramiro Saldaña .Web Intelligence: . In: V Oficina de Inteligência Artificial, 2001, Pelotas,
RS. V Oficina de Inteligência Artificial. Pelotas : EDUCAT - Editora da UCPEL, 2001. p. 11-34.
LOPES, Giseli Rabello. Sistema de Recomendação para bibliotecas digitais sob a perspectiva da Web Semântica.
Dissertação (mestrado), Universidade Federal do Rio Grande do Sul – Porto Alegre, 2007.
LOURENÇO, Cléria Donizete da Silva. Relações de troca sob a ótica do marketing de relacionamento e da
teoria da dádiva. Dissertação (Mestrado). Universidade Federal de Lavras,2006.
LOURENÇO, C. REZENDE, D. C. Vale-presente: Como Fica a Dimensão Simbólica do Ato de Presentear?. In:
XI Seminários em Administração FEA-USP, 2008, São Paulo. XI SEMEAD. São Paulo-SP : FEA-USP, 2008.
MACHADO, Nilton José. Notas para uma antropologia da dádiva. IN: Seminários Abertos de Pós-Graduação,
Grupo de Estudos em Epistemologia e Didática. Universidade de São Paulo.2004.
MARQUES, Roberto Ligeiro. DUTRA, Inês. Redes BAYESIANAS: o que são, para que servem, algoritmos e
exemplos de aplicações. Universidade Federal do Rio de Janeiro. 2000.
OLIVEIRA, Leonardo Gomes de. Sistemas de recomendação de meios de hospedagem: baseado em filtragem
colaborativa e informações contextuais. Universidade Federal de Santa Catarina, 2007. Florianópolis.
OLIVEIRA, Marcos Barbosa de. Mercadoria, mercantilização e mercado. Universidade de São Paulo. 2009.
PELLEGRINI, G. F. COLLAZOS L.K. Extração de Conhecimento a partir dos Sistemas de Informação. UFSC.
Florianópolis, 2000.
PEPECE, Olga Maria Coutinho. O ato de presentear:o único capaz de transmitir mensagens sem utilizar
palavras, de expressar carinho sem utilizar o toque. In: XXVV Congresso Brasileiro de Ciências da
Comunicação-Salvador, 2002.
PEREIRA, Diego. Uma aplicação em sistemas de recomendação: Sistema de Recomendação para pacotes
GNU/Linux. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2007.
118
PRÊTO, Leneide Fátima. Et al. Comportamento do consumidor no ato de presentear.In: XI SEMEAD Seminários em Administração FEA/USP, 2008, São Paulo. Anais do XI SEMEAD-Seminários em Administração
FEA/USP, 2008.
REATEGUI, Eliseo Berni. CAZELLA, Sílvio César. Sistemas de Recomendação. IN: XXV Congresso da
Sociedade Brasileira de Computação. A universalidade da computação: Um Agente de Inovação e Conhecimento
UNISINOS - São Leopoldo - RS, 2005.
REATEGUI, Eliseo. LORENZATTI, Alexandre. Um assistente virtual para resolução de dúvidas e
recomendação de conteúdo. IN: XXV Congresso da Sociedade Brasileira de Computação. UNISINOS, São
Leopoldo, 2005.
REATEGUI, Eliseo Berni. BOFF, Elisa. CERON, Rafael Fernando. KURRUPAKO: Um agente animado sócioafetivo para ambientes de aprendizagem. In: CINTED, Novas Tecnologias na Educação. Universidade Federal
do Rio Grande do Sul, Porto Alegre, 2006.
REZENDE, Solange Oliveira. Mineração de Dados. In: XXV Congresso da Sociedade Brasileira de
Computação. UNISINOS-São Leopoldo,RS.2005
REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicações. Barueri, São Paulo. 2003.
Editora Manole LTDA. 1 edição. 517 pág.
RUSSELL, Stuart J. NORVIG, Peter. Inteligência Artificial. Tradução da segunda edição, tradução de Publicare
Consultoria. Rio de Janeiro. Elsevier, 2004 – 992 págs. 01 a 89 pág.
SAMPAIO, Igor Azevedo. Aprendizagem Ativa em Sistemas de Filtragem Colaborativa.Universidade Federal de
Pernambuco, 2006.
SANTOS, Rafael. Conceitos de mineração de dados na Web. Instituto Nacional de pesquisas espaciais. 2009.
SOMMERVILE, Ian; Sawyer, Pete. Requirements engineering: (a good practive guide). England: John Wiley &
Sons, 1997.
TEIXEIRA, I.R. 2002. Um Método de Aprendizagem Ativa em Sistemas de Filtragem Colaborativa. Dissertação
de Mestrado, Universidade Federal de Pernambuco.
THOMÉ, Antonio Carlos Gay. Redes Neurais - Uma Ferramenta para KDD e Data Mining. 2005.
TORRES, R. Técnicas para desenvolver sistemas de recomendação na Web. Universidade Federal do Rio
Grande do Sul, 2003. Trabalho individual I (Mestrado em Ciência da Computação)
VARGAS, Heliana Comin. O caráter público da troca e a alma da mercadoria: Reflexões a partir da obra de
Marcel Mauss. In: II Colóquio Internacional de comércio e cidade: uma relação de origem. Março, 2008. São
Paulo.
VENSON, Elaine. Um Modelo de Sistema de Recomendação Baseado em Filtragem Colaborativa e Correlação
de Itens para Personalização no Comércio Eletrônico.
Florianópolis : UFSC, 2002.
VON ZUBEN, F.J. Rede Neural de Kohonen e Aprendizado Não-Supervisionado em Notas de Aula do Curso
IA353, 1º semestre de 2005, capítulo 6, 2005.
Download