Área Temática: Empreendedorismo e Inovação Inovação deProdutos Baseada na Web: Aspectos Trazidos pelos Recursos de Informação na Web, Redes Sociais Virtuais e Micro blogs ANDRE GRUTZMANN (APOIO FAPEMIG) Universidade Federal de Lavras (apoio FAPEMIG) [email protected] ANDRE LUIZ ZAMBALDE Universidade Federal de Lavras [email protected] RESUMO O crescimento da disponibilidade de informações na internet tem feito com que empresas busquem recursos na web para auxiliar seus processos de inovação. A atividade inovativa não é tarefa trivial pois envolve grande quantidade de informações na complexa trama de interrelações da empresa e dos consumidores. O avanço computacional, com as técnicas de mineração de dados na web (webmining), permite a criação de ferramentas capazes de tratar grandes volumes de dados. Este trabalho pesquisou características dos recursos de informação, redes sociais e microblogs que possam ser úteis no processo de inovação de produtos e explorados com webmining. A pesquisa foi caracterizada como exploratória e descritiva, investigando e classificando os recursos de informação na web, sob a ótica da inovação e a categoria de web mining. Dentre os resultados, destaca-se que o uso de websites específicos contendo revisões de usuários sobre características de produtos é apontado como auxiliar para gerar inovação, usando algoritmos de busca focada ou focused crawling. As análises dos diversos recursos informacionais presentes na web, bem como as redes sociais e micro blogs servem para situar as possibilidades de aplicação das ferramentas de webmining. A partir deste estudo, é possível aprofundar as pesquisas e validar as relações apontadas. ABSTRACT The growth of information on the Internet has impelled companies to search for new webresources to assist their innovation processes. Innovation involves large amount of informations that has place in the company relationship with its customers. The new computational techniques, including webmining, allows development of tools that handles large volumes of data. This study investigates the characteristics of information resources, social networking and microbloggings where webmining can be used in the process of product innovation. The research is exploratory and descriptive, investigating and classifying information resources on the web, from the perspective of innovation and the categorization of webmining. The results emphasize that the use of websites containing reviews of specific users on features of products is touted as helping to generate innovation, using search algorithms focus or Focused crawling. The analysis of websites, virtual social networks and microbloggs serves to situate the possibilities of applying webmining tools. From this study, it is possible to do further research and validate the relationships afore mentioned. Palavras-chave: inovação de produto; inovação baseada na web; redes sociais virtuais. INTRODUÇÃO O uso da web para coletar informações sobre os mais diversos assuntos disseminou-se na sociedade com a popularização dos mecanismos de busca. As empresas e os clientes utilizam-se das ferramentas disponíveis para tomar melhores decisões e facilitar seus negócios. O crescimento da disponibilidade de informações na internet também tem trazido para as corporações formas diferentes de analisar os mercados. Isto tem feito com que algumas aproveitem oportunidades, utilizando-se de novos softwares e tecnologias capazes de processar grandes volumes de dados. Algumas empresas tem direcionado esforços para auxiliar seus processos de inovação. Porém, os casos de sucessos normalmente são provenientes das empresas que conseguem suas informações de maneira eficaz a partir de softwares criados recentemente. Apesar da maior quantidade de informações disponíveis, a atividade inovativa não é tarefa das mais triviais, uma vez que envolve a complexa trama de inter-relações da empresa e dos consumidores. A inovação deve ser orientada para os consumidores, visando gerar lucratividade com a introdução de novos produtos e/ou serviços (inovação radical) ou com a melhoria dos já existentes (inovação incremental). A importância da inovação parece ser inegável neste ambiente de acirrada competição. Porém, um contexto de grande quantidade de informações torna a sua prática mais complexa. Outro fenômeno recente são as chamadas redes sociais na internet. Estas redes são compostas de usuários com diversos perfis que se agrupam conforme possuam amizade, contatos comuns ou interesses semelhantes. Normalmente, cada usuário define seus interesses, adiciona amigos e participa de comunidades sobre assuntos de sua preferência. Tanto no Brasil como mundialmente a sua disseminação foi bastante rápida e é comum encontrarmos as empresas anunciando suas comunidades em seus websites. Dentro destas redes, um serviço com características diferenciadas tem chamado a atenção: o microblog. As redes sociais transformaram-se em foco de interesse de diversas empresas, pois o conteúdo gerado nelas é proveniente de consumidores dos mais diversos produtos com diferentes perfis. Além de mensagens relacionadas a amizade e aspectos profissionais, é comum encontrarmos relatos e análises sobre produtos e serviços. É justamente este conteúdo que as organizações desejam coletar, processar e analisar para auxiliá-las em seus negócios. A quantidade de informações na web tem crescido significativamente na última década e é um universo a ser pesquisado para se encontrar oportunidades de inovação. O avanço computacional, com as técnicas de mineração de dados (data mining) e mais recentemente web mining, permite a criação de ferramentas capazes de tratar grandes volumes de dados. O objetivo deste trabalho foi pesquisar características dos recursos de informação, redes sociais e microblogs que possam ser úteis para o processo de inovação especificamente de produtos. A análise inspirou-se no chain-linked model of innovation descrito por Kline (1986) e no stage-gate system proposto por Cooper (1990). Estes referenciais se justificam por contemplarem a inovação como um processo endógeno e exógeno (KLINE, 1986) e considerar o desenvolvimento de produtos como um conjunto de etapas, nas quais se pode continuar ou parar o processo (COOPER, 1990). O ambiente de negócios dinâmico e a grande quantidade de informações externas à organização, especialmente na web, sugerem que a inovação deva cada vez mais considerar aspectos exógenos e ser executada em passos, de acordo com a evolução do ambiente. A pesquisa busca servir como referência para futuros estudos, focando os principais sites, não tendo a pretensão de ser exaustiva e completa. REFERENCIAL TEÓRICO O mundo dos negócios tem feito com que concorrentes bem preparados, normalmente 2 com melhor entendimento das necessidades dos clientes consigam sobrepujar empresas consolidadas. A ênfase das empresas, apesar do ambiente competitivo que enfrentam, deve deslocar-se dos concorrentes para os consumidores, oferecendo valor a estes últimos. A atuação pró-ativa da empresa, com o correto entendimento do ambiente em que está inserida, identificando mercados, consumidores, parceiros e concorrentes pode aproximá-la dos clientes. Porém, não se trata apenas de produzir o que os consumidores desejam, é necessário antecipar-se as suas necessidades e condições. Para que isto seja possível, a organização deve utilizar o conhecimento de que dispõe, envidando esforços para inovar. Isto será tanto mais complexo quanto o ambiente da empresa for mais intensivo em informação, ou seja, nestas condições serão maiores os desafios a serem enfrentados. Este artigo contempla aspectos de inovação e recursos de informação na web e, por este motivo, torna-se importante compreender o processo de inovação, bem como as ferramentas de web mining existentes. A evolução nestas áreas é contínua e diversos trabalhos recentes tem evidenciado (SHAW et al, 2001; SU; CHEN; CHA, 2006; YAN et al., 2009) os benefícios do uso das técnicas de data mining e web mining para as atividades de marketing, com especial atenção ao desenvolvimento de produtos. A quantidade de informações necessárias para o trabalho nas organizações é cada vez maior. Com os avanços tecnológicos, tornou-se mais fácil coletar dados e armazená-los. Considerando que o volume de dados cresce rapidamente, é necessário encontrar meios de processá-los eficientemente para sua transformação em informações que possam ser utilizadas e criar conhecimento para a organização. Este conhecimento pode ser gerenciado para gerar inovação na empresa. Na literatura é possível encontrar trabalhos que usaram métodos e técnicas de extração de conhecimento da web (BRIN; PAGE, 1998; SHAW et al., 2001; LI; ZHONG, 2004; ZHOU et al., 2007; YAN et al., 2009). Estas pesquisas normalmente possuem um foco de aprimoramento da tecnologia visando sua aplicação em diversas áreas. Também existem estudos que buscam delimitar melhor o processo de inovação, a partir da gestão do conhecimento. Tanto a inovação como o uso da internet tem sido considerados fundamentais para a competitividade das empresas, contanto inclusive com significativos apoios governamentais nos últimos anos. O contexto desta pesquisa pode ser considerado importante, em virtude da atenção que tem atraído nos últimos anos. Sendo assim, gerar inovação a partir de informações existentes na web se justifica por ser um aspecto considerado estratégico em organizações. Além disso, são poucos os trabalhos existentes que relacionam os conceitos, sendo que normalmente o enfoque é mais técnico do que gerencial. Esta pesquisa buscou delimitar aspectos que possam facilitar o processo inovativo na organização, a partir de recursos informacionais da web. Em pesquisas nas edições do SEMEAD, CONTECSI e EnANPAD nos últimos 5 anos, foi encontrado apenas um artigo relacionando webmining, inovação e web. Nas edições do SEMEAD, apenas o trabalho de Martinez e Tsuruta (2008) tratou sobre webmining no contexto de serviços bancários. Alguns trabalhos do EnANPAD abordam o conceito mineração de dados e suas aplicações (FERREIRA et al., 2004; LINS; QUANDT, 2007; HORTA; ALVES, 2008; CÚNICO; ZAMPIER, 2008; SANCHEZ; PINHEIRO, 2009), porém não com o enfoque voltado para o consumidor ou inovação. Um artigo que merece referência é o de (BRAMBILLA, 2009), por tratar de mineração de dados no contexto do Customer Relationship Management (CRM). Nos artigos do Contecsi contemplando webmining foram encontrados os trabalhos de Díaz e Gauna (2007), Guagliardi, Silva e Periotto (2008), Dias e Moita (2009) e Grützmann et al. (2010). Porém, somente o último tratou sobre inovação de produtos a partir da web. Isto denota que o tema é recente no país e merece aprofundamento. É possível afirmar que a construção de conhecimentos sobre o mercado passa pela 3 capacidade da empresa de coletar, processar e relacionar novas informações. Sendo assim, o uso de ferramentas e técnicas que viabilizem tais atividades é desejado na rotina das organizações. No caso da inovação, isto é de fundamental importância se as fontes forem os próprios consumidores. Esta visão advém da proposta trazida por Kline (1986), autor que modificou a visão sobre o processo de inovação, o qual era considerado uma caixa-preta, com poucas interrelações entre tecnologia e economia. Além de investigar o que acontece na inovação (aspectos tecnológicos), o pesquisador sugeriu atenção aos fatores exógenos a organização, especialmente as modificações ocorridas no mercado. A inovação pode ser caracterizada pelo grau de novidade em relação aos produtos existentes. Schumpeter (1934) diferenciou inovação incremental, composta de pequenos avanços, de inovação radical, a qual conduz a alterações significativas nos produtos. Christensen (1997) atualizou a idéia propondo a inovação sustentadora e a inovação disruptiva, sendo a última, capaz de criar novos mercados com oportunidade de crescimento. Para McCarthy e Perreault Jr. (2003) existem cinco passos para a geração de novos produtos: Geração de Idéias; Triagem; Avaliação de Idéias; Desenvolvimento e Comercialização. Os autores indicam que a participação do consumidor acontece mais no primeiro (oferecendo idéias) e terceiro (reação as idéias sendo avaliadas) passos. O desenvolvimento de novos produtos, sejam inovações incrementais ou radicais, implica em conhecer as necessidades dos consumidores e buscar soluções para estas. Pugh (1991) considera o desenvolvimento de produtos atividade sistemática, desde a identificação das necessidades até a venda dos produtos, englobando processos, pessoas e organização. Para Su, Chen, Sha (2006), a inovação tecnológica permite que as empresas consigam enfrentar competição intensa num mercado de mudanças rápidas e constantes. É possível considerar que existe relação entre a inovação e competição, sendo que a inovação aumenta a competição, levando ao aumento constante da inovação resultando numa queda da concentração de mercado ao longo do tempo. (GEROSKI; POMROY, 1990, p. 300). Cooper (1990) propôs uma ferramenta para gerar inovação que divide o processo em etapas (stages) que culminam em momentos de decisão administrativa (gates), o chamado sistema Stage-Gate. O desenvolvimento deve ter um líder que coordena uma equipe interdepartamental e apresenta o produto a cada etapa. A direção, responsável pela decisão, pode cancelar, deixar passar, reciclar ou aguardar nova oportunidade. O processo de inovação é bem conhecido pelos participantes e possui momentos definidos dentro da organização. Para Sawhney, Verona, Prandelli (2005), as empresas devem fazer mais do que apenas enxergar o cliente como recebedor passivo da inovação. Segundo eles, desta maneira a capacidade da empresa compreender o conhecimento e contexto de experiência dos clientes fica limitada. Os consumidores podem adaptar produtos de acordo com suas necessidades e as empresas utilizarem-se disso, o que é visto em (BALDWIN; HIENERTH; von HIPPEL, 2006, p. 1291). Existem vários estudos que mostraram o importante papel do consumidor no desenvolvimento de produtos. (ENOS, 1962; FREEMAN, 1968; von HIPPEL, 1988; PAVITT, 1984; SHAH, 2000, 2003). Outras pesquisas ressaltaram a importância dos “lead users” no desenvolvimento de produtos comercialmente atrativos. (URBAN, von HIPPEL, 1988; MORRISON; ROBERTS; von HIPPEL, 2000; FRANKE; von HIPPEL; SCHREIER, 2006; OLSON, BAKKE, 2001). Herbig e Kramer (1994) afirmam que a sobrevivência das organizações depende de sua capacidade de oferecer inovações que satisfaçam as necessidades existentes no mercado. O desenvolvimento e disseminação da internet como infra-estrutura de distribuição, promoção, realização de transações e coordenação de processo de negócio, fez com que a web surgisse como importante e conveniente fonte de dados e informações de e sobre consumidores. Web mining é um desafio a ser encarado pelas empresas. (SHAW et al., 2001, 4 p. 135). No artigo que definiu as bases do Google, Brin e Page (1998) afirmam que a web estabelecia novos desafios para a recuperação das informações, devido as grandes quantidades e rápido crescimento destas. De acordo com Yan et al. (2009, p. 21), o uso do data mining cresceu nas áreas de marketing e análise web, o chamado web mining. Para Zhou et al. (2007), a aplicação de técnicas de mineração nos dados da web é chamada de web mining. Segundo Pal, Talwar e Mitra (2002), é o uso de técnicas de mineração de dados para automaticamente recuperar, extrair, generalizar e analisar a informação. Os recursos de informação, redes sociais e micro blogs trouxeram novas oportunidades de interação com o consumidor. Ferramentas baseadas na web, dentre elas o web mining, facilitam interações com os clientes e simplificam a absorção do conhecimento a um custo baixo, se comparado aos métodos tradicionais. (PRANDELLI; VERONA; RACCAGNI, 2006). Liao, Chen, Wu (2008) dizem em seu estudo que o conhecimento extraído pelo data mining resultou em regras para sugestões de linhas de produtos e extensão de marcas. Outro caso em que o web mining demonstrou-se efetivo para auxiliar na busca de dados dos consumidores auxiliando nos estágios iniciais do desenvolvimento de novos produtos é relatado em Yan et al. (2009). Engler e Kusiak (2008), no artigo “Web mining for innovation”, combinaram opiniões de usuários coletadas em websites específicos e informações em bases de dados de patentes. Os pesquisadores mencionaram o possível ganho de tempo e amplitude, ao substituir, por exemplo, grupos de foco e pesquisas de mercado com clientes selecionados por uma abordagem voltada para a inovação baseada na web. Recentemente, os termos opinion mining e sentiment analysis ganharam espaço na academia e na mídia (LIU, 2007; PANG; LEE, 2008). Trata-se de identificar em um texto, por meio de algoritmos, a opinião do autor sobre determinado assunto. Esta identificação é dada como sendo positiva ou negativa. O framework proposto por Grützmann et al. (2010) apenas considera aspectos do sistema stage-gate, sem levar em conta o modelo de Kline (1986). Porém, como contempla webmining para gerar inovação, suas etapas serão usadas tendo em vista a necessidade de identificar características de recursos de informação da web, redes sociais e micro blog que possam auxiliar no processo de inovação. As seguintes etapas são encontradas não somente neste trabalho mas em outros sobre inovação: planejamento para inovação; idéias ou conceitos; delimitação de escopo; investigação detalhada; desenvolvimento do produto; teste e validação; produção e lançamento. O webmining pode ser dividido em três categorias, todas elas relacionadas a aspectos específicos de busca: web content mining (WC); web structure mining (WS) e web usage mining (WU) (MADRIA et al., 1999; BORGES; LEVENE, 1999; KOSALA; BLOCKEEL, 2000). O web usage mining trata das estatísticas de uso do internauta e de seu comportamento. Por sua vez, o web structure mining tenta identificar o modelo que delimita a estrutura lógica de hiperlinks de determinado web site ou conjunto deles. O mais importante para o contexto deste estudo é o web content mining, pois o seu escopo trata de descobrir conteúdo útil existente em páginas web. Kosala e Blockeel (2000) fazem uma separação da fonte de dados destas três categorias, sendo documentos hipertexto para WC, estrutura de links para WS e logs do servidor e browser para WU. METODOLOGIA Esta pesquisa pode ser caracterizada quanto a sua natureza como exploratória e descritiva, pois trata de investigar e delinear aspectos dos recursos de informação na web, redes sociais e micro blogs sob a ótica da inovação, a partir de um framework proposto para 5 este fim. O trabalho buscou coletar dados secundários que também servissem de referências futuras, considerando os poucos artigos sobre o tema mineração de dados nos últimos 5 anos no SEMEAD, CONTECSI e EnANPAD. Tais eventos foram escolhidos tendo em vista sua relevância e atualidade dos temas tratados. Para Rudio (1980), quando não se acumulou ainda significativo conhecimento, abre-se a possibilidade de novas descobertas, caso exista o interesse em observar o fenômeno para descrevê-lo e interpretá-lo, compreendendo suas partes e processos. Quanto aos procedimentos, este trabalho pode ser compreendido como sendo bibliográfico. A base teórica para o presente artigo foi construída a partir de pesquisa bibliográfica, buscando estabelecer referencial teórico que dê suporte aos estudos para gerar inovação a partir de recursos de informação existentes na web. As informações sobre os recursos de informação, redes sociais virtuais e micro blogs foram coletadas entre fevereiro e junho de 2011. As fontes preferenciais eram os próprios websites dos recursos. Sob a luz do referencial teórico sobre inovação, procurou-se enquadrar cada um dos recursos quanto a categoria de web mining e aspectos relacionados a inovação. Optou-se por limitar a quantidade de web sites apresentados no texto, tendo como critérios para a seleção a popularidade e possível relevância para a inovação, este último de acordo com avaliação dos pesquisadores. A limitação do trabalho fica evidente considerando o viés dos pesquisadores nesta análise. Também deve ser mencionado o dinamismo das redes sociais virtuais, o que pode reconfigurar os serviços em curto prazo de tempo, afastando-se da análise original dos pesquisadores. De qualquer forma, estas limitações não invalidam a pesquisa, apenas reforçam o velocidade das mudanças na web e a necessidade de ferramentas para automatizar a análise de seus conteúdos. ANÁLISE DOS RESULTADOS A pesquisa iniciou por identificar os principais mecanismos de busca existentes, sendo considerados como ponto de partida para a coleta de novas informações. Os mecanismos de busca oferecem uma interface amigável para o usuário inserir palavras-chave e retorna documentos que contenham todas ou algumas delas. É possível ajustar o detalhe e a precisão da busca, diretamente nas linhas de comando ou interfaces avançadas de pesquisa. No escopo deste trabalho, estes mecanismos podem ser enquadrados na categoria de web content mining, pois servirão como indicativos para os textos que possuam o conteúdo desejado. Os sites de busca identificados aqui restringiram-se a: Google, Bing, Altavista, Yahoo e Ask. A figura 1 traz informações básicas sobre estes serviços. O potencial uso destes mecanismos, reside no uso de ferramentas de web content mining e focused crawling para realizar buscas por determinadas palavras-chave relacionadas a empresa, produtos de interesse, tecnologias e características de produtos. Eventualmente, é possível utilizar buscas manuais para verificar a coerência dos resultados trazidos pelas ferramentas de focused crawling. As empresas têm utilizado os recursos dos sites de busca para anunciar seus produtos relacionados a determinadas palavras-chave. Assim, quando uma pesquisa é realizada, anúncios são exibidos conforme a relevância e similaridade dos termos escolhidos. Outro aspecto a ser mencionado é que existem técnicas que podem fazer com que determinadas páginas sejam exibidas nos primeiros resultados de busca, mas isto é dependente de cada mecanismo. 6 Nome Google Endereço web www.google.com Yahoo www.yahoo.com Altavista www.altavista.com Bing www.bing.com Ask www.ask.com Breve descrição Citado como o site com maior número de acessos do mundo e principal referência para buscas na web. Teve início com os estudos de Larry Page e Sergei Brin na Universidade de Stanford. Conhecido como o segundo lugar em buscas no mundo, mas atualmente é mais reconhecido por ser um portal web com outros recursos agregados em sua página inicial. Foi fundado por Jerry Yang e David Filo nos EUA. É considerado o primeiro índice da web na internet, tendo sido lançado pela Digital Equipment Corporation (DEC). Também é apontado como o primeiro a oferecer recursos de pesquisa em diferentes idiomas. Atualmente, é de propriedade do Yahoo. Buscador criado pela Microsoft para concorrer diretamente com o Google e Yahoo. É uma renovação de outros serviços de busca oferecidos pela Microsoft que não tiveram destaque, como o Live Search. É um buscador com foco para fornecer respostas as questões dos usuários. Em sua fundação, era conhecido como askjeeves.com e o novo nome foi criado em 2005. Ano de lançamento 1998 1995 1995 2009 1996 Figura 1 – Mecanismos de busca na web selecionados Fonte: Dados da pesquisa (2011) As redes sociais são espaços onde os usuários expressam suas idéias e trocam mensagens sobre os mais diversos assuntos, inclusive sobre produtos e empresas. As comunidades são um recurso destes web sites, onde os usuários agrupam-se por interesse e contexto. A figura 2 traz informações básicas sobre estes serviços. Recentemente, as empresas tem criado perfis online e comunidades para interagir com clientes e interessados, incentivando a troca de opiniões sobre seus produtos e práticas. Algumas destas redes bloqueiam o acesso dos mecanismos de busca externos, fazendo com que o web content mining seja limitado. Com isto, a demanda por funcionários para atualizar e coletar os dados nestas redes é significativa, o que pode dificultar sua manutenção. Uma das alternativas é terceirizar o serviço e definir as informações relevantes desejadas. Site Facebook Usuários Idiomas * Endereço 750 milhões Po, In, Es, Fr, Al, www.facebook.com Jp, Ru, Tu, Ro, (+) Breve descrição Ano É o maior site de relacionamento social da web atualmente. 2004 Permite a criação de perfil para que o usuário conecte-se a outros. Foi criado inicialmente apenas para adesão pelos estudantes de Harvard, mas posteriormente o uso se ampliou e passou agregar outros colégios e universidades. Friendster 115 milhões In, Es, Ma, Jp (+) www.friendster.com Um dos primeiros sites de relacionamento que, desde a sua 2002 fundação, oferece a possibilidade de trocar informações entre os usuários. MySpace 100 milhões In, Es, Po, Al, It, myspace.com Rede de relacionamentos que permite o compartilhamento 2004 Fr, Jp (+) de interesses entre os membros, especialmente de músicas. É conhecida por conter perfis de diversos artistas. Linkedin 100 milhões Po, In, Es, Fr, Al, www.linkedin.com Rede social focada em negócios, destinada principalmente 2003 Ru, Tu, Ro para que colegas de profissão mantenham contato online. Orkut 52 milhões Po, In, Es, Fr, Al, www.orkut.com Sistema que permite a usuários criarem um perfil e 2004 Jp (+) adicionarem amigos e conhecidos por meio de convites. Também oferece a possibilidade de afiliação a comunidades criadas pelos próprios usuários, de acordo com seus interesses. Sua criação aconteceu nos EUA, mas o maior número de usuários está no Brasil e na Índia. É de propriedade do Google. Hi5 50 milhões Po, In, Es, Fr, Al, www.hi5.com Uma das redes sociais destinada principalmente ao público 2003 (+) jovem, especialmente para jogos online. Permite uma customização do perfil, incluindo a criação de um avatar. Sonico 50 milhões Es, Po, In www.sonico.com Destinada ao público latino-americano. Propõe-se a auxiliar 2007 na organização da vida online dos usuários, mantendo a privacidade. * In – Inglês; Es – Espanhol; Po – Português; Fr – Francês; Al – Alemão; It – Italiano; Jp – Japonês; Ma – Malaio; Ru – Russo; Tu Turco; Ro – Romeno; (+) disponibiliza outras línguas Figura 2 – Redes sociais virtuais selecionadas Fonte: Dados da pesquisa (2011) 7 Um fenômeno recente das redes sociais é o chamado serviço de micro blog, do qual o Twitter (twitter.com) é o maior expoente. Este recurso permite o envio de mensagens curtas (normalmente 140 caracteres) entre os usuários que estejam associados de alguma forma. O termo usado para descrever esta associação é seguidor ou follower. O princípio de uso é atualização do perfil, indicando nas mensagens que atividade está sendo realizada em dado momento ou qual a localização da pessoa. Os agregadores de notícias, chamados feeds RSS (Really Simple Syndication), podem ser enquadrados nesta categoria. Apenas cabe a ressalva de que neste serviço são postados resumos de notícias. Também tem sido usado para expressar o estado de espírito do usuário, sentimento ou opiniões curtas sobre algo que está ocorrendo, ou seja, em tempo real. Diversas redes sociais agregaram a possibilidade de atualização de status, nos moldes de um micro blog. A partir das mensagens postadas, é possível utilizar ferramentas de web content mining e web usage mining para extrair informações sobre empresas, produtos ou pessoas. As ferramentas de opinion mining e sentiment analysis também são empregadas para pesquisar o conteúdo do micro blog Twitter. Inclusive, existe uma interface que facilita a extração dos dados do Twitter, para que sejam tratados posteriormente conforme o interesse de análise. As principais aplicações tem sido para avaliar sentimento negativo ou positivo sobre uma palavra-chave. Para o framework proposto, este tipo de pesquisa seria aplicável para identificar a imagem da empresa e de seus produtos, bem como de seus concorrentes. Após o lançamento de um novo produto, seria possível avaliar a reação despertada no público, fornecendo feedback ao processo. Outra fonte de informação disponível na www reside nos fóruns de discussão, os quais podem ser especializados ou de usuários comuns. Nestes ambientes, é comum existirem tópicos bem delimitados para manter as mensagens referentes apenas a determinado produto, serviço ou empresa. O conteúdo disponível nos fóruns tem potencial para auxiliar na descoberta de características desejáveis ou indesejáveis, por meio da análise das opiniões dos usuários. A principal categoria a ser utilizada é a de web content mining, embora alguns destes sites optem por bloquear a pesquisa em seus conteúdos provenientes de ferramentas externas. Algumas empresas varejistas optam por disponibilizar avaliações de produtos pelos usuários em seus sites, no formato prós e contras. Neste caso específico, além do web content, seria possível utilizar web usage mining, identificando o comportamento do internauta enquanto navega no site (ex.: produtos visualizados, menus que foram clicados, tempo de permanência em cada página, entre outros dados). Além dos recursos informacionais presentes na www apresentados acima, devem ser considerados os sites de concorrentes, clientes corporativos, parceiros e fornecedores. A maioria dos sites de empresas permite o acesso de ferramentas de busca externas. Isto é necessário para que as informações constantes nas páginas web da empresa sejam consideradas e possam aparecer nos resultados de um site de buscas, caso contrário, suas páginas não seriam encontradas a não ser por ligações provenientes de outras páginas ou acesso direto. Nestas condições, ferramentas de web content mining podem ser aplicadas. Especificamente nos sites de parceiros e fornecedores, onde o acesso a dados dos servidores web poderia ser liberado, o web usage mining é uma possibilidade além do web content. O uso das informações nestes casos tende a ser mais rico se forem cruzados os resultados dos sites, porém, deve-se levar em consideração o contexto, popularidade e público de cada um deles. Um site com milhões de acessos mensais terá resultados mais significativos do que os daqueles com algumas centenas, pois os fundamentos do web mining são estatísticos e uma casuística elevada contribui para maior grau de confiança. Em tese, isto significaria informações mais relevantes para o processo de inovação. Por fim, as páginas de notícias provenientes de veículos de mídia reconhecidos são 8 candidatos ao web content mining. Diferente dos agregadores RSS, mencionados anteriormente, estes sites contém o texto da notícia completa. Enquanto os primeiros permitem apenas uma análise de sentimento sobre os resumos, os segundos oportunizam um aprofundamento da análise e coleta de dados adicionais. Deve-se levar em consideração alguns fatores como, regionalismos, atualidade da notícia, orientação do jornal, possibilidade de existirem matérias pagas, entre outros. De qualquer maneira, a análise destes conteúdos poderá ser uma fonte relevante para identificar tendências sociais para uso na adaptação ou criação de produtos. Resumidamente, na figura 3 são apresentados os possíveis usos dos recursos informacionais em cada uma das etapas do framework. A indicação é baseada na análise das características e sua possibilidade de fornecer informações para o processo de inovação proposto, tendo por critério o pesquisador. As relações apontadas na figura 4 servem como indicativos de uso dos recursos, mas não eliminam os demais contatos da empresa com técnicos, pesquisadores e outros personagens do processo de inovação. Mecanismos de busca Planejamento para inovação Idéias ou conceitos Delimitação de escopo Investigação detalhada Desenvolvimento do produto Teste e validação Produção e lançamento X X Redes sociais Micro blogs/RSS de notícias X X X X X X X X Fóruns de discussão Websites de concorrentes Websites de parceiros e fornecedores Websites de clientes Websites de notícias X X X X X X X X X X X X X X X Figura 3 – Relações entre recursos informacionais web e etapas do framework para inovação Fonte: Elaborado pelo autor (2011) Cabe mencionar que os sites de procura de preços e características de produtos e serviços não foram contemplados neste estudo. Como os seus resultados são provenientes das páginas dos varejistas, optou-se por não analisá-los, ficando como recomendação para outros estudos. Outra ressalva a ser feita é a de que o web structure mining, não mencionado nas análises, pode ser aplicado na maioria dos sites, exceto os mecanismos de busca. No entanto, os resultados deste tipo de ferramenta agregariam pouco valor ao processo de inovação, uma vez que seu foco reside em analisar a estrutura de interligações nos sites. CONSIDERAÇÕES FINAIS Num contexto de aumento exponencial da informação e de transformações sociais significativas, é difícil e oneroso para as empresas conduzirem pesquisas com os consumidores para identificar suas necessidades e desejos. Além disso, alguns tipos de pesquisas podem levar a avaliações equivocadas ou limitadoras do entendimento do mercado. Assim, o uso da informação disponível na web, associado com ferramentas automatizadas de descoberta de conhecimento, pode auxiliar em ambientes competitivos. A aplicação de web mining pode auxiliar no processo de extração de conhecimento da web, a partir de usuários ou grupos (LI; ZHONG, 2004). O uso de websites específicos contendo revisões de usuários sobre características de produtos também é apontado como 9 auxiliar para gerar inovação, usando algoritmos de busca focada ou focused crawling (ENGLER; KUSIAK, 2008). A partir das descobertas de conhecimento, a empresa pode direcionar seus esforços para o desenvolvimento de novos produtos ou serviços inovadores. A web apresenta um vasto campo para coleta de informações das mais diversas fontes e com diferentes enfoques. As análises dos diversos recursos informacionais presentes na web, bem como as redes sociais e micro blogs servem para situar as possibilidades de aplicação das ferramentas de web mining. A partir deste estudo, é possível aprofundar as pesquisas e validar as relações apontadas. O cruzamento das informações permite focar melhor o trabalho a ser desenvolvido durante um processo de inovação baseado na web. O fato de terem sido encontrados poucos trabalhos no SEMEAD, CONTECSI e EnANPAD que relacionem os diversos temas de estudo, quais sejam – web mining e inovação baseada na web, permitem com que este artigo sirva como referencial para futuros trabalhos. O referencial coletado também é um ponto positivo, pois agrega em um local vários estudos já publicados e que podem ser utilizados como ponto de partida para outras pesquisas. Sendo uma área pouco explorada ainda, recomenda-se novas análises, revisando os recursos tratados aqui e acrescentando novos e diferentes enfoques. REFERÊNCIAS BALDWIN, C.Y.; HIENERTH, C.; von HIPPEL, E. A. How User Innovations Become Commercial Products: A Theoretical Investigation and Case Study. Research Policy, v. 35, n. 9, p. 1291-1313, nov. 2006. BORGES, J.; LEVENE, M. Data mining of user navigation patterns. In: WBBKDD'99 Workshop on Web Usage Analysis and User Profiling, Proceedings... p. 31-36. San Diego, CA, USA, aug. 1999. BRAMBILLA, F. R. Utilizando Data Warehouse, Database Marketing e Data Mining: Uma Análise Empírica à luz das Estratégias de Customer Relationship Management (CRM). In: EnANPAD, 33., 2009, São Paulo. Anais... Rio de Janeiro: ANPAD, 2009. (CD-ROM) KOSALA, R.; BLOCKEEL, H. Web Mining Research: a Survey. SIGKDD Explorations. ACM SIGKDD, v. 2, issue 1, July 2000. BRIN, Sergey; PAGE, Lawrence. The anatomy of a large-scale hypertextual Web search engine. Computer Networks and ISDN Systems, v. 30, p. 107- 117, 1998. CHRISTENSEN, C.M. The Innovator's Dilemma: When New Technologies Cause Great Firms to Fail. Boston: Harvard Business School Press, 1997. COOPER, Robert G. Stage -gate systems: a new tool for managing new products, Business Horizons, p. 45-55, may-june, 1990. CÚNICO, L. H. B.; ZAMPIER, M. A. Predição de Satisfação de Funcionários de uma Rede de Lojas do Comércio Varejista através da Aplicação de Técnicas em Data Mining. In: EnANPAD, 32., 2008, Rio de Janeiro. Anais... Rio de Janeiro: ANPAD, 2008. (CD-ROM). DIAS, T. M. R.; MOITA, G. F. Use of web services for web mining systems. In: CONTECSI, 6., 2009, São Paulo. Anais... São Paulo: TECSI FEA USP, 2009. DÍAZ, C.; GAUNA, E. Exploitation of data of the website of the Facultad De Ciencias Económicas De La Universidad Nacional De Córdoba. In: CONTECSI, 4., 2007, São Paulo. Anais... São Paulo: TECSI FEA USP, 2007. ENGLER, Joseph; KUSIAK, Andrew. Web Mining for Innovation. ASME Mechanical Engineering, v. 130, n. 11, nov. 2008, p. 38-40. ENOS, J. L. Petroleum Progress and Profits: A History of Process Innovation. MIT Press, 1962. 10 FERREIRA, J.; VELLASCO, M.; PACHECO, M. A.; SILVA, J. Mining and Understanding Wireless Churn. In: EnANPAD, 28., Curitiba. Anais... Rio de Janeiro: ANPAD, 2004. (CDROM) FRANKE, N., von HIPPEL, E., SCHREIER, M. Finding commercially attractive user innovations: An exploration and test of lead user theory. Journal of Product Innovation Management, v. 23, n. 4, jul. 2006, p. 301–315. FREEMAN, C. Chemical process plant: innovation and the world market. National Institute Economic Review, v. 45, 1968, p. 29–57. GEROSKI, P.A.; POMROY, R. Innovation and the Evolution of Market Structure. Journal of Industrial Economics, v. 38, n. 3, p. 299-314, mar. 1990. GRÜTZMANN, A.; ZAMBALDE, A. L.; ESMIN, A. A. E.; MATIOLI, L. Framework for Product Innovation Based on Knowledge Extracted from the Web. In: CONTECSI, 7., 2010, São Paulo. Anais... São Paulo: TECSI FEA USP, 2010. GUAGLIARDI, J. A.; SILVA, M. J. da; PERIOTTO, A. J. Data web mining about practical knowledge management in areas of the business administration. In: CONTECSI, 5., 2008, São Paulo. Anais... São Paulo: TECSI FEA USP, 2008. HERBIG; Paul A.; KRAMER, Hugh.The Effect of Information Overload on the Innovation Choice Process. Journal of Consumer Marketing, v. 11, n.2, 1994, p. 45-54. HORTA, R. A. M.; ALVES, F. J. dos S. Técnicas de Data Mining na seleção de atributos para previsão de insolvência: aplicação e avaliação usando dados brasileiros recentes. In: EnANPAD, 32., 2008, Rio de Janeiro. Anais... Rio de Janeiro: ANPAD, 2008. (CD-ROM) KLINE, R. An overview of innovation. In: LANDAU, R.; ROSENBERG, N. The positive sum strategy. Washington, DC: National Academy, 1986. p. 275-306. LI, Yuefeng; ZHONG, Ning. Web mining model and its applications for information gathering. Knowledge-Based Systems, v. 17, 2004, pp. 207–217. LIAO, S.; CHEN, C.; WU, C. Mining customer knowledge for product line and brand extension in retailing. Expert Systems with Applications, v. 34, n. 3, p. 1763-1776, apr. 2008. LINS, A.; QUANDT; C. O. Criando Inteligência Competitiva Através da Utilização da Ferramenta de Data Mining: Estudo no Setor de Telecomunicações. In: EnADI, 1., 2007, Florianópolis. Anais... Rio de Janeiro: ANPAD, 2007. (CD-ROM) LIU, B. Web Data Mining. Exploring Hiperlinks, Contents, and Usage Data. Chicago: Springer, 2007. MADRIA, K.; BHOWMICK, W. K.; NG, W. K.; LIM, E. P. Research Issues in Web Data Mining. In: International Conference on Data Warehousing and Knowledge Discovery, 1., 1999. Proceedings... p. 303-312, sep. 1999. McCARTHY, E. J.; PERREAULT Jr, W. D. Essentials of Marketing: A Global-Managerial Approach. 9.ed. New York: Mcgraw-Hill/Irwin, 2003. MORRISON, P. D.; ROBERTS, J. H.; von HIPPEL, E. Determinants of user innovation and innovation sharing in a local market. Management Science, v. 46, n. 12, 2000, pp. 1513– 1527. OLSON, E. L.; BAKKE, G. Implementing the lead user method in a high technology firm: a longitudinal study of intentions versus actions. Journal of Product Innovation Management, v. 18, n. 6, p. 388-395, nov. 2001. PAL, S. K.; TALWAR, V.; MITRA, P. Web Mining in Soft Computing Framework: Relevance, State of the Art and Future Directions. IEEE Transactions on Neural Networks, v. 13, n. 5, p. 1163-1177, sep. 2002. PANG, B.; LEE, L. Opinion Mining and Sentiment Analysis. Foundations and Trends R in Information Retrieval, v. 2, n. 1-2 (2008) p. 1-135 11 PAVITT, K. Sectoral patterns of technical change: towards a taxonomy and a theory. Research Policy, v. 13, n. 6, 1984, p. 343–373. PRANDELLI, Emanuela; VERONA, Gianmario; RACCAGNI, Deborah. Diffusion of WebBased Product Innovation. California Management Review, v. 48, n. 4, summer 2006. pp. 109-135. PUGH, S. Total design: integrated methods for successful product engineering. Addison Wesley, 1991. RUDIO, F. V. Introdução ao projeto de pesquisa científica. Petrópolis: Vozes, 1980. SANCHEZ, O. P.; PINHEIRO, J.C.S. A Evolução da Utilização de Teorias no Campo de Sistemas de Informação: Mapeamento por Meio de Mineração Textual. In: EnANPAD, 33., 2009, São Paulo. Anais... Rio de Janeiro: ANPAD, 2009. (CD-ROM) SAWHNEY, M.; VERONA, G.; PRANDELLI, E. Collaborating to create: The Internet as a platform for customer engagement in product innovation. Journal of Interactive Marketing, v. 19, n. 4, 2005, p. 4-17. SCHUMPETER, J. The theory of economic development. Boston: Harvard University Press, 1934. SHAH, S.K. Community-Based Innovation & Product Development: Findings From Open Source Software and Consumer Sporting Goods. Unpublished Ph.D. thesis, Sloan School of Management, Massachusetts Institute of Technology: Cambridge, 2003.. SHAH, S.K. Sources and Patterns of Innovation in a Consumer Products Field: Innovations in Sporting Equipment. MIT Sloan School of Management Working Paper # 4105, Cambridge, MA. 2000. SHAW, Michael J.; SUBRAMANIAM, Chandrasekar; TAN, Gek Woo; WELGE, Michael E. Knowledge management and data mining for marketing. Decision Support Systems, v. 31, pp. 127–137, 2001. SU, Chao-Ton; CHEN, Yung-Hsin; SHA, D. Y. Linking innovative product development with customer knowledge: a data-mining approach. Technovation, v. 26, n. 7, jul. 2006, pp. 784-795. URBAN, G. L.; von HIPPEL, E. Lead user analyses for the development of new industrial products. Management Science, v. 34, n. 5 , 1988, pp. 569–582. von HIPPEL, E. The Sources of Innovation. Oxford: Oxford University Press, 1988. YAN, Wei; CHEN, Chun-Hsien; HUANG,Youfang, MI, Weijian. A data-mining approach for product conceptualization in a web-based architecture. Computers in Industry, v. 60, p. 21–34, 2009. ZHOU, Xujuan; LI, Yuefeng; BRUZA, Peter; WU, Sheng-Tang; XU, Yue; LAU, Raymond Y. K. Using Information Filtering in Web Data Mining Process. In: 2007 IEEE/WIC/ACM International Conference on Web Intelligence, 2007. 12