UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS SÓCIO-ECONÔMICAS E HUMANAS DE ANÁPOLIS COORDENAÇÃO DO CURSO DE PEDAGOGIA Disciplina: AEA – INTRODUÇÃO À REVISÃO SISTEMÁTICA NA CONDUÇÃO DE PESQUISAS Ano / Período: 1°/1° Professor (a): Elisabete Tomomi Kowata Nome: Luana Silva Campos Quirino Atividade de revisão – Serviços de Busca 1. O que são serviços de busca e quais são eles? Os serviços de busca são sítios especializados em localizar informações na internet. • Divididos em três categorias: • Diretórios ou repertórios de assuntos; • Mecanismo de busca; • Metamecanismo de busca. 1 2. Faça um quadro comparativo dos tipos de serviços de busca quanto a forma de classificação das informações, nomenclatura utilizada e a característica principal. Diretórios ou repertórios de assunto Serviço de busca pioneiro na web Mecanismo de busca Metamecanismo de busca É o tipo de serviço que faz São serviços que fazem a a indexação automática das procura de determinado termo em informações sem qualquer diversos mecanismos de busca classificação Biblioteca de sítios Preocupam-se menos com a São conhecidos também organizada ou estruturada em seletividade do que com a como: metabuscador ou metamotor categorias abrangência de suas bases de dados e subcategorias A classificação dos sítios é Colecionam o maior Trazem resultados mais feita manualmente (especialistas número possível de informações amplos do que a busca num único da empresa que coordena o serviço mecanismo de busca, ou voluntários, navegam pelos sítios e selecionam as categorias temáticas que julgarem mais adequadas para encaixá-los nessa estrutura É mais adequada para uma Alguns índices indexam Não possuem banco de busca quando não se sabe integralmente o conteúdo dos dados próprio exatamente como descrever o que sítios, outros somente o título e um se procura, ou quando resumo algoritmicamente quer listar vários sítios construído, outros, o título e as relacionados primeiras linhas do sítio Em geral, requerem um A varredura dos sítios é Funcionam como um cadastro prévio para feita por meio da utilização de agente intermediário que repassa a disponibilização das informações programas de computador pesquisa e as respostas dos em seu banco de dados denominados robôs pesquisadores individualmente e, então, apresenta um resultado unificado, extraído das diversas fontes Exemplos: Exemplos: São mais indicados para • Dmoz •Google buscas onde se utilizam termos • Google Directory • Ask únicos ou outras buscas simples, • About.com • Bing que não requeiram maior sofisticação Podem tomar mais tempo, porque é necessário processamento adicional para compilar os resultados Exemplos: •WebFerret •Mata Hari • Copernic 2 3. Quais são os critérios utilizados para avaliar um mecanismo de busca? Como avaliar os mecanismos de busca: • Autoridade da fonte • Confiabilidade da instituição • Imparcialidade dos dados • Atualidade 4. Que indagações podem ser feitas para verificar a autoridade da fonte? Algumas indagações para conhecer o grau de autoridade: • Está absolutamente claro que existe uma instituição responsável pelas informações oferecidas no sítio? • Existe algum hipervínculo (link) para uma página que descreva qual a missão e os objetivos dessa instituição e quais pessoas estão envolvidas com ela (geralmente uma página intitulada ‘Sobre nós’)? • Existe um caminho válido para se ter certeza de que a instituição é legítima e que funciona num lugar físico certo e que se possa fazer algum contato real (o endereço do correio eletrônico nem sempre é suficiente)? 5. Quais perguntas devemos fazer para julgar a confiabilidade de uma instituição? Algumas indagações para conhecer a confiabilidade da instituição: • É possível saber sem dificuldade quem escreveu a informação? • Os dados inseridos no sítio foram extraídos de fontes seguras ou conhecidas? Eles de fato podem ser citados? • Existem muitos erros gramaticais ou de digitação nas páginas do sítio? Isto pode indicar que o conteúdo não é digno de confiança; • Desde quando a página é atualizada? Existe alguma informação sobre a data do conteúdo ou das tabelas? • É possível verificar a qualificação técnica do autor? Essa qualificação é mencionada em algum lugar do sítio? 3 6. Quais são as dificuldades encontradas na busca na web em relação às informações? • Em relação às informações: • Dados armazenados em computadores de diversos fabricantes, modelos ou sistemas operacionais; • Alta taxa de mortalidade das informações; a vida média de uma página web é de cerca de 70 dias; • Grande volume de dados e altas taxas de crescimento mensal no número de páginas web; • Qualidade dos dados deixa a desejar, isto é, nem sempre são atualizadas, são mal-escritos e com erros de digitação; • Baixa qualidade dos conteúdos das páginas web. 7. E quanto à relação ao usuário e sua interação com o sistema de recuperação? Quais são dificuldades que podem surgir? • Em relação ao usuário e sua interação com o sistema de recuperação: • Dificuldades para especificar os termos que descrevem uma pergunta ou necessidade de informação; • Dificuldades para entender os resultados fornecidos pelo sistema de recuperação; • Dificuldade para identificar o sítio relevante por ocasião de recuperação que resulte em dezenas e até milhares de registros; • Cansaço ou desmotivação em folhear mais do que três páginas com o resultado da busca. 8. Como é feita a atualização dos mecanismos de busca? • Verificar se a página identifica a que período ou data se refere o conteúdo informacional; • Verificar se foi inserida na página a data de sua atualização; • No caso de notícias, pregões das bolsas de valores e cotações de moedas, por exemplo, talvez seja indispensável à inclusão do horário da publicação do conteúdo; • Quando a data não é informada é interessante que o leitor dê uma olhada no código-fonte da página para identificar esse dado. (Como ver: clique na aba Exibir -> Código fonte) 4 9. Cite 3 links sobre documentos na web que você achou interessante. Descreva brevemente cada um deles. • Documentos na web: • PENSO, LOGO ENCONTRO (http://users.skynet.be/penso.logo.encontro/curso/curso.htm) Curso de pesquisa de informação na internet. Inclui muita informação sobre os aspectos relacionados com estratégias e mecanismos de busca, e web invisível. • SEARCH ENGINE SHOWDOWN: THE USER’S GUIDE TO WEB SEARCHING (www.searchengineshowdown.com/features) Excelente fonte que inclui atualizações correntes sobre os principais mecanismos de busca. • SEARCH ENGINE HISTORY (http://www.searchenginehistory.com/) Importante sítio que mostra a evolução histórica dos serviços de busca, desde sua idealização por Vannevar Bush, em 1945. 10. Que estratégias podem ser utilizadas para realizar uma busca na web? • Estratégias de busca nos diversos mecanismos de busca: • (1) Busca booleana (boolean search): um tipo de busca que permite a utilização dos operadores booleanos. • (2) busca difusa (fuzzy search): busca de grafias alternativas de palavras fazendo combinações mesmo quando as palavras estão grafadas erradamente; • (3) busca por conceito (concept search): uma busca de documentos que não contenham uma palavra específica, porém que esteja relacionada conceitualmente com essa palavra; • (4) busca por frase (phrase search): busca por documentos que contenham uma frase ou sentença exata ou específica; • (5) busca por palavra-chave (keyword search): estratégia de busca que requer que o resultado final contenha uma ou mais palavras especificadas; • (6) busca por proximidade (proximity search): busca por documentos que contenham certas palavras perto de outras; • (7) índice (index): o ‘catálogo’ de resultados da busca criado pelo mecanismo de busca quando analisa sítios da web; • (8) relevância (relevance): valor ou porcentagem de qualidade informativa dos documentos recuperados de acordo com os termos de busca especificados previamente. 5 11. Qual o significado de www? World Wide Web 12. Quais são os resultados de busca dos seguintes termos? Descreva. a) b) c) d) e) f) Goiás UEG Páginas que contenham os dois termos UEG OR UFG Páginas que contenham um ou os dois termos “Pedagogia e UnUCSEH” As aspas farão recuperar as páginas que contenham a frase exata entre elas UEG – greve Recuperam-se páginas com “UEG”, mas não “greve” UEG + greve Recuperam-se páginas que contenham os dois termos Revista ~ política Recuperam-se páginas que mencionam “revista” e sinônimos de “política” 13. Crie expressões utilizando os seguintes operadores booleanos: AND (+ ou &), OR ( - ), NOT ( - ), FOLLOWED BY, NEAR e (“ ”). Diretórios AND mecanismo de busca Confiabilidade da instituição OR Atualidade Pesquisador NOT web Google Directory Diretórios ~ About.com “Penso, logo encontro” 14. Agora, faça a busca na web com as expressões apresentadas nas questões 12 e 13. Goiás UEG / Google Directory: Páginas que continham os dois termos UEG OR UFG / Confiabilidade da instituição OR Atualidade: Páginas que continham um ou os dois termos “Pedagogia e UnUCSEH” / “Penso, logo encontro”: As aspas fez recuperar as páginas que continham a frase exata entre elas UEG – greve / Pesquisador NOT web: Recuperaram-se páginas com “UEG” e “Pesquisador”, mas não recuperaram “greve” e “web” UEG + greve / Diretórios AND mecanismo de busca: Recuperaram-se páginas que continham os dois termos Revista ~ política / Diretórios ~ About.com: Recuperaram-se páginas que mencionavam “revista” e “diretórios”; e sinônimos de “política” e “About.com” 6 15. Cite os mecanismos de busca desenvolvido no Brasil. Os principais mecanismos de busca na Internet brasileira, no ano de 2006, são: (SILVEIRA, 2002; SEARCH ENGINE WATCH, 2006). . Google BR (www.google.com.br) . Yahoo! Brasil (www.yahoo.com.br) . Cadê (www.cade.com.br) . MSN Busca (www.msn.com.br) . AltaVista Brasil (www.altavista.com.br) . Zoom (www.zoom.com) . Achei (www.achei.com.br) . Terra (www.terra.com.br) . UOL Buscas (radaruol.uol.com.br) . Radix (www.radix.com.br) 7