APOSTILA 2 – CURSO DE SISTEMAS DE INFORMAÇÃO INTERNET E RECUPERAÇÃO DA INFORMAÇÃO – 2º PERÍODO PROFESSOR FERNANDO LUIZ FERRAMENTAS DE PESQUISA NA INTERNET As ferramentas de pesquisa Internet procuram recursos que contêm certas palavras-chave que você fornece. Elas procuram pelo conteúdo, título ou URL do recurso. As ferramentas de pesquisa retornam uma página Web de resultados contendo o URL, o título e ocasionalmente uma breve descrição de cada recurso. Em geral, eis como você trabalha com uma ferramenta de pesquisa: 1. Abra a home page da ferramenta de pesquisa em seu Browser Web. 2. Digite as palavras-chave que você está pesquisando e pressione Enter. A ferramenta de pesquisa retorna uma página Web contendo o primeiro grupo de recursos Internet que coincidem com sua pesquisa. 3. Se você vir um URL promissor, clique no vínculo correspondente para abrir esse recurso no browser Web. Caso contrário, você pode visualizar outra página de resultados se a ferramenta de pesquisa encontrar mais recursos do que cabem em uma única página Web. Há dois tipos amplos de ferramentas de pesquisa na Internet. O primeiro tipo chama-se índice de pesquisa (search index). Esses índices tentam visitar todas as páginas Web na Internet e catalogam o conteúdo de cada página em um banco de dados. Então, você pesquisa o banco de dados. O segundo tipo chama-se diretório de pesquisa (search directory). Essas ferramentas aceitam registros (submissions) de usuários e organizam os registros em uma hierarquia de categorias pela qual você navega. COMO OS ÍNDICES DE PESQUISA FUNCIONAM Um índice de pesquisa tem três partes diferentes. O spider (aranha, também chamado de worm ou crawler: minhoca ou verme) varre a Internet procurando páginas Web. Cada vez que ele vê uma página Web, ele anota qualquer URL na página. Então, o spider repete o mesmo processo para cada URL que ele extraiu até não encontrar nenhum outro URL para visitar. Às vezes, esse processo não é suficiente para permitir que o spider encontre cada página Web na Internet. Portanto, a maioria dos índices ainda se baseia nos usuários que registram o URL de suas páginas Web para fazer o processo continuar. Cada vez que um spider visita uma página Web, um indexador a examina. O indexador varre o título da página Web e todo o texto na página. Ele cataloga o URL e uma lista de palavras encontradas nesse URL em um enorme banco de dados. Esses indexadores usam algoritmos muito eficientes e técnicas de banco de dados para manter a redundância em um mínimo. Isso não é difícil uma vez que a maioria das pessoas usa um número muito pequeno de palavras singulares. O trabalho do indexador é fazer coincidir cada URL na Internet com as palavras encontradas nesse URL. Quando você envia sua pesquisa usando a página Web de uma ferramenta de pesquisa, você a está enviando para um motor de busca (search engine). O motor de busca procura no banco de dados as palavras-chave que você forneceu e exibe cada URL que ele encontrou associado a essas palavras-chave na página Web de resultados. As capacidades dos motores de busca variam bastante. Alguns motores de busca permitem que você utilize combinações de palavras-chave para tornar sua pesquisa mais exata. Outros motores de busca assumem que se o pesquisador puder coincidir pelo menos uma de suas palavras-chave com um URL, você vai conhecer esse URL. COMO OS DIRETÓRIOS DE PESQUISA FUNCIONAM À primeira vista, você poderia não ser capaz de dizer a diferença entre um diretório de pesquisa e um índice. Os resultados de uma mesma pesquisa em ambos podem ser praticamente os mesmos quanto aos conteúdos relevantes. Mas os diretórios não varrem a Internet procurando páginas Web. Eles se baseiam nos usuários para registrar um URL e uma breve descrição, que o diretório cataloga e coloca em algum lugar de uma hierarquia. Você pode pesquisar um diretório, mas você também pode navegá-lo clicando em categorias na hierarquia para ver o que está sob elas. BOAS TÉCNICAS DE PESQUISA NA INTERNET Em algumas ferramentas de pesquisa, você pode usar combinações de palavras-chave para especificar exatamente que tipo de resultado você quer obter. Se você munir-se de técnicas como desse tipo, obterá resultados muito melhores nas pesquisas. Entretanto, a habilidade número um para pesquisar é escolher boas palavras-chave. Eis algumas dicas: • Seja específico. Uma pesquisa específica produz menos resultados e facilita a localização de conteúdo relevante. Por exemplo, não pesquise com a palavra-chave “dog” ou “cão” se você quer encontrar informação sobre Yokshire Terriers. • Não use palavras comuns. Por exemplo: “que”, “o”, “programa”, ou “Internet”. Essas palavras são tão genéricas que a ferramenta de pesquisa retornará dezenas de milhares de páginas Web. • Aprenda a ajustar sua pesquisa. Se sua pesquisa retorna muitos resultados, torne-a mais específica. Se retorna poucos, torne-a mais geral. Não pressuponha que sua primeira escolha de palavras-chave foi a melhor. • Use variações de palavra. Por exemplo, use “automobilístico”, “automobilista” e “automóvel”, se você estiver procurando páginas Web sobre automóveis. • Use sinônimos. Por exemplo, use duas palavras “automóvel” e “veículo”. Se for usar uma ferramenta de pesquisa que suporta combinações de palavras-chave, certifique-se de que você separou cada sinônimo com a palavra-chave OR. • Use frases entre aspas. Se você quiser fazer sua pesquisa coincidir exatamente com uma frase ou um título, coloque o texto entre aspas. • Use letras maiúsculas quando desejar. A maioria dos diretórios e índices de pesquisa diferencia o uso de letras maiúsculas e minúsculas na pesquisa. Assim, se sua pesquisa for inteiramente em minúsculas, a ferramenta de pesquisa procura coincidências indistintamente entre letras maiúsculas e minúsculas. Mas se você usar uma letra maiúscula, a ferramenta de pesquisa assumirá que você realmente quis isso e encontrará resultados que coincidam com sua entrada exatamente como você a digitou. • Entenda as ferramentas de pesquisa que você está usando. Algumas ferramentas de pesquisa têm muitos recursos especiais que tornam mais fácil a localização de conteúdo relevante. Você aprende sobre as ferramentas de pesquisa mais populares neste capítulo, mas você pode aprender ainda mais procurando um vínculo na home page de cada ferramenta de pesquisa que oferece mais informação. Procure um vínculo chamado Tips (Dicas) ou Search Tips (Dicas de pesquisa). USANDO COMBINAÇÕES DE PALAVRAS EM PESQUISAS A maioria das páginas de pesquisa oferece um modo de usar combinação de palavras numa pesquisa. A combinação de palavras em pesquisas oferece maior exatidão do que a utilização de palavras-chave isoladas. Usando as palavras AND (E), OR (OU) ou NOT (NÃO) (conhecidas como operadores booleanos) em suas pesquisas, você pode controlá-las melhor. Por exemplo, você pode utilizar uma ferramenta de pesquisa para encontrar todas as páginas Web que contêm a palavra “golfe” combinada com qualquer uma das seguintes palavras: “equipamento”, “clubes”, “bolsas” ou “bolas”. Você usa as palavras-chave descritas na Tabela abaixo para escrever pesquisas booleanas. Quando você une duas palavras-chave com a palavra “AND”, a ferramenta de pesquisa encontra páginas Web que contêm as duas palavras-chave. Quando você une duas palavraschave com a palavra “OR”, a ferramenta de pesquisa encontra páginas Web que contêm uma ou ambas as palavras. Quando você precede uma palavra-chave com a palavra “NOT”, a ferramenta de pesquisa encontrará páginas Web que não contêm essa palavra-chave. Palavra-chave AND OR NOT Exemplo Golfe AND Bola Bolas OR Ovos NOT Futebol Descrição Ambas são requeridas Uma ou ambas são requeridas A palavra deve estar ausente Você pode encadear mais de duas palavras-chave com as palavras-chave descritas na Tabela acima. Você pode até encadear duas ou mais citações de frases. Eis alguns exemplos para mostrar como você faz isso: • Música AND celta – Localiza todas as páginas Web que contêm ambas as palavras, “música” e “celta”. • Honeycutt AND Livro AND NOT Internet – Localiza todas as páginas Web que contêm as palavras “Honeycutt” e “livro” mas não contêm a palavra “Internet”. • Honeycutt OR Campus AND Livro AND “Usando a Internet” – Localiza todas as páginas Web que contêm as palavras “Honeycutt” ou “Campus” (ou ambas) junto com a palavra “Livro” e a frase “Usando a Internet”. • Tosa AND “Yorkshire Terrier” – Localiza todas as páginas Web que contêm a palavra “tosa” e a frase “Yorkshire Terrier”. Você pode tornar uma pesquisa booleana ainda mais exata agrupando diferentes partes dela dentro de parênteses. A ferramenta de pesquisa avalia primeiro qualquer coisa entre parênteses. Por exemplo: • “Usando a Internet” AND (Segunda OR Terceira) – Localiza todas as páginas Web que contêm uma das palavras, “segunda” ou “terceira”, e a frase “Usando a Internet”. • (Tosa OR Cuidado) AND (Yorkie OR Westie) – Localiza todas as páginas Web que contêm uma das duas palavras, “Tosa” ou “Cuidado” e uma das palvras “Yorkie” ou “Westie”. • Search AND (Tool OR Index OR Directory) – Localiza todas as páginas Web que contêm a palavra “Search” em combinação com uma das palavras “Tool”, “Index” ou “Directory”. INCLUINDO OU OMITINDO PALAVRAS EM PESQUISAS Algumas ferramentas de pesquisa permitem que você declare explicitamente se você quer certificar-se de que uma palavra-chave aparece ou não em uma página Web. Você faz isso usando o sinal de adição (+) e o sinal de subtração (-). Por exemplo, + palavra ou – palavra. Usar o sinal de adição indica que uma página Web deve incluir a palavra-chave para que seja considerada relevante. O sinal de subtração significa que a página Web deve não incluir a palavra-chave para ser relevante. Eis dois exemplos: • +Honeycutt –Gerald +Jerry – Localiza todas as páginas Web que incluem as palavras “Honeycutt” e “Jerry” e não incluem a palavra “Gerald”. A pesquisa booleana equivalente pareceria algo como Honeycutt AND Jerry AND NOT Gerald. • +Book –Plus – Localiza todas as páginas Web que incluem as palavras “Book” e não incluem a palavra “Plus”. A pesquisa booleana equivalente seria algo como Book AND NOT Plus. PROCURANDO ÍNDICES DE ASSUNTOS NAS FERRAMENTAS DE PESQUISA Se você não encontrar uma página Web relevante em uma ferramenta de pesquisa, isso não significa que a página Web não exista. Muitas pessoas criam índices para páginas Web relacionadas e então listam esses índices em diretórios como o Yahoo!. Se você não puder encontrar uma página Web sobre tosa de Yorkshire Terriers, por exemplo, veja se você pode encontrar um índice sobre Yorkshire Terriers. É possível que você encontre um vínculo para uma página Web relevante no índice. Para encontrar bons índices em um diretório ou índice de pesquisa, torne sua pesquisa um pouco mais geral e adicione a palavra-chave “index”. Por exemplo, se você for usar a pesquisa Tosa AND (Yorkie OR “Yorkshire Terrier”), mude-a para algo mais parecido com isto: Index AND (Yorkie OR Yorkshire). Você poderia até ter melhor sorte tornando-a ainda mais geral, como isto: Index AND Terrier. Possivelmente, a ferramenta de pesquisa retornará um ou mais índices que contêm vínculos para páginas Web relacionadas com Yorkies ou Terriers. ESCOLHENDO A MELHOR FERRAMENTA DE PESQUISA PARA O TRABALHO As ferramentas de pesquisa discutidas nesta seção estão entre as mais populares na Internet. Uma parte importante da sua estratégia de pesquisa é escolher a melhor ferramenta de pesquisa para começar. Se a primeira ferramenta de pesquisa falhar, você pode passar para uma das outras. Para ajudá-lo a escolher uma das ferramentas de pesquisa descritas a seguir, dê uma olhada na Tabela abaixo. A coluna da esquerda descreve diferentes tipos de coisas que você poderia querer fazer. A coluna da direita recomenda as ferramentas de pesquisa que você deve usar para conseguir isso. Se você quiser Navegar pelas categorias Encontrar um site pouco conhecido Obter muitos resultados Fazer pesquisas conceituais Fazer pesquisa por exemplo Nomes próprios Pesquisar toda a Web Pesquisar avaliações de sites Pesquisar títulos e URLs Pesquisar a Use Net Comece aqui Excite, infoseek, Yohoo! Yahoo! Alta Vista, Infoseek Excite, infoseek Excite Alta Vista, Excite, infoseek Alta Vista, infoseek Excite, infoseek Alta Vista, Yahoo! Alta Vista, Excite, infoseek