apostila 1 – internet e recuperação da informação

Propaganda
APOSTILA 2 – CURSO DE SISTEMAS DE INFORMAÇÃO
INTERNET E RECUPERAÇÃO DA INFORMAÇÃO – 2º PERÍODO
PROFESSOR FERNANDO LUIZ
FERRAMENTAS DE PESQUISA NA INTERNET
As ferramentas de pesquisa Internet procuram recursos que contêm certas palavras-chave que
você fornece. Elas procuram pelo conteúdo, título ou URL do recurso. As ferramentas de
pesquisa retornam uma página Web de resultados contendo o URL, o título e ocasionalmente
uma breve descrição de cada recurso. Em geral, eis como você trabalha com uma ferramenta
de pesquisa:
1. Abra a home page da ferramenta de pesquisa em seu Browser Web.
2. Digite as palavras-chave que você está pesquisando e pressione Enter. A ferramenta de
pesquisa retorna uma página Web contendo o primeiro grupo de recursos Internet que
coincidem com sua pesquisa.
3. Se você vir um URL promissor, clique no vínculo correspondente para abrir esse recurso no
browser Web. Caso contrário, você pode visualizar outra página de resultados se a ferramenta
de pesquisa encontrar mais recursos do que cabem em uma única página Web.
Há dois tipos amplos de ferramentas de pesquisa na Internet. O primeiro tipo chama-se índice
de pesquisa (search index). Esses índices tentam visitar todas as páginas Web na Internet e
catalogam o conteúdo de cada página em um banco de dados. Então, você pesquisa o banco
de dados. O segundo tipo chama-se diretório de pesquisa (search directory). Essas ferramentas
aceitam registros (submissions) de usuários e organizam os registros em uma hierarquia de
categorias pela qual você navega.
COMO OS ÍNDICES DE PESQUISA FUNCIONAM
Um índice de pesquisa tem três partes diferentes. O spider (aranha, também chamado de
worm ou crawler: minhoca ou verme) varre a Internet procurando páginas Web. Cada vez que
ele vê uma página Web, ele anota qualquer URL na página. Então, o spider repete o mesmo
processo para cada URL que ele extraiu até não encontrar nenhum outro URL para visitar. Às
vezes, esse processo não é suficiente para permitir que o spider encontre cada página Web na
Internet. Portanto, a maioria dos índices ainda se baseia nos usuários que registram o URL de
suas páginas Web para fazer o processo continuar.
Cada vez que um spider visita uma página Web, um indexador a examina. O indexador varre
o título da página Web e todo o texto na página. Ele cataloga o URL e uma lista de palavras
encontradas nesse URL em um enorme banco de dados. Esses indexadores usam algoritmos
muito eficientes e técnicas de banco de dados para manter a redundância em um mínimo. Isso
não é difícil uma vez que a maioria das pessoas usa um número muito pequeno de palavras
singulares. O trabalho do indexador é fazer coincidir cada URL na Internet com as palavras
encontradas nesse URL.
Quando você envia sua pesquisa usando a página Web de uma ferramenta de pesquisa, você a
está enviando para um motor de busca (search engine). O motor de busca procura no banco de
dados as palavras-chave que você forneceu e exibe cada URL que ele encontrou associado a
essas palavras-chave na página Web de resultados. As capacidades dos motores de busca
variam bastante. Alguns motores de busca permitem que você utilize combinações de
palavras-chave para tornar sua pesquisa mais exata. Outros motores de busca assumem que se
o pesquisador puder coincidir pelo menos uma de suas palavras-chave com um URL, você vai
conhecer esse URL.
COMO OS DIRETÓRIOS DE PESQUISA FUNCIONAM
À primeira vista, você poderia não ser capaz de dizer a diferença entre um diretório de
pesquisa e um índice. Os resultados de uma mesma pesquisa em ambos podem ser
praticamente os mesmos quanto aos conteúdos relevantes.
Mas os diretórios não varrem a Internet procurando páginas Web. Eles se baseiam nos
usuários para registrar um URL e uma breve descrição, que o diretório cataloga e coloca em
algum lugar de uma hierarquia. Você pode pesquisar um diretório, mas você também pode
navegá-lo clicando em categorias na hierarquia para ver o que está sob elas.
BOAS TÉCNICAS DE PESQUISA NA INTERNET
Em algumas ferramentas de pesquisa, você pode usar combinações de palavras-chave para
especificar exatamente que tipo de resultado você quer obter. Se você munir-se de técnicas
como desse tipo, obterá resultados muito melhores nas pesquisas.
Entretanto, a habilidade número um para pesquisar é escolher boas palavras-chave. Eis
algumas dicas:
• Seja específico. Uma pesquisa específica produz menos resultados e facilita a localização de
conteúdo relevante. Por exemplo, não pesquise com a palavra-chave “dog” ou “cão” se você
quer encontrar informação sobre Yokshire Terriers.
• Não use palavras comuns. Por exemplo: “que”, “o”, “programa”, ou “Internet”. Essas
palavras são tão genéricas que a ferramenta de pesquisa retornará dezenas de milhares de
páginas Web.
• Aprenda a ajustar sua pesquisa. Se sua pesquisa retorna muitos resultados, torne-a mais
específica. Se retorna poucos, torne-a mais geral. Não pressuponha que sua primeira escolha
de palavras-chave foi a melhor.
• Use variações de palavra. Por exemplo, use “automobilístico”, “automobilista” e
“automóvel”, se você estiver procurando páginas Web sobre automóveis.
• Use sinônimos. Por exemplo, use duas palavras “automóvel” e “veículo”. Se for usar uma
ferramenta de pesquisa que suporta combinações de palavras-chave, certifique-se de que você
separou cada sinônimo com a palavra-chave OR.
• Use frases entre aspas. Se você quiser fazer sua pesquisa coincidir exatamente com uma
frase ou um título, coloque o texto entre aspas.
• Use letras maiúsculas quando desejar. A maioria dos diretórios e índices de pesquisa
diferencia o uso de letras maiúsculas e minúsculas na pesquisa. Assim, se sua pesquisa for
inteiramente em minúsculas, a ferramenta de pesquisa procura coincidências indistintamente
entre letras maiúsculas e minúsculas. Mas se você usar uma letra maiúscula, a ferramenta de
pesquisa assumirá que você realmente quis isso e encontrará resultados que coincidam com
sua entrada exatamente como você a digitou.
• Entenda as ferramentas de pesquisa que você está usando. Algumas ferramentas de pesquisa
têm muitos recursos especiais que tornam mais fácil a localização de conteúdo relevante.
Você aprende sobre as ferramentas de pesquisa mais populares neste capítulo, mas você pode
aprender ainda mais procurando um vínculo na home page de cada ferramenta de pesquisa
que oferece mais informação. Procure um vínculo chamado Tips (Dicas) ou Search Tips
(Dicas de pesquisa).
USANDO COMBINAÇÕES DE PALAVRAS EM PESQUISAS
A maioria das páginas de pesquisa oferece um modo de usar combinação de palavras numa
pesquisa. A combinação de palavras em pesquisas oferece maior exatidão do que a utilização
de palavras-chave isoladas. Usando as palavras AND (E), OR (OU) ou NOT (NÃO)
(conhecidas como operadores booleanos) em suas pesquisas, você pode controlá-las melhor.
Por exemplo, você pode utilizar uma ferramenta de pesquisa para encontrar todas as páginas
Web que contêm a palavra “golfe” combinada com qualquer uma das seguintes palavras:
“equipamento”, “clubes”, “bolsas” ou “bolas”.
Você usa as palavras-chave descritas na Tabela abaixo para escrever pesquisas booleanas.
Quando você une duas palavras-chave com a palavra “AND”, a ferramenta de pesquisa
encontra páginas Web que contêm as duas palavras-chave. Quando você une duas palavraschave com a palavra “OR”, a ferramenta de pesquisa encontra páginas Web que contêm uma
ou ambas as palavras. Quando você precede uma palavra-chave com a palavra “NOT”, a
ferramenta de pesquisa encontrará páginas Web que não contêm essa palavra-chave.
Palavra-chave
AND
OR
NOT
Exemplo
Golfe AND Bola
Bolas OR Ovos
NOT Futebol
Descrição
Ambas são requeridas
Uma ou ambas são requeridas
A palavra deve estar ausente
Você pode encadear mais de duas palavras-chave com as palavras-chave descritas na Tabela
acima. Você pode até encadear duas ou mais citações de frases. Eis alguns exemplos para
mostrar como você faz isso:
• Música AND celta – Localiza todas as páginas Web que contêm ambas as palavras,
“música” e “celta”.
• Honeycutt AND Livro AND NOT Internet – Localiza todas as páginas Web que contêm as
palavras “Honeycutt” e “livro” mas não contêm a palavra “Internet”.
• Honeycutt OR Campus AND Livro AND “Usando a Internet” – Localiza todas as páginas
Web que contêm as palavras “Honeycutt” ou “Campus” (ou ambas) junto com a palavra
“Livro” e a frase “Usando a Internet”.
• Tosa AND “Yorkshire Terrier” – Localiza todas as páginas Web que contêm a palavra
“tosa” e a frase “Yorkshire Terrier”.
Você pode tornar uma pesquisa booleana ainda mais exata agrupando diferentes partes dela
dentro de parênteses. A ferramenta de pesquisa avalia primeiro qualquer coisa entre
parênteses. Por exemplo:
• “Usando a Internet” AND (Segunda OR Terceira) – Localiza todas as páginas Web que
contêm uma das palavras, “segunda” ou “terceira”, e a frase “Usando a Internet”.
• (Tosa OR Cuidado) AND (Yorkie OR Westie) – Localiza todas as páginas Web que contêm
uma das duas palavras, “Tosa” ou “Cuidado” e uma das palvras “Yorkie” ou “Westie”.
• Search AND (Tool OR Index OR Directory) – Localiza todas as páginas Web que contêm a
palavra “Search” em combinação com uma das palavras “Tool”, “Index” ou “Directory”.
INCLUINDO OU OMITINDO PALAVRAS EM PESQUISAS
Algumas ferramentas de pesquisa permitem que você declare explicitamente se você quer
certificar-se de que uma palavra-chave aparece ou não em uma página Web. Você faz isso
usando o sinal de adição (+) e o sinal de subtração (-). Por exemplo, + palavra ou – palavra.
Usar o sinal de adição indica que uma página Web deve incluir a palavra-chave para que seja
considerada relevante. O sinal de subtração significa que a página Web deve não incluir a
palavra-chave para ser relevante. Eis dois exemplos:
• +Honeycutt –Gerald +Jerry – Localiza todas as páginas Web que incluem as palavras
“Honeycutt” e “Jerry” e não incluem a palavra “Gerald”. A pesquisa booleana equivalente
pareceria algo como Honeycutt AND Jerry AND NOT Gerald.
• +Book –Plus – Localiza todas as páginas Web que incluem as palavras “Book” e não
incluem a palavra “Plus”. A pesquisa booleana equivalente seria algo como Book AND NOT
Plus.
PROCURANDO ÍNDICES DE ASSUNTOS NAS FERRAMENTAS DE PESQUISA
Se você não encontrar uma página Web relevante em uma ferramenta de pesquisa, isso não
significa que a página Web não exista. Muitas pessoas criam índices para páginas Web
relacionadas e então listam esses índices em diretórios como o Yahoo!. Se você não puder
encontrar uma página Web sobre tosa de Yorkshire Terriers, por exemplo, veja se você pode
encontrar um índice sobre Yorkshire Terriers. É possível que você encontre um vínculo para
uma página Web relevante no índice.
Para encontrar bons índices em um diretório ou índice de pesquisa, torne sua pesquisa um
pouco mais geral e adicione a palavra-chave “index”. Por exemplo, se você for usar a
pesquisa Tosa AND (Yorkie OR “Yorkshire Terrier”), mude-a para algo mais parecido com
isto: Index AND (Yorkie OR Yorkshire). Você poderia até ter melhor sorte tornando-a ainda
mais geral, como isto: Index AND Terrier. Possivelmente, a ferramenta de pesquisa retornará
um ou mais índices que contêm vínculos para páginas Web relacionadas com Yorkies ou
Terriers.
ESCOLHENDO A MELHOR FERRAMENTA DE PESQUISA PARA O TRABALHO
As ferramentas de pesquisa discutidas nesta seção estão entre as mais populares na Internet.
Uma parte importante da sua estratégia de pesquisa é escolher a melhor ferramenta de
pesquisa para começar. Se a primeira ferramenta de pesquisa falhar, você pode passar para
uma das outras. Para ajudá-lo a escolher uma das ferramentas de pesquisa descritas a seguir,
dê uma olhada na Tabela abaixo. A coluna da esquerda descreve diferentes tipos de coisas que
você poderia querer fazer. A coluna da direita recomenda as ferramentas de pesquisa que você
deve usar para conseguir isso.
Se você quiser
Navegar pelas categorias
Encontrar um site pouco conhecido
Obter muitos resultados
Fazer pesquisas conceituais
Fazer pesquisa por exemplo
Nomes próprios
Pesquisar toda a Web
Pesquisar avaliações de sites
Pesquisar títulos e URLs
Pesquisar a Use Net
Comece aqui
Excite, infoseek, Yohoo!
Yahoo!
Alta Vista, Infoseek
Excite, infoseek
Excite
Alta Vista, Excite, infoseek
Alta Vista, infoseek
Excite, infoseek
Alta Vista, Yahoo!
Alta Vista, Excite, infoseek
Download