Apontamentos

Propaganda
KIT DE TREINO MULTIMEDIA
APONTAMENTOS SOBRE PESQUISA NA INTERNET
Developed by: Anna Feldman, for the Association for Progressive Communications
Sobre este documento
Estes materiais são parte do Kit de Treino Multimedia (MMTK). O MMTK oferece um conjunto
integrado de materiais de formação multimedia e recursos de apoio aos media comunitários,
centros multimédia comunitários, telecentros, e outras iniciativas usando tecnologias de
informação e comunicação (ICTs) para empoderar comunidades e apoiar o desenvolvimento.
Informação Copyright
Esta unidade esta disponivel sob licenca, NonCommercial-ShareAlike Licence de Creative
Commons Creative Commons . Para saber comopodeusar estes materiais leia a declaracao
de copyright incluida nesta unidade ou veja.
http://creativecommons.org/licenses/by-nc-sa/1.0/legalcode
Sobre esta unidade
Esta unidade acompanha os participantes através do processo de compreender as
prioridades envolvidas em procurar com sucesso informação na Internet.
Vamos abordar a tarefa para:
o
Compreender mais sobre Internet como meio de encontrar informação.
o
Explorar forças e fraquezas das diferentes ferramentas de busca disponíveis: pegando
as certas para a tarefa.
o
Aprender a usar adequadamente as ferramenta: : dúvidas sobre reformulação na forma
adequada à ferramenta de busca.
o
Avaliar a informação dada pelas ferramentas de busca: aproveitando com eficiência os
resultados mais relevantes.
o
Desenvolver uma estratégia para construir um banco de “links” personalizado e bem
estruturado para futura referência, permitindo ao mesmo tempo ultrapassar as
ferramentas de busca. .
A Internet como um meio para procurar informação
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
1
Existem várias características distintas sobre como mapear e navegar a Internet, que vale a
pena ter presentes antes de começar a nossa viagem para encontrar a informação que
procuramos:
o
Na medida em que o conteúdo está constantemente a ser acrescentado e actualizado,
não existem estatísticas exactas disponíveis relativas à quantidade de informação
acessível na Internet – em 2001 calculava-se que tivesse 3 biliões de documentos.
o
Estes documentos não estão indexados em nenhum sistema normalizado. Ao contrário
da maioria das bibliotecas, com os seus índices por assuntos, por autores e por títulos, a
Web precisa que nós adivinhemos em que palavras-chave estão as páginas que
queremos.
o
Não é possível pesquisar o WWW directamente. O seu computador não pode encontrar
todas as páginas Web. Estas residem nos computadores “servidores” por todo o mundo.
O que pode fazer no seu computador, usando os conhecimentos técnicos que vamos
desenvolver nesta unidade, é aceder a alguns dos muitos motores de busca disponíveis
e pô-los a fazer esse trabalho.
o
Uma ferramenta de busca deixa-o pesquisar a sua base de dados ou lista de sítios –
este é um subsistema relativamente menor de todo o World Wid Web. A ferramenta de
busca dá-lhe “links hypertext” com URLs para outras páginas. Clicando nestes “links”
vamos buscar documentos, imagens, som, e outras coisas, de servidores individuais do
mundo inteiro.
Por detrás da mecânica de como a informação é armazenada e distribuida estão as pessoas
que a produziram. São pessoas com as mesmas falhas das pessoas que produzem
informação impressa. A existência de informação na Internet não a faz nem mais nem menos
exacta do que se fosse publicada noutro lugar qualquer. Da mesma maneira, o conteudo só
está na Internet se alguém achou que o devia lá colocar. Uma ideia não pode encontrar o
seu caminho até à Internet sem ter um ser humano por de trás – por muito valiosa e
procurada que essa ideia seja.
Para começar – escolhendo a ferramenta de busca
certa para a tarefa
Há dezenas de ferramentas de busca acessíveis na Internet. Esta breve ronda vai dar-lhe a
conhecer as bases das ferramentas disponíveis, mas só com a prática se adquire um
conhecimento mais a fundo de uso destas ferramentas.
Motores de busca
Os motores de busca funcionam procurando através de um índice de uma base de dados
que é compilada automáticamente por “spiders" (aranhas) que são programas de
computador “robot” – não são pessoas. O motor de busca tenta combinar as suas palavraschave de pesquisa com palavras no texto de páginas web seleccionadas.
A quantidade de conteúdo que os motores de busca pesquisam varia entre os que são
pequenos e especializados até aos que cobrem mais de 90 por cento da web indexável.
Conseguir bons resultados dos motores de busca depende só da sua familiaridade com a
sintaxe e as características do motor de busca que está a usar, na medida em que isso é
quase o tamanho do índice do motor de busca.
Bom Para: Quando tem de ser exacto acerca daquilo que procura.
Não é Bom Para: Quando precisa de ajuda na procura de um caminho que o conduza
através de diferentes áreas de um assunto, e das quais podia não ter ideia no início da sua
pesquisa.
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
2
Entre os motores de busca mais importantes estão:
Google
http://www.google.com/
alltheweb (chamado anteriormente "Fast Search")
http://www.alltheweb.com/
AltaVista
http://www.altavista.com/
O Google tem a base de dados do motor de busca mais abrangente, mas não há
possibilidade de algum motor de busca encontrar toda a informação possível sobre um
tópico.
Motores de Meta-busca
Também relevantes aqui são os motores de meta-busca que rápidamente podem fazer uma
pesquisa através de vários motores de busca individuais de uma vez (habitualmente
alcançam 10% dos resultados da busca em qualquer dos outros motores de busca que
visitam). Isto significa que não há vantagem em usar a sintaxe de pesquisa mais avançada
de qualquer motor de busca. Vale mais ficar por pesquisas simples, usando um único termo
ou frase.
SurfWax
http://www.surfwax.com/
Ixquick
http://www.ixquick.com/
Recursos de informação do tipo “gateway”
Estes podem chamar-se Catálogos Internet, directórios por assunto, bibliotecas virtuais or
gateways. São especializados em recursos num domínio específico, e tendem a ser
pesquisáveis bem como organizados num formato hierarquizado. Alguns funcionam como
um catálogo de recursos para uma domínio particular, enquanto outros são catálogos de
catálogos. São sempre compilados por pessoas (em vez de indexados automáticamente)
que organizam a informação de acordo com um sistema de classificação. Isto significa que
se pode esperar que os items da lista foram peneirados e avaliados pela sua relevância e
qualidade. Veja o exemplo no material de distribuição.
Exemplos de sítios do tipo “gateway” são:
ELDIS
O “gateway” ELDIS para Informação do Desenvolvimento, serve de ponto central de acesso
para guias de recursos, perfis de países, notícias, empregos, e outros recursos.
http://www.eldis.org/
Biblioteca Virtual World Wide Web
A Biblioteca Virtual World Wide Web descreve-se a si própria como “o mais antigo catálogo
da Web, iniciado por Tim Berners-Lee, o criador da própria Web. Ao contrário dos catálogos
comerciais, é gerida por uma confederação informal de voluntários, que compilam páginas de
“links” fundamentais em determinadas áreas das quais eles são especialistas; embora não
seja o maior índice na Web, as páginas da BV são largamente reconhecidas como estando
entre os guias da mais alta qualidade para secções particulares da Web. Pode-se procurar
na biblioteca por categoria ou ordem alfabética e também é pesquisável.
http://www.vlib.org/
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
3
SOSIG, Catálogo de Informação em Ciências Sociais
Um serviço educacional dando acesso a fontes de alta qualidade para cientistas sociais. A
informação está organizada em secções de assuntos que podem ser procurados e
pesquisados.
http://www.sosig.ac.uk/
Bases de Dados especializadas
Há muitas bases de dados de informação que são acessíveis pelos utentes da Web mas não
pelos “robots” que compilam os indices para motores de busca. Este tipo de informação
forma aquilo que é conhecido por “web invisível”. Não está contida em páginas
convencionais da web, mas tem um conteúdo gerado dinamicamente, que é movido para as
páginas web por bases de dados quando é requerido. É chamado "invisível" porque está fora
do alcance dos “spiders” e das suas ferramentas de busca. Pode-se encontrar este tipo de
conteúdo em directórios de assuntos mas em geral é preciso saber onde aceder às próprias
bases de dados para encontrar a informação lá dentro. São geralmente pesquisáveis pelos
métodos normais de busca e variam à medida que a sua pesquisa é mais elaborada e
avançada.
É bom se: Sabe onde encontrar uma base de dados que trata da sua area de interesse.
Não é bom se: Se a sua pesquisa é mais alargada que aquilo que a base de dados em
causa contem.
Aprendendo a usar apropriadamente as ferramentas
Vamos adoptar uma estratégia que vai clarificar o seu pensamento sobre o seu tópico, ajudar
a conseguir bons resultados e também poupar tempo precioso “on-line”. Esta estratégia
funciona através de 7 estágios:
Estágio 1. Desdobrando a pergunta
Faça perguntas a si mesmo para tornar a sua questão mais clara. Por exemplo: se está
interessado em informação sobre refugiados, faça a si próprio perguntas do tipo :
o
Há paises particularmente relevantes para o meu interesse em refugiados?
o
Quero saber sobre serviços disponíveis para refugiados, legislação afectando refugiados,
organizações fazendo campanhas por intermédio dos refugiados ou investigação geral
na area de estudos sobre refugiados?
o
Estou interessado em questões actuais sobre refugiados ou o meu interesse é mais de
carácter histórico?
Tente colocar a sua pergunta numa frase, por exemplo
o
Serviços de defesa legal para refugiados Somali no Reino Unido
Divida a sua frase em Conceitos:
Conceito 1
Serviços legais
Conceito 2
Refugiados Somali
Conceito 3
Reino Unido
Tenha em atenção outros conceitos que também possam ser usados para descrever os
conceitos. Isto inclui diferentes grafias e sinónimos.
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
4
Pensando em termos alternativas de pesquisa, pode desenvolver uma série de termos para
usar em conjunção com as características de várias ferramentas de pesquisa.
Conceito 1
Serviços legais
Consultoria de migração
Requerentes de asilo
Conceito 2
Refugiados Somali
Emigrados Somali
Conceito 3
Reino Unido
Grã-Bretanha
Inglaterra
Estágio 2. Pondo a questão numa frase: introdução à sintaxe da
pesquisa
Sintaxe da pesquisa é o método que usamos para ligar os conceitos de modo adequado à
pesquisa. Diferentes ferramentas de pesquisa oferecem diferentes opções para refinar
pesquisas e podem usar diferentes sintaxes ou linguagens. Alguns motores de busca
permitem-lhe refinar a sua pesquisa seleccionando entre um número de opções da
linguagem natural tais como "procure todas as palavras," "procure quaisquerpalavras" ou
"não deve incluir". Outros precisam que use quer “matemática de pesquisa” quer lógica
Boolean para refinar a sua pesquisa. Aprendendo e aplicando estas bases, a sua pesquisa
torna-se considerávelmente mais eficaz.
Os princípios básicos são os mesmos para a maioria dos motores de busca, mas podem
usar versões ligeiramente diferentes de sintaxe de busca. Em caso de dúvida leia a página
da ajuda (help) da ferramenta de pesquisa que estiver a usar. Tenha em atenção que
embora a maioria das facilidades de pesquisa ignorem o caso (gramatical), não acontece
com todas.
Muitos motores de busca ignoram palavras comuns como “the” e “in” etc. Estas são
conhecidas como "stop words".
Matemática de pesquisa
Refere-se aos símbolos matemáticos comuns como modo de refinar a pesquisa.
Use + (sinal de mais) à frente de cada termo que deve aparecer nos seus resultados de
pesquisa. Por exemplo, se está a procurer informação sobre como o preço do café está a ter
impacto nos salaries dos apanhadores de café
+café +apanhadores +preço + salários
Garantirá que todos os resultados incluam todos os termos: café, preços, apanhadores,
salaries – e não traga os Cafés (da cidade) os apanhadores de algodão, ou os salários dos
contabilistas da Price Waterhouse.
Use - (sinal de menos) à frente de cada termo, que não deve aparecer no resultado da sua
pesquisa. Usando o mesmo exemplo como acima, pode entrar
+café - chávena - algodão
Use " " (aspas) à volta das palavras que quer marcar como uma frase. Por exemplo,
"apanhadores de café"
"refugiados somali"
"pinguim imperador"
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
5
Use * (asterisco) para truncar. 1 Por exemplo se quer pesquisar sobre educação,
educadores, educar etc., entre
educ*
Lógica Boolean
Alguns motores de busca usam os operadores Boolean "AND," "OR" e "NOT" para
refinamento de pesquisa. Os operadores Boolean devem geralmente ser escritos em
maiúsculas.
Use AND para requerer que apareça mais de um termo em todos os resultados da pesquisa.
Por exemplo entrando
imperador AND pinguim
encontrará páginas com ambos os termos.
Use OR se quer que todos os resultados da sua pesquisa incluam qualquer dos termos (ou
ambos)
Isto pode ser útil se houver grafias alternatives (por exemplo "organization" e "organisation"
ou sinónimos (paludismo e malária) para as palavras. Para encontrar todas as páginas que
contêm a palavra “paludismo” ou a palavra "malária" (ou ambas), entre
malária OR paludismo
Use NOT para excluir termos que não quer que venham nos seus resultados da pesquisa 2 . 3 4
Por exemplo, se procura informação sobre “marfim de elefante” mas não tinta cor-de-marfim,
pode entrar
marfim NOT cor
Alguns motores de busca permitem o uso de “operador de proximidade” NEAR tanto quanto
os três operadores Boolean.
Onde uma pesquisa sobre
sul AND africa
pode conduzi-lo a uma página com "sul" no topo e "africa" no fundo, entrando
sul NEAR africa
assegura que os termos aparecem próximos um do outro. Nem todas as ferramentas de
pesquisa permitem isto – veja a página de ajuda do motor de busca que está a usar.
1
Nem todos os motores de busca permitem esta truncagem com asterisco. Veja a página da ajuda da
ferramenta de pesquisa que está a usar.
2
4 Some search engines use AND NOT instead of NOT. Check the help page of the search tool you are using.
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
6
With your search query unpacked into a syntactically correct format, we can now proceed through the next Estágios of the search using this table:
Estágio 3. Categorising the query.
Estágio 4. Matching the tool to the query
Try to match the right tool to the type of search query you are working on. Think about the way
that the tool will work on your query and re-phrase the query to get the most out of the tools. Try
a variety of tools – use general tools to find subject-specific ones.
Type of Search Query
Includes clearly distinctive
words or phrases (about
which there can be no
misunderstanding).
Examples
o
“Black history month”
o
“Sleeping sickness”
o
“Robusta coffee”
o
“Fair trade” +chocolate
Includes common or general
terms that seem to get
numerous inappropriate
results.
o
o
o
o
Looks for a broad overview of
a subject area.
o
o
o
o
Looks for a narrowly focused
part of a broad subject.
o
o
o
Weekend break
Taj Mahal
Campaigning techniques
Study abroad
Afro-Caribbean diaspora
history
Intellectual property
rights
Lone parenting
Rain forest ecology
Statistics on domestic
violence in Soweto
Migration patterns of
Emperor penguins in the
Antarctic
Grass-roots ICT projects
in Africa
Search Engine
Place the words or phrase in
speech marks (“”), to make
sure that the search engine
looks for those words strung
together exactly as you have
specified.
Think about which terms
might develop your query to
remove the ambiguity. Go
back to the lists of Conceitos
you made in staqe 1 and try
making ithemmore specific
A search engine is
inappropriate for this type of
search.
Subject Directory
Try and think around your
phrase – look at the available
categories and identify which
one(s) it may belong to.
Think about re-phrasing your
query into a structure that
includes Boolean search
terms – AND, OR, NOT etc.
These will help the tool focus
the search and deliver less
"junk".
Look for a subject directory
that covers the broad subject
and move through its
hierarchy of categories to
home in on your specific
query.
Use the subject directory’s
pre-defined subject categories
to guide you and help
articulate a clearer search
query.
Best results will be achieved
by finding a specialist subject
directory that covers your
area.
Specialist Database
If you are searching for:
o
Data
o
Facts
o
Statistics
o
Schedules
o
Maps etc.
then specialist databases can
help you with any of the
example search queries. Use
a subject directory or a search
engine as your starting point
to find the appropriate
database – i.e. start with the
visible web and use it to find a
signpost to an entry point into
the "invisible web".
Be imaginative about the
routes you take through
information on the Internet.
Estágio 5. Ask a
human being!
If you can’t find what you want
from a search tool, ask a
person.
Remember ,the tools don’t
have brains – people do! If
you have found a specialised
subject directory on your
topic, but it doesn’t contain
what you want, look for an
email link to a relevant
resource person, or the
author of a good page you
find.
Alternatively ask a discussion
group or expert.
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
7
Could be spelled or phrased
in a variety of alternative ways
o
o
o
o
o
o
“Falkland Islands” OR
Malvinas
“New Zealand” OR
Aotearoa
Cassava OR manioc
Aubergine OR eggplant
OR brinjal
“Freedom of speech” OR
“press freedom” OR
st
“anti-censorship” OR “1
amendment”
“Female genital
mutilation” OR FGM OR
cliterodectomy OR
“female circumcision”
Use the Boolean search term
OR to enable searching for
information under alternative
labels.
Specialist subject directories
may accommodate alternative
labelling, but the more
general ones are likely to be
inappropriate for this type of
search.
Esta estratégia de cinco estágios é uma forma forte de abordar a pesquisa na internet e leva-o certamente o mais próximo possível de encontrar aquilo que
procura. Mas com a internet não há garantias, razão pela qual pode precisar de considerar outro estágio para a pesquisa.
Pesquisando Internet Handout
Ultima Actualizacao 31de Junho 2006
Disponível Online http://www.itrainonline.org/
8
Estágio 6. Se à primeira não conseguiu – tente outra vez!
Não se sinta desencorajado quando a ferramenta que escolheu não o leva aos resultados
perfeitos. Para chegar a ser um pesquisador de internet habilitado, implica recapitular os
passos dados e procurar as voltas que pode ter perdido, ou re-formular e mesmo re-pensar a
sua procura. Pode ficar mais rapidamente habilitado adaptando as suas questões à
ferramenta que esta usando.
Estágio 7. Avaliando resultados da pesquisa
"pense antes de clicar"
A cultura do “controlo editorial” que procura estabelecer normas no mundo da imprensa, está
muitas vezes ausente da “web”. Enquanto a liberdade da “web” é aquilo que a torna tão rica
e compensadora para nós que recolhemos informação, é esta mesma liberdade que nos
deve alertar para a necessidade de questionar a exactidão e validade de tudo o que
encontramos.
Isto leva-nos à próxima parte da estratégia da pesquisa:
Olhar inteligentemente para as URLs nos resultados encontrados pela ferramenta de
pesquisa capacita-o a fazer selecções mais relevantes a partir da lista, tornando a busca
mais eficiente.
Precisamos de começar por compreender a anatomia de uma URL(Uniforme Resource
Locator – Localizador de Recursos Uniforme):
http://www.hrw.org/press/2003/02/powell20303.htm
O tipo de protocolo: neste caso hypertext transfer protocol
http://
www.
Indica o World Wide Web
hrw.org
O domain name ()nome do domínio) do site da web.
press/2003/02/powell20303
.htm
Mostra a localização, ou “caminho” para a página. Esta página
está numa pasta chamada 02 que está dentro duma pasta
chamada 2003 que está dentro duma pasta chamada
imprensa(press). Esta pasta está dentro da pasta www.hrw.org.
Um “/” é usado para separar diferentes níveis de
armazenamento da informação (pastas) no site da web.
O nome da página no ficheiro do computador.
Extensão do ficheiro mostrado de que tipo é – este é htm
(hypertext mark-up language).
/powell20303.htm
htm
O que está numa URL?
Tipos de domínios
O domínio que um “website” usa pode indicar as características do conteúdo relativamente a
sua pesquisa.
o
o
o
Sites do governo: procure .go, .gov, .mil
Sites educacionais: procure .edu, .ac
Organizações não-comerciais: procure .org
Last updated 4 July 2006
Available online from http://www.itrainonline.org/
9
Assim, se procuram as vozes dos dissidentes da Indonésia, provavelmente não chega ao
cerne da sua busca em páginas onde a URL usa o domínio .gov ou .mil. No entanto, estas
páginas podem conter informação periférica relevante para si.
O domínio também pode conter o código de um país indicando o site da web de onde foi
retirado o conteúdo e/ou em que língua(s) pode esperar que o conteúdo apareça. Se o
mesmo site aparece em vários resultados diferentes, procure um que tenha o código do país
mais apropriado para as suas necessidades em termos de língua.
Fonte de publicação
A fonte de publicação de uma página está muitas vezes nomeada na URL, quer no domínio,
quer no pathway(pasta). Pergunte a si própio o seguinte:
o
Já ouviu falar desta fonte ? É credível?
o
Tem relação com o nome do “website” ? Precisa de ter?
o
O URL tem um nome pessoal inscrito no domínio de um ISP(Internet Service Provider –
Provedor de Serviços Internet) comercial ou outro provedor de web(como aol.com ou a
geocities.com), seguido de um til(~), um sinal de percentangem(%) ou das palavras
“users”(utentes) ou “member”(membro) ?
Isto é habitualmente indicação de que a página é pessoal(publicada pelo autor) e deve
investigar cuidadosamente o autor, porque não há nenhum editor ou proprietário de domínio
respondendo pela publicação desta página.
Construindo um banco de “links” personalizado e bem estruturado
Cada pesquisa de sucesso deve dar uma contribuição para as suas futuras pesquisas.
Usando bookmarks ou favorites pode recolher informação e benefício para a próxima vez.
Todos os pesquisadores de internet tem uma versão das suas características com
funcionalidades muito semelhantes. Isto dá-lhe possibilidade de registar o URL de qualquer
página ou consulta. Ao visitar uma página que pensa que lhe pode ser útil para uso futuro,
simplesmente escolha “add...” da barra do menu relevante. O URL é acrescentado a uma
lista e é habitualmente apresentado nesta lista como nome de página(que pode modificar se
quiser).
Esta é uma lista fácil de referenciar das suas páginas mais usadas. Mas com um pouco mais
de atenção, a lista pode tornar-se um valioso banco de recursos – o seu “gateway” de
informação pessoal. Fazendo um uso inteligente destas ferramentas de arquivo – pastas e
subpastas, pode organizar as suas referências num sistema lógico que faz da procura de
páginas uma tarefa rápida.
Last updated 4 July 2006
Available online from http://www.itrainonline.org/
10
Download