KIT DE TREINO MULTIMEDIA APONTAMENTOS SOBRE PESQUISA NA INTERNET Developed by: Anna Feldman, for the Association for Progressive Communications Sobre este documento Estes materiais são parte do Kit de Treino Multimedia (MMTK). O MMTK oferece um conjunto integrado de materiais de formação multimedia e recursos de apoio aos media comunitários, centros multimédia comunitários, telecentros, e outras iniciativas usando tecnologias de informação e comunicação (ICTs) para empoderar comunidades e apoiar o desenvolvimento. Informação Copyright Esta unidade esta disponivel sob licenca, NonCommercial-ShareAlike Licence de Creative Commons Creative Commons . Para saber comopodeusar estes materiais leia a declaracao de copyright incluida nesta unidade ou veja. http://creativecommons.org/licenses/by-nc-sa/1.0/legalcode Sobre esta unidade Esta unidade acompanha os participantes através do processo de compreender as prioridades envolvidas em procurar com sucesso informação na Internet. Vamos abordar a tarefa para: o Compreender mais sobre Internet como meio de encontrar informação. o Explorar forças e fraquezas das diferentes ferramentas de busca disponíveis: pegando as certas para a tarefa. o Aprender a usar adequadamente as ferramenta: : dúvidas sobre reformulação na forma adequada à ferramenta de busca. o Avaliar a informação dada pelas ferramentas de busca: aproveitando com eficiência os resultados mais relevantes. o Desenvolver uma estratégia para construir um banco de “links” personalizado e bem estruturado para futura referência, permitindo ao mesmo tempo ultrapassar as ferramentas de busca. . A Internet como um meio para procurar informação Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 1 Existem várias características distintas sobre como mapear e navegar a Internet, que vale a pena ter presentes antes de começar a nossa viagem para encontrar a informação que procuramos: o Na medida em que o conteúdo está constantemente a ser acrescentado e actualizado, não existem estatísticas exactas disponíveis relativas à quantidade de informação acessível na Internet – em 2001 calculava-se que tivesse 3 biliões de documentos. o Estes documentos não estão indexados em nenhum sistema normalizado. Ao contrário da maioria das bibliotecas, com os seus índices por assuntos, por autores e por títulos, a Web precisa que nós adivinhemos em que palavras-chave estão as páginas que queremos. o Não é possível pesquisar o WWW directamente. O seu computador não pode encontrar todas as páginas Web. Estas residem nos computadores “servidores” por todo o mundo. O que pode fazer no seu computador, usando os conhecimentos técnicos que vamos desenvolver nesta unidade, é aceder a alguns dos muitos motores de busca disponíveis e pô-los a fazer esse trabalho. o Uma ferramenta de busca deixa-o pesquisar a sua base de dados ou lista de sítios – este é um subsistema relativamente menor de todo o World Wid Web. A ferramenta de busca dá-lhe “links hypertext” com URLs para outras páginas. Clicando nestes “links” vamos buscar documentos, imagens, som, e outras coisas, de servidores individuais do mundo inteiro. Por detrás da mecânica de como a informação é armazenada e distribuida estão as pessoas que a produziram. São pessoas com as mesmas falhas das pessoas que produzem informação impressa. A existência de informação na Internet não a faz nem mais nem menos exacta do que se fosse publicada noutro lugar qualquer. Da mesma maneira, o conteudo só está na Internet se alguém achou que o devia lá colocar. Uma ideia não pode encontrar o seu caminho até à Internet sem ter um ser humano por de trás – por muito valiosa e procurada que essa ideia seja. Para começar – escolhendo a ferramenta de busca certa para a tarefa Há dezenas de ferramentas de busca acessíveis na Internet. Esta breve ronda vai dar-lhe a conhecer as bases das ferramentas disponíveis, mas só com a prática se adquire um conhecimento mais a fundo de uso destas ferramentas. Motores de busca Os motores de busca funcionam procurando através de um índice de uma base de dados que é compilada automáticamente por “spiders" (aranhas) que são programas de computador “robot” – não são pessoas. O motor de busca tenta combinar as suas palavraschave de pesquisa com palavras no texto de páginas web seleccionadas. A quantidade de conteúdo que os motores de busca pesquisam varia entre os que são pequenos e especializados até aos que cobrem mais de 90 por cento da web indexável. Conseguir bons resultados dos motores de busca depende só da sua familiaridade com a sintaxe e as características do motor de busca que está a usar, na medida em que isso é quase o tamanho do índice do motor de busca. Bom Para: Quando tem de ser exacto acerca daquilo que procura. Não é Bom Para: Quando precisa de ajuda na procura de um caminho que o conduza através de diferentes áreas de um assunto, e das quais podia não ter ideia no início da sua pesquisa. Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 2 Entre os motores de busca mais importantes estão: Google http://www.google.com/ alltheweb (chamado anteriormente "Fast Search") http://www.alltheweb.com/ AltaVista http://www.altavista.com/ O Google tem a base de dados do motor de busca mais abrangente, mas não há possibilidade de algum motor de busca encontrar toda a informação possível sobre um tópico. Motores de Meta-busca Também relevantes aqui são os motores de meta-busca que rápidamente podem fazer uma pesquisa através de vários motores de busca individuais de uma vez (habitualmente alcançam 10% dos resultados da busca em qualquer dos outros motores de busca que visitam). Isto significa que não há vantagem em usar a sintaxe de pesquisa mais avançada de qualquer motor de busca. Vale mais ficar por pesquisas simples, usando um único termo ou frase. SurfWax http://www.surfwax.com/ Ixquick http://www.ixquick.com/ Recursos de informação do tipo “gateway” Estes podem chamar-se Catálogos Internet, directórios por assunto, bibliotecas virtuais or gateways. São especializados em recursos num domínio específico, e tendem a ser pesquisáveis bem como organizados num formato hierarquizado. Alguns funcionam como um catálogo de recursos para uma domínio particular, enquanto outros são catálogos de catálogos. São sempre compilados por pessoas (em vez de indexados automáticamente) que organizam a informação de acordo com um sistema de classificação. Isto significa que se pode esperar que os items da lista foram peneirados e avaliados pela sua relevância e qualidade. Veja o exemplo no material de distribuição. Exemplos de sítios do tipo “gateway” são: ELDIS O “gateway” ELDIS para Informação do Desenvolvimento, serve de ponto central de acesso para guias de recursos, perfis de países, notícias, empregos, e outros recursos. http://www.eldis.org/ Biblioteca Virtual World Wide Web A Biblioteca Virtual World Wide Web descreve-se a si própria como “o mais antigo catálogo da Web, iniciado por Tim Berners-Lee, o criador da própria Web. Ao contrário dos catálogos comerciais, é gerida por uma confederação informal de voluntários, que compilam páginas de “links” fundamentais em determinadas áreas das quais eles são especialistas; embora não seja o maior índice na Web, as páginas da BV são largamente reconhecidas como estando entre os guias da mais alta qualidade para secções particulares da Web. Pode-se procurar na biblioteca por categoria ou ordem alfabética e também é pesquisável. http://www.vlib.org/ Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 3 SOSIG, Catálogo de Informação em Ciências Sociais Um serviço educacional dando acesso a fontes de alta qualidade para cientistas sociais. A informação está organizada em secções de assuntos que podem ser procurados e pesquisados. http://www.sosig.ac.uk/ Bases de Dados especializadas Há muitas bases de dados de informação que são acessíveis pelos utentes da Web mas não pelos “robots” que compilam os indices para motores de busca. Este tipo de informação forma aquilo que é conhecido por “web invisível”. Não está contida em páginas convencionais da web, mas tem um conteúdo gerado dinamicamente, que é movido para as páginas web por bases de dados quando é requerido. É chamado "invisível" porque está fora do alcance dos “spiders” e das suas ferramentas de busca. Pode-se encontrar este tipo de conteúdo em directórios de assuntos mas em geral é preciso saber onde aceder às próprias bases de dados para encontrar a informação lá dentro. São geralmente pesquisáveis pelos métodos normais de busca e variam à medida que a sua pesquisa é mais elaborada e avançada. É bom se: Sabe onde encontrar uma base de dados que trata da sua area de interesse. Não é bom se: Se a sua pesquisa é mais alargada que aquilo que a base de dados em causa contem. Aprendendo a usar apropriadamente as ferramentas Vamos adoptar uma estratégia que vai clarificar o seu pensamento sobre o seu tópico, ajudar a conseguir bons resultados e também poupar tempo precioso “on-line”. Esta estratégia funciona através de 7 estágios: Estágio 1. Desdobrando a pergunta Faça perguntas a si mesmo para tornar a sua questão mais clara. Por exemplo: se está interessado em informação sobre refugiados, faça a si próprio perguntas do tipo : o Há paises particularmente relevantes para o meu interesse em refugiados? o Quero saber sobre serviços disponíveis para refugiados, legislação afectando refugiados, organizações fazendo campanhas por intermédio dos refugiados ou investigação geral na area de estudos sobre refugiados? o Estou interessado em questões actuais sobre refugiados ou o meu interesse é mais de carácter histórico? Tente colocar a sua pergunta numa frase, por exemplo o Serviços de defesa legal para refugiados Somali no Reino Unido Divida a sua frase em Conceitos: Conceito 1 Serviços legais Conceito 2 Refugiados Somali Conceito 3 Reino Unido Tenha em atenção outros conceitos que também possam ser usados para descrever os conceitos. Isto inclui diferentes grafias e sinónimos. Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 4 Pensando em termos alternativas de pesquisa, pode desenvolver uma série de termos para usar em conjunção com as características de várias ferramentas de pesquisa. Conceito 1 Serviços legais Consultoria de migração Requerentes de asilo Conceito 2 Refugiados Somali Emigrados Somali Conceito 3 Reino Unido Grã-Bretanha Inglaterra Estágio 2. Pondo a questão numa frase: introdução à sintaxe da pesquisa Sintaxe da pesquisa é o método que usamos para ligar os conceitos de modo adequado à pesquisa. Diferentes ferramentas de pesquisa oferecem diferentes opções para refinar pesquisas e podem usar diferentes sintaxes ou linguagens. Alguns motores de busca permitem-lhe refinar a sua pesquisa seleccionando entre um número de opções da linguagem natural tais como "procure todas as palavras," "procure quaisquerpalavras" ou "não deve incluir". Outros precisam que use quer “matemática de pesquisa” quer lógica Boolean para refinar a sua pesquisa. Aprendendo e aplicando estas bases, a sua pesquisa torna-se considerávelmente mais eficaz. Os princípios básicos são os mesmos para a maioria dos motores de busca, mas podem usar versões ligeiramente diferentes de sintaxe de busca. Em caso de dúvida leia a página da ajuda (help) da ferramenta de pesquisa que estiver a usar. Tenha em atenção que embora a maioria das facilidades de pesquisa ignorem o caso (gramatical), não acontece com todas. Muitos motores de busca ignoram palavras comuns como “the” e “in” etc. Estas são conhecidas como "stop words". Matemática de pesquisa Refere-se aos símbolos matemáticos comuns como modo de refinar a pesquisa. Use + (sinal de mais) à frente de cada termo que deve aparecer nos seus resultados de pesquisa. Por exemplo, se está a procurer informação sobre como o preço do café está a ter impacto nos salaries dos apanhadores de café +café +apanhadores +preço + salários Garantirá que todos os resultados incluam todos os termos: café, preços, apanhadores, salaries – e não traga os Cafés (da cidade) os apanhadores de algodão, ou os salários dos contabilistas da Price Waterhouse. Use - (sinal de menos) à frente de cada termo, que não deve aparecer no resultado da sua pesquisa. Usando o mesmo exemplo como acima, pode entrar +café - chávena - algodão Use " " (aspas) à volta das palavras que quer marcar como uma frase. Por exemplo, "apanhadores de café" "refugiados somali" "pinguim imperador" Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 5 Use * (asterisco) para truncar. 1 Por exemplo se quer pesquisar sobre educação, educadores, educar etc., entre educ* Lógica Boolean Alguns motores de busca usam os operadores Boolean "AND," "OR" e "NOT" para refinamento de pesquisa. Os operadores Boolean devem geralmente ser escritos em maiúsculas. Use AND para requerer que apareça mais de um termo em todos os resultados da pesquisa. Por exemplo entrando imperador AND pinguim encontrará páginas com ambos os termos. Use OR se quer que todos os resultados da sua pesquisa incluam qualquer dos termos (ou ambos) Isto pode ser útil se houver grafias alternatives (por exemplo "organization" e "organisation" ou sinónimos (paludismo e malária) para as palavras. Para encontrar todas as páginas que contêm a palavra “paludismo” ou a palavra "malária" (ou ambas), entre malária OR paludismo Use NOT para excluir termos que não quer que venham nos seus resultados da pesquisa 2 . 3 4 Por exemplo, se procura informação sobre “marfim de elefante” mas não tinta cor-de-marfim, pode entrar marfim NOT cor Alguns motores de busca permitem o uso de “operador de proximidade” NEAR tanto quanto os três operadores Boolean. Onde uma pesquisa sobre sul AND africa pode conduzi-lo a uma página com "sul" no topo e "africa" no fundo, entrando sul NEAR africa assegura que os termos aparecem próximos um do outro. Nem todas as ferramentas de pesquisa permitem isto – veja a página de ajuda do motor de busca que está a usar. 1 Nem todos os motores de busca permitem esta truncagem com asterisco. Veja a página da ajuda da ferramenta de pesquisa que está a usar. 2 4 Some search engines use AND NOT instead of NOT. Check the help page of the search tool you are using. Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 6 With your search query unpacked into a syntactically correct format, we can now proceed through the next Estágios of the search using this table: Estágio 3. Categorising the query. Estágio 4. Matching the tool to the query Try to match the right tool to the type of search query you are working on. Think about the way that the tool will work on your query and re-phrase the query to get the most out of the tools. Try a variety of tools – use general tools to find subject-specific ones. Type of Search Query Includes clearly distinctive words or phrases (about which there can be no misunderstanding). Examples o “Black history month” o “Sleeping sickness” o “Robusta coffee” o “Fair trade” +chocolate Includes common or general terms that seem to get numerous inappropriate results. o o o o Looks for a broad overview of a subject area. o o o o Looks for a narrowly focused part of a broad subject. o o o Weekend break Taj Mahal Campaigning techniques Study abroad Afro-Caribbean diaspora history Intellectual property rights Lone parenting Rain forest ecology Statistics on domestic violence in Soweto Migration patterns of Emperor penguins in the Antarctic Grass-roots ICT projects in Africa Search Engine Place the words or phrase in speech marks (“”), to make sure that the search engine looks for those words strung together exactly as you have specified. Think about which terms might develop your query to remove the ambiguity. Go back to the lists of Conceitos you made in staqe 1 and try making ithemmore specific A search engine is inappropriate for this type of search. Subject Directory Try and think around your phrase – look at the available categories and identify which one(s) it may belong to. Think about re-phrasing your query into a structure that includes Boolean search terms – AND, OR, NOT etc. These will help the tool focus the search and deliver less "junk". Look for a subject directory that covers the broad subject and move through its hierarchy of categories to home in on your specific query. Use the subject directory’s pre-defined subject categories to guide you and help articulate a clearer search query. Best results will be achieved by finding a specialist subject directory that covers your area. Specialist Database If you are searching for: o Data o Facts o Statistics o Schedules o Maps etc. then specialist databases can help you with any of the example search queries. Use a subject directory or a search engine as your starting point to find the appropriate database – i.e. start with the visible web and use it to find a signpost to an entry point into the "invisible web". Be imaginative about the routes you take through information on the Internet. Estágio 5. Ask a human being! If you can’t find what you want from a search tool, ask a person. Remember ,the tools don’t have brains – people do! If you have found a specialised subject directory on your topic, but it doesn’t contain what you want, look for an email link to a relevant resource person, or the author of a good page you find. Alternatively ask a discussion group or expert. Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 7 Could be spelled or phrased in a variety of alternative ways o o o o o o “Falkland Islands” OR Malvinas “New Zealand” OR Aotearoa Cassava OR manioc Aubergine OR eggplant OR brinjal “Freedom of speech” OR “press freedom” OR st “anti-censorship” OR “1 amendment” “Female genital mutilation” OR FGM OR cliterodectomy OR “female circumcision” Use the Boolean search term OR to enable searching for information under alternative labels. Specialist subject directories may accommodate alternative labelling, but the more general ones are likely to be inappropriate for this type of search. Esta estratégia de cinco estágios é uma forma forte de abordar a pesquisa na internet e leva-o certamente o mais próximo possível de encontrar aquilo que procura. Mas com a internet não há garantias, razão pela qual pode precisar de considerar outro estágio para a pesquisa. Pesquisando Internet Handout Ultima Actualizacao 31de Junho 2006 Disponível Online http://www.itrainonline.org/ 8 Estágio 6. Se à primeira não conseguiu – tente outra vez! Não se sinta desencorajado quando a ferramenta que escolheu não o leva aos resultados perfeitos. Para chegar a ser um pesquisador de internet habilitado, implica recapitular os passos dados e procurar as voltas que pode ter perdido, ou re-formular e mesmo re-pensar a sua procura. Pode ficar mais rapidamente habilitado adaptando as suas questões à ferramenta que esta usando. Estágio 7. Avaliando resultados da pesquisa "pense antes de clicar" A cultura do “controlo editorial” que procura estabelecer normas no mundo da imprensa, está muitas vezes ausente da “web”. Enquanto a liberdade da “web” é aquilo que a torna tão rica e compensadora para nós que recolhemos informação, é esta mesma liberdade que nos deve alertar para a necessidade de questionar a exactidão e validade de tudo o que encontramos. Isto leva-nos à próxima parte da estratégia da pesquisa: Olhar inteligentemente para as URLs nos resultados encontrados pela ferramenta de pesquisa capacita-o a fazer selecções mais relevantes a partir da lista, tornando a busca mais eficiente. Precisamos de começar por compreender a anatomia de uma URL(Uniforme Resource Locator – Localizador de Recursos Uniforme): http://www.hrw.org/press/2003/02/powell20303.htm O tipo de protocolo: neste caso hypertext transfer protocol http:// www. Indica o World Wide Web hrw.org O domain name ()nome do domínio) do site da web. press/2003/02/powell20303 .htm Mostra a localização, ou “caminho” para a página. Esta página está numa pasta chamada 02 que está dentro duma pasta chamada 2003 que está dentro duma pasta chamada imprensa(press). Esta pasta está dentro da pasta www.hrw.org. Um “/” é usado para separar diferentes níveis de armazenamento da informação (pastas) no site da web. O nome da página no ficheiro do computador. Extensão do ficheiro mostrado de que tipo é – este é htm (hypertext mark-up language). /powell20303.htm htm O que está numa URL? Tipos de domínios O domínio que um “website” usa pode indicar as características do conteúdo relativamente a sua pesquisa. o o o Sites do governo: procure .go, .gov, .mil Sites educacionais: procure .edu, .ac Organizações não-comerciais: procure .org Last updated 4 July 2006 Available online from http://www.itrainonline.org/ 9 Assim, se procuram as vozes dos dissidentes da Indonésia, provavelmente não chega ao cerne da sua busca em páginas onde a URL usa o domínio .gov ou .mil. No entanto, estas páginas podem conter informação periférica relevante para si. O domínio também pode conter o código de um país indicando o site da web de onde foi retirado o conteúdo e/ou em que língua(s) pode esperar que o conteúdo apareça. Se o mesmo site aparece em vários resultados diferentes, procure um que tenha o código do país mais apropriado para as suas necessidades em termos de língua. Fonte de publicação A fonte de publicação de uma página está muitas vezes nomeada na URL, quer no domínio, quer no pathway(pasta). Pergunte a si própio o seguinte: o Já ouviu falar desta fonte ? É credível? o Tem relação com o nome do “website” ? Precisa de ter? o O URL tem um nome pessoal inscrito no domínio de um ISP(Internet Service Provider – Provedor de Serviços Internet) comercial ou outro provedor de web(como aol.com ou a geocities.com), seguido de um til(~), um sinal de percentangem(%) ou das palavras “users”(utentes) ou “member”(membro) ? Isto é habitualmente indicação de que a página é pessoal(publicada pelo autor) e deve investigar cuidadosamente o autor, porque não há nenhum editor ou proprietário de domínio respondendo pela publicação desta página. Construindo um banco de “links” personalizado e bem estruturado Cada pesquisa de sucesso deve dar uma contribuição para as suas futuras pesquisas. Usando bookmarks ou favorites pode recolher informação e benefício para a próxima vez. Todos os pesquisadores de internet tem uma versão das suas características com funcionalidades muito semelhantes. Isto dá-lhe possibilidade de registar o URL de qualquer página ou consulta. Ao visitar uma página que pensa que lhe pode ser útil para uso futuro, simplesmente escolha “add...” da barra do menu relevante. O URL é acrescentado a uma lista e é habitualmente apresentado nesta lista como nome de página(que pode modificar se quiser). Esta é uma lista fácil de referenciar das suas páginas mais usadas. Mas com um pouco mais de atenção, a lista pode tornar-se um valioso banco de recursos – o seu “gateway” de informação pessoal. Fazendo um uso inteligente destas ferramentas de arquivo – pastas e subpastas, pode organizar as suas referências num sistema lógico que faz da procura de páginas uma tarefa rápida. Last updated 4 July 2006 Available online from http://www.itrainonline.org/ 10