todobr 1 1 FERNANDA CHRISTNA , JOCÉLIA RANGEL , 1 UFMG – Escola de Ciência da Informação, Curso de Biblioteconomia, Disciplina de Introdução à Informática, Av. Antônio Carlos, 6627, 31270-010, Belo Horizonte, MG, Brasil [email protected] [email protected] Resumo. Este artigo visa apresentar uma máquina de busca, que foca a internet brasileira. Procura-se explicar o que é uma máquina de busca, além de justificar o porquê do desenvolvimento do todobr e mostrar o seu funcionamento. 1. Introdução O todobr é uma máquina de busca, ou seja, é um sistema que têm por objetivo encontrar informação de interesse dos usuários na World Wide Web. Em termos gerais, ele coleta periodicamente os dados disponíveis na Web e constróe uma grande base de dados que é processada para aumentar a rapidez na recuperação de informação. Brasil, tanto em termos de cobertura da Web brasileira (a base do todobr, em constante crescimento, já inclui mais de 10 milhões de páginas), quanto em termos de precisão e de qualidade das respostas geradas. Logotipo da máquina de busca é apresentado na figura 1. O todobr, assim como todas as máquinas de busca, possibilitam encontrar informação na internet, uma vez que há mais de um bilhão de páginas espalhadas em todo o mundo. 2. O todobr É compreensível que, para um melhor entendimento do todobr, torna-se imprescindível descrever as características do mesmo, além de discorrer sobre a sua crição. 2.1 Como surgiu O todobr possui tecnologia de classe mundial inteiramente proprietária, tendo características de abrangência, velocidade de busca e precisão de resultados que a diferenciam de qualquer outra máquina de busca com foco na internet brasileira. Está máquina foi desenvolvida pelo grupo que atua na área de Recuperação de Informação no Departamento de Ciência da Computação da UFMG [1] e no Departamento de Ciência de Computação da Universidade do Chile, em Santiago, onde está disponível a máquina de busca TodoCl (www.todocl.cl) [2] sobre a internet chilena. O todobr foi colocado para uso público em Novembro de 1999, permanecendo dentro dos laboratórios da UFMG como site experimental até o final de Maio de 2000. No início de Junho de 2000, o todobr sai dos muros da Universidade para se transformar no empreendimento comercial todobr S.A, consolidando as suas caraterísticas de máquina de busca mais completa do Figura 1. Logotipo do todobr 2.2 O porquê do seu desenvolvimento. Um dos problemas mais comuns dos internautas que procuram informação nas máquinas de busca da Web brasileira está relacionado com a baixa qualidade das respostas encontradas, principalmente pelo fato de as máquinas de busca genéricas, como AltaVista, Excite, Google, Yahoo, dentre outras, incluírem páginas Web de todos os países. Se o usuário estiver interessado em efetuar uma busca no Brasil, a qualidade das respostas destas máquinas de busca genéricas é, na melhor das hipóteses, sofrível. O todobr resolve este problema porque dedica-se exclusivamente à busca de informação dentro da Web brasileira, dentro do conceito de busca vertical, melhorando extraordinariamente a qualidade das respostas. 2.3 Sobre o seu funcionamento. Ao contrário das meta-ferramentas de busca, que precisam buscar as páginas remotamente no momento da consulta, o todobr coleta periodicamente a quase totalidade das páginas da Web brasileira e efetua localmente a busca, assim acelerando a localização de qualquer informação disponível no Brasil. Dentre as vantagens e características técnicas do todobr pode-se citar que: o todobr focaliza o conjunto de documentos a pesquisar, retornando respostas precisas e de maior relevância para o usuário, além de coletar e armazenar permanentemente toda a internet brasileira, o que garante cobertura completa de todos os sites ".br"; o sistema de coleta de páginas do todobr representa o estado da arte em termos mundiais e, por isto, é capaz de revisitar todos os documentos da Web brasileira em poucos dias. com a busca por estados (ou regiões) e a busca por acentos, levando diretamente à informação desejada; todobr utiliza algoritmos originais de compressão no estado da arte, acelerando extraordinariamente o processamento de consultas. Faz-se necessário ressaltar que a máquina de busca do todobr permite ao usuário buscar informação focalizando qualquer estado ou região do Brasil, aumentando dramaticamente a qualidade das respostas. Pode-se, por exemplo, localizar pessoas mais rapidamente e evitar encontrar muitos homônimos informando o estado onde moram; a máquina de busca do todobr permite a formulação de consultas utilizando palavras acentuadas, melhorando a qualidade das respostas. Pode-se, por exemplo, buscar páginas sobre o pássaro sabiá ou sobre o atleta Pelé. Esta é outra característica exclusiva da tecnologia desenvolvida; o todobr permite também que o usuário procure por ocorrências de frases exatas como "ah, se ela soubesse que quando ela passa". Consultas por frases são muito importantes para localizar, por exemplo, receitas culinárias, letras de músicas e documentos legais. Além disso, a busca por frases exatas pode ser combinada 3. Conclusão Pode-se observar que, o todobr, é uma máquina de busca muito interessante, pois, evidencia informações relevantes ao público brasileiro, além de apresentar meios fáceis de se fazer buscas na Web. Agradecimentos Gostaríamos de agradecer a Ramurti de Alencar Barbosa integrante da empresa Akwan que forneceu informações sobre a composição do todobr. Referências [1] www.dcc.ufmg.br, site do Departamento de Ciência da Computação, visitado em 05/05/05, 19hs. [2] www.todocl.cl, site do todocl visitado em 15/05/05, 20hs.