todobr - DCC/UFMG

Propaganda
todobr
1
1
FERNANDA CHRISTNA , JOCÉLIA RANGEL
,
1
UFMG – Escola de Ciência da Informação, Curso de Biblioteconomia, Disciplina de Introdução à Informática,
Av. Antônio Carlos, 6627, 31270-010, Belo Horizonte, MG, Brasil
[email protected] [email protected]
Resumo. Este artigo visa apresentar uma máquina de busca, que foca a internet brasileira. Procura-se explicar o
que é uma máquina de busca, além de justificar o porquê do desenvolvimento do todobr e mostrar o seu
funcionamento.
1.
Introdução
O todobr é uma máquina de busca, ou seja, é um sistema
que têm por objetivo encontrar informação de interesse
dos usuários na World Wide Web. Em termos gerais, ele
coleta periodicamente os dados disponíveis na Web e
constróe uma grande base de dados que é processada para
aumentar a rapidez na recuperação de informação.
Brasil, tanto em termos de cobertura da Web brasileira (a
base do todobr, em constante crescimento, já inclui mais
de 10 milhões de páginas), quanto em termos de precisão e
de qualidade das respostas geradas. Logotipo da máquina
de busca é apresentado na figura 1.
O todobr, assim como todas as máquinas de busca,
possibilitam encontrar informação na internet, uma vez
que há mais de um bilhão de páginas espalhadas em todo o
mundo.
2.
O todobr
É compreensível que, para um melhor entendimento do
todobr,
torna-se
imprescindível
descrever
as
características do mesmo, além de discorrer sobre a sua
crição.
2.1
Como surgiu
O todobr possui tecnologia de classe mundial inteiramente
proprietária, tendo características de abrangência,
velocidade de busca e precisão de resultados que a
diferenciam de qualquer outra máquina de busca com foco
na internet brasileira.
Está máquina foi desenvolvida pelo grupo que atua
na área de Recuperação de Informação no Departamento
de Ciência da Computação da UFMG [1] e no
Departamento de Ciência de Computação da Universidade
do Chile, em Santiago, onde está disponível a máquina de
busca TodoCl (www.todocl.cl) [2] sobre a internet chilena.
O todobr foi colocado para uso público em
Novembro de 1999, permanecendo dentro dos
laboratórios da UFMG como site experimental até o final
de Maio de 2000. No início de Junho de 2000, o todobr
sai dos muros da Universidade para se transformar no
empreendimento comercial todobr S.A, consolidando as
suas caraterísticas de máquina de busca mais completa do
Figura 1. Logotipo do todobr
2.2
O porquê do seu desenvolvimento.
Um dos problemas mais comuns dos internautas que
procuram informação nas máquinas de busca da Web
brasileira está relacionado com a baixa qualidade das
respostas encontradas, principalmente pelo fato de as
máquinas de busca genéricas, como AltaVista, Excite,
Google, Yahoo, dentre outras, incluírem páginas Web de
todos os países. Se o usuário estiver interessado em
efetuar uma busca no Brasil, a qualidade das respostas
destas máquinas de busca genéricas é, na melhor das
hipóteses, sofrível. O todobr resolve este problema porque
dedica-se exclusivamente à busca de informação dentro da
Web brasileira, dentro do conceito de busca vertical,
melhorando extraordinariamente a qualidade das
respostas.
2.3
Sobre o seu funcionamento.
Ao contrário das meta-ferramentas de busca, que precisam
buscar as páginas remotamente no momento da consulta, o
todobr coleta periodicamente a quase totalidade das
páginas da Web brasileira e efetua localmente a busca,
assim acelerando a localização de qualquer informação
disponível no Brasil. Dentre as vantagens e características
técnicas do todobr pode-se citar que: o todobr focaliza o
conjunto de documentos a pesquisar, retornando respostas
precisas e de maior relevância para o usuário, além de
coletar e armazenar permanentemente toda a internet
brasileira, o que garante cobertura completa de todos os
sites ".br"; o sistema de coleta de páginas do todobr
representa o estado da arte em termos mundiais e, por isto,
é capaz de revisitar todos os documentos da Web
brasileira em poucos dias.
com a busca por estados (ou regiões) e a busca por
acentos, levando diretamente à informação desejada;
todobr utiliza algoritmos originais de compressão no
estado da arte, acelerando extraordinariamente o
processamento de consultas.
Faz-se necessário ressaltar que a máquina de busca
do todobr permite ao usuário buscar informação
focalizando qualquer estado ou região do Brasil,
aumentando dramaticamente a qualidade das respostas.
Pode-se, por exemplo, localizar pessoas mais rapidamente
e evitar encontrar muitos homônimos informando o estado
onde moram; a máquina de busca do todobr permite a
formulação de consultas utilizando palavras acentuadas,
melhorando a qualidade das respostas. Pode-se, por
exemplo, buscar páginas sobre o pássaro sabiá ou sobre o
atleta Pelé. Esta é outra característica exclusiva da
tecnologia desenvolvida; o todobr permite também que o
usuário procure por ocorrências de frases exatas como "ah,
se ela soubesse que quando ela passa". Consultas por
frases são muito importantes para localizar, por exemplo,
receitas culinárias, letras de músicas e documentos legais.
Além disso, a busca por frases exatas pode ser combinada
3. Conclusão
Pode-se observar que, o todobr, é uma máquina de busca
muito interessante, pois, evidencia informações relevantes
ao público brasileiro, além de apresentar meios fáceis de
se fazer buscas na Web.
Agradecimentos
Gostaríamos de agradecer a Ramurti de Alencar Barbosa
integrante da empresa Akwan que forneceu informações
sobre a composição do todobr.
Referências
[1] www.dcc.ufmg.br, site do Departamento de Ciência da
Computação, visitado em 05/05/05, 19hs.
[2] www.todocl.cl, site do todocl visitado em 15/05/05,
20hs.
Download