Implementação e Análise de Desempenho de clusters de PCs usando aplicações OLAP sobre Bancos de Dados Espaciais Dados do Projeto e do Proponente Sigla do Projeto: CG-OLAP Título do Projeto: Implementação e Análise de Desempenho de clusters de PCs usando aplicações OLAP sobre Bancos de Dados Espaciais Referência da Chamada: Edital Universal – MCT/CNPq 02/2006 Proponente: Prof. Fernanda Araujo Baião Amorim Endereço para Contato: Departamento de Informática Aplicada Av. Pasteur 458, Urca, 22290-240, Rio de Janeiro, RJ http://www.uniriotec.br Instituição Vinculada: Universidade Federal do Estado do Rio de Janeiro UNIRIO http://www.unirio.br Resumo Este projeto de pesquisa visa investigar e propor métodos e ferramentas computacionais para processar, de modo eficiente, consultas que envolvam grandes massas de dados através de sistemas de banco de dados sobre clusters de PCs. 1. Introdução O aspecto de desempenho de sistemas de informação tem se tornado cada vez mais crítico nas organizações, em função do crescente volume de dados manipulado pelos sistemas e da complexidade das requisições feitas à base de dados. Em especial, a crescente utilização de Data Warehouse (DW) nas organizações torna cada dia mais freqüentes as aplicações de alto custo em tempo de consulta, como as aplicações denominadas OLAP (On Line Analytical Processing), típicas de ambientes voltados para diretores e gerentes, que precisam tomar decisões rápidas baseadas em análises complexas, de natureza não previsível (ad-hoc), sobre um grande volume de dados [Gorla, 2003]. As aplicações OLAP têm como objetivo fornecer aos tomadores de decisão a informação na forma mais palatável possível, no nível de precisão mais adequado [Barbieri, 2001]. A característica principal dessas consultas é demandar muito tempo de processamento envolvendo varreduras desse grande volume de dados, e atualizações pouco freqüentes [TPC, 2003]. A otimização de bancos de dados para suporte a consultas em ambientes de Data Warehousing é mais complexa, uma vez que elas não são predefinidas. Torna-se, então, mais difícil escolher as estruturas de acesso a serem criadas e as formas de organização dos registros em disco, entre outras. A materialização das agregações mais utilizadas nas consultas é, muitas vezes, utilizada como solução para melhorar o tempo de resposta das aplicações OLAP, gerando, em contrapartida, uma sobrecarga de armazenamento além do próprio DW que, por si só, usualmente é um depósito gigantesco de dados. Adicionalmente, desde a década de 1980, sistemas de informação geográficos (Geographical Information Systems - GIS) têm sido usados também como ferramentas de suporte a tomadas de decisão em diferentes contextos e aplicações. São sistemas automatizados usados para armazenar, analisar e manipular dados geográficos, ou seja, dados que representam objetos e fenômenos em que a localização geográfica é uma característica inerente à informação e indispensável para analisá-la [Aronoff 1989, Câmara et al 1997, Longley et al 2001]. Um GIS armazena e manipula dados com referências geográficas em bancos de dados espaciais, permitindo a execução de operações geométricas e a análise dos dados espaciais com a produção de mapas. Pela natureza dos dados geo-referenciados, o volume de armazenamento tende a ser grande, assim como no ambiente de Data Warehousing. Mais recentemente, pesquisas têm focado a integração das tecnologias de OLAP e GIS, visando a extensão do conceito de cubo de dados no domínio espacial [Shekar et al. 2001], ou a interconexão de aplicações OLAP e GIS desenvolvidas separadamente [Kouba, Matousek and Miksovsky 2000, Fidalgo, Times and Souza 2001], ou o desenvolvimento de aplicações OLAP espaciais [Han, Stefanovic and Koperski 1998, Papadias et al. 2001]. Nesta última abordagem de integração, enquadra-se o projeto em desenvolvimento denominado GeoOLAP [Colonese et. al 2005], que utiliza o Sistema de Gerência de Bancos de Dados (SGBD) PostgreSQL [PostgreSQL] com sua extensão geográfica [PostGIS] e integra a iniciativa “PostgreSQL for Business Intelligence and Datawarehousing” [Bizgres], assim como a comunidade de desenvolvimento livre do PostgreSQL [PGFoundry]. Segundo dados do Open GeoSpatial Consortium [OGC 2006], mais de 80% das informações comerciais ou governamentais possuem algum tipo de referência espacial. Daí a justificativa dessa integração, permitindo o processamento analítico mais completo, envolvendo as dimensões temporal e espacial, o que aumenta significativamente o volume de armazenamento e a complexidade de manipulação dos dados por SGBDs. Tradicionalmente, o problema de desempenho de aplicações sobre grandes volumes de dados tem sido endereçado através de processamento paralelo, com a substituição da plataforma de hardware e software por componentes de maior capacidade computacional (como servidores e SGBDs paralelos) e a correspondente adaptação da aplicação do ambiente seqüencial para o ambiente paralelo. Nesta situação, a migração de uma aplicação é bastante complexa, e muitas vezes inviável, uma vez que pode requerer alterações no código-fonte. Além disso, esta solução representa alto custo para a organização, tanto para a aquisição/expansão do ambiente computacional quanto para a migração da aplicação. Uma alternativa mais barata é a utilização de clusters de PCs. Nesta plataforma, o processamento paralelo pode ser então implementado através da aquisição de software ou hardware específico e otimizado para funcionar sobre osclusters de PCs, como os SGBDs paralelos ou as unidades centrais de armazenamento (SAN – Storage Area Network) [MySQL Cluster]. Soluções proprietárias seguindo esta abordagem incluem o Oracle Real Application Clusters e o DB2 Parallel Edition, que apesar de explorar o paralelismo do cluster, tornam a migração muito custosa e impedem a autonomia de cada nó do cluster. Uma abordagem alternativa, denominada “cluster de bancos de dados” [Röhm et al., 2002], implementa o paralelismo de forma transparente, utilizando SGBDs seqüenciais nos nós de um cluster como componentes do tipo “caixapreta”, ou seja, sem modificar seu código-fonte para incluir funcionalidades que melhorem sua utilização em clusters, e sem nenhuma otimização específica para o funcionamento sobre o cluster de PCs. Essa abordagem evita o alto custo de migração das aplicações e dos bancos de dados, existente nos SGBDs paralelos, e é utilizada pelos projetos Pargres [Mattoso et al 2005a, 2005b], C-JDBC [Cecchet et al., 2004] e o PowerDB [Röhm et al., 2002]. No entanto, não existem estudos comparativos entre as duas abordagens. 2. Objetivos e Metas Este projeto de pesquisa visa investigar e propor métodos e ferramentas computacionais para desenvolver e executar, de modo eficiente, aplicações que envolvam grandes volumes de dados armazenados em sistemas de banco de dados geográficos instalados em clusters de PCs. A arquitetura do ambiente computacional a ser utilizado neste projeto é ilustrada na figura abaixo. Cluster de PCs PostgreSQL SGBD DW PostgreSQL SGBD DW Aplicação Geo-OLAP (clientes) Camada Intermediária PostgreSQL SGBD DW PostgreSQL SGBD DW PostgreSQL SGBD DW Pretende-se realizar investigações nas 3 camadas do ambiente computacional do projeto, a saber, na aplicação OLAP, no SGBD e no cluster de PCs: Experimentação com DW geográfico, desenvolvido sobre o SGBD PostgreSQL estendido com as funcionalidades espaciais do PostGIS e com as funcionalidades OLAP do Bizgres. O desenvolvimento e a implantação da aplicação contarão com a parceria da empresa OpenGeo Consultoria. Nesta camada, o objetivo específico será analisar o desempenho da aplicação e propor aperfeiçoamentos no âmbito da comunidade de desenvolvimento livre PGFoundry. Definição de uma arquitetura eficiente para processamento paralelo sobre o cluster de PCs. Para isso, serão realizados testes de desempenho comparando a arquitetura de clusters de bancos de dados com a arquitetura de SGBDs específicos para clusters de PCs. Testes com diferentes protocolos de comunicação usados entre o nó mestre e os nós escravos, desenvolvendo ferramenta para modelagem, monitoração e estudo da latência entre os nós. Nesta camada, o objetivo específico será analisar o tráfego de dados no cluster de PCs. É importante observar que o ambiente computacional montado para este projeto terá uma utilização e produção mais ampla do que o escopo do presente projeto. O Departamento de Informática Aplicada da UNIRIO possui um Programa de Pós-Graduação em Informática (Mestrado na área de Sistemas de Informação), recentemente recomendado pela CAPES e aprovado na UNIRIO, cujas atividades terão início em março de 2007. Duas linhas de pesquisa do programa, a saber, “Distribuição e Redes” e “Sistemas de Apoio a Negócios”, serão beneficiadas diretamente pelos resultados do presente projeto. Portanto, o ambiente de cluster de PCs também servirá para o desenvolvimento da pesquisa dos alunos de mestrado que forem trabalhar nessas linhas de pesquisa. Também cabe ressaltar que o CCET/UNIRIO, pela sua natureza multidisciplinar, tem buscado privilegiar o desenvolvimento de software livre em domínios de aplicação em que a UNIRIO possui tradição acadêmica estabelecida (Teatro, Música e Área de Saúde). Este projeto, em particular, tem potencial para aplicação em gerenciamento de DW de ensaios clínicos, uma área essencial na pesquisa em Informática Médica. Como resultado prático do projeto, destaca-se o benefício direto das organizações públicas ou privadas que venham a adotar as soluções propostas, nas três camadas. Numa área particularmente carente de soluções de baixo custo para as organizações, o desenvolvimento totalmente realizado com a utilização de software livre, e com a filosofia de desenvolvimento cooperativo adotado pela comunidade de software livre, tornará os produtos do projeto disponíveis na medida em que forem sendo publicados. As metas do projeto incluem: 3 trabalhos finais de graduação 1 dissertação de mestrado 2 artigos submetidos para conferência nacional indexada 3. Metodologia e Estratégia de Ação As tarefas propostas serão realizadas durante o período de dois anos, segundo uma metodologia baseada nas seguintes atividades: Primeiro ano: a) Instalação e teste do ambiente de cluster de PCs; b) Instalação do SGBD PostgreSQL com suas extensões PostGIS e Bizgres em todos os nós do cluster; c) Modelagem, desenvolvimento e instalação de ferramenta de monitoração do cluster; d) Instalação do middleware Pargres e de outras soluções de paralelismo em clusters; e) Instalação da ferramenta PostGeoOLAP; f) Desenvolvimento da aplicação OLAP com carga de dados analíticos e geográficos; g) Testes e análise de desempenho nas três camadas da arquitetura; h) Estudo comparativo das soluções de middleware analisadas; i) Identificação dos pontos de melhoria e desenvolvimento de soluções nas três camadas. Segundo ano: j) Desenvolvimento de aplicações em outros domínios; k) Prosseguimento das atividades g), h), i) do primeiro ano; l) Apresentação e publicação de artigos. A avaliação do andamento do projeto será realizada semanalmente (através de reunião entre pesquisadores, alunos e colaboradores) e semestralmente através de relatórios técnicos parciais que apresentarão as atividades desenvolvidas, os resultados obtidos e os próximos passos do projeto. Ao longo do desenvolvimento do projeto, serão gerados subprodutos acadêmicos materializados em projetos de graduação e dissertações de mestrado. Ao final do projeto, será apresentado um relatório técnico-científico detalhando as atividades executadas no projeto e os resultados obtidos. 4. Trabalhos Relacionados Na área de integração de aplicações OLAP e GIS, foram mencionados anteriormente os trabalhos: projeto MapCube [Shekar et al. 2001], projeto GOAL (Geographical Information On Line Analysis) [Kouba, Matousek and Miksovsky 2000], projeto GOLAPA (Geographical On-Line Analytical Processing Architecture) [Fidalgo, Times and Souza 2001], projetos de DW espacial em [Han, Stefanovic and Koperski 1998] e [Papadias et al. 2001], e a ferramenta PostGeoOLAP [Colonese et al. 2005]. Além desses trabalhos, pode-se mencionar também o projeto de Data Mining Espacial denominado GeoMiner [Stefanovic 1997], que propôs extensões ao esquema estrela de DW de forma a prover ponteiros para objetos espaciais aos itens de tabelas fatos e dimensões. E o projeto GISOLAP [Ferreira, Campos e Tanaka 2001], que propôs um modelo de integração baseado em metadados. A ferramenta PostGeoOLAP é uma evolução em relação ao projeto GISOLAP, pois independe da existência de aplicações GIS e OLAP previamente desenvolvidas. Com o PostGeoOLAP, é possível construir uma aplicação OLAP geográfica desde a modelagem conceitual do DW a partir das bases de dados operacionais da organização, introduzindo-se as referências geográficas nas dimensões espaciais, de modo que os resultados das análises possam ser visualizados em mapas. As principais soluções de clusters de BD existentes na literatura são C-JDBC [Cecchet et al., 2004], PowerDB [Röhm et al., 2002] e o Pargres [Mattoso et al. 2005a, 2005b]. O PowerDB oferece paralelismo intra-consulta, mas trata-se de software proprietário. O CJDBC é software livre, porém se baseia no paralelismo inter-consultas. O ParGRES possui arquitetura descentralizada. Seus componentes se encontram distribuídos entre os nós do cluster. A eficiência da solução foi obtida ao se explorar o paralelismo de dados, adotando técnicas de processamento paralelo, aliadas ao poder de processamento de um cluster, com cada nó executando o SGBD livre PostgreSQL para obter um bom desempenho no processamento de consultas que são de leitura intensiva.. A solução é alcançada de maneira pouco dispendiosa usando paralelismo intra-consulta em clusters de bancos de dados. O ParGRES é um software que permite paralelizar e distribuir consultas SQL com alto custo computacional, em um conjunto de SGBDs PostgreSQL sobre clusters de PCs, com suporte a balanceamento de carga e alta disponibilidade. A abordagem não é intrusiva, mantendo os programas de aplicação, as consultas ao SGBD e o esquema relacional intactos, permitindo a migração imediata de sistemas atualmente em ambientes seqüenciais. Como resultado, são obtidos ganhos de aceleração de consultas muitas vezes acima do linear no número de nós. Além disso, por usar uma arquitetura em cluster, a solução oferece também alta disponibilidade. Sendo totalmente baseada em software livre, é uma solução de baixo custo para a execução em tempo hábil de consultas pesadas OLAP. O Pargres surge então como uma alternativa de baixo custo, que provê técnicas de processamento paralelo aos SBDs livres. Na área de infra-estrutura, existe literatura relacionada ao estudo de desempenho dos clusters como, por exemplo, [Lee et al. 2000], [Yeung e Wang 2002], [Salverda e Zilles, 2005]. Na área de gerenciamento de clusters é possível citar os seguintes trabalhos: [Fadlallah, Lavoie, Dessaint, 2000], [Mugler, Naughton, Scott, 2005]. A comunicação entre os nós do cluster é um dos principais temas de pesquisa desta área; são exemplos de artigos que abordam este assunto: [Hohn, Veitch, Abry, 2003], [Nagaraja et al. 2003], [Clutterbuck 2005]. 5. Equipe do projeto A equipe será coordenada pela professora Fernanda Baião, e contará com a colaboração dos professores Asterio Tanaka e Morganna Diniz, esta última bolsista de produtividade em pesquisa CNPq. Abaixo é descrita a participação de cada docente integrante da equipe, todos professores adjuntos do Departamento de Informática Aplicada da UNIRIO em regime de dedicação exclusiva, nos temas relacionados a este projeto. O professor Asterio Tanaka (http://www.uniriotec.br/~tanaka) orientou a dissertação de mestrado de Giovanni Colonese [Colonese 2004], que implementou a ferramenta PostGeoOLAP para desenvolvimento de aplicações OLAP geográficas a partir de bancos de dados operacionais. Anteriormente, havia orientado a dissertação de mestrado de Ana Cristina Ferreira [Ferreira 2002], que propôs um modelo baseado em metadados para integração de aplicações OLAP e GIS. A ferramenta PostGeoOLAP deu origem a um projeto de software livre publicado no repositório de projetos SourceForge (http://sourceforge.net/projects/postgeoolap/) e cadastrado na comunidade de desenvolvimento de software aberto do SGBD PostgreSQL denominada PGFoundry (http://postgeoolap.projects.postgresql.org/portugues/index.html). A produção científica do professor Asterio Tanaka na área do projeto proposto inclui, além das dissertações mencionadas, os artigos publicados [Ferreira, Campos e Tanaka 2001], [Colonese, Tanaka e Carvalho 2003], [Colonese et al. 2005]. A professora Fernanda Baião (http://www.uniriotec.br/~fernanda.baiao) participou da equipe do projeto ParGRES, que desenvolveu um middleware para processar, de modo eficiente, consultas que envolvam grandes massas de dados através de sistemas de banco de dados sobre clusters de PCs. O software está disponível e publicado no portal de software livre ObjectWeb (http://forge.objectweb.org/projects/pargres/). Trabalhos publicados pela professora Fernanda Baião na área do projeto proposto incluem [Mattoso et al. 2005a] e [Mattoso et al. 2005b]. A professora Morganna Diniz (http://www.uniriotec.br/~morganna) participa do projeto EELA (E-Infrastructure shared between Europe and Latin América - http://www.eueela.org/) no grupo de trabalho que estuda a implementação de computação paralela aplicada ao ensino a distância. A professora tem interesse na área de modelagem matemática, participou do desenvolvimento da ferramenta TANGRAM-II (http://land.ufrj.br) durante a sua tese de doutorado e atualmente coordena o desenvolvimento da ferramenta SET (Scaling Estimator Tool) (http://letra.uniriotec.br). A primeira ferramenta disponibiliza métodos markovianos para a modelagem e a análise de sistemas de computação e comunicação, enquanto a segunda ferramenta disponibiliza métodos para a caracterização e estudo da dependência temporal do tráfego de dados. Trabalhos publicados pela professora Morganna que incluem estes tópicos de pesquisa são [Zão et al. 2006], [Toscano et al. 2005] e [Loss et al. 2006]. Além dos três docentes, o projeto contará com a participação de alunos da UNIRIO, na elaboração de projetos de graduação do Curso de Bacharelado em Sistemas de Informação e dissertações de mestrado do Programa de Pós-Graduação em Informática. Na etapa de desenvolvimento da aplicação, o projeto contará com a colaboração de consultores da OpenGeo Consultoria (http://www.opengeo.com.br), uma empresa nacional dedicada exclusivamente ao geoprocessamento com software livre, que fornecerá as bases de dados para carga no sistema. 6. Experiência Anterior da Equipe do Projeto A Prof. Fernanda Baião participou da equipe do projeto ParGRES, que desenvolveu um software para processar, de modo eficiente, consultas que envolvem grandes massas de dados através de sistemas de banco de dados sobre clusters de PCs. A eficiência foi obtida ao se explorar o paralelismo de dados, adotando técnicas de processamento paralelo, aliadas ao poder de processamento de um cluster, com cada nó executando o Sistema de Bancos de Dados livre PostgreSQL para obter um bom desempenho no processamento de consultas que são de leitura intensiva. . A solução é alcançada de maneira pouco dispendiosa usando paralelismo intra-consulta em clusters de bancos de dados. O ParGRES é um software que permite paralelizar e distribuir consultas SQL com alto custo computacional, em um conjunto de sistemas de banco de dados PostgreSQL sobre clusters de PCs, com suporte a balanceamento de carga e alta disponibilidade. A abordagem não é intrusiva, mantendo os programas de aplicação, as consultas ao SGBD e o esquema relacional intactos, permitindo a migração imediata de sistemas atualmente em ambientes seqüenciais. Como resultado, são obtidos ganhos de aceleração de consultas muitas vezes acima do linear no número de nós. Além disso, por usar uma arquitetura em cluster, a solução oferece também alta disponibilidade. Sendo totalmente baseada em software livre, é uma solução de baixo custo para a execução em tempo hábil de consultas pesadas OLAP. O Pargres surge então como uma alternativa de baixo custo, que provê técnicas de processamento paralelo aos SBDs livres. O software está publicado no portal de software livre ObjectWeb: http://forge.objectweb.org/projects/pargres/ Referências Aronoff, S. Geographic Information Systems. WDL Publications, Canada, 1989. Bizgres. PostgreSQL for Business Intelligence and Data Warehousing. http://www.bizgres.org Acesso em 25/05/2006. Câmara, G.; Casanova, M.A.; Medeiros, C. B.; Hemerly, A.; Magalhães, G. Anatomia de Sistemas de Informação Geográfica. Curitiba, Sagres Editora, 1997 Cecchet, E., Marguerite, J., and Zwaenepoel, W. (2004), “C-JDBC: Flexible Database Clustering Middleware”, In: Freenix 2004: USENIX Annual Technical Conference, Boston, EUA, pp. 9-18. Chen, Y., Dehne, F., Eavis, T., Rau-Chaplin, A. (2004), "Parallel ROLAP Datacube Construction on Shared Nothing Multi-Processors", Journal of Parallel and Distributed Databases, 15 (3), pp. 219-236. Clutterbuck, P.; Cluster Scheduling and Load Balancing via TCP Options. e-Science and Grid Computing, First International Conference on. 05-08 Dec. 2005 Page(s):230 - 237 Colonese, G. Uma Ferramenta Aberta de Desenvolvimento Integrado de Sistemas de Informação para Processamento Analítico e Geográfico, Dissertação de Mestrado, Universidade Cândido Mendes, 2004. Colonese, G.; Manhaes, R. S. ; Gonzalez, S. M. ; Carvalho, R. A. ; Tanaka, A. K. . PostGeoOlap: an Open-Source Tool for Decision Support. In: II Simpósio Brasileiro de Sistemas de Informação, 2005,Florianópolis. Proceedings do I Simpósio Brasileiro de Sistemas de Informação, 2005. Colonese, G.; Tanaka, A.K.; Carvalho, R.A. Mapeando Modelos Conceituais Dimensionais OO para Modelos Lógicos Dimensionais Relacionais. Anais do CACIC 2003, Argentina, 2003. Fadlallah, G.; Lavoie, M.; Dessaint, L.-A.; Parallel computing environments and methods. Parallel Computing in Electrical Engineering, 2000. PARELEC 2000. Proceedings. International Conference on. 27-30 Aug. 2000 Page(s):2 – 7. Ferreira, A. C. F. Um Modelo para Suporte à Integração de Análises Multidimensionais e Espaciais. Dissertação de Mestrado, Instituto de Matemática e Núcleo de Computação Eletrônica, UFRJ, 2002. Ferreira, A. C.; Campos, M. L. ; Tanaka, A. K. An Architecture for Spatial and Dimensional Analysis Integration. In Proceedings of World Multiconference on Systemics, Cibernetics and Informatics, Orlando, USA, (SCI 2001). Fidalgo, R.; Times, V.; Souza, F. (2001) “GOLAPA: Uma Arquitetura Aberta e Extensível para Integração entre SIG e OLAP”. GeoInfo 2001, III Workshop Brasileiro de Geoinformática, p. 111-118. Instituto Militar de Engenharia, Rio de Janeiro, 2001. Gorla, N. (2003), “Features to Consider in a Data Warehousing System”, Comm ACM,46(11),pp. 111-115. Han, J.; Stefanovic, N.; Koperski, K. (1998) “Selective Materialization: An Efficient Meted for Spatial Data Cube Construction”. PAKDD, 1998. Hohn, N.; Veitch, D.; Abry, P.; Cluster processes: a natural language for network traffic. Signal Processing, IEEE Transactions on [see also Acoustics, Speech, and Signal Processing, IEEE Transactions on] Volume 51, Issue 8, Aug. 2003 Page(s):2229 - 2244 Kouba, Z.; Matousek, K.; Miksovsky, P. (2000) “On Data Warehouse and GIS Integration”. In: Proceedings of DEXA2000. Greenwich: DEXA2000, 2000. Lee, C.; DeMatteis, C.; Stepanek, J.; Wang, J.; Cluster performance and the implications for distributed, heterogeneous grid performance. Heterogeneous Computing Workshop, 2000. (HCW 2000) Proceedings. 9th 1 May 2000 Page(s):253 - 261 Lima, A. A. B. (2004), “Paralelismo Intra-Consulta em Clusters de Bancos de Dados”, Tese de Doutorado, Programa de Engenharia de Sistemas e Computação, COPPE, UFRJ, Brasil. Lima, A. A. B., Mattoso, M. and Valduriez, P. (2004), “Adaptive Virtual Partitioning for OLAP Query Processing in a Database Cluster”, In: Proc 19th SBBD, Brasília, Brasil, pp. 92-105. Longley, P.; Goodchild, M.; Maguire, D.; Rhind, D. Geographic Information Systems and Science. Wiley, 2001. Loss, G., Diniz, M.C., Coelho, R.F. (2006), Contention Prediction and Evaluation in Photonic Packet Switched Systems. 3rd IEEE/IFIP International Conference on Wireless and Optical Communications Network. 2006. Mattoso, M. L. Q. ; Zimbrao, G. ; Lima, A.A.B. ; Baião, F. ; Braganholo, V. P. ; Aveleda, A. A. ; Miranda, B. ; Almentero, B. K. ; Costa, M. N. . (2005b) ParGRES: Middleware para Processamento Paralelo de Consultas OLAP em Clusters de Banco de Dados. In: 20o. Simpósio Brasileiro de Banco de Dados - Sessão de Demos, 2005. Mattoso, M., Zimbrão, G., Lima, A. A. B., Baião, F., Braganholo, V., Aveleda, A., Miranda, B., Almentero, B., Costa, M. (2005a), “ParGRES: uma camada de processamento paralelo de consultas sobre o PostgreSQL”. In: Proc WSL - Workshop de Software Livre, Porto Alegre, pp. 259-264. Mondrian (2005), “Mondrian OLAP Server”, url: http://mondrian.sourceforge.net/, acesso em Jul/2005 Mugler, J.; Naughton, T.; Scott, S.L.; OSCAR meta-package system. High Performance Computing Systems and Applications, 2005. HPCS 2005. 19th International Symposium on. 1518 May 2005 Page(s):353 -360 MySQL Cluster, “A Guide to High Availability Clustering – How MySQL Supports 99.999% Availability”, MySQL Business White Paper, http://www.mysql.com/products/cluster. Acesso em 25/05/2006. Open Geospatial Consortium (2006) http://www.opengeospatial.org/ Acesso em 25/05/2006. Open Source Geospatial Foundation (2006) http://www.osgeo.org/ Acesso em 25/05/2006. Papadias, D. et al. (2001) “Efficient OLAP Operations in Spatial Data Warehouses”. In: Proceedings of the 7th International Symposium on Advances in Spatial and Temporal Databases. p.443-459. ACM Records, 2001. PostGIS. Extensão espacial PostGIS ao <http://postgis.org>. Acesso em 25/05/2006. PostGreSQL, versão 1.1. Disponível em PostgreSQL (2005), “PostgreSQL v.8.0”, url: http://www.postgresql.org/download/, acesso em Jul 2005. PostgreSQL. SGBD Relacional-Objeto PostGreSQL <http://www.postgresql.org>. Acesso em 25/05/2006. 8.1. Disponível em: Röhm, U., Böhm, K., Schek, H.-J., et al. (2002), FAS - A Freshness-Sensitive Coordination Middleware for a Cluster of OLAP Components, Intl. Conf. Very Large Databases, Hong Kong, pp. 754-765. Salverda, P.; Zilles, C.; A Criticality Analysis of Clustering in Superscalar Processors. Microarchitecture, 2005. MICRO-38. Proceedings. 38th Annual IEEE/ACM International Symposium on, 12-16 Nov. 2005 Page(s):55 – 66. Shatdal, A., Naughton, J. (1995), “Adaptive Parallel Aggregation Algorithms”, SIGMOD, pp.104-114. Shekar, S. et al. (2000) “Map Cube: A Visualization Tool for Spatial Data Warehouse”. http://www.cs.umn.edu/research/shashi-group/mapcube.htm Acesso em 25/05/2006. Toscano, M.B., Diniz, M.C., Coelho, R.F (2005), Caracterização do Tráfego de Redes Locais Sem Fio Baseada em Processos Pseudo-Markovianos e Fractais. SBRT 2005. TPC (2003), “TPC BenchmarkTM H – Revision 2.1.0”, url: http://www.tpc.org. Acesso em 25/05/2006. Yeung, D.S.; Wang, X.Z.; Improving performance of similarity-based clustering by feature weight learning. Pattern Analysis and Machine Intelligence, IEEE Transactions on. Volume 24, Issue 4, April 2002 Page(s):556 - 561 Zão, L., Filho, J., Pereira, A., Diniz, M.C., Coelho, R.F. (2006), SET (Scaling Estimation Tool): Uma Ferramenta Gráfica de Estimação e Análise de Sistemas. SBRT 2006, Curitiba.