UNIRIO - CGOLAP

Propaganda
Implementação e Análise de Desempenho de clusters de PCs
usando aplicações OLAP sobre Bancos de Dados Espaciais
Dados do Projeto e do Proponente
Sigla do Projeto: CG-OLAP
Título do Projeto: Implementação e Análise de Desempenho de clusters de PCs
usando aplicações OLAP sobre Bancos de Dados Espaciais
Referência da Chamada: Edital Universal – MCT/CNPq 02/2006
Proponente: Prof. Fernanda Araujo Baião Amorim
Endereço para Contato: Departamento de Informática Aplicada
Av. Pasteur 458, Urca, 22290-240, Rio de Janeiro, RJ
http://www.uniriotec.br
Instituição Vinculada: Universidade Federal do Estado do Rio de Janeiro
UNIRIO
http://www.unirio.br
Resumo Este projeto de pesquisa visa investigar e propor métodos e
ferramentas computacionais para processar, de modo eficiente,
consultas que envolvam grandes massas de dados através de
sistemas de banco de dados sobre clusters de PCs.
1. Introdução
O aspecto de desempenho de sistemas de informação tem se tornado cada vez mais crítico
nas organizações, em função do crescente volume de dados manipulado pelos sistemas e
da complexidade das requisições feitas à base de dados.
Em especial, a crescente utilização de Data Warehouse (DW) nas organizações torna cada
dia mais freqüentes as aplicações de alto custo em tempo de consulta, como as aplicações
denominadas OLAP (On Line Analytical Processing), típicas de ambientes voltados para
diretores e gerentes, que precisam tomar decisões rápidas baseadas em análises
complexas, de natureza não previsível (ad-hoc), sobre um grande volume de dados [Gorla,
2003]. As aplicações OLAP têm como objetivo fornecer aos tomadores de decisão a
informação na forma mais palatável possível, no nível de precisão mais adequado
[Barbieri, 2001]. A característica principal dessas consultas é demandar muito tempo de
processamento envolvendo varreduras desse grande volume de dados, e atualizações
pouco freqüentes [TPC, 2003]. A otimização de bancos de dados para suporte a consultas
em ambientes de Data Warehousing é mais complexa, uma vez que elas não são
predefinidas. Torna-se, então, mais difícil escolher as estruturas de acesso a serem criadas
e as formas de organização dos registros em disco, entre outras. A materialização das
agregações mais utilizadas nas consultas é, muitas vezes, utilizada como solução para
melhorar o tempo de resposta das aplicações OLAP, gerando, em contrapartida, uma
sobrecarga de armazenamento além do próprio DW que, por si só, usualmente é um
depósito gigantesco de dados.
Adicionalmente, desde a década de 1980, sistemas de informação geográficos
(Geographical Information Systems - GIS) têm sido usados também como ferramentas de
suporte a tomadas de decisão em diferentes contextos e aplicações. São sistemas
automatizados usados para armazenar, analisar e manipular dados geográficos, ou seja,
dados que representam objetos e fenômenos em que a localização geográfica é uma
característica inerente à informação e indispensável para analisá-la [Aronoff 1989,
Câmara et al 1997, Longley et al 2001]. Um GIS armazena e manipula dados com
referências geográficas em bancos de dados espaciais, permitindo a execução de
operações geométricas e a análise dos dados espaciais com a produção de mapas. Pela
natureza dos dados geo-referenciados, o volume de armazenamento tende a ser grande,
assim como no ambiente de Data Warehousing.
Mais recentemente, pesquisas têm focado a integração das tecnologias de OLAP e GIS,
visando a extensão do conceito de cubo de dados no domínio espacial [Shekar et al.
2001], ou a interconexão de aplicações OLAP e GIS desenvolvidas separadamente
[Kouba, Matousek and Miksovsky 2000, Fidalgo, Times and Souza 2001], ou o
desenvolvimento de aplicações OLAP espaciais [Han, Stefanovic and Koperski 1998,
Papadias et al. 2001]. Nesta última abordagem de integração, enquadra-se o projeto em
desenvolvimento denominado GeoOLAP [Colonese et. al 2005], que utiliza o Sistema de
Gerência de Bancos de Dados (SGBD) PostgreSQL [PostgreSQL] com sua extensão
geográfica [PostGIS] e integra a iniciativa “PostgreSQL for Business Intelligence and
Datawarehousing” [Bizgres], assim como a comunidade de desenvolvimento livre do
PostgreSQL [PGFoundry].
Segundo dados do Open GeoSpatial Consortium [OGC 2006], mais de 80% das
informações comerciais ou governamentais possuem algum tipo de referência espacial.
Daí a justificativa dessa integração, permitindo o processamento analítico mais completo,
envolvendo as dimensões temporal e espacial, o que aumenta significativamente o volume
de armazenamento e a complexidade de manipulação dos dados por SGBDs.
Tradicionalmente, o problema de desempenho de aplicações sobre grandes volumes de
dados tem sido endereçado através de processamento paralelo, com a substituição da
plataforma de hardware e software por componentes de maior capacidade computacional
(como servidores e SGBDs paralelos) e a correspondente adaptação da aplicação do
ambiente seqüencial para o ambiente paralelo. Nesta situação, a migração de uma
aplicação é bastante complexa, e muitas vezes inviável, uma vez que pode requerer
alterações no código-fonte. Além disso, esta solução representa alto custo para a
organização, tanto para a aquisição/expansão do ambiente computacional quanto para a
migração da aplicação. Uma alternativa mais barata é a utilização de clusters de PCs.
Nesta plataforma, o processamento paralelo pode ser então implementado através da
aquisição de software ou hardware específico e otimizado para funcionar sobre osclusters
de PCs, como os SGBDs paralelos ou as unidades centrais de armazenamento (SAN –
Storage Area Network) [MySQL Cluster]. Soluções proprietárias seguindo esta
abordagem incluem o Oracle Real Application Clusters e o DB2 Parallel Edition, que
apesar de explorar o paralelismo do cluster, tornam a migração muito custosa e impedem
a autonomia de cada nó do cluster. Uma abordagem alternativa, denominada “cluster de
bancos de dados” [Röhm et al., 2002], implementa o paralelismo de forma transparente,
utilizando SGBDs seqüenciais nos nós de um cluster como componentes do tipo
“caixapreta”, ou seja, sem modificar seu código-fonte para incluir funcionalidades que
melhorem sua utilização em clusters, e sem nenhuma otimização específica para o
funcionamento sobre o cluster de PCs. Essa abordagem evita o alto custo de migração das
aplicações e dos bancos de dados, existente nos SGBDs paralelos, e é utilizada pelos
projetos Pargres [Mattoso et al 2005a, 2005b], C-JDBC [Cecchet et al., 2004] e o
PowerDB [Röhm et al., 2002]. No entanto, não existem estudos comparativos entre as
duas abordagens.
2. Objetivos e Metas
Este projeto de pesquisa visa investigar e propor métodos e ferramentas computacionais
para desenvolver e executar, de modo eficiente, aplicações que envolvam grandes
volumes de dados armazenados em sistemas de banco de dados geográficos instalados em
clusters de PCs. A arquitetura do ambiente computacional a ser utilizado neste projeto é
ilustrada na figura abaixo.
Cluster de PCs
PostgreSQL
SGBD
DW
PostgreSQL
SGBD
DW
Aplicação
Geo-OLAP
(clientes)
Camada
Intermediária
PostgreSQL
SGBD
DW
PostgreSQL
SGBD
DW
PostgreSQL
SGBD
DW
Pretende-se realizar investigações nas 3 camadas do ambiente computacional do projeto, a
saber, na aplicação OLAP, no SGBD e no cluster de PCs:
Experimentação com DW geográfico, desenvolvido sobre o SGBD PostgreSQL
estendido com as funcionalidades espaciais do PostGIS e com as funcionalidades OLAP
do Bizgres. O desenvolvimento e a implantação da aplicação contarão com a parceria da
empresa OpenGeo Consultoria. Nesta camada, o objetivo específico será analisar o
desempenho da aplicação e propor aperfeiçoamentos no âmbito da comunidade de
desenvolvimento livre PGFoundry.
Definição de uma arquitetura eficiente para processamento paralelo sobre o cluster de
PCs. Para isso, serão realizados testes de desempenho comparando a arquitetura de
clusters de bancos de dados com a arquitetura de SGBDs específicos para clusters de PCs.
Testes com diferentes protocolos de comunicação usados entre o nó mestre e os nós
escravos, desenvolvendo ferramenta para modelagem, monitoração e estudo da latência
entre os nós. Nesta camada, o objetivo específico será analisar o tráfego de dados no
cluster de PCs.
É importante observar que o ambiente computacional montado para este projeto terá uma
utilização e produção mais ampla do que o escopo do presente projeto. O Departamento
de Informática Aplicada da UNIRIO possui um Programa de Pós-Graduação em
Informática (Mestrado na área de Sistemas de Informação), recentemente recomendado
pela CAPES e aprovado na UNIRIO, cujas atividades terão início em março de 2007.
Duas linhas de pesquisa do programa, a saber, “Distribuição e Redes” e “Sistemas de
Apoio a Negócios”, serão beneficiadas diretamente pelos resultados do presente projeto.
Portanto, o ambiente de cluster de PCs também servirá para o desenvolvimento da
pesquisa dos alunos de mestrado que forem trabalhar nessas linhas de pesquisa.
Também cabe ressaltar que o CCET/UNIRIO, pela sua natureza multidisciplinar, tem
buscado privilegiar o desenvolvimento de software livre em domínios de aplicação em
que a UNIRIO possui tradição acadêmica estabelecida (Teatro, Música e Área de Saúde).
Este projeto, em particular, tem potencial para aplicação em gerenciamento de DW de
ensaios clínicos, uma área essencial na pesquisa em Informática Médica.
Como resultado prático do projeto, destaca-se o benefício direto das organizações
públicas ou privadas que venham a adotar as soluções propostas, nas três camadas. Numa
área particularmente carente de soluções de baixo custo para as organizações, o
desenvolvimento totalmente realizado com a utilização de software livre, e com a filosofia
de desenvolvimento cooperativo adotado pela comunidade de software livre, tornará os
produtos do projeto disponíveis na medida em que forem sendo publicados.
As metas do projeto incluem:

3 trabalhos finais de graduação

1 dissertação de mestrado

2 artigos submetidos para conferência nacional indexada
3. Metodologia e Estratégia de Ação
As tarefas propostas serão realizadas durante o período de dois anos, segundo uma
metodologia baseada nas seguintes atividades:
Primeiro ano:
a) Instalação e teste do ambiente de cluster de PCs;
b) Instalação do SGBD PostgreSQL com suas extensões PostGIS e Bizgres em todos os
nós do cluster;
c) Modelagem, desenvolvimento e instalação de ferramenta de monitoração do cluster;
d) Instalação do middleware Pargres e de outras soluções de paralelismo em clusters;
e) Instalação da ferramenta PostGeoOLAP;
f) Desenvolvimento da aplicação OLAP com carga de dados analíticos e geográficos;
g) Testes e análise de desempenho nas três camadas da arquitetura;
h) Estudo comparativo das soluções de middleware analisadas;
i) Identificação dos pontos de melhoria e desenvolvimento de soluções nas três camadas.
Segundo ano:
j) Desenvolvimento de aplicações em outros domínios;
k) Prosseguimento das atividades g), h), i) do primeiro ano;
l) Apresentação e publicação de artigos.
A avaliação do andamento do projeto será realizada semanalmente (através de reunião
entre pesquisadores, alunos e colaboradores) e semestralmente através de relatórios
técnicos parciais que apresentarão as atividades desenvolvidas, os resultados obtidos e os
próximos passos do projeto.
Ao longo do desenvolvimento do projeto, serão gerados subprodutos acadêmicos
materializados em projetos de graduação e dissertações de mestrado.
Ao final do projeto, será apresentado um relatório técnico-científico detalhando as
atividades executadas no projeto e os resultados obtidos.
4. Trabalhos Relacionados
Na área de integração de aplicações OLAP e GIS, foram mencionados anteriormente os
trabalhos: projeto MapCube [Shekar et al. 2001], projeto GOAL (Geographical
Information On Line Analysis) [Kouba, Matousek and Miksovsky 2000], projeto
GOLAPA (Geographical On-Line Analytical Processing Architecture) [Fidalgo, Times
and Souza 2001], projetos de DW espacial em [Han, Stefanovic and Koperski 1998] e
[Papadias et al. 2001], e a ferramenta PostGeoOLAP [Colonese et al. 2005]. Além desses
trabalhos, pode-se mencionar também o projeto de Data Mining Espacial denominado
GeoMiner [Stefanovic 1997], que propôs extensões ao esquema estrela de DW de forma a
prover ponteiros para objetos espaciais aos itens de tabelas fatos e dimensões. E o projeto
GISOLAP [Ferreira, Campos e Tanaka 2001], que propôs um modelo de integração
baseado em metadados. A ferramenta PostGeoOLAP é uma evolução em relação ao
projeto GISOLAP, pois independe da existência de aplicações GIS e OLAP previamente
desenvolvidas. Com o PostGeoOLAP, é possível construir uma aplicação OLAP
geográfica desde a modelagem conceitual do DW a partir das bases de dados operacionais
da organização, introduzindo-se as referências geográficas nas dimensões espaciais, de
modo que os resultados das análises possam ser visualizados em mapas.
As principais soluções de clusters de BD existentes na literatura são C-JDBC [Cecchet et
al., 2004], PowerDB [Röhm et al., 2002] e o Pargres [Mattoso et al. 2005a, 2005b]. O
PowerDB oferece paralelismo intra-consulta, mas trata-se de software proprietário. O CJDBC é software livre, porém se baseia no paralelismo inter-consultas. O ParGRES
possui arquitetura descentralizada. Seus componentes se encontram distribuídos entre os
nós do cluster. A eficiência da solução foi obtida ao se explorar o paralelismo de dados,
adotando técnicas de processamento paralelo, aliadas ao poder de processamento de um
cluster, com cada nó executando o SGBD livre PostgreSQL para obter um bom
desempenho no processamento de consultas que são de leitura intensiva.. A solução é
alcançada de maneira pouco dispendiosa usando paralelismo intra-consulta em clusters de
bancos de dados. O ParGRES é um software que permite paralelizar e distribuir consultas
SQL com alto custo computacional, em um conjunto de SGBDs PostgreSQL sobre
clusters de PCs, com suporte a balanceamento de carga e alta disponibilidade. A
abordagem não é intrusiva, mantendo os programas de aplicação, as consultas ao SGBD e
o esquema relacional intactos, permitindo a migração imediata de sistemas atualmente em
ambientes seqüenciais. Como resultado, são obtidos ganhos de aceleração de consultas
muitas vezes acima do linear no número de nós. Além disso, por usar uma arquitetura em
cluster, a solução oferece também alta disponibilidade. Sendo totalmente baseada em
software livre, é uma solução de baixo custo para a execução em tempo hábil de consultas
pesadas OLAP. O Pargres surge então como uma alternativa de baixo custo, que provê
técnicas de processamento paralelo aos SBDs livres.
Na área de infra-estrutura, existe literatura relacionada ao estudo de desempenho dos
clusters como, por exemplo, [Lee et al. 2000], [Yeung e Wang 2002], [Salverda e Zilles,
2005]. Na área de gerenciamento de clusters é possível citar os seguintes trabalhos:
[Fadlallah, Lavoie, Dessaint, 2000], [Mugler, Naughton, Scott, 2005]. A comunicação
entre os nós do cluster é um dos principais temas de pesquisa desta área; são exemplos de
artigos que abordam este assunto: [Hohn, Veitch, Abry, 2003], [Nagaraja et al. 2003],
[Clutterbuck 2005].
5. Equipe do projeto
A equipe será coordenada pela professora Fernanda Baião, e contará com a colaboração
dos professores Asterio Tanaka e Morganna Diniz, esta última bolsista de produtividade
em pesquisa CNPq. Abaixo é descrita a participação de cada docente integrante da equipe,
todos professores adjuntos do Departamento de Informática Aplicada da UNIRIO em
regime de dedicação exclusiva, nos temas relacionados a este projeto.
O professor Asterio Tanaka (http://www.uniriotec.br/~tanaka) orientou a dissertação de
mestrado de Giovanni Colonese [Colonese 2004], que implementou a ferramenta
PostGeoOLAP para desenvolvimento de aplicações OLAP geográficas a partir de bancos
de dados operacionais. Anteriormente, havia orientado a dissertação de mestrado de Ana
Cristina Ferreira [Ferreira 2002], que propôs um modelo baseado em metadados para
integração de aplicações OLAP e GIS. A ferramenta PostGeoOLAP deu origem a um
projeto de software livre publicado no repositório de projetos SourceForge
(http://sourceforge.net/projects/postgeoolap/) e cadastrado na comunidade de
desenvolvimento de software aberto do SGBD PostgreSQL denominada PGFoundry
(http://postgeoolap.projects.postgresql.org/portugues/index.html). A produção científica
do professor Asterio Tanaka na área do projeto proposto inclui, além das dissertações
mencionadas, os artigos publicados [Ferreira, Campos e Tanaka 2001], [Colonese, Tanaka
e Carvalho 2003], [Colonese et al. 2005].
A professora Fernanda Baião (http://www.uniriotec.br/~fernanda.baiao) participou da
equipe do projeto ParGRES, que desenvolveu um middleware para processar, de modo
eficiente, consultas que envolvam grandes massas de dados através de sistemas de banco
de dados sobre clusters de PCs. O software está disponível e publicado no portal de
software livre ObjectWeb (http://forge.objectweb.org/projects/pargres/). Trabalhos
publicados pela professora Fernanda Baião na área do projeto proposto incluem [Mattoso
et al. 2005a] e [Mattoso et al. 2005b].
A professora Morganna Diniz (http://www.uniriotec.br/~morganna) participa do projeto
EELA (E-Infrastructure shared between Europe and Latin América - http://www.eueela.org/) no grupo de trabalho que estuda a implementação de computação paralela
aplicada ao ensino a distância. A professora tem interesse na área de modelagem
matemática, participou do desenvolvimento da ferramenta TANGRAM-II
(http://land.ufrj.br) durante a sua tese de doutorado e atualmente coordena o
desenvolvimento da ferramenta SET (Scaling Estimator Tool) (http://letra.uniriotec.br). A
primeira ferramenta disponibiliza métodos markovianos para a modelagem e a análise de
sistemas de computação e comunicação, enquanto a segunda ferramenta disponibiliza
métodos para a caracterização e estudo da dependência temporal do tráfego de dados.
Trabalhos publicados pela professora Morganna que incluem estes tópicos de pesquisa
são [Zão et al. 2006], [Toscano et al. 2005] e [Loss et al. 2006].
Além dos três docentes, o projeto contará com a participação de alunos da UNIRIO, na
elaboração de projetos de graduação do Curso de Bacharelado em Sistemas de Informação
e dissertações de mestrado do Programa de Pós-Graduação em Informática. Na etapa de
desenvolvimento da aplicação, o projeto contará com a colaboração de consultores da
OpenGeo Consultoria (http://www.opengeo.com.br), uma empresa nacional dedicada
exclusivamente ao geoprocessamento com software livre, que fornecerá as bases de dados
para carga no sistema.
6. Experiência Anterior da Equipe do Projeto
A Prof. Fernanda Baião participou da equipe do projeto ParGRES, que desenvolveu um
software para processar, de modo eficiente, consultas que envolvem grandes massas de
dados através de sistemas de banco de dados sobre clusters de PCs. A eficiência foi obtida
ao se explorar o paralelismo de dados, adotando técnicas de processamento paralelo,
aliadas ao poder de processamento de um cluster, com cada nó executando o Sistema de
Bancos de Dados livre PostgreSQL para obter um bom desempenho no processamento de
consultas que são de leitura intensiva. . A solução é alcançada de maneira pouco
dispendiosa usando paralelismo intra-consulta em clusters de bancos de dados. O
ParGRES é um software que permite paralelizar e distribuir consultas SQL com alto custo
computacional, em um conjunto de sistemas de banco de dados PostgreSQL sobre clusters
de PCs, com suporte a balanceamento de carga e alta disponibilidade. A abordagem não é
intrusiva, mantendo os programas de aplicação, as consultas ao SGBD e o esquema
relacional intactos, permitindo a migração imediata de sistemas atualmente em ambientes
seqüenciais. Como resultado, são obtidos ganhos de aceleração de consultas muitas vezes
acima do linear no número de nós. Além disso, por usar uma arquitetura em cluster, a
solução oferece também alta disponibilidade. Sendo totalmente baseada em software
livre, é uma solução de baixo custo para a execução em tempo hábil de consultas pesadas
OLAP. O Pargres surge então como uma alternativa de baixo custo, que provê técnicas de
processamento paralelo aos SBDs livres. O software está publicado no portal de software
livre ObjectWeb: http://forge.objectweb.org/projects/pargres/
Referências
Aronoff, S. Geographic Information Systems. WDL Publications, Canada, 1989.
Bizgres. PostgreSQL for Business Intelligence and Data Warehousing. http://www.bizgres.org
Acesso em 25/05/2006.
Câmara, G.; Casanova, M.A.; Medeiros, C. B.; Hemerly, A.; Magalhães, G. Anatomia de
Sistemas de Informação Geográfica. Curitiba, Sagres Editora, 1997
Cecchet, E., Marguerite, J., and Zwaenepoel, W. (2004), “C-JDBC: Flexible Database Clustering
Middleware”, In: Freenix 2004: USENIX Annual Technical Conference, Boston, EUA, pp. 9-18.
Chen, Y., Dehne, F., Eavis, T., Rau-Chaplin, A. (2004), "Parallel ROLAP Datacube Construction
on Shared Nothing Multi-Processors", Journal of Parallel and Distributed Databases, 15 (3), pp.
219-236.
Clutterbuck, P.; Cluster Scheduling and Load Balancing via TCP Options. e-Science and Grid
Computing, First International Conference on. 05-08 Dec. 2005 Page(s):230 - 237
Colonese, G. Uma Ferramenta Aberta de Desenvolvimento Integrado de Sistemas de Informação
para Processamento Analítico e Geográfico, Dissertação de Mestrado, Universidade Cândido
Mendes, 2004.
Colonese, G.; Manhaes, R. S. ; Gonzalez, S. M. ; Carvalho, R. A. ; Tanaka, A. K. . PostGeoOlap:
an Open-Source Tool for Decision Support. In: II Simpósio Brasileiro de Sistemas de Informação,
2005,Florianópolis. Proceedings do I Simpósio Brasileiro de Sistemas de Informação, 2005.
Colonese, G.; Tanaka, A.K.; Carvalho, R.A. Mapeando Modelos Conceituais Dimensionais OO
para Modelos Lógicos Dimensionais Relacionais. Anais do CACIC 2003, Argentina, 2003.
Fadlallah, G.; Lavoie, M.; Dessaint, L.-A.; Parallel computing environments and methods.
Parallel Computing in Electrical Engineering, 2000. PARELEC 2000. Proceedings. International
Conference on. 27-30 Aug. 2000 Page(s):2 – 7.
Ferreira, A. C. F. Um Modelo para Suporte à Integração de Análises Multidimensionais e
Espaciais. Dissertação de Mestrado, Instituto de Matemática e Núcleo de Computação
Eletrônica, UFRJ, 2002.
Ferreira, A. C.; Campos, M. L. ; Tanaka, A. K. An Architecture for Spatial and Dimensional
Analysis Integration. In Proceedings of World Multiconference on Systemics, Cibernetics and
Informatics, Orlando, USA, (SCI 2001).
Fidalgo, R.; Times, V.; Souza, F. (2001) “GOLAPA: Uma Arquitetura Aberta e Extensível para
Integração entre SIG e OLAP”. GeoInfo 2001, III Workshop Brasileiro de Geoinformática, p.
111-118. Instituto Militar de Engenharia, Rio de Janeiro, 2001.
Gorla, N. (2003), “Features to Consider in a Data Warehousing System”, Comm ACM,46(11),pp.
111-115.
Han, J.; Stefanovic, N.; Koperski, K. (1998) “Selective Materialization: An Efficient Meted for
Spatial Data Cube Construction”. PAKDD, 1998.
Hohn, N.; Veitch, D.; Abry, P.; Cluster processes: a natural language for network traffic. Signal
Processing, IEEE Transactions on [see also Acoustics, Speech, and Signal Processing, IEEE
Transactions on] Volume 51, Issue 8, Aug. 2003 Page(s):2229 - 2244
Kouba, Z.; Matousek, K.; Miksovsky, P. (2000) “On Data Warehouse and GIS Integration”. In:
Proceedings of DEXA2000. Greenwich: DEXA2000, 2000.
Lee, C.; DeMatteis, C.; Stepanek, J.; Wang, J.; Cluster performance and the implications for
distributed, heterogeneous grid performance. Heterogeneous Computing Workshop, 2000. (HCW
2000) Proceedings. 9th 1 May 2000 Page(s):253 - 261
Lima, A. A. B. (2004), “Paralelismo Intra-Consulta em Clusters de Bancos de Dados”, Tese de
Doutorado, Programa de Engenharia de Sistemas e Computação, COPPE, UFRJ, Brasil.
Lima, A. A. B., Mattoso, M. and Valduriez, P. (2004), “Adaptive Virtual Partitioning for OLAP
Query Processing in a Database Cluster”, In: Proc 19th SBBD, Brasília, Brasil, pp. 92-105.
Longley, P.; Goodchild, M.; Maguire, D.; Rhind, D. Geographic Information Systems and
Science. Wiley, 2001.
Loss, G., Diniz, M.C., Coelho, R.F. (2006), Contention Prediction and Evaluation in Photonic
Packet Switched Systems. 3rd IEEE/IFIP International Conference on Wireless and Optical
Communications Network. 2006.
Mattoso, M. L. Q. ; Zimbrao, G. ; Lima, A.A.B. ; Baião, F. ; Braganholo, V. P. ; Aveleda, A. A. ;
Miranda, B. ;
Almentero, B. K. ; Costa, M. N. . (2005b) ParGRES: Middleware para Processamento Paralelo de
Consultas OLAP em Clusters de Banco de Dados. In: 20o. Simpósio Brasileiro de Banco de
Dados - Sessão de Demos, 2005.
Mattoso, M., Zimbrão, G., Lima, A. A. B., Baião, F., Braganholo, V., Aveleda, A., Miranda, B.,
Almentero,
B., Costa, M. (2005a), “ParGRES: uma camada de processamento paralelo de consultas sobre o
PostgreSQL”. In: Proc WSL - Workshop de Software Livre, Porto Alegre, pp. 259-264.
Mondrian (2005), “Mondrian OLAP Server”, url: http://mondrian.sourceforge.net/, acesso em
Jul/2005
Mugler, J.; Naughton, T.; Scott, S.L.; OSCAR meta-package system. High Performance
Computing Systems and Applications, 2005. HPCS 2005. 19th International Symposium on. 1518 May 2005 Page(s):353 -360
MySQL Cluster, “A Guide to High Availability Clustering – How MySQL Supports 99.999%
Availability”,
MySQL Business White Paper, http://www.mysql.com/products/cluster. Acesso em 25/05/2006.
Open Geospatial Consortium (2006) http://www.opengeospatial.org/ Acesso em 25/05/2006.
Open Source Geospatial Foundation (2006) http://www.osgeo.org/ Acesso em 25/05/2006.
Papadias, D. et al. (2001) “Efficient OLAP Operations in Spatial Data Warehouses”. In:
Proceedings of the 7th International Symposium on Advances in Spatial and Temporal Databases.
p.443-459. ACM Records, 2001.
PostGIS. Extensão espacial PostGIS ao
<http://postgis.org>. Acesso em 25/05/2006.
PostGreSQL,
versão
1.1.
Disponível
em
PostgreSQL (2005), “PostgreSQL v.8.0”, url: http://www.postgresql.org/download/, acesso em
Jul 2005.
PostgreSQL.
SGBD
Relacional-Objeto
PostGreSQL
<http://www.postgresql.org>. Acesso em 25/05/2006.
8.1.
Disponível
em:
Röhm, U., Böhm, K., Schek, H.-J., et al. (2002), FAS - A Freshness-Sensitive Coordination
Middleware for a Cluster of OLAP Components, Intl. Conf. Very Large Databases, Hong Kong,
pp. 754-765.
Salverda, P.; Zilles, C.; A Criticality Analysis of Clustering in Superscalar Processors.
Microarchitecture, 2005. MICRO-38. Proceedings. 38th Annual IEEE/ACM International
Symposium on, 12-16 Nov. 2005 Page(s):55 – 66.
Shatdal, A., Naughton, J. (1995), “Adaptive Parallel Aggregation Algorithms”, SIGMOD,
pp.104-114.
Shekar, S. et al. (2000) “Map Cube: A Visualization Tool for Spatial Data Warehouse”.
http://www.cs.umn.edu/research/shashi-group/mapcube.htm Acesso em 25/05/2006.
Toscano, M.B., Diniz, M.C., Coelho, R.F (2005), Caracterização do Tráfego de Redes Locais
Sem Fio Baseada em Processos Pseudo-Markovianos e Fractais. SBRT 2005.
TPC (2003), “TPC BenchmarkTM H – Revision 2.1.0”, url: http://www.tpc.org. Acesso em
25/05/2006.
Yeung, D.S.; Wang, X.Z.; Improving performance of similarity-based clustering by feature
weight learning. Pattern Analysis and Machine Intelligence, IEEE Transactions on. Volume 24,
Issue 4, April 2002 Page(s):556 - 561
Zão, L., Filho, J., Pereira, A., Diniz, M.C., Coelho, R.F. (2006), SET (Scaling Estimation Tool):
Uma Ferramenta Gráfica de Estimação e Análise de Sistemas. SBRT 2006, Curitiba.
Download