PROPOSTA DE IMPLEMENTAÇÃO DE AMBIENTE PARALELIZADO PARA APLICAÇÃO NA COMPUTAÇÃO GRAFICA E CRIAÇÃO DE ANIMAÇÕES Ronaldo Adriano Guilhermino dos Santos¹; Marcelo Gonçalves Narciso² 1 - Faculdades Hoyler de Hortolândia - [email protected] 2 - Embrapa Informática Agropecuária - [email protected] PALAVRAS-CHAVE: paralelização, cluster, desempenho INTRODUÇÃO Cassiopéia foi à primeira produção de um longa-metragem em todo o mundo de origem virtual, ou seja, 100% modelado, animado e com imagens geradas totalmente por computador. Isto torna o Brasil um pioneiro no setor, porém os recursos para se fazer isto é escasso e nem sempre é possível investir em máquinas com processamento paralelo devido ao alto custo. Devido a crescimento de softwares de código aberto, é possível a criação de grandes máquinas paralelas usando pequenos computadores, em uma formação denominada cluster. Essa formação gera um grande poder computacional que pode ser usando para inúmeras aplicações e uma delas pode ser a geração de animações e efeitos. Neste trabalho, será demonstrado o ganho que se tem ao implementar um cluster e paralelizar algumas aplicações de uso especifico à área de computação gráfica. METODOLOGIA O experimento foi instalado em 4 (quatro) máquinas totalizando 6 cpu’s no período de 02/07/2004 a 22/07/2004, no laboratório de Sistema de Informação Campus II das Faculdades Hoyler - Hortolândia – SP (HOYLER, 2005) . Os dados do hardware utilizado para construir o cluster está descrito na tabela 1 a seguir. Modelo Número de CPUs Memória RAM PIII 550 2 512 PIII 450 2 386 PIII 650 1 128 Ultra Sparc I 143 MHZ 1 64 Tabela 1 - Configuração dos equipamentos utilizados nos experimentos Os dados do software utilizado para construir o cluster está descrito na tabela abaixo: Nome Versão usada na implementação Sistema Operacional Linux SuSe 9.1 SuSe 9.1 Kernel 2.6.6 Bibliotecas de Message-Passing Mpich-1.2.6 Parallel Virtual Machine PVM-3.4.4 Bproc-Beowulf Distributed Process Space (SSI) Bproc-4.0.0pre5 Pov-Ray Persistence of Vision Raytracer PovRay 3.1 com patch para MPICH e PVM Tabela 2 - Configuração do software do experimento. Foi realizada renderização de imagem, skyvase.pov, usada como benchmark e comparada com o site oficial de benchmark do pov-ray (POVRAY, 2005) Nos testes, aumentou-se gradativamente o número de processadores, para renderizar a mesma imagem e colhendo os resultados. Através destes estudos, observamos o tempo de latência, custo/beneficio, migração de processos, eficiência do meio de transporte e aplicação de aperfeiçoamento no meio físico de troca de mensagens. RESULTADOS Os resultados obtidos estão descritos nas tabelas a seguir. Quantidade de processadores utilizados TEMPO (s) OBSERVAÇÕES 2 59 3 33 4 34 Aumento relacionado ao tempo latência 5 37 Aumento relacionado ao tempo latência 6 30 Tabela 3 – Sistema No Single System Image Quantidade de processadores utilizados TEMPO (s) 5 15 6 10 Tabela 4 – Sistema Single System Image Há um aumento considerável de performance no ambiente “clusterizado” quando se aplica a implementação no núcleo do sistema operacional, fazendo assim o conjunto trabalhar de forma transparente como uma única entidade (SSI). Comparando com os resultados obtidos no site http://www.haveland.com/, observamos: EQUIPAMENTO SISTEMA OPERCIONAL Intel Xeon 2800 MHz. Lunar-Linux Intel Xeon 2800 MHz Lunar-Linux 733 G4 1 733 MHz. OSX 10.3.4 Slowpoke Itanium 2 1000 MHz Windows 2003 Server (RC-2) P4 800 FSb 3600 MHz. Windows XP Tabela 5 – Benchmark Top Single TEMPO (h) 07:34:00 00:07:46 00:07:54 00:11:07 00:12:39 EQUIPAMENTO SISTEMA OPERACIONAL AMD Athlon XP 2600+ 2075 MHz. 128 used Linux kernel 2.4.21, RedHat 9.0 Xeon 3060 MHz. 32 used Red Hat Linux 9 AMD Athlon XP 2600+ 2075 MHz. 48 used Linux kernel 2.4.21,RedHat 9.0 AMD Opteron 244 1800 MHz. 32 used SuSE Linux Enterprise Server 8 Tabela 6 - Skyvase Top Parallel EQUIPAMENTO SISTEMA OPERACIONAL Intel P-III 866 MHz. 24 used kernel 2.2.18_Cluster Athlon 768 MHz. 64 used Linux 2.4.14 Dual G5 2048 MHz. 2 used MacOs X, 10.3 Panther Intel Pentium III (96 total) 48000 MHz. 96 used Linux 2.2.2 Tabela 7 - Skyvase Top Clusters TEMPO (h) 00:01:12 00:01:42 00:01:43 00:01:47 TEMPO (h) 00:00:01 00:00:01 00:00:01 00:00:02 Das tabela 3 e 4, observa-se que o cluster, em relação às tabelas 5 e 6, retiradas do site (HAVELAND, 2005) teve um rendimento bem melhor. Porém teve rendimento menor, se considerada a tabela 7, mas isto pode ser explicado pela velocidade das máquinas do cluster em termos de clock e memória. Desta forma, o resultado obtido pode se considerado satisfatório. Com respeito a implementação de cluster, tem-se um bom rendimento, conforme mostrado nos experimentos. A dificuldade maior é a implementação do cluster. Porém, apesar desta dificuldade, a implementação de uma infra- estrutura de hardware não proprietário e software livre se mostram totalmente viáveis na área de grande processamento e computação gráfica, já que proporciona economia de tempo e recursos financeiros. Assim, em aplicações de alto desempenho, podem-se usar microcomputadores comuns para implementar uma arquitetura paralela para cálculos de natureza complexa. REFERÊNCIAS HAVELAND. Disponível em http://www.haveland.com/. Visitado em 16/10/2005 HOYLER. Disponível em http://hortolândia.hoyler.edu.br. Visitado em 16/10/2005 POVRAY. Disponível em http://www.povray.org. Visitado em 16/10/2005