ESTUDO E PROJETO DE UM CLUSTER PARA COMPUTAÇÃO DE ALTO DESEMPENHO Diego Gadens dos Santos (ICV – UNICENTRO), Luiz Antonio Carraro (participante – UNICENTRO), Gisane Aparecida Michelon (Orientador, Dep. de Ciência da Computação/UNICENTRO ), Tony Alexandre Hild (professor participante UNICENTRO) email: [email protected] Palavras chave: Sistemas Distribuídos, Computação Paralela, Cluster. Resumo Com a necessidade de maximizar o poder de processamento, surgem várias pesquisas que abordam a criação de um supercomputador baseado em vários computadores de processamento comum e de baixo custo. Essa nova arquitetura foi chamada de cluster sendo que o mesmo opera utilizando vários terminais de processamento, que trabalham em conjunto, a fim de otimizar o desempenho como um todo. Neste trabalho propõe-se o estudo e implementação de um cluster para computação de alto desempenho. Introdução Devido a grande demanda por mais poder computacional, especialmente em situações que necessitam de processamento contínuo, as quais podem variar de algumas horas até meses, surge a necessidade de tecnologias de baixo custo e com alto poder de processamento. A computação distribuída é um exemplo de tecnologia de alto desempenho, que utiliza uma coleção de máquinas interligadas em rede, cujo objetivo é concluir uma tarefa em comum, caracterizando assim, um cluster. Em um cluster, as máquinas devem trabalhar em conjunto a fim de coordenar e organizar todas as ações a serem executadas. Esse agrupamento de máquinas deve ser transparente, ou seja, o usuário deve ter a impressão de estar trabalhando com apenas uma máquina [PEREIRA FILHO, 2004]. Os custos provém da aquisição de máquinas de processamento comum e da implementação de aplicações específicas para o cluster. Mesmo assim, estes custos são menores do que os custos gerados com a aquisição de computadores potentes, podendo até superar os mesmos, em relação ao processamento [INFOWESTER, 2007]. Materiais e Métodos Devido ao assunto ser de grande importância para a área da computação distribuída e estar em constante expansão, trata-se de uma pesquisa de caráter investigativo. Com isso, foi realizado um estudo aprofundado sobre clusters, suas características, ferramentas e outros tópicos importantes para desenvolvimento do projeto [INFOWESTER, 2007]. Após a etapa de levantamento bibliográfico, estão sendo avaliados recursos de software a serem utilizados na implementação, como o sistema operacional e o sistema base de operação do cluster, ambos baseados em software livre [Software livre, 2007] sob a licença da General Public License (Licença Pública Geral) [GPL, 2007]. A etapa seguinte do projeto trata-se da implementação e testes do cluster. Resultados e Discussão Como o presente projeto encontra-se na fase inicial, os resultados até agora alcançados foram a pesquisa bibliográfica na área de processamento distribuído e principalmente sobre cluster. Foram pesquisadas várias ferramentas para a implementação do cluster, e até o presente momento constatou-se que o sistema operacional a ser utilizado será o Linux, por tratar-se de software livre e de código aberto, o que facilita a configuração e customização de um cluster. Além disso, preferiu-se o Linux, pelo motivo de ser uma tendência, visto que a maior parte dos clusters implementados utiliza este sistema operacional. Foram pesquisados os softwares disponíveis e que poderiam ser utilizados no sistema operacional Linux. Este software será responsável pela gerência do processamento. Existem muitos, dentre os quais destacam-se o OpenMosix, kerrighed e o OpenSSI. Outro estudo ocorreu em relação aos tipos de clusters e quais aplicações cada um executa. De acordo com a aplicação que pretende-se executar em um cluster implementa-se o seu tipo adequado. Conclusões A motivação em utilizar um cluster advém de vários fatores, entre eles o baixo custo dos computadores e a otimização do processamento dos mesmos [PITANGA, 2006]. Dessa forma um cluster pode ser utilizado como uma alternativa aos supercomputadores. Como as pesquisas relacionadas a este assunto são escassas, o estudo dessa nova tecnologia poderá ser utilizado por outros profissionais que necessitem de informações sobre este tema. Referências GPL GNU. Página do projeto de licença GPL. Disponível em http://www.gnu.org/copyleft/gpl.html. Acessado em 18.09.2007. INFOWESTER. Página oficial do Infowester. Disponível em http://www.infowester.com. Acessado em 22/09/2007. PEREIRA FILHO, N. A. Serviços de Pertinência para Clusters de Alta Disponibilidade. Dissertação de Mestrado apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo. São Paulo, SP: USP, 2004. PITANGA, MARCOS. Computação em cluster. Ed. Brasport, 1ª Edição, 2003. SLACKWARE. Página oficial do sistema operacional Slackware. Disponível em http://www.slackware.com. Acessado em 10/08/2007. SOTWARE LIVRE. Site oficial do Software livre no Brasil. Disponível em http://www.softwarelivre.gov.br/. Acessado em 20/09/2007.