Infraestrutura de Software Prof. Dr. Ney Lemke [email protected] IBB-Unesp Agenda Introdução Pesquisa GridUnesp Demandas Computacionais Infra-estrutura de Software do GridUnesp Discussão Grid Computing Questionário Perguntas Ney Lemke André Malvezzi Adriano Cansian Gastão Krein João Figueiredo Makoto Myoshida 1. Which is your research area? Bioinformatics Condensed Matter Computer Security Physics Computational Fluid Dynamics Protein Folding 2.1. Operating System: Linux, MacOS Linux,Windows Linux Linux Windows and Linux Linux 2. Computing Language: C++,Java,Python Fortran Java, C, SQL and PHP Fortran 77/90, C/C++ Fortran 90/95 ,C/ C++, Python Fortran, C/C+ + 2.3. Open Source or Proprietary Codes : Both Own Code Open Source Open Source Own Code Open source 2.4. Necessary libraries: None IMSL libft, JDK and JRE MPI IMSL, MPI 2.5. Typical use of RAM memory: 2 Gb 1 Gb 1 Gb A lot 15GB - 500TB 1 Mb 2.6. Typical use of disk space: 100 Gb 50 Gb 30 Gb 1 Tb 25 Tb 1 Gb 2.7. CPU bounded?: Yes Yes No Yes Yes 2.8. I/O bounded?: No No No Yes No 2.9. Execution time of the jobs: 4h-24 h days Daemon Months Days 2.10. Bag-of-tasks application?: Yes Yes No 3.1. Are you looking forward to have your jobs running on GridUNESP: Yes Yes Yes Yes Yes Not yet 3.2. Do you use a grid application to process your jobs Condor No No No No No 3.3. Do you know if your application is already adapted to run on a grid infrastructure? Yes No No Yes No No 3.4. Do you know any alternative to the software you are using that is already adapted to run on grids? Yes No No Yes Yes No Days Yes 3. About your research problem and the grid: Questionário Perguntas 3.5. Do yo u know a ny expert that is working on this a dap tation? 3.6. Are yo u re ady to co opera te with an internatio nal effort to mak e yo ur application rea dy to run o n OSG? 3.7. Do yo u have a ny students o r po stdocs that could work on this? 3.8 What do yo u need to co operate on this (tra vel, bring expert, etc.) Andr_ Malvezzi Ney Lemke Adriano Cansian Gast_o Krein Jo_o Figueiredo Myos hida Yes No No Yes No Yes Yes Yes Yes Yes Yes Yes Yes No Yes Yes No Tra vel Talk Expe rt Tra vel Bring Expert No Computer Time Infraestrutura de Software Instalação baseada no CentOS 5.4 Pacotes adicionais: Development Tools group C++, C, Java Intel C, C++ Intel MPI Fortran Intel e g77 Fortran90 Gromacs Infraestrutura de Software Bibliotecas Matemáticas – GMP – MKL – BLAS – LAPACK – MSL Depuradores – GDB – Depuradores Paralelos Software não Livre Crystal Gaussian Amber Mathematica Mathlab CFD GID ANSYS Análise da Demanda Novo cadastro de Grupos de Pesquisa e de Projetos. Demanda por recursos de Clusters Documentacao para o usuário Infra-estrtura de software Uma boa parte das nossas demandas podem ser satisfeitas com a instalação do CentOS + OSG. Parte das aplicações foram implementadas pelos usuários e poderão ser facilmente portadas para o grid com algum esforço de gridificação. Ambiente de Desenvolvimento • • • • Parte do desenvolvimento poderá ser feito nos clusters. Parte do desenvolvimento deverá ser feito na máquina do usuário. Apesar de existirem soluções de interesse genérico, parte dos problemas deverá ser resolvido caso a caso. Política Aquisição Software • • • Como encaminhar o proceso de aquisição de software? Projeto comum para Fapesp? Solicitação à Reitoria Desafios Permitir que os usuários se concentrem em suas áreas de pesquisa e consigam abstrair a infra-estrutura computacional. Diminuir a declividade da curva de aprendizagem Disponibilidade: MFLOPY != 365*24*3600*MFLOPS