Análise de Desempenho dos Frameworks de Persistência Hibernate e Spring Data 1 Vitor Gotardo , Edson A. Oliveira Junior 2 Resumo. Grande parte das aplicações desenvolvidas utilizando linguagens orientadas a objetos persistem seus objetos por meio de bases de dados relacionais com o apoio de frameworks de Mapeamento Objeto-Relacional (ORM), como Hibernate. Este artigo apresenta uma análise de desempenho baseada em benchmark dos frameworks Hibernate e Spring Data. Tal análise fornece indícios iniciais para que analistas e desenvolvedores possam escolher os frameworks mais apropriados para o desenvolvimento de seus projetos. Palavras-chave: framework, ORM, Hibernate, JPA, Spring Data, benchmark. Abstract. Most applications developed using object-oriented languages persist your objects using relational databases with support of Object-Relational Mapping (ORM) frameworks such as Hibernate. This paper presents a benchmark-based performance analysis for Hibernate and Spring Data frameworks. Such an analysis provides initial evidence to analysts and developers may choose the most appropriate frameworks for the development of their projects. Keywords: framework, ORM, Hibernate, JPA, Spring Data, benchmark. 1. Introdução Muitas aplicações utilizam dados que precisam ser guardados e recuperados, em um ambiente orientado a objetos. Os objetos são utilizados para representar esses dados, e nesse caso, é o objeto que precisa ser armazenado. Para tanto, existem três tipos de mecanismos de persistência de objetos: Object-Oriented Database Management Systems (OODBMS), Relational Database Management Systems (RDBMS) e ObjectRelational Database Management Systems (ORDMS) [1]. Um problema muito conhecido na persistência de objetos em um banco de dados relacional é o conflito de impedância, que surge entre o modelo orientado a objeto e o modelo relacional e também entre a linguagem orientada a objeto e a linguagem de consulta (query) relacional [1]. Conflito de impedância é quando dois sistemas diferentes não funcionam de maneira ideal e eficiente quando conectados para funcionarem em conjunto. Poderíamos dizer então que os conceitos de modelo de orientação a objeto e do modelo relacional possuem valores de impedância diferentes. Enquanto o modelo relacional dá mais ênfase aos dados em si e sua representação e organização, o modelo orientado a objetos enfoca na abstração dos dados e seu comportamento, operações na forma de objetos [7]. O Mapeamento Objeto-Relacional (Object-Oriented Mapping - ORM) foi desenvolvido para servir como uma ponte entre esse conflito de impedância e tornar a persistência de objetos mais simples. Assim, é oferecido um mapeamento entre o modelo orientado a objeto e o modelo relacional [1]. 1 Aluno do curso de especialização em Desenvolvimento de Sistemas para Web – Universidade Estadual de Maringá (UEM) - Av. Colombo, 5790 – Bloco C56 – Maringá – PR – Brasil – [email protected] 2 Departamento de Informática – Universidade Estadual de Maringá (UEM) - Av. Colombo, 5790 – Bloco C56 – Maringá – PR – Brasil - [email protected] 1 Este artigo tem como meta comparar dois frameworks ORM, o Hibernate que é um dos mais consolidados por desenvolvedores Java e .NET e o Spring Data JPA que é um framework recente, mas que promete agilizar o desenvolvimento da camada de persistência. Para tal comparação serão utilizados algumas operações de persistência sendo elas: consultas simples e com joins, inserção, alteração e exclusão. Será utilizado uma média do desempenho dos procedimentos executados para encontrar o framework com menor tempo médio nas operações de persistência. Este artigo está organizado da seguinte forma: na Seção 2 são abordadas as tecnologias utilizadas para efetuar a comparação dos frameworks; na Seção 3 é realizado o estudo comparativo de desempenho entre Hibernate e Spring Data JPA; na Seção 4 é apresentada a conclusão e trabalhos que podem ser desenvolvidos futuramente. 2. Revisão Bibliográfica 2.1. Hibernate O Hibernate é um projeto que tem como objetivo ser uma solução completa para o problema de mapeamento persistindo dados em Java. Ele serve como mediador na interação de aplicações com banco de dados relacional, deixando o desenvolvedor livre para concentrar-se na camada de negócio da aplicação. O Hibernate é uma solução não intrusiva. O desenvolvedor não precisa seguir todas as regras e design patterns quando estiver desenvolvendo a camada lógica de negócio e classes de persistência, mas, o Hibernate se integra facilmente com a maioria das novas e existentes aplicações e não requer grandes mudanças na aplicação [9]. 2.2. Spring Data JPA O Spring oferece suporte para as tecnologias de acesso a dados desde seu início. Este oferece uma implementação mais simples de acesso a dados, independente da tecnologia utilizada como JDBC, Hibernate, TopLink, JDO e iBatis para a persistência de dados. O principal alvo do Spring em relação a acesso a dados era bancos de dados relacionais, sendo que esta tecnologia era predominante quando se trata de persistência de dados. Com a chegada da tecnologia NoSQL a espaço para criar suporte para desenvolvedores surgiu. Além disso, ainda existem melhorias a serem feitas relacionadas ao acesso a dados relacionais. Foram esses fatores que incentivaram a criação do projeto Spring Data que consiste em módulos dedicados para tecnologias como NoSQL, JPA e módulos JDBC para suporte a banco de dados relacional [12]. O projeto Spring Data JPA, embora não seja um framework ORM, foi desenvolvido com base no padrão JPA 2 para trabalhar com qualquer framework que siga tal especificação. O Spring Data JPA é responsável pela criação das classes Data Access Object (DAO) que possuem os métodos concretos para comunicação com a base de dados. Assim, fica abstraída a necessidade de se criar classes concretas para os repositórios de dados, sendo necessário apenas criar uma interface específica para cada classe de entidade, e nelas, estender a interface JpaRepository [3]. 2.3. Benchmark Employees Sample Database O benchmark é um teste, ou uma série de testes, que medem o desempenho de um sistema ou subsistema enquanto executam tarefas definidas. O benchmark deve medir o pico de desempenho de um sistema, normalmente operações com um problema conhecido. Benchmarks medem a capacidade de um sistema, muitas vezes referente a performance de uma aplicação em particular, como um banco de dados [11]. 2 Neste artigo o benchmark é utilizado para medir o desempenho de frameworks ORM efetuando operações de persistência em banco de dados relacional, assim, tornando possível a comparação entre eles. A base de dados Employee Sample Database foi desenvolvida por Crews e Maxia [4] e fornece aproximadamente 160MB de dados que estão separados em seis tabelas, fornecendo um total de 4 milhões de registros. Tal benchmark é bastante interessante para realizar tarefas de comparação de mecanismos de persistência de dados. 2.4. Java Persistence Query Language Em muitas maneiras o JPQL é similar ao SQL, uma ferramenta para interagir com base de dados relacional. Além disso, o JPQL é similar ao SQL em sua sintaxe, declarações e cláusulas. A principal diferença entre JPQL e SQL esta nos objetos que são especificados nas declarações e o objeto retornado por esta declaração. Em declarações SQL, é definido diretamente o objeto que deseja utilizar, por exemplo, uma tabela ou view para ser consultada ou modificada. Em declarações JQPL são utilizadas as entidades. E o mesmo acontece para os resultados retornados pela consulta JQPL, estes são instâncias de entidades, enquanto que os resultados retornados pelo SQL são tabelas ou views. Resumindo, o JQPL trata as entidades mapeadas para uma estrutura de base de dados, não precisando lidar com a estrutura da base de dados diretamente. O JQPL simplifica muito a tarefa de recuperar entidades. Todas as instâncias de entidades retornadas são automaticamente mapeadas. Assim, não é necessário mapear estas instâncias manualmente [10]. 2.5. Anotação @Query A anotação @Query pode ser utilizada para criar consultas usando JPA e vincular esta consulta a um método na interface dos repositórios. Assim, quando o método é chamado, o Spring Data JPA executa a consulta especificada na anotação @Query [6]. 3. Estudo Comparativo de Desempenho entre Hibernate e Spring Data JPA 3.1. Ambiente de Testes Para efetuar os testes de benchmark foi utilizado: • Spring Tool Suite 3.3.0 como ambiente de desenvolvimento integrado (IDE) • Spring Framework 3.1.1 • Hibernate 4.2.2; • Spring Data JPA 1.3.4; • MySQL 5.5.24; • Java JDK 1.7; • Maven 3.0.5 para construir os projetos mais facilmente mantendo as versões dos pacotes utilizados sempre estáveis e garantir que as mesmas versões foram utilizadas para os dois projetos. O computador usado para os testes tem processador [email protected] com 4 núcleos reais e 8 threads, e 16GB de memoria RAM. 3.2. Planejamento, Execução e Análise dos Resultados 3 3.2.1 Definição de Contexto e Planejamento do Estudo Comparativo 3.2.1.1 Objetivo do Estudo Comparar frameworks de persistência objeto-relacional com o objetivo de identificar o melhor desempenho com relação a operações de persistência de dados em um banco de dados relacional do ponto de vista de analistas e desenvolvedores de software no contexto de um benchmark específico para operações de persistência relacionais. 3.2.1.2 Seleção das Variáveis • Variáveis independentes (entrada/causa): o • Framework de persistência – Hibernate e Spring Data JPA Variável dependente (observação/efeito): o Desempenho 3.2.1.3 Definição das Hipóteses • Hipótese Nula (H0): os tempos médios para a execução das operações de persistência usando Hibernate e Spring Data JPA são os mesmos. • Hipótese Alternativa (H1): o tempo médio de execução das operações de persistência usando Hibernate é menor que o tempo médio usando Spring Data JPA. • Hipótese Alternativa (H2): o tempo médio de execução das operações de persistência usando Hibernate é maior que o tempo médio usando Spring Data JPA. 3.2.2 Execução do Estudo Comparativo O estudo comparativo foi conduzido com base na execução de 14 operações de persistência, sendo 11 consultas (query1 a query11), sendo que as consultas (query3 e query5) possuem JOIN e as demais são consultas simples, 1 inserção, 1 alteração e 1 exclusão. Cada consulta foi executada 10 vezes manualmente, sendo efetuado o cálculo médio do desempenho de cada consulta para ter uma ideia geral dos resultados. Query1: é uma consulta simples que busca 1 Employee em um total de 10.000 registros. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id = 249359")”. Como mostra a Figura 1 o Hibernate efetuou a consulta em 0,163s e o Spring Data JPA efetuou a consulta em 0,048s. 4 0,2 0,163 0,15 0,1 0,048 0,05 0 Hibernate SpringData JPA Figura 1: Busca 1 Employee em um total de 10.000 registros. Query2: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID maior que 20.000 utilizando o operador “>”. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id > 20000")”. Como mostra a Figura 2 o Hibernate efetuou a consulta em 1,006s e o Spring Data JPA efetuou a consulta em 1,087s. 1,087 1,1 1,08 1,06 1,04 1,02 1,006 1 0,98 0,96 Hibernate SpringData JPA Figura 2: Busca 10.000 registros do tipo Employee com ID maior que 20.000. Query3: é uma consulta com JOIN que busca 10.000 registros do tipo Employee que possuam o ID maior que 20.000 e estão no Department de ID 7, os resultados estão ordenados pela data de início e de término que determinado Employee permaneceu no departamento. Foram utilizadas as tabelas employees e dept_emp e o comando utilizado para esta consulta foi: “@Query("FROM Employee e INNER JOIN e.deptEmps de WHERE e.id > 20000 AND de.pk.department = 7 ORDER BY de.from_date, de.to_date")”. Como mostra a Figura 3, o Hibernate efetuou a consulta em 3,826s e o Spring Data JPA efetuou a consulta em 3,536s. 5 3,9 3,826 3,8 3,7 3,6 3,536 3,5 3,4 3,3 Hibernate SpringData JPA Figura 3: Busca 10.000 registros do tipo Employee com ID maior que 20.000 que estão no Department de ID 7, ordenados pelas datas de início e término. Query4: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID maior ou igual a 20.000 utilizando o operador “>=”. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id >= 20000")”. Como mostra a Figura 4, o Hibernate efetuou a consulta em 1,021s e o Spring Data JPA efetuou a consulta em 1,055s. 1,055 1,06 1,05 1,04 1,03 1,021 1,02 1,01 1 Hibernate SpringData JPA Figura 4: Busca 10.000 registros do tipo Employee com ID maior ou igual que 20.000. Query5: é uma consulta com JOIN que busca 10.000 registros do tipo Employee que estão no Department de ID 7. Foi utilizado as tabelas employees e dept_emp e o comando utilizado para esta consulta foi: “@Query("FROM Employee e INNER JOIN e.deptEmps de WHERE de.pk.department = 7")”. Como mostra a Figura 5, o Hibernate efetuou a consulta em 3,787s e o Spring Data JPA efetuou a consulta em 3,470s. 6 3,9 3,787 3,8 3,7 3,6 3,47 3,5 3,4 3,3 Hibernate SpringData JPA Figura 5: Busca 10.000 registros do tipo Employee que estão no Department de ID 7. Query6: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID menor que 20.000 utilizando o operador “<”. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id < 20000")”. Como mostra a Figura 6, o Hibernate efetuou a consulta em 0,997s e o Spring Data JPA efetuou a consulta em 1,064s. 1,08 1,064 1,06 1,04 1,02 0,997 1 0,98 0,96 Hibernate SpringData JPA Figura 6: Busca 10.000 registros do tipo Employee com ID menor que 20.000. Query7: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID menor ou igual a 20.000 utilizando o operador “<=”. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id <= 20000")”. Como mostra a Figura 7, o Hibernate efetuou a consulta em 1,007s e o Spring Data JPA efetuou a consulta em 1,041s. 1,05 1,041 1,04 1,03 1,02 1,01 1,007 1 0,99 Hibernate SpringData JPA Figura 7: Busca 10.000 registros do tipo Employee com ID menor ou igual que 20.000. 7 Query8: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID diferente de 20.000 utilizando o operador “<>”. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id <> 20000")”. Como mostra a Figura 8, o Hibernate efetuou a consulta em 1,006s e o Spring Data JPA efetuou a consulta em 1,037s. 1,037 1,04 1,03 1,02 1,01 1,006 1 0,99 Hibernate SpringData JPA Figura 8: Busca 10.000 registros do tipo Employee com ID diferente de 20.000. Query9: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam o ID entre 25.000 e 50.000 utilizando o operador BETWEEN. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.id BETWEEN 25000 AND 50000")”. Como mostra a Figura 9, o Hibernate efetuou a consulta em 0,998s e o Spring Data JPA efetuou a consulta em 1,033s. 1,04 1,033 1,03 1,02 1,01 1 0,998 0,99 0,98 Hibernate SpringData JPA Figura 9: Busca 10.000 registros do tipo Employee com ID entre 25.000 e 50.000. Query10: é uma consulta simples que busca 10.000 registros do tipo Employee que são do GENDER(sexo) masculino(M) utilizando o operador IN. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.gender IN('M')")”. Como mostra a Figura 10, o Hibernate efetuou a consulta em 0,999s e o Spring Data JPA efetuou a consulta em 1,030s. 8 1,04 1,03 1,03 1,02 1,01 0,999 1 0,99 0,98 Hibernate SpringData JPA Figura 10: Busca 10.000 registros do tipo Employee que são do sexo masculino. Query11: é uma consulta simples que busca 10.000 registros do tipo Employee que possuam primeiro nome com as letras “Sa” utilizando o operador LIKE. Foi utilizado somente a tabela employees da base de dados e o comando utilizado para esta consulta foi: “@Query("FROM Employee e WHERE e.first_name LIKE '%Sa%'")”. Como mostra a Figura 11, o Hibernate efetuou a consulta em 1,039s e o Spring Data JPA efetuou a consulta em 1,066s. 1,066 1,07 1,06 1,05 1,039 1,04 1,03 1,02 Hibernate SpringData JPA Figura 11: Busca 10.000 registros do tipo Employee que possuam “Sa” no primeiro nome. Query12: foram inseridos 1.000 objetos do tipo Employee na tabela employees. Todas as propriedades do objeto foram preenchidas, sendo elas: first_name, last_name, gender, hire_date, birth_date. Como mostra a Figura 12, o Hibernate efetuou a inserção em 0,701s e o Spring Data JPA efetuou a inserção em 5,930s. 7 5,93 6 5 4 3 2 1 0,701 0 Hibernate SpringData JPA Figura 12: Inserção de 1.000 objetos do tipo Employee. 9 Query13: foram alterados os últimos 10.000 registros do tipo Employee, os campos alterados foram: first_name, last_name, gender. Como mostra a Figura 13, o Hibernate efetuou a operação em 0,177s e o Spring Data JPA efetuou a operação em 0,078s. 0,2 0,177 0,15 0,1 0,078 0,05 0 Hibernate SpringData JPA Figura 13: Alteração dos últimos 10.000 registros do tipo Employee. Query14: foram excluídos os últimos 10.000 registros do tipo Employee. Como mostra a Figura 14, o Hibernate efetuou a operação em 0,247s e o Spring Data JPA efetuou a operação em 0,147s. 0,3 0,247 0,25 0,2 0,147 0,15 0,1 0,05 0 Hibernate SpringData JPA Figura 14: Exclusão dos últimos 10.000 registros do tipo Employee. 3.2.3 Análise dos Dados do Estudo Comparativo Com base na execução das 14 operações de persistência realizadas neste estudo o Hibernate obteve melhor desempenho em 9 operações. O Spring Data JPA obteve melhor desempenho em 5 operações. Sendo assim, o framework Hibernate obteve o melhor desempenho geral com base nas operações utilizadas neste estudo. A Tabela 1 mostra o desempenho dos frameworks categorizados por tipo de operação. Cláusulas Hibernate Spring Data JPA WHERE 8 1 JOIN x 2 INSERT 1 x UPDATE x 1 10 DELETE x 1 Total 9 5 Tabela 1: Desempenho dos frameworks categorizados por tipo de operação. Assim, o estudo realizado fornece indícios de que a hipótese nula (H0) deve ser rejeitada e, consequentemente, a hipótese alternativa (H1) deve ser aceita, sendo que na média, o framework Hibernate obteve melhor desempenho do que o framework Spring Data JPA para as operações realizadas neste estudo. O resultado do desempenho geral dos frameworks pode ser visto na Figura 15. 2 1,544 1,5 1,199 1 0,5 0 Hibernate SpringData JPA Figura 15: Desempenho geral dos frameworks. 4. Conclusões e Trabalhos Futuros Este artigo apresentou uma análise de desempenho baseada em benchmark por meio de uma série de operações de persistência com o intuito de fornecer evidências iniciais podendo guiar analistas e gerentes na escolha do framework de persistência mais adequado para os seus projetos. Com base nos resultados obtidos pode-se observar uma ligeira vantagem na utilização do Hibernate com relação ao Spring Data para o conjunto de operações definidas pelo benchmark utilizado. Como direção a trabalhos que podem ser desenvolvidos futuramente tem-se: (i) a análise do desempenho em um sistema multiusuário; (ii) planejamento e realização de uma análise comparativa utilizando benchmarks com operações de persistência mais complexas; (iii) estudo comparativo dos diferentes tipos de linguagem de queries suportadas pelos frameworks; e (iv) comparação de funcionalidades entre os frameworks. Referências Bibliográficas [1] PIETER VAN ZYL, DERRICK G. KOURIE, ANDREW BOAKE – Comparing the Performance of Object Databases and ORM Tools. Disponível em: <http://odbms.org/download/027.01 Zyl Comparing the Performance of Object Databases and ORM Tools September 2006.PDF>. Acesso em: 10, set, 2013. [2] MIKAEL KOPTEFF – The Usage and Performance of Object Databases compared with ORM tools in a Java environment. Disponível em: <http://www.odbms.org/download/045.01 11 Kopteff The Usage and Performance of Object Databases Compared with ORM Tools in a Java Environment March 2008.PDF>. Acesso em: 10, set, 2013. [3] MARCIO BALLEM S. – Persistencia com Spring Data JPA. Disponível em: <http://www.devmedia.com.br/persistencia-com-spring-data-jpa-revista-java-magazine-103/24390>. Acesso em: 10, set, 2013. [4] MYSQL – Employees Sample Database – Introduction. Disponível em: <http://dev.mysql.com/doc/employee/en/employees-introduction.html>. Acesso em: 11, set, 2013. [5] ORACLE – The Java Persistence Query Language. Disponível em: <http://docs.oracle.com/javaee/6/tutorial/doc/bnbtg.html>. Acesso em: 11, set, 2013. [6] PETRI KAINULAINEN – Spring Data JPA Tutorial Part Three: Custom Queries with Query Methods. Disponível em: <http://www.petrikainulainen.net/programming/spring-framework/springdata-jpa-tutorial-three-custom-queries-with-query-methods/>. Acesso em: 01, out, 2013. [7] DIOGO V. DOS SANTOS, MARCELO DE R. MARTINS – Métricas para avaliação das alternativas de persistência de dados num ambiente objeto relacional. São Paulo: IME/USP, 2007. [8] SHOAIB MAHMOOD BHATTI, ZAHID HUSSAIN ABRO, FARZANA RAUF ABRO – Performance Evaluation of Java Based Object Relational Mapping Tools. Disponível em: <http://publications.muet.edu.pk/research_papers/pdf/pdf755.pdf>. Acesso em: 16, nov, 2013. [9] CHRISTIAN BAUER, GAVIN KING – Java Persistence with Hibernate. Manning Publications, Revised edition, p. 4, 2006. [10] YULI VASILIEV – Beginning Database-Driven Application Development in Java EE: Using GlassFish. Apress, 1 edition, p. 283 – 284, 2008. [11] MIKE AULT, DONALD K. BURLESON, CLAUDIA FERNANDEZ, KEVIN KLEIN, BERT SCALZO - Database Benchmarking: Practical Methods for Oracle & SQL Server. Rampant Techpress, PAP/CDR edition, p. 19, 2007. [12] JONATHAN L. BRISBIN, OLIVER GIERKE, THOMAS RISBERG, MARK POLLACK, MICHAEL HUNGER – Spring Data. O'Reilly Media, 1 edition, p. 3, 2012. 12