U NIVERSIDADE F EDERAL DE G OIÁS I NSTITUTO DE I NFORMÁTICA ÁUREA VALÉRIA P EREIRA DA S ILVA Persistência de Dados Clínicos Baseada nas Definições ADL de Arquétipos do openEHR Goiânia 2016 ÁUREA VALÉRIA P EREIRA DA S ILVA Persistência de Dados Clínicos Baseada nas Definições ADL de Arquétipos do openEHR Dissertação apresentada ao Programa de Pós-Graduação do Instituto de Informática da Universidade Federal de Goiás, como requisito parcial para obtenção do título de Mestre em Computação. Área de concentração: Ciência da Computação. Orientador: Prof. Dr. Plínio de Sá Leitão Júnior Goiânia 2016 2 Ficha de identificação da obra elaborada pelo autor, através do Programa de Geração Automática do Sistema de Bibliotecas da UFG. Valéria Pereira da Silva, Áurea Persistência de Dados Clínicos Baseada nas Definições ADL de Arquétipos do openEHR [manuscrito] / Áurea Valéria Pereira da Silva. - 2016. 90 f.: il. Orientador: Prof. Dr. Plínio de Sá Leitão Júnior. Dissertação (Mestrado) - Universidade Federal de Goiás, Instituto de Informática (INF), Programa de Pós-Graduação em Ciência da Computação, Goiânia, 2016. Bibliografia. Anexos. Inclui lista de figuras. 1. Persistência de dados Médicos. 2. Persistência direta de Arquétipos. 3. Interoperabilidade de Registros Eletrônicos de Saúde. I. de Sá Leitão Júnior, Plínio , orient. II. Título. CDU 004 Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador(a). Áurea Valéria Pereira da Silva Licenciada em Computação pela UNEMAT(Universidade do Estado de Mato Grosso), Campus de Alto Araguaia. Durante a pós-graduação foi bolsista da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). 5 Á minha mãe Alda e ao meu pai Vanderlei 6 Agradecimentos Agradeço primeiramente a Deus, que me guiou para que eu chegasse aqui neste momento, escolhendo cada pessoa que me acompanhou nessa jornada chamada “Mestrado”. Agradeço ao professor Dr. Plínio de Sá Leitão Júnior pela orientação, exigência, paciência e disponibilidade. Agradeço pela confiança depositada, pelas contribuições através das enriquecedoras reuniões. Aos colegas de curso, em especial ao Paulo, Vinícius e Walisson, que estiveram comigo nos momentos mais difíceis durante o mestrado, escutando e me dando apoio para eu não desistir quando as coisas não estavam a meu favor. A Ludmila e ao Alexandre, que me deram atenção para as conversas mais banais, que dava ânimo para retornar a este trabalho, agradecendo também por ler algumas das minhas produções, pelas sugestões e pela troca de experiências. A Laís, Nattane, Joyce, Luis e Afonso, pelo apoio que deram no decorrer do mestrado. Aos meus “irmãos” de orientação, principalmente á Beatriz que me auxiliou tantas vezes em meio as dificuldades que tive no cumprimento dos créditos do mestrado. Agradeço a Isabel por revisar a minha dissertação, e vejo nela uma grande companheira e teria muito orgulho de inclui-la em meu ciclo de amizades. Ao meu pai Vanderlei e minha mãe Alda, por serem meu porto seguro, ajudando sempre nos caminhos que eu enfrento, apoiando as minhas decisões e desafios. Por minhas irmãs Alba e Wanderléia, pelo apoio e por entenderem minha ausência em momentos bons e ruins de suas vidas, e por sempre retribuírem com abraços repletos de compreensão e saudade. Aos meus colegas de laboratório, a Capes pelo apoio financeiro, e a todos que perto ou longe, me ajudaram a concretizar esta etapa importante. 7 Albert Einstein, A menos que modifiquemos a nossa maneira de pensar, não seremos capazes de resolver os problemas causados pela forma como nos acostumamos a ver o mundo. Resumo Silva, Áurea V. P. da. Persistência de Dados Clínicos Baseada nas Definições ADL de Arquétipos do openEHR. Goiânia, 2016. 88p. Dissertação de Mestrado. Instituto de Informática, Universidade Federal de Goiás. Introdução: OpenEHR é uma padronização dos Sistemas de Informação em Saúde (SIS) que se preocupa principalmente com a troca de Registros de Saúde Eletrônicos (RES). Um dos maiores obstáculos à adoção do openEHR é a carência de especificações de persistência de banco de dados. Objetivo: O objetivo deste trabalho é o mapeamento de estruturas de armazenamento a partir das especificações Archetype Definition Language (ADL) que descrevem a estrutura do conhecimento clínico. Métodos: Esta pesquisa inicialmente faz um mapeamento sistemático sobre estruturas de persistência que são derivadas diretamente de especificações ADL, isto é, sem dependências do Modelo de Referência (RM) de openEHR. Uma nova estratégia de persistência é proposta e comparada com as encontradas na literatura. Resultados: Foram utilizados pressupostos, critérios e regras para apresentar a abordagem proposta. Uma avaliação considerou aspectos quantitativos das estruturas de persistência, em comparação com o que foi encontrado na literatura. Conclusões: A avaliação revelou algumas vantagens da abordagem proposta, tais como: reduções de atributos de referência (integridade referencial) e redundância em banco de dados clínicos; produção de registros clínicos não identificados em relação ao paciente; criação de uma tabela de base única para cada arquétipo, independentemente da sua utilização sob a forma de slots; escalabilidade do esquema de banco de dados (número estável de tabelas de banco de dados), mesmo na ocorrência de recursão através de slots. Palavras–chave Persistência de dados clínicos; Persistência direta de Arquétipos; Interoperabilidade de Registros Eletrônicos de Saúde. 9 Abstract Silva, Áurea V. P. da. Clinical Data Persistence Based on OpenEHR Archetypes ADL Definitions. Goiânia, 2016. 88p. MSc. Dissertation. Instituto de Informática, Universidade Federal de Goiás. Introduction: OpenEHR is a standardization of Health Information Systems (HIS) that is mainly concerned with the exchange of Electronic Health Records (EHR). One of the major obstacles to the adoption of openEHR is the lack of database persistence specifications. Objective: The aim of this work is the mapping of storage structures from the Archetype Definition Language (ADL) specifications which describe clinical knowledge structure. Method: This research initially makes a systematic mapping about persistence structures that are derived directly from ADL specifications, i.e. without dependences from the Reference Model (RM) of openEHR. A new persistence strategy is proposed and compared with ones found in the literature. Results: Assumptions, criteria and rules were used to present the proposed approach. Its evaluation considered quantitative aspects of persistence structures. Conclusion: The evaluation revealed some advantages of proposed approach, such as: reductions of reference attributes (referential integrity) and redundancy in clinical database; production of unidentified clinical records in relation to the patient; creation of a single base table for each archetype, regardless of its use in the form of slots; scalability of database schema (stable number of database tables), even in the occurrence of recursion through slots. Keywords Clinical Data Persistence; Direct Persistence of Archetypes; Interoperability of Electronic Health Records. 10 Sumário Lista de Figuras 14 Lista de Tabelas 16 1 17 18 18 19 19 19 Introdução 1.1 Motivação 1.2 Problema 1.3 Objetivo 1.3.1 1.4 2 Organização do trabalho Estrutura dos Dados Clínicos a partir do openEHR 2.1 Arquitetura Multinível 2.2 Padrão openEHR 2.3 2.4 3 Objetivos específicos 2.2.1 Modelo de Referência (MR) 2.2.2 Definição de Arquétipo Archetype Definition Language – ADL 2.3.1 dADL (Data Archetype Definition Language) 2.3.2 cADL (Constraint Archetype Definition Language) 2.3.3 FOPL (First-Order Predicate Logic) 2.3.4 Função Slot 2.3.5 Modelos de Persistência de Dados Baseada no openEHR 2.3.6 Bases de Arquétipos Considerações finais Trabalhos Relacionados 3.1 Protocolo 3.1.1 Elaboração das Questões 3.1.2 Fontes de seleção Idioma dos estudos Identificação das Fontes 21 21 22 23 24 25 26 28 30 31 32 32 33 34 34 35 36 36 36 Palavras-chave e termos relacionados Formação da string de busca 3.1.3 Seleção de estudos Critérios de Inclusão dos Estudos Critérios de Exclusão dos Estudos Definição do Tipo dos Estudos Procedimentos para a Seleção 3.2 Condução do Mapeamento Sistemático – Processo de Busca e seleção dos 38 trabalhos 3.3 Condução do Mapeamento Sistemático - Resumo Estruturado dos Estudos Selecionados 3.3.1 Archetype Relational Mapping Based on openEHR [39] 3.3.2 Archetype relational mapping a practical openEHR persistence solution [40] 3.3.3 Applying the archetype approach to the database of a biobank information 3.3.4 Case Study: Applying OpenEHR Archetypes to a Clinical Data Repository in a Chinese Hospital [22] 4 Condução do Mapeamento Sistemático - Análise dos Estudos Selecionados 3.4.1 Estratégias sobre a persistência de dados 3.4.2 Comparação das Estratégias que Persistem Diretamente os Arquétipos 3.4.3 Desafios 3.5 Resposta á Questão Primária 3.6 Considerações finais Protocolo para o Mapeamento Direto de Arquétipos 4.1 Pressupostos para o Mapeamento Direto dos Arquétipos 4.2 Critérios Básicos para a Persistência dos Arquétipos 4.3 Regras para o Mapeamento Direto dos Arquétipos 4.3.1 Regra R1: Metadados para a persistência de dados clínicos 4.3.2 Regra R2: Tabela base para cada arquétipo 4.3.3 Regra R3: Compatibilidade entre versões de arquétipos 4.3.4 Regra R4: Identificação (ID) de linhas nas tabelas 4.3.5 Regra R5: Mapeamento dos Elementos dos Arquétipos 4.3.6 Regra R6: Mapeamento de Coleções 4.3.7 Regra R7: Mapeamento de Slots Exemplo de Utilização da Regra de Mapeamento de Slots (Regra R7) 4.3.8 4.4 40 40 41 41 management system [37] 3.4 36 36 37 37 37 37 37 Regra R8: Nomenclatura do Esquema Comparação da Abordagem de Mapeamento Direto Proposta com a Literatura 12 42 42 43 44 45 46 47 48 48 49 51 52 52 53 54 54 55 55 57 58 59 4.5 5 62 Considerações finais Prova de Conceito: um estudo comparativo 5.1 Um arquétipo com a presença de coleção e slot em sua definição 5.2 Dois arquétipos distintos com slots que referenciam um mesmo terceiro arquétipo 5.3 Arquétipo com a presença de múltiplos slots em sua definição 5.4 Arquétipo com recursividade oriunda da presença de slots 5.5 Considerações finais 64 65 67 69 70 71 6.1 Contribuições 6.2 Trabalhos Futuros 73 74 74 Referências Bibliográficas 76 A ADL do arquétipo: openEHR-EHR-EVALUATION.goal.v1 80 B ADL dos dois arquétipos e do slots que eles referenciam 82 C ADL do Arquétipo “openEHR-EHR-CLUSTER.exam_eye.v0” 85 D ADL do arquétipo: “openEHR-EHR-CLUSTER.sympto_sign.v1” 86 6 Conclusão 13 Lista de Figuras 22 23 25 26 2.1 Modelo Dual [3]. 2.2 Pacote ENTRY do modelo de referência (openEHR UML) [5] 2.3 Representação em mapa mental de arquétipos 2.4 Estrutura da ADL do arquétipo [4] 2.5 Representação do código ADL da seção de Ontology do arquétipo 27 “openEHR-EHR-CLUSTER.anatomical_location_clock.v0” 2.6 Representação do código ADL da seção Definition do arquétipo 29 “openEHR-EHR-CLUSTER.anatomical_location_clock.v0”. 2.7 Estrutura hierárquica de um arquétipo, que possui a inclusão de dois slots – Slot A e Slot B – ambos oriundos de um mesmo arquétipo definido. 32 4.1 Arquétipo de pressão arterial [25] 49 4.2 Utilização das regras de persistência no arquétipo “openEHR-EHR- 57 CLUSTER.anatomical_location_clock.v0” 4.3 Exemplo de persistência do arquétipo “openEHR- EHR- 58 CLUSTER.anatomical_location_clock.v0” 5.1 Estrutura de persistência do arquétipo “openEHR-EHR- EVALUATION.goal.v1”, segundo a abordagem apresentada no trabalho 66 de Wang et al. [40]. 5.2 Estrutura de persistência do arquétipo “openEHR-EHR- EVALUATION.goal.v1”, que emprega a abordagem apresentada no 67 Capítulo 4. 5.3 Estrutura de persistência dos CLUSTER.anatomical_location_clock.v0” arquétipos e “openEHR-EHR“openEHR-EHR- CLUSTER.anatomical_location_relative.v1”, que empregam a abordagem 68 Wang et al. [40] 5.4 Estrutura de persistência dos CLUSTER.anatomical_location_clock.v0” arquétipos e “openEHR-EHR“openEHR-EHR- CLUSTER.anatomical_location_relative.v1” , que empregam a abordagem apresentada no Capítulo 4. 69 5.5 Representação hierárquica da estrutura definida para o arquétipo “openEHR-EHR-CLUSTER.exam_eye.v0”. 5.6 70 Representação hierárquica da estrutura definida para o arquétipo “openEHR-EHR-CLUSTER.symptom-_sign.v1” 71 A.1 Código ADL do arquétipo “openEHR-EHR-EVALUATION.goal.v1” parte 1 A.2 Código ADL do arquétipo “openEHR-EHR-EVALUATION.goal.v1” parte 2 80 81 B.1 Código ADL do arquétipo “openEHR-EHR-CLUSTER.multimedia.v1” 82 B.2 Código ADL do arquétipo “openEHR-EHR-CLUSTER.anatomical_location_ 83 clock.v0” B.3 Código ADL do arquétipo “openEHR-EHR-CLUSTER.anatomical_location _relative.v1” 84 C.1 Código ADL do arquétipo “openEHR-EHR-CLUSTER.exam_eye.v0” 85 D.1 Código ADL do arquétipo “openEHR-EHR-CLUSTER.sympto_sign.v1” 86 parte 1 D.2 Código ADL do arquétipo “openEHR-EHR-CLUSTER.sympto_sign.v1” 87 parte 2 D.3 Código ADL do arquétipo “openEHR-EHR-CLUSTER.sympto_sign.v1” 88 parte 3 15 Lista de Tabelas 2.1 Elementos léxicos da dADL 2.2 Elementos léxicos da cADL 2.3 Elementos léxicos da FOPL 3.1 Primeira fase do MS 3.2 Última fase 3.3 Estratégias sobre a persistência de dados 3.4 Comparação das Estratégias que Persistem Diretamente os Arquétipos 3.5 Desafios 4.1 Tipos de dados básicos para o mapeamento direto de arquétipos, extraída de Wang et al. [40]. 4.2 Relação semântica entre versões de arquétipos, adaptada de [40] 4.3 Comparação entre da abordagem proposta nesta pesquisa e o trabalho Wang et al. [40]. 28 30 31 39 40 44 45 46 50 53 60 CAPÍTULO 1 Introdução A área da saúde continuamente passa por mudanças, por isto, é muito difícil definir uma representação para a informação que seja padronizada e válida para todos os dados a serem armazenados nos Registros Eletrônicos de Saúde (RESs) [12]. Um RES é constituído pelo conjunto de informações de saúde de um determinado paciente. Essas informações são concebidas a partir de múltiplos eventos ocorridos, como ações, avaliações, observações e instruções [24]. Os Sistemas de Registros Eletrônico em Saúde (SRESs) obtiveram uma grande evolução nas últimas décadas, os primeiros sistemas destinavam a comportar o maior número de informações sobre o paciente, transferindo os dados que estavam em papel, para os registros eletrônicos, isto envolveu captura de dados, e processos para auxiliar a parte administrativa do sistema [32]. Com o desenvolvimento de SRESs independentes entre instituições de saúde, em que cada uma possui o seu próprio sistema, começou a existir uma dificuldade na interoperabilidade entre os SRESs, transformando as intuições de saúde em ilhas de dados. O que impossibilitava a troca e compartilhamento de dados entre si, dificultando um diagnóstico dos pacientes, pois os profissionais de saúde não tinham o acesso aos registros de saúde realizados pelo paciente em outras instituições. Devido a falta de diretrizes claras e definidas é que ocorreu uma falta de interoperabilidade na obtenção de sistemas, tornando-os cada vez mais isolados entre si [2]. Neste contexto o modelo openEHR, permite a padronização de Sistemas Registros Eletrônicos de Saúde (SRESs) com uma arquitetura multinível [6], permite a interoperabilidade entre os SRESs, lidando com as constantes mudanças do conhecimento na área da saúde com uma arquitetura multinível, que separa as informações referentes a saúde, representadas na forma de arquétipos, do conjunto as classes de objetos [15]. O padrão openEHR dispõe um conjunto as classes de objetos, chamado de Modelo de Referência (MR) que proporciona uma representação das informações geradas no âmbito de atenção à saúde [14]. O SRES deve estar de acordo com o modelo de informação disponibilizado, independente de como as informações estão organizadas no banco de dados utilizado [35]. Os arquétipos no contexto deste trabalho, são descritos como o conjunto de conhecimentos em saúde para o modelo de um conceito clínico ou de outro domínio específico, por exemplo: (i) pressão sanguínea; (ii) frequência cardíaca; (iii) histórico de saúde familiar; dentre outros [8]. Arquétipos são expressos em ADL (Archetype Definition Language), uma linguagem de definição de arquétipos que tem uma sintaxe composta por cADL, dADL e FOLP. A sintaxe cADL (Constraint Archetype Definition Language) utiliza para expressar a seção de definição de arquétipo. A dADL (Data Archetype Definition Language) demonstra instâncias de dados firmados em um modelo de informação, e sua estrutura é compreensível para humanos e computadores. A FOPL realiza a definição de predicados lógicos de primeira ordem, no entanto essa sintaxe e raramente utilizada na estrutura dos arquétipos [4]. 1.1 Motivação Este trabalho está contextualizado em uma pesquisa sobre alternativas para a persistência de Registros Eletrônicos de Saúde (RESs), em sistemas que obedeçam o openEHR, para a recuperação e troca de dados de saúde entre instituições. Em 31 de agosto de 2011, o Ministério da Saúde publicou a portaria 2.073 [10], que determina que os Sistemas de Registros Eletrônico em Saúde (SRESs) no Brasil devem respeitar um conjunto de preceitos técnicos, para que haja a comunicação de informação, sendo o openEHR um dos padrões adotados. Ou seja, torna-se uma obrigação que os sistemas troquem as informações de seus RESs seguindo os conceitos clínicos definidos em arquétipos modelados a partir do openEHR. O legado destes sistemas possui formatos proprietários para a persistência de dados e em geral, não aplicam modelagem por arquétipos. 1.2 Problema Por outro lado, o openEHR não estabelece parâmetros referentes ao armazenamento e recuperação de dados nas instituições de origem, inexistindo especificação para o mapeamento entre conceitos clínicos e a persistência de dados em si [36]. Assim, é pertinente que sejam estabelecidas estratégias de persistência que se aproximem da estrutura em que estão representados os conceitos clínicos, empregando-se nesse caso a persistência nas definições de conhecimento clínico disponibilizada no Clinical Knowledge Manager (CKM) 1 . 1 http://www.openehr.org/ckm 18 O presente trabalho apresenta técnicas de persistência, sendo um eixo distinto em comparação com outras pesquisas de persistência utilizando o openEHR, como por exemplo Silva et al. [36], Freire et al. [13], entre outros, que dependem do Modelo de Referência (MR) do openEHR como um caminho de persistência dos RESs. A proposta deste trabalho é utilizar as próprias definições ADL para projetar estruturas de persistência sem basear-se no MR. Neste contexto, existe o trabalho Wang et al. [40] e Wang et al. [39] que fazem este estilo de persistência. 1.3 Objetivo O objetivo principal deste trabalho é a análise e proposição de estratégias para o mapeamento de estruturas de persistência, diretamente a partir das definições ADL de arquétipos do openEHR. 1.3.1 Objetivos específicos Para atingir o objetivo geral foram definidos os seguintes objetivos específicos: • verificação do estado da arte encontrando abordagens existentes para a persistência de dados clínicos, que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de armazenamento; • extração das informações por diferentes dimensões de abstração de forma objetiva das estratégias para a persistência direta dos arquétipos existentes na literatura; • avaliação da abordagem proposta com respeito às existentes na literatura, ressaltado as características das propostas encontradas; • aplicação da proposta da nova abordagem e das abordagens encontradas no estado da arte, evidenciado as semelhanças e diferenças entre cada uma delas. Os termos “persistência direta de arquétipos” e “mapeamento direto de arquétipos” referem-se, no presente trabalho, às estruturas de persistência de dados clínicos derivadas a partir das definições de arquétipos pela ADL. Ou seja, as definições ADL são analisadas e utilizadas para determinar que estruturas de armazenamento são necessárias para os dados clínicos baseados nos arquétipos. 1.4 Organização do trabalho Esta dissertação está organizada em seis capítulos, conforme descritos a seguir: • Capítulo 1: O presente capítulo apresenta o tema da pesquisa, o problema a ser explanado, além de objetivos e a organização geral do trabalho; 19 • Capítulo 2: apresenta a fundamentação teórica do trabalho, expondo definições de RES, do openEHR, do modelo dual, do Modelo de Referência(MR), a estrutura arquétipos, sendo considerados a sintaxe da linguagem ADL, a definição de slot e a apresentação de repositórios de conhecimento clínico, definido o CKM(Clinical Knowledge Manager), para realizar o mapeamento de arquétipos proposto neste trabalho; • Capítulo 3: apresenta um mapeamento sistemático, sendo exibido um protocolo que ressalta os seguintes pontos: elaboração das questões da pesquisa, fontes de seleção, critérios de inclusão dos estudos, critérios de exclusão dos estudos, definição do tipo dos estudos e procedimentos para a seleção. O capítulo ainda apresenta a condução do mapeamento sistemático com processo de busca e seleção dos trabalhos encontrados com este mapeamento, após a seleção dos trabalhos encontrados e elaborado o resumo estruturado dos estudos selecionados, por fim uma análise dos estudos selecionados é realizada; • Capítulo 4: apresenta a proposta desta pesquisa abordada na forma de pressupostos, critérios e regras; • Capítulo 5: este capítulo explora a estrutura de persistência oriunda desta pesquisa, por meio do mapeamentos de arquétipos selecionados, efetuando comparações em relação à estrutura gerada por outros mapeamentos diretos de arquétipos encontrados no mapeamento sistemático; • Capítulo 6: apresenta a conclusão desta dissertação, discutindo algumas considerações finais, as contribuições alcançadas e possibilidades de trabalhos futuros. 20 CAPÍTULO 2 Estrutura dos Dados Clínicos a partir do openEHR Este capítulo apresenta conceitos da estrutura dos dados clínicos a partir do openEHR. A Seção 2.1 apresenta as funcionalidades de uma arquitetura multinível. Na Seção 2.2 é descrito o padrão openEHR, sendo apresentados os conceitos do Modelo de Referência (MR) e a definição de arquétipo. Na Seção 2.3 é abordada a estrutura da linguagem ADL. Por fim, na Seção 2.4 são expostas as considerações finais do capítulo. 2.1 Arquitetura Multinível A utilização da arquitetura multinível tem em vista uma redução de problemas em comparação com a modelagem de um único nível, sendo que os problemas que podem ser evitados [5] são: • • • • • dificuldade de manutenção dos requisitos; problema de adequação semântica; dificuldade em se alcançar padronização no domínio; dificuldade de completar os modelos de forma satisfatória; dificuldade em se alcançar interoperabilidade. O objetivo da arquitetura multinível proposta pelo openEHR é delimitar os campos de desenvolvimento e do conhecimento em dois níveis em um modelo hierárquico [3]. O primeiro nível é usado por profissionais de tecnologia da informação para modelagem de objetos e esquemas de dados preservando a informação sobre saúde, este e comumente chamado de Modelo de Referência (MR). No segundo nível, é delimitado o modelo de conhecimento [24]. A Figura 2.1 apresenta o modelo da arquitetura multinível. À esquerda estão as informações referentes à saúde, em que os autores são responsáveis pela modelagem dos arquétipos, por meio do MR. No lado mais à direita estão o modelo de referência e o esquema do banco de dados, sendo este o ambiente de desenvolvimento que os profissionais de informática são responsáveis. No centro da figura esta o SRES, este sistema é implementado com um conjunto das classes do MR. Conforme estas são utilizadas para a modelagem dos arquétipos, o SRES deve estar de acordo com o modelo de informação disponibilizado pelos profissionais de saúde, independente de como as informações estão organizadas no banco de dados utilizado. Figura 2.1: Modelo Dual [3]. 2.2 Padrão openEHR O openEHR é uma fundação virtual que tem como seu foco principal a padronização de Sistemas de Registros Eletrônicos de Saúde (SRESs) e sistemas relacionados, concentrando-se em meios de transformar dados de saúde a partir da forma física em formato eletrônico e garantir a interoperabilidade universal entre os RESs [28]. OpenEHR é um modelo RES interoperável no ponto de vista de informação da ISO 13606 que determina a interoperabilidade destes registros, a ISO 13606 define padrões de uma arquitetura lógica, tendo em vista o desenvolvimento de um RES universal [18]. O padrão openEHR é um modelo que utiliza esta normatização para a interoperabilidade entre diferentes Sistemas de Registros Eletrônico em Saúde (SRESs). Este modelo e utilizado neste trabalho para contemplar a portaria 2.073 [10] publicada pelo Ministério da Saúde, que determina que os SRESs no Brasil devem respeitar um conjunto de preceitos técnicos para que haja a comunicação de informação, sendo o openEHR um dos padrões adotados. A seguir serão apresentados alguns conceitos centrais do padrão openEHR, lembrando que este modelo obedece a arquitetura multinível descrita na Seção 2.1. 22 2.2.1 Modelo de Referência (MR) O MR define uma estrutura de classes para serem utilizadas no desenvolvimentos de arquétipos. O MR forma o primeiro nível da arquitetura multinível oferecida pelo openEHR, no segundo nível os arquétipos [1]. A norma ISO 13606 define conceitos principais para a adoção de um modelo interoperável de SRESs, sendo eles: COMPOSITION, SECTIONS, ENTRY, e, ELEMENT [16]. O openEHR apresenta um modelo de referência simplificado e inspirado nas definições da norma ISO 13606 [9]. Para uma visão abrangente deste conceito. A Figura 2.2 apresenta o pacote ENTRY do MR, responsável por classificar os arquétipos por diferentes tipos de entradas. Figura 2.2: Pacote ENTRY do modelo de referência (openEHR UML) [5] As classes do pacote representado na Figura 2.2 podem ser descritas da seguinte maneira: • ENTRY: Esta classe é a raiz de um item criada no contexto da declaração clínica; • CARE_ENTRY: Define protocolos e atributos de diretriz para todos os subtipos de entrada clínica; • ADMIN_ENTRY: Esta classe é utilizada para detalhes administrativos, como admissão de funcionários, episódio, localização da ala, alta, nomeação; • OBSERVATION: Esta classe diz respeito a informação crua sobre livre interpretação de tudo que é dito pelo paciente como sintoma; 23 • EVALUATION: Representa a interpretação clínica, rotulações, ideias, opiniões, resumos, ou visões, a partir da avaliação realizada pelo profissional da área da saúde; • INSTRUCTION: Esta classe permite expressar especificações simples ou complexas, inclusive em um formulário de fluxo de trabalho totalmente computável. Utilizado para qualquer declaração acionável, como medicação e ordens terapêuticas, monitoramento e revisão; • ACTION: Esta classe registra uma ação clínica que tenha sido realizada. Cada ação corresponde a um passo de cuidados de algum tipo; • ACTIVITY: Esta classe define uma única atividade dentro de uma Instrução, como administração de medicação. 2.2.2 Definição de Arquétipo Os arquétipos têm a origem de sua definição desde a antiguidade, os neoplatônicos usaram este termo para definir parâmetros de toda matéria que existe. Na filosofia pitagórica são parâmetros matemáticos representados por números. Os arquétipos podem ser compreendidos como um plano abstrato associados com as ideias de quantidade e forma [18]. Os arquétipos no openEHR definem o conhecimento de saúde sobre as combinações estruturadas das classes contidas no modelo de referência, um único arquétipo pode ser representado de maneiras distintas a partir de um código ADL [29]. Na Figura 2.3 esta a representação de dois arquétipos, sendo que na Figura 2.3 (a) esta o mapa mental do arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0” que tem parte de sua ADL nas Figuras 2.5 e 2.6, e na Figura 2.3 (b) esta a representação do arquétipo “openEHR-EHR-OBSERVATION.blood_pressure.v1”. 24 (a) Mapa mental do arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0” (b) Mapa mental do arquétipo “openEHR-EHR-OBSERVATION.blood_pressure.v1” Figura 2.3: Representação em mapa mental de arquétipos 2.3 Archetype Definition Language – ADL A ADL é uma linguagem formal para a criação de arquétipos, que se baseia em modelos de restrições de entidades de domínio. ADL utiliza três outras sintaxes, cADL para a restrição dos dados clínicos, dADL para a definição de dados, e FOPL para predicados lógicos de primeira ordem [4]. A estrutura em ADL de uma arquétipo apresentada na Figura 2.4. 25 Figura 2.4: Estrutura da ADL do arquétipo [4] Conforme a Figura 2.4 os níveis estruturais dos arquétipos podem ser definidos da seguinte maneira [34]: • Header: o cabeçalho inicial dos arquétipos criados. esta seção descreve as informações básicas de identificação do arquétipo e do respectivo conceito em foco podendo ser utilizadas para recuperação em um repositório. Destaca-se em sua estrutura: linguagem original, especialização (Herança de arquétipos), dados de autoria, possíveis traduções. Suas subseções são: archeytpe, specialise, concept, language, translation e description; • Definition: as restrições de definição do conhecimento de saúde são escritas em cADL. É uma seção obrigatória em uma estrutura de arquétipo; • Invariant: nesta seção é apresentada a versão lógica de predicados de primeira ordem (FPOL) contendo então operações e fórmulas matemáticas e lógicas; • Ontology: esta seção e codificada em dADL, aqui são determinados a configuração e nome dos objetos, links e restrições. suas subseções são: terminologies_available, term_definitions, constraint_definitions, term_binding e constraint_binding; • Revision_history: esta seção codifica em dADL apresentando o histórico de alterações ocorridas no arquétipo. 2.3.1 dADL (Data Archetype Definition Language) A sintaxe dADL opera com um ou mais itens do MR, trabalhando para apresentar as instâncias de dados do modelo de informação, com uma estrutura compreensível [34]. Na seção de ontologia e apresentada na sintaxe dADL os códigos dos objetos presentes no arquétipo, traduções, restrições sobre os termos e referências feitas [24]. 26 A Figura 2.5 apresenta um trecho da sintaxe dADL do arquétipo “openEHR-EHRCLUSTER.anatomical_location_clock.v0”, sendo definidos os termos [atxxxx] para a identificação das restrições definidas na seção Definition do arquétipo, tal que “xxxx” representa um número sequencial inteiro, a identificadores de termos começam com uma letra maiúscula, enquanto nomes de objetos e sua descrição começam com uma letra minúscula. Figura 2.5: Representação do código ADL da seção de Ontology do arquétipo “openEHR-EHRCLUSTER.anatomical_location_clock.v0” A Tabela 2.1, descreve os elementos léxicos básicos da linguagem dADL. 27 Tabela 2.1: Elementos léxicos da dADL dADL < Abrir um bloco de objeto > Fechar um bloco de objeto = Indicar valor do atributo, = bloco de objeto (,) Nome do tipo plug-in ou delimitadores tipo de sintaxe <# Abrir um bloco objeto, expresso em um plug-in de sintaxe #> Fechar um bloco objeto expresso em um plug-in de sintaxe – Comentário Dentro <>delimitadores, vários personagens são usados como segue para indicar valores primitivos: " Aspas duplas são utilizadas para delimitar valores de cadeia de strings ’ Os caracteres aspas simples são utilizadas para delimitar valores de caracteres individuais | barras são usadas para delimitar intervalos [] são usados para, delimitar termos codificados 2.3.2 cADL (Constraint Archetype Definition Language) A sintaxe é utilizada na seção de definição, onde são expostas as principais restrições formais do arquétipo, escritas em linguagem cADL (constaints ADL) [4]. Em sua estrutura destacam-se: • • • • matches que define uma relação de pertinência; ocurrences que indica o número de instâncias possíveis de um atributo; existence que indica a opcionalidade de um atributo; cardinality que define se o atributo é um container e as palavras ordered, unorderede e unique que definem o tipo de agrupamento lógico usado no container. No código da Figura 2.6 apresenta um trecho de cADL do arquétipo “openEHREHR-CLUSTER.anatomical_location_clock.v0”, no qual a palavra “Events” é definida como a cardinalidade de utilização dos elemento como “minCardinality = 1” e “maxCardinality = * (ilimitada)”. As restrições identificadas por at0000, são as instâncias do conhecimento clínico, definidos por um comentário que apresenta o seu significado. 28 Figura 2.6: Representação do código ADL da seção Definition do arquétipo “openEHR-EHRCLUSTER.anatomical_location_clock.v0”. Na Tabela 2.2, descreve os elementos léxicos básicos da linguagem cADL, sendo apresentado o elemento seguido de sua descrição. 29 Tabela 2.2: Elementos léxicos da cADL Principais itens da Semântica do cADL 2.3.3 { Abertura de restrições do atributo } Fechamento de restrições do atributo * significa o intervalo ou qualquer – Comentário ∈ Associação definida “p, está em P” ∈ / Associação,“p está não em P” ∼ Negação, “não p” /.+/ Expressão regular que significa “string não-vazia” {0..1} Marcadores “de 0 a 1” {0..*} Marcadores “de 0 a muitos” FOPL (First-Order Predicate Logic) Por ser uma linguagem lógica é utilizada na seção Invariant com operadores de comparação, relacionais, aritméticos, booleanos, palavras chave e quantificadores, para que assim possa ser realizado qualquer operação lógica [34]. Na Tabela 2.3 tem uma visão global sobre os elementos léxicos da FOPL: 30 Tabela 2.3: Elementos léxicos da FOPL Assertion (FOPL -First-Order Predicate Logic) As palavras chave são •exists, for_all; •true, false; • and, or, xor, not, implies Operadores aritméticos • adição: +; • subtração: -; •multiplicação: *; •divisão: /; •exponencial: ^; •resto da divisão: % ; Operadores de comparação •igualdade: =; •não igualdade: <>; •menor que: <; •menor ou igual: <=; •maior que: >; • maior ou igual: >=; Operadores booleanos Quantificadores 2.3.4 •negação: not; •e: and; •xor: xor; •implicação: implies; •associação: matches, is_in; •existencial: exists •universal: for_all Função Slot Os Slots são a inclusão de arquétipos dentro da estrutura raiz do arquétipo base, os slots em geral são restrições que podem ser adicionado em um determinado ponto, podendo utilizar o mesmo arquétipo em slots com diferentes funções [27]. Na Figura 2.7 é apresentado um modelo representativo de um arquétipo, conforme sua estrutura hierárquica. A particularidade existente é a inclusão de dois slots, por exemplo, cluster, ambos oriundos de um mesmo arquétipo definido na base de dados de arquétipos. Esta particularidade representa um desafio para o mapeamento direto de arquétipos, conforme será ressaltado adiante. 31 Figura 2.7: Estrutura hierárquica de um arquétipo, que possui a inclusão de dois slots – Slot A e Slot B – ambos oriundos de um mesmo arquétipo definido. 2.3.5 Modelos de Persistência de Dados Baseada no openEHR O trabalho [13] apresenta uma técnica que armazena a representação XML do MR, indexado pelos caminhos dos dados definidos por arquétipos. Já o trabalho [23] apresenta a persistência de dados com um estudo sobre quais soluções tecnológicas são adequadas para cada componente do servidor seguindo o padrão EN13606, entretanto o tempo para armazenamento de dados é alto na arquitetura proposta. E na proposta do trabalho [36] define estratégias de persistência com base na geração de esquemas de dados das classes do MR. Em um eixo distinto destes trabalhos existe o trabalho [40] que realiza a persistência dos RESs a partir da estrutura ADL dos arquétipos disponibilizados pelo openEHR, sendo a inspiração da presente pesquisa. 2.3.6 Bases de Arquétipos O desenvolvimento de arquétipos é uma atividade que fornece alguns repositórios de arquétipos online [37], com isso podem se destacar as seguintes bases de arquétipos, como o Clinical Knowledge Manager (CKM) 1 , NEHTA - National E-Health Transition Authority, Austrália 2 , entre outros. O CKM (Clinical Knowledge Manager) é um repositório internacional conhecimento clínico online mais utilizado dentre os outros. Reunindo uma comunidade ativa de indivíduos interessados e motivados em promover uma abordagem aberta e internacional para informática em saúde, o CKM é responsável por partilhar informações de saúde entre diferentes instituições; entre as aplicações, e através das fronteiras regionais e nacionais. Todas as contribuições para CKM e numa base voluntária, e todo o conteúdo CKM é open source disponível gratuitamente sob uma licença Creative Commons [30]. 1 http://www.openehr.org/ckm 2 http://dcm.nehta.org.au/ckm/ 32 De acordo com openEHR, as principais categorias para a descrição de conceitos clínicos e a observação, avaliação, instrução e ação. Esta categorização esta relacionada com a forma como a informação é criada [21]. O CKM oferece a oportunidade e meios para os usuários interessados em modelar conteúdo clínico para participar na criação e/ou aperfeiçoamento de um conjunto internacional de arquétipos, e estes por sua vez, tem o potencial de fornecer bases interoperáveis de RES [26]. 2.4 Considerações finais Este capítulo introduziu os conceitos do modelo openEHR, apresentando a modelagem multinível do openEHR, Modelo de Referência (MR), as classes do modelo openEHR, a definição de arquétipo, Archetype Definition Language – ADL e suas sintaxes para expressar restrições estruturadas das informações hospitalares, além da definição de slot em um arquétipo e o repositório CKM. Com esta fundamentação teórica se passa a ter uma visão abrangente sobre o restante do trabalho. 33 CAPÍTULO 3 Trabalhos Relacionados A busca por trabalhos relacionados foi realizada por um Mapeamento Sistemático (MS), que proporciona um cenário geral de uma determinada área de pesquisa, detectando os números, e os resultados apresentados sobre o tema. O MS é um tipo de revisão sistemática, que analisa os estudos primários encontrados de uma maneira mais ampla, para detectar as propostas de resoluções disponíveis sobre determinado assunto, bem como identificar lacunas nas pesquisas encontradas [17]. Isto significa que o MS tem um processo de condução de uma pesquisa do tipo sistemática, que segue uma sequência de passos metodologicamente muito bem definidos e rigorosos, sendo apresentado por um protocolo desenvolvido a princípio. Este instrumento é construído em torno de um ponto central, que representa o núcleo de investigação, e que se expressa utilizando conceitos e termos específicos [7]. Em sintonia com o objetivo da presente pesquisa – investigar e desenvolver um modelo de persistência de arquétipos baseados no openEHR –, um MS de literatura foi conduzido, para verificar os modelos de persistência existentes. Na Seção 3.1 elabora o planejamento do protocolo deste mapeamento sistemático. Na Seção 3.2 dispõe processo de busca e seleção dos trabalhos, explorando a quantidade de estudo que tiveram contribuição para o trabalho. Na Seção 3.3 é realizada uma extração dos dados a partir da leitura integral dos estudos selecionados. Na Seção 3.4 os indícios coletados dos estudos apontados como relevantes são identificados por dimensões de abstração, colaborando na investigação do mapeamento sistemático. A resposta da questão primária é apresentada na Seção 3.5. As considerações finais do MS é descrita na Seção 3.6. 3.1 Protocolo O planejamento do protocolo deste mapeamento sistemático foi elaborado conforme o modelo apresentado em [7], cujos os elementos são apresentados nas subseções seguintes. 3.1.1 Elaboração das Questões O protocolo para o desenvolvimento do MS inicia-se com a formulação da questão de pesquisa, que deve representar claramente o objetivo da pesquisa. A formulação da questão e composta pelos seguintes itens: Questão primária e Qualidade e amplitude da questão. A “Questão Primária” define o foco do MS, e deverá ser respondida pela análise dos estudos primários selecionados: Quais as abordagens existentes para a persistência de dados clínicos, que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de armazenamento? Os termos “persistência direta de arquétipos” e “mapeamento direto de arquétipos” referem-se, no presente trabalho, as estruturas de persistência de dados clínicos derivadas a partir das definições de arquétipos pela ADL. Ou seja, as definições ADL são analisadas e utilizadas para determinar que estruturas de armazenamento são necessárias para os dados clínicos baseados nos arquétipos. A “Qualidade e Amplitude da Questão” é definida pelos elementos abaixo: • Intervenção: A intervenção apresenta o que vai ser observado no contexto da pesquisa. Neste MS irão ser observados os seguintes subconjuntos de temas: – Persistência direta dos arquétipos para um banco de dados; – Regras para mapeamento direto dos arquétipos para um banco de dados. • Controle: O controle é o que já se tem sobre o tema especificado. No início deste MS continha um único trabalho para referir como base: Wang et al. [40]. • População: A população enquadra os envolvidos nas atividades ou áreas que a questão primária de pesquisa está ligada, o grupo observado foi o de pesquisadores e desenvolvedores de software de sistema de registros eletrônicos de saúde. • Efeito: O efeito representa os tipos de resultados esperados no final do MS, sendo eles: – Propriedades, características de critérios para a persistência direta de arquétipos para um banco de dados; – Contexto de aplicação de cada critério de persistência direta de arquétipos para um banco de dados; – Contribuições sobre especificações de arquétipos em ADL pertinentes ao mapeamento para um banco de dados. • Aplicação: Serve de base para apoiar as pesquisas envolvendo os seguintes pontos: – Delimitar regras para a persistência direta de arquétipos; – Fornecer perspectiva de persistência direta de arquétipos. 35 3.1.2 Fontes de seleção O objetivo desta seção é apresentar critérios de seleção de estudos nas bases de buscas. Idioma dos estudos O idioma definido leva em consideração a ampla disponibilidade dos estudos nas fontes de pesquisa. Assim, neste MS foi definido que qualquer idioma se enquadraria nos trabalhos encontrados, porém a string de busca está escrita em inglês. Identificação das Fontes A seleção de fontes para o estudo teve como principal característica sua ampla utilização e indexação, bem como a disponibilidade do acervo para consulta. Assim, foi definido que seriam utilizadas bases de dados eletrônicas indexadas: • Publicações Médicas (PubMed), que permite a pesquisa bibliográfica de artigos publicados em revistas de grande circulação da área da saúde, e que foi desenvolvida pelo National Center for Biotechnology Information (NCBI), sendo mantido pela National Library of Medicine (NLM); • Association for Computing Machinery (ACM); • Institute of Electrical and Electronics Engineers (IEEE). Palavras-chave e termos relacionados • • • • • Persistência de conhecimento clínico (clinical knowledge persistence) Persistência de arquétipos (archetypes persistence); Banco de dados clínicos (clinical database); Banco de dados baseado na EN13606 (database based on EN13606); Armazenamento de arquétipo do openEHR (Archetype storage openEHR). Formação da string de busca A string de busca foi feita pela combinação de palavras-chave e termos relacionados da Subseção 3.1.2, que respondem a questão primária de pesquisa, sendo apresentada na forma de uma expressão lógica com os operadores OR e AND. A primeira busca por artigos nos repositórios foi com a seguinte string de busca: • ((“persistence” OR “database” OR “storage”) AND ((“EN13606” OR “openEHR”) AND (“archetypes”)) 36 Porém, como a aplicação desta resultou em um número pequeno de artigos (nenhum na ACM, dois na IEEE e nenhum no PubMed), a mesma foi reformulada para: • ((“persistence” OR “database” OR “storage”) AND (“archetypes” OR “EN13606” OR “openEHR”)) 3.1.3 Seleção de estudos Os critérios de inclusão e exclusão apoiam a seleção dos estudos primários, que serão avaliados no contexto do MS. É necessário definir tais critérios, porque uma pesquisa executada em motores de busca na Internet pode encontrar um grande número de artigos que não correspondem à solução da questão de pesquisa. Critérios de Inclusão dos Estudos • Critérios de inclusão 1: Estudos que abordam qualquer característica sobre persistência direta dos arquétipos; • Critérios de inclusão 2: Estudos que tratam da comparação de persistência direta de um banco de dados com outras estratégias; • Critérios de inclusão 3: Estudos que exploram a conversão de bases de dados existentes para a estrutura de arquétipos. Critérios de Exclusão dos Estudos • Critério de exclusão 1: Estudos que não estão disponíveis por completo (menos de 03 páginas); • Critério de exclusão 2: Estudos que não abordam informática e saúde; • Critério de exclusão 3: Estudos que não abordam a persistência de dados em saúde; • Critério de exclusão 4: Estudos que não abordam a persistência direta dos arquétipos do openEHR para um banco de dados. Definição do Tipo dos Estudos A pesquisa considera publicações em livros, teses, dissertações, monografias, conferências, relatórios e revistas da área de Informática. Procedimentos para a Seleção Os procedimentos para a Seleção irão direcionar quais os estudos serão avaliados de acordo com os critérios de exclusão e inclusão. Neste MS há dois processos de seleção descritos a seguir. 37 • Etapa 01 - Seleção Inicial: A seleção envolve a preparação de strings de busca a partir das palavras-chave e dos termos relacionados. Para saber se um determinado estudo é relevante à pesquisa, serão lidos os resumos (abstracts) e, em caso positivo, estes serão selecionados para serem lidos por completo. • Etapa 02 - Seleção final das buscas: Para a seleção final serão lidos todos os artigos relevantes identificados na Etapa 01, sendo analisado se o trabalho possui relevância para a pesquisa em andamento, aplicando-se os critérios de inclusão e de exclusão. 3.2 Condução do Mapeamento Sistemático – Processo de Busca e seleção dos trabalhos Para acesso aos portais de buscas, foi utilizado o seguinte procedimento: (i) entrar no site do repositório; (ii) digitar a string de busca no campo de pesquisa; (iv) clicar no botão enviar para obter os resultados. Nas buscas realizadas na Etapa 01, foram obtidos 93 trabalhos. Dentre estes documentos, não havia estudos duplicados. Os trabalhos na maioria foram excluídos por não tratarem sobre persistência de dados clínicos, resultando em 57 artigos excluídos por este motivo, e 15 artigos excluídos por não tratar sobre persistência de arquétipos, restando apenas nove estudos selecionados. Na Tabela 3.1, pode-se ter uma visão sobre a quantidade de artigos selecionados na Etapa 01, e os motivos que levaram á exclusão dos trabalhos. Os rótulos das colunas da Tabela 3.1 são apresentados abaixo: • • • • • • • • • • A1- Estudos encontrados com a string de busca; A2- Estudos selecionados por meio da seleção inicial; A3- Estudos repetidos em diferentes motores de buscas ou na mesma pesquisa; A4- Estudos rejeitados no geral; A5- Estudos rejeitados pelo Critério de Exclusão 1; A6- Estudos rejeitados pelo Critério de Exclusão 2; A7- Estudos rejeitados pelo Critério de Exclusão 3; A8- Estudos rejeitados pelo Critério de Exclusão 4; A9- Porcentagem final de estudos selecionados; A10- Porcentagem final de estudos rejeitados. 38 Tabela 3.1: Primeira fase do MS Artigos encontrados (primeira etapa) Motores de Buscas A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 PubMed 59 5 0 54 5 0 40 9 8,47 91,53 ACM 32 2 0 30 3 4 17 6 6,25 93,75 IEEE 2 2 0 0 0 0 0 0 100 0 Total 93 9 0 84 8 0 57 15 9,47 90,33 No total nove estudos permaneceram na seleção para leitura completa, porém, nem todos estes trabalhos respondiam a questão primária do MS, assim foram descartados seis estudos sendo eles: • [20] Os autores desenvolvem um novo repositório clínico de arquétipos, baseado em ontologias, conforme a norma CEN / ISO 13606, sendo rejeitado neste MS pelo Critério de Exclusão 3; • [31] e [33] Descrevem a manipulação e persistência de um banco de dados de RESs, porém utilizam como base o MR do openEHR, sendo rejeitados neste MS pelo Critério de Exclusão 4; • [41] Faz uma revisão na literatura sobre a avaliação da aplicabilidade dos RES interoperáveis, sendo rejeitados pelos Critérios de Exclusão 3 e 4; • [38] Faz uma comparação de desempenho sobre o armazenamento dos RES com respeito a técnicas de persistência existentes na literatura do openEHR e outros modelos, porém, não faz referência a qualquer mapeamento para um banco de dados, sendo rejeitado pelo Critério de Exclusão 4; • [12] Faz um levantamento de implementações de armazenamento através do openEHR, porém nenhuma das implementações o objetivo do artigo refere-se ao MR do openEHR, sendo rejeitado pelo Critério de Exclusão 4. Ao final do MS restaram três trabalhos que lidava sobre persistência direta dos arquétipos: Wang et al. [40], Späth e Grimson [37] e Min et al. [22]. Na Tabela 3.2 está a representação dos estudos selecionados no MS. Vale ressaltar que, após esta seleção foram verificadas as referências bibliográficas dos estudos selecionados, resultando no acréscimo de outro estudo primário: “Archetype Relational Mapping Based on openEHR Wang et al. [39]”, totalizando, assim, quatro estudos encontrados ao final. 39 Tabela 3.2: Última fase Artigos encontrados (etapa final) Rejeitados Porcentagem de Estudos Selecionados Porcentagem de Estudos rejeitados 3 2 60 40 2 0 2 0 100 IEEE 2 0 2 0 100 Total 9 3 6 33,34 66,66 Motores de Buscas Seleção Preliminar Selecionados PubMed 5 ACM 3.3 Condução do Mapeamento Sistemático - Resumo Estruturado dos Estudos Selecionados Nesta etapa do MS foi realizada uma extração dos dados a partir da leitura integral dos quatro estudos selecionados, conforme descrito na Seção 3.2. Para tanto, foram abstraídos aspectos de comparação – itens de extração de dados – com o objetivo de organizar as informações obtidas na leitura dos estudos. Os itens de extração utilizados são elaborados na forma de um resumo estruturado da seguinte maneira: • Resumo estruturado: Introdução, objetivo, métodos, resultados, conclusões e limitações. 3.3.1 Archetype Relational Mapping Based on openEHR [39] Introdução: A complexidade e evolução contínua das informações em saúde é o maior desafio para o desenvolvimento de Sistemas de Informática em Saúde (SISs). O openEHR que é um modelo para implementações de Registros Eletrônico de Saúde (RES), propõem uma modelagem multinível para a solução deste problema, pois as informações em saúde são desenvolvidas pelos profissionais de saúde em um nível diferente dos desenvolvedores. Porém, a persistência dos dados de saúde pelo openEHR, ainda é um grande desafio. Métodos de persistência, como Node+path, determinado pelo openEHR e Mapeamento Objeto Relacional (MOR) do MR podem não satisfazer as necessidades de utilização diária de uma instituição clínica. Objetivo: O objetivo deste trabalho é desenvolver um mapeamento de banco de dados relacional direto a partir dos próprios conceitos clínicos(arquétipos) oferecidos pelo openEHR. Métodos: Para o Mapeamento Relacional de Arquétipos (MRA) foram projetadas quatro regras estruturais e uma seção para o controle de diferentes versões do mesmo arquétipo. Resultado: Foram realizados 40 testes com MRA, Node+Path e o MOR. Nota-se que a abordagem MRA foi mais eficiente que as outras, sendo até 69 vezes mais rápida. Conclusão: Com a abordagem MRA pode-se alcançar um alto desempenho de processamento, fazendo com que o openEHR mantenha a vantagem da modelagem multinível para uma continua evolução dos arquétipos. Limitações: Uma limitação encontrada no estudo e não solucionada é a utilização recursiva do mesmo slot, houver múltiplas ocorrências o mapeamento proposto no estudo gera redundância das tabelas. 3.3.2 Archetype relational mapping a practical openEHR persistence solution [40] Introdução: O openEHR é uma normatização de SISs que descreve a gestão, armazenamento, recuperação e troca de dados de saúde em RES. Um dos obstáculos principais para a adoção do openEHR é a falta de soluções de persistência em banco de dados para os sistemas. Objetivo: O objetivo do artigo é desenvolver um banco de dados construído diretamente a partir dos arquétipos. Métodos: O trabalho projeta um conjunto de regras e restrições para o desenvolvimento de uma estrutura de MRA. Para a realização dos testes comparativos com outras abordagens os arquétipos foram analisados e organizados conforme o esquema da base de dados convencional utilizada em um hospital chinês. Resultado: A base de dados MRA foi aproximadamente 6-50 vezes mais eficiente que o banco de dados convencional, enquanto o banco de dados node+path requer mais tempo do que as duas outras estruturas. Conclusão: O desempenho MRA é superior aos sistemas RESs convencionalmente concebidos, na maioria dos testes realizados, podendo ser uma solução para o problema de persistência do openEHR. Limitações: A limitação encontrada na abordagem, foi para a utilização recursiva do mesmo slot. O mapeamento oferecido pelo autor faz tratamento para a ocorrência dos slots, havendo uma grande limitação neste ponto, pois propõe uma propagação que causa uma redundância nas tabelas do banco de dados. 3.3.3 Applying the archetype approach to the database of a biobank information management system [37] Introdução: A abordagem openEHR é um modelo multinível, capaz de disponibilizar um nível para os profissionais de saúde desenvolver os conhecimentos clínicos (arquétipos), e um nível inferior para os profissionais de informática manipular os RESs. Atualmente as instituições de saúde têm que se adequar ao modelo openEHR, pois além da sua modelagem multinível, o openEHR disponibiliza um padrão para a interoperabilidade entre sistemas de diferentes instituições. Objetivo: O objetivo deste estudo é 41 investigar a viabilidade de aplicação do openEHR em um banco de dados de um sistema legado. Métodos: Os autores propõem uma abordagem para que as colunas das tabelas do banco de dados correspondente aos itens de entrada dos arquétipos sejam agrupadas com base no significado e contexto de cada coluna. Resultado: Um conjunto de 47 arquétipos foi encontrado para cobrir todos os conceitos utilizados no Biobank. Destes, 29 (62%) foram reutilizados sem mudança, seis foram modificados ou estendidos, e 11 foram recémdefinidos. Conclusão: O ponto positivo desta abordagem é a ideia de mapear arquétipos em diferentes entidades, sendo possível gerar um banco de dados diretamente baseado na estrutura dos arquétipos. Limitações: A pesquisa apresenta uma limitação pela diferença entre a cardinalidade das tabelas do banco de dados e dos arquétipos, causando modificações e desenvolvimento de novos arquétipos, podendo tornar a versão deste banco de dados incompatível com a proposta interoperável do modelo openEHR. 3.3.4 Case Study: Applying OpenEHR Archetypes to a Clinical Data Repository in a Chinese Hospital [22] Introdução: O openEHR é uma metodologia para a modelagem flexível e escalável de informação clínica. Este modelo tem sido amplamente adotado na Europa e Austrália. Devido às vantagens da utilização desta metodologia, existem alguns projetos de implementação do openEHR na China. Objetivo: Este trabalho realiza um estudo de caso para aplicar arquétipos do openEHR em um Repositório de Dados Clínicos (RDC) de um hospital chinês. Métodos: Os autores desenvolveram regras para a conversão do banco de dados para os arquétipos. Ao todo foram seis regras para auxiliar na conversão. Resultado: Os resultados mostram que um conjunto de 26 arquétipos foram encontrados para cobrir os requisitos utilizados no RDC. De todos estes, nove (34,6%) foram reutilizados sem alteração, 10 foram modificados ou estendidos, e sete foram desenvolvidos. Conclusão: O trabalho completou o seu objetivo, que era o desenvolvimento da conversão do banco de dados para os arquétipos. Porém alguns arquétipos foram modificados, estendidos ou foram desenvolvidos, devido a grande diferença dos níveis de cardinalidade das tabelas do banco de dados com os arquétipos. Limitações: A limitação encontrada refere-se a conversão do banco de dados para a estrutura dos arquétipos, sendo uma tarefa muito complicada devido a diferença de cardinalidade estrutural entre ambos. 3.4 Condução do Mapeamento Sistemático - Análise dos Estudos Selecionados As informações extraídas dos estudos primários selecionados foram organizadas em tabelas expondo os principais aspectos de relevância de cada estudo. Em síntese, a 42 análise dos estudos foi desenvolvida com base na cobertura do conteúdo, sendo apresentada nas Tabelas 3.3, 3.4 e 3.5. • Tabela 3.3. (Estratégias sobre a persistência de dados); • Tabela 3.4 (Comparação das estratégias que persistem diretamente os arquétipos); • Tabela 3.5 (Desafios). Nestas tabelas, se os campos forem preenchidos com o valor X, expressa que o estudo primário aborda o conteúdo em questão; caso este campo não seja preenchido, este estudo não aborda aquele determinado assunto. 3.4.1 Estratégias sobre a persistência de dados Na Tabela 3.3 é avaliado se cada estudo encontrado no MS realmente estabelece critérios semelhantes com o que foi inicialmente estipulado. Os aspectos explorados sobre as estratégias de persistência de dados são: • Estratégia para o mapeamento direto dos arquétipos para o banco de dados: analisa se o artigo trata sobre persistência direta de arquétipos para um banco de dados; • Regras para o mapeamento direto dos arquétipos para um banco de dados: se o estudo disponibiliza uma lista metodológica de regras para persistir qualquer arquétipo independente de sua estrutura; • Conversão de bases de dados existentes para a estrutura de arquétipos: se o estudo explora a conversão de bases de dados existentes para a estrutura de arquétipos; • Regras para a conversão de bases de dados existentes para a estrutura de arquétipos: se regras são apresentadas para esta conversão. 43 Tabela 3.3: Estratégias sobre a persistência de dados Estratégias sobre a persistência de dados Aspectos de cobertura de cada estratégia Späth and Grimson (2010) [37] Wang et al (2014) [39] Min et al (2015) [22] Wang et al (2015) [40] Estratégia para o mapeamento direto dos arquétipos para um banco de dados X X Regras para o mapeamento direto dos arquétipos para um banco de dados X X Explora a conversão de bases de dados existentes para a estrutura de arquétipos X X Regras para a conversão de bases de dados existentes para a estrutura de arquétipos X X Após a análise dos estudos, comprova-se que há apenas dois estudos referentes a persistência direta dos arquétipos para o desenvolvimento de um banco de dados, sendo Wang et al. [39] e Wang et al. [40]. Estes estudos elaboram regras para se obter o armazenamento dos conceitos dos arquétipos. Mas, vale ressaltar que os estudos são dos mesmos autores, portanto seguem a mesma linha metodológica. As regras empregadas no trabalho de Wang et al. [40], o estudo mais recente, é mais completa. Os estudos Späth and Grimson [37], Min et al. [22] e Wang et al. [40] convertem uma base de dados para arquétipos. Porém o único que estabelece regras para se obter esta conversão é o estudo Min et al. [22]. 3.4.2 Comparação das Estratégias que Persistem Diretamente os Arquétipos Nesta seção será avaliado se as estratégias que persistem os arquétipos abordam os critérios estruturais dos mesmos. Na Tabela 3.4, apresenta a avaliação dos aspectos explorados, que são os seguintes: • Recursividade de slots: se a abordagem avaliada considera múltiplas ocorrências ao mesmo arquétipo especializado; 44 • Utilização CLUSTER: se a abordagem prevê a utilização de arquétipos do tipo CLUSTER; • Tratamento para diferentes tipos de coleção: se a abordagem avaliada, considera várias coleções (elementos do arquétipos com vários sub-elementos) no mesmo arquétipo; • Múltiplas ocorrência de um mesmo elemento: se a abordagem leva em consideração múltiplos acessos ao mesmo elemento. Tabela 3.4: Comparação das Estratégias que Persistem Diretamente os Arquétipos Comparação das estratégias que persistem diretamente os arquétipos Aspectos de cobertura de cada estratégia Späth and Grimson (2010) [37] Wang et al (2014) [39] Min et al (2015) [22] Wang et al (2015) [40] Recursividade de slots Utilização CLUSTER X Tratamento para diferentes tipos de coleção X X Prevê múltiplas ocorrências de um mesmo elementos X X Após a análise da comparação das abordagens que persistem diretamente os arquétipos para um banco de dados, pode-se notar que a abordagem mais completa é do trabalho Wang et al [40], porém nem mesmo esta abordagem cobre toda a diversidade da estrutura dos arquétipos, pois a recursividade de slots se torna uma redundância de tabelas, tornando de difícil manutenibilidade no banco de dados desenvolvido. 3.4.3 Desafios Nesta seção será avaliado se cada proposta soluciona as principais limitações encontradas para a persistência direta dos arquétipos, apresentadas na Tabela 3.5. Os aspectos explorados sobre os desafios são: • Tratamento para várias versões do mesmo arquétipo: um grande desafio para a persistência direta dos arquétipos e que estes estão em constante modificação. As abordagens presentes têm que prever um tratamento para diferentes versões do mesmo arquétipo, pois podem existir versões discrepantes, estabelecendo uma falta de interoperabilidade dentre estas, falhando na proposta primordial do openEHR; 45 • Tratamento para redundância das tabelas em um banco de dados: outro desafio que o estudo deve se atentar e a redundância das tabelas no banco de dados se a proposta faz tratamento para esta limitação; • Segurança: neste ponto é avaliado se o estudo se atenta para a segurança dos dados em saúde; • Tratamento para a perda de informação com o achatamento dos arquétipos: uma limitação apresentada nas abordagens e a perda de informações referente ao achatamento dos elementos dos arquétipos para se adequar as tabelas de um banco de dados já existente. Tabela 3.5: Desafios Desafios Aspectos de cobertura de cada estratégia Späth and Grimson (2010) [37] Tratamento para várias versões do mesmo arquétipo Wang et al (2014) [39] X Min et al (2015) [22] Wang et al (2015) [40] X Tratamento para redundância das tabelas em um banco de dados Segurança Tratamento para a perda de informação com o achatamento dos arquétipos X Nenhum trabalho cobre o tratamento para redundância das tabelas e a segurança de um banco de dados. O trabalho de Wang et al. [40] se mostrou mais completo em comparação aos outros, pois ele se atenta a perda das informações com o achatamento e para tratamento de várias versões do mesmo arquétipo. Já os trabalhos de Späth e Grimson [37] e Min et al. [22] apresentam a limitação para a modificação dos arquétipos com a desnomatização, porém estes não apresentam propriamente uma solução. O trabalho Wang et al. [39] soluciona a limitação das atualizações de várias versões do mesmo arquétipo. 3.5 Resposta á Questão Primária Quais as abordagens existentes para a persistência de dados clínicos, que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de ar46 mazenamento? Existem poucos estudos que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de armazenamento. Dos trabalhos encontrados na literatura muitos pertenciam a um eixo distinto que emprega o MR para a persistência. Dos estudos encontrados, os trabalhos de Späth and Grimson [37] e Min et al. [22] não fazem persistência a partir dos arquétipos e sim exploram a conversão de bases de dados existentes para a estrutura de arquétipos. Ainda assim o trabalho de Min et al. [22] é o único que estabelece regras para a conversão dos bancos de dados para arquétipos. Contudo, apenas os trabalhos de Wang et al. [39] e Wang et al. [40] determinam uma maneira de desenvolver um banco de dados a partir das definições ADL dos arquétipos do openEHR. 3.6 Considerações finais Foi projetado um mapeamento sistemático através da metodologia proposta no artigo [7], em que se procura explorar os estudos que apresentam o estado da arte de persistência direta dos arquétipos do modelo openEHR. Com isso foi estabelecida uma questão primária de pesquisa: Quais as abordagens existentes para a persistência de dados clínicos, que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de armazenamento? Um conjunto de quatro estudos primários que foram classificados, e tiveram suas informações textuais relevantes extraídas na forma de resumo na Seção 3.3, já na Seção 3.4 foi exposta a extração das informações por diferentes dimensões de abstração de forma objetiva, colaborando na investigação do mapeamento sistemático, e contribuindo com o embasamento para a resposta da questão de pesquisa na Seção 3.5. As evidências coletadas neste capítulo são os pilares para a definição da proposta Protocolo para o mapeamento direto de arquétipos apresentada no Capítulo 4. 47 CAPÍTULO 4 Protocolo para o Mapeamento Direto de Arquétipos Este capítulo apresenta a proposta de mapeamento com as regras estruturais que utilizam as definições ADL (Archetype Definition Language) para projetar estruturas de persistência, sem basear-se no Modelo de Referencia(MR), criando um caminho lógico e adaptável com o openEHR, ou seja, realizando o mapeamento direto de arquétipos para as estruturas de persistência do banco de dados. Na Seção 4.1 é descrito os pressupostos para o mapeamento direto dos arquétipos. Na Seção 4.2 são abordados os critérios básicos para a persistência dos arquétipos. A Seção 4.3 disponibiliza as regras propostas para a persistência dos dados clínicos. Na Seção 4.4 é realizada uma comparação da abordagem de mapeamento direto proposta no presente trabalho com da abordagem encontrada no mapeamento sistemático do Capítulo 3. Por fim na Seção 4.5 apresenta a conclusão do capítulo de mapeamento direto de arquétipos. 4.1 Pressupostos para o Mapeamento Direto dos Arquétipos No contexto desta dissertação, a interoperabilidade entre Sistemas de Informação em Saúde (SISs) é apoiada pela definição e a utilização dos arquétipos. Um Registro Eletrônico de Saúde(RES) que utiliza o modelo de arquétipos terá o mesmo significado em qualquer lugar. Assim, dados clínicos modelados a partir de arquétipos podem ser compartilhados por vários SISs, permitindo a interoperabilidade das informações em diferentes instituições [15]. Inspirado em Wang et al. [40], mas não limitado a tal referência, há pressupostos para o mapeamento direto de arquétipos para a persistência de dados, a saber: • A estrutura de persistência deve promover a integridade, a disponibilidade e a confidencialidade do dados clínicos para qualquer RES. • O mapeamento proposto não deve afetar a arquitetura multinível do openEHR, em que o modelo clínico é separado do modelo de informação; • O mapeamento proposto deve permitir a reutilização de componentes dos RESs, que é alcançado pelo encapsulamento de conceitos clínicos por meio da definição de arquétipos, oferecendo assim uma maior facilidade na recuperação de informações; • O “código” ADL que define um arquétipo é a fonte de conhecimento para a definição de regras de mapeamento direto para persistência; assim, a análise deste código deve ser criteriosa e sistematizada através de regras de mapeamento. • Os arquétipos podem ser visualizados como uma estrutura hierárquica de dados (árvore), como apresentado na Figura 4.1. Nesta figura se encontra o mapa mental do arquétipo “pressão arterial”, que está definido no CKM(Clinical Knowledge Manager) [25]. Pode-se perceber nesse mapa mental que se trata de uma estrutura de árvore, que contém a raiz como “Blood Pressure”, possuindo quatro subárvores de dados: “Data”, “State”, “Events” e “Protocol”, e duas subárvores de metadados “Attribution” e “Description”. As definições ADL de cada arquétipo, em geral, estabelecem uma hierarquia de conceitos clínicos, diferentemente do Modelo de Referência (MR) do openEHR, que caracteriza um grafo de objetos. Para o modelo de persistência direta, cada arquétipo é composto por elementos clínicos simples, podendo ainda possuir subárvores de dados, coleções de elementos e slots, que caracterizam o uso das definições de outros arquétipos. Figura 4.1: Arquétipo de pressão arterial [25] 4.2 Critérios Básicos para a Persistência dos Arquétipos Para a definição de modelos para a persistência direta de arquétipos, alguns aspectos básicos devem ser observados, sendo eles: 49 • Identificação de tipos de dados básicos. Dado que a definição de arquétipos é abstração de conceitos clínicos que, para a sua persistência, irá utilizar uma composição de tipos de dados básicos do modelo de informação, é pertinente a identificação destes tipos básicos, baseando-se no Modelo de Referência (MR) do openEHR. Inspirado em Wang et al. [40], vale considerar o conteúdo da Tabela 4.1. A primeira coluna apresenta classes do MR que são concretas e estão em nível folha na hierarquia de classes; a segunda coluna denota os atributos geralmente utilizados na definição da referidas classes; a terceira coluna apresenta os tipos de dados básicos propriamente ditos; a última coluna mapeia os tipos de dados básicos para tipos de dados normalmente disponíveis para a definição de esquemas relacionais. Tabela 4.1: Tipos de dados básicos para o mapeamento direto de arquétipos, extraída de Wang et al. [40]. Classes do MR Atributos Tipos de dados básicos Tipos de dados do Modelo Relacional CodePhrase codeString String NVARCHAR DvBoolean value Boolean INTEGER DvCodedText definingCode CodePhrase NVARCHAR DvCount magnitude Integer INTEGER DvDateTime value String NVARCHAR DvEHRURI value URI NVARCHAR DvIdentifier id String NVARCHAR DvMultimedia uri DvURI NVARCHAR DvProportion precision Integer INTEGER DvQuantity magnitude units Double String FLOAT NVARCHAR DvText value String NVARCHAR DvURI value URI NVARCHAR GenericID value name String String NVARCHAR NVARCHAR Link target DvEHRURI NVARCHAR • Identificação de coleções de dados. As coleções de dados referem-se a dados estruturados, que podem ter ocorrências de repetição. Tais coleções requerem especial atenção na definição de regras de mapeamento para a persistência. Alguns exemplos de coleções são as classes ITEM_TABLE, ITEM_TREE e ITEM_LIST do MR. Coleções podem ainda incluir slots, que se referem a pontos de inserção de 50 definições ADL externas ao arquétipo em questão. Os slots são outros arquétipos existentes e que estão sendo utilizados na definição de um arquétipo particular; • Identificação de cardinalidade para dados e coleção de dados. Neste texto, o termo “cardinalidade” denota o número de ocorrências de um elemento existente na definição de arquétipos. Estes elementos são dados e coleções de dados, e sua cardinalidade tem impacto importante no mapeamento direto para persistência; • Identificação de itens de consulta. Itens de consulta referem-se a dados que, em geral, são utilizados em consultas sobre os RESs. Sempre que possível, é pertinente que tais dados sejam conhecidos e “marcados”, de tal forma que sejam empregados para a criação de estruturas adicionais de persistência voltadas para a eficiência das consultas. Ou seja, podem ser criadas estruturas adicionais de persistência para agilizar as consultas, tais como a presença de índices, em que os itens de consulta definem sua chave de indexação. • Nomenclatura de tabelas e colunas. As definições ADL de arquétipos possuem, em geral, “comentários” associados aos elementos que as compõem, dedicados a estabelecer a semântica do conceito clínico, ou seja, atribuem o significado dos elementos para os profissionais de saúde. Desta forma estes comentários devem ser usados como o nome dos atributos presentes nas estruturas de persistência, tornado, assim, mais “entendíveis” para a área da saúde. 4.3 Regras para o Mapeamento Direto dos Arquétipos O mapeamento direto de arquétipos gera um esquema de persistência, a partir de regras definidas, as quais promovem a geração automática das estruturas de persistência a partir das definições ADL. Tais regras são introduzidas a seguir. O termo “tabela” é usado para estabelecer uma estrutura primária de persistência, caracterizada como uma estrutura bidimensional composta por colunas (atributos) e linhas. O termo “esquema da tabela” refere-se aos metadados que compõem uma tabela: os atributos que denotam os elementos das definições ADL, e que se referem aos conceitos clínicos da saúde. As linhas das tabelas referem-se a registros clínicos, ou parte de um registro clínico, de um paciente. Em síntese, a persistência direta de arquétipos gera um conjunto de tabelas, cada qual com seu esquema, conforme estabelecido nas definições ADL dos arquétipos. Tabelas e seus atributos terão um nome, que deve caracterizar o propósito do conceito clínico subjacente. 51 4.3.1 Regra R1: Metadados para a persistência de dados clínicos Duas tabelas com metadados são propostas para a estrutura de persistência: ARCHETYPE e HEALTH_RECORD. Na descrição destas tabelas, o esquema segue as seguintes convenções: o nome das tabelas estão em letras maiúsculas, os atributos está entre parênteses e o atributo de identificação está sublinhado. ARCHETY PE(name_archetype,type, purpose) HEALT H_RECORD(id_health_record, id_patient, name_archetype, id_archetype) A Tabela ARCHETYPE refere-se aos arquétipos que são efetivamente utilizados nos registros clínicos, e são oriundos de uma ou mais bases de arquétipos. Sobre seus atributos: • name_archetype: refere-se ao nome do arquétipo, conforme designado na base de arquétipos, e servirá para nomear a sua tabela base; • type: refere-se à natureza do arquétipo: composite, entry, cluster, etc.; • purpose: descreve o propósito do arquétipo. A Tabela HEALTH_RECORD refere-se ao registro clínico em si. Seus atributos são: • id_health_record: refere-se à identificação absoluta do registro clínico, ou seja, uma identificação única em relação a qualquer outro registro clínico; • id_patient: refere-se à identificação absoluta do paciente; • name_archetype: refere-se ao nome do arquétipo que serve como base para o registro clínico; representa um atributo de referência para a Tabela ARCHETYPE; • id_archetype: refere-se à identificação da linha na tabela do arquétipo que serve como base para o registro clínico. Qualquer registro clínico deve ser inserido na Tabela HEALTH_RECORD. Vale ressaltar que a única tabela da persistência de dados clínicos que possui a identificação do paciente é Tabela HEALTH_RECORD. As demais tabelas possuem dados clínicos não identificados (em relação ao paciente). 4.3.2 Regra R2: Tabela base para cada arquétipo Todo arquétipo, independente de sua natureza – entry, composition, cluster, etc. –, terá uma “tabela base”, que conterá os elementos básicos definidos no arquétipo. A tabela base de um arquétipo terá o mesmo nome do arquétipo. 52 Sobre a Regra R1, a descrição da tabela base de cada arquétipo deve estar inserida na Tabela ARCHETYPE. Outras regras a seguir introduzem “tabelas complementares” à tabela base, com o propósito de cobrir todos os conceitos clínicos previstos em cada arquétipo. 4.3.3 Regra R3: Compatibilidade entre versões de arquétipos É natural a evolução dos conceitos clínicos, devido às contribuições dos diversos especialistas da saúde e à adaptação a novos requisitos. Esta regra estabelece que versões novas e antigas de um mesmo arquétipo devem partir de uma mesma tabela base. A Tabela 4.2 apresenta itens de compatibilidade e a relação semântica entre diferentes versões de um mesmo arquétipo. A primeira coluna chamada “Relação” corresponde ao tipo de ligação que a nova versão e a antiga tem; na coluna “Modificação” é descrito o tipo de modificação que o arquétipo sofreu; já na coluna intitulada “Compatibilidade” será descrito se a nova e a antiga versões são compatíveis. É importante salientar que, para que a tabela base e as suas tabelas complementares de diferentes versões de um arquétipo seja as mesmas, é requerido um estudo de compatibilidade entre versões em relação às estruturas de persistência. A ideia básica é tentar alcançar tal compatibilidade e, não sendo possível, haverá a inclusão da versão do arquétipo no nome das tabelas que o mapeiam. Tabela 4.2: Relação semântica entre versões de arquétipos, adaptada de [40] Relação Modificação Compatibilidade Garante a retrocompatibilidade Revisão Modifica parte de descrição Amplia atributos, variedade de conjuntos de valores, a terminologia Dados criados por arquétipo pré-revistas é compatível com a versão revisada Fortalece as restrições Especialização Nova versão Redefine e adiciona nós Os conjuntos de valores e semântica de nós está em conformidade com o arquétipo anterior Altera item obrigatório para opcional Ajusta o intervalo do valor ou conjunto de termos codificada 53 O novo arquétipo especializado cria dados que está em conformidade com o progenitor As modificações são incompatíveis com o arquétipo anterior 4.3.4 Regra R4: Identificação (ID) de linhas nas tabelas Cada linha em qualquer das tabelas da persistência de dados clínicos deverá ser identificada por um “atributo de identificação”, ou seja, uma coluna específica para tal fim. A definição ADL de um arquétipo pode prever esta identificação: um elemento existente na definição ADL com este propósito. Mas, se não for o caso, um atributo (coluna) denominado ID será artificialmente criado para tal fim, mas não será acessível ao profissional de saúde. Atributos de identificação, previstos na ADL ou artificialmente criados, terão restrições associadas, tais como unique e clustered index. 4.3.5 Regra R5: Mapeamento dos Elementos dos Arquétipos A cada elemento de um arquétipo, também denominado “item de dado”, podem ser associadas cardinalidades mínima e máxima, assumindo, em geral, os valores: “0” (zero, elemento de ocorrência opcional), “1” (elemento de uma ocorrência) e “*” (elemento de várias ocorrências). Os tipos de dados básicos, ilustrados na Tabela 4.1 (pag. 50), serão utilizados para os dados clínicos em si, ou seja, para o item de dado que o representa. Com respeito às cardinalidades mínima e máxima, vale salientar: • Se a cardinalidade máxima de um elemento não for superior a 1 (um), então este deve ser mapeado para uma coluna da tabela base; • Se a cardinalidade máxima de um elemento for superior a 1 (um), então o elemento deve ser mapeado para uma tabela complementar, cujo nome será o <nome-databela-base>_< comentário que significa o elemento>. As seguintes colunas farão parte desta nova tabela: – atributo de identificação para a nova tabela (atributo artificial), cujo nome será ID; – atributo de identificação da tabela base, que, neste caso, será denominado “atributo de referência”, e deverá haver “integridade referencial” com respeito ao atributo de identificação da tabela base; o nome deste atributo será ID_<nome-da-tabela-base>; – atributo para o elemento da definição ADL, cujo nome será o próprio comentário que o identifica. 54 4.3.6 Regra R6: Mapeamento de Coleções Coleções são agrupamentos de dados, em geral definidos pelos termos do MR: ITEM_TREE, ITEM_LIST, etc. Uma coleção é composta por elementos, que ainda podem ser outras coleções, recursivamente. Similarmente aos elementos previstos na Regra 4, coleções podem ter cardinalidades mínima e máxima. Com respeito às cardinalidades mínima e máxima, vale salientar: • Se a cardinalidade máxima de uma coleção não for superior a 1 (um), então cada um de seus elementos deve ser mapeado para uma coluna da tabela base; • Se a cardinalidade máxima de uma coleção for superior a 1 (um), então a coleção deve ser mapeada para uma tabela complementar, cujo nome será o <nome-databela-base>_<comentário que significa a coleção>. As seguintes colunas farão parte desta nova tabela: – atributo de identificação para a nova tabela (atributo artificial), cujo nome será ID_<nome-da-tabela-base>_<comentário que significa a coleção>; – atributo de identificação da tabela base, que, neste caso, será denominado “atributo de referência”, e deverá haver “integridade referencial” com respeito ao atributo de identificação da tabela base; o nome deste atributo será ID_<nome-da-tabela-base>; – um atributo para cada elemento da coleção, cujo nome será o próprio comentário que o significa, conforme sua definição ADL. • vale salientar que uma tabela complementar oriunda de uma coleção pode gerar outras tabelas complementares a mesma, aplicando-se recursivamente às Regras 4 e 5. 4.3.7 Regra R7: Mapeamento de Slots Conforme ressaltado anteriormente, os slots são outros arquétipos existentes e que são utilizados na definição de um arquétipo particular. Para a introdução de slots, novas tabelas com metadados foram projetadas, em adição às tabelas mencionadas na Regra R1, conforme o esquema abaixo: SLOT _METADATA(id_meta, name_archetype_origin, name_archetype_target, card_min, card_max, attribute) SLOT _DATA(id_data, id_meta, id_archetype_origin, id_archetype_target) 55 O esquema acima segue as mesmas convenções usadas na Regra R1: o nome das tabelas estão em letras maiúsculas, os atributos estão entre parênteses e o atributo de identificação está sublinhado. A Tabela SLOT_METADATA refere-se a presença de slots na definição ADL de arquétipos. Este esquema representa as ligações entre o arquétipo de origem (que possui slots em sua definição) e o arquétipo alvo (que é incluído no arquétipo de origem na forma de slots). Seus atributos são: • id_meta: atributo de identificação (artificial) para a ligação entre arquétipos através de slots; • name_archetype_origin: refere-se ao nome do arquétipo de origem; representa um atributo de referência para a Tabela ARCHETYPE; • name_archetype_target: refere-se ao nome do arquétipo alvo; representa um atributo de referência para a Tabela ARCHETYPE; • card_min: representa a cardinalidade mínima na qual o arquétipo alvo é inserido no arquétipo de origem, conforme a definição ADL no arquétipo de origem; • card_max: representa a cardinalidade máxima na qual o arquétipo alvo é inserido no arquétipo de origem, conforme a definição ADL no arquétipo de origem; • attribute: representa o atributo em si, que designa o comentário que significa a presença do slot no arquétipo de origem. Neste ponto, vale retornar à Figura 2.7 (pag. 32), em que há a inclusão de dois slots, ambos oriundos de um mesmo arquétipo definido na base de dados de arquétipos. Esta particularidade ocorrerá em duas linhas na Tabela SLOT_METADATA, que terão o mesmo valor para os Atributos name_archetype_origin e name_archetype_target. Contudo, haverá nestas linhas valores distintos para o Atributo attribute, pois cada slot terá um propósito particular: o comentário que significa a presença de cada slot é individual em relação a qualquer outro slot. Diferentemente da Tabela SLOT_METADATA, que descreve a presença de slots, conforme as definições ADL dos arquétipos, a Tabela SLOT_DATA refere-se à sua ocorrência nos registros clínicos, ou seja, ela associa linhas das tabelas (base e complementares) pelo uso de slots nos registros clínicos existentes. Seus atributos são: • id_data: atributo de identificação (artificial) para a ligação entre linhas das tabelas dos arquétipos de origem e alvo, devido à ocorrência de slots; • id_meta: refere-se ao metadado sobre a presença de slots; representa um atributo de referência para a Tabela SLOT_METADATA; • id_archetype_origin: refere-se ao valor do atributo de identificação na linha da tabela pertinente ao arquétipo de origem; 56 • id_archetype_target: refere-se ao valor do atributo de identificação na linha da tabela pertinente ao arquétipo de alvo. Exemplo de Utilização da Regra de Mapeamento de Slots (Regra R7) Para exemplificar o mapeamento direto com a presença de slots, foi escolhido o arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0”, que possui em sua estrutura a utilização de um slot, oriundo do arquétipo “openEHR-EHR-CLUSTER.multimedia.v1”. O arquétipo “openEHR-EHRCLUSTER.anatomical_location_clock.v0” tem sua representação no formato de mapa mental na Figura 2.3. Na Figura 2.6 do Capítulo 2 (pag.29) é apresentado o código ADL do Arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0”. Este arquétipo identifica e regista detalhes estruturados, em termos da posição do ponteiro das horas de um relógio em relação a um local anatômico de referência na face, que representa a posição das 12 horas mostradas em um relógio. Na Figura 4.2 está o modelo de persistência oriundo da aplicação da Regra R7 (mapeamento de slots). As Tabelas C_ClockAnatomicalLocation e C_Multimedia foram criadas em adição às tabelas de mapeamento de slots. Na Figura 4.3 está a apresentação de uma base de dados aleatória, em que pode ser visualizado a utilização da estrutura de persistência de slots proposta. As Tabelas C_ClockAnatomicalLocation e C_multimedia possuem linhas com dados clínicos baseados nos Arquétipos “openEHR-EHR-CLUSTER.anatomical_location_clock.v0” e “openEHR-EHR-CLUSTER.multimedia.v1”, respectivamente. A Tabela SLOT_METADATA possui uma linha que denota a descrição da presença de um slot no arquétipo openEHR-EHR-CLUSTER.anatomical_location_clock.v0”. As linhas da Tabela SLOT_DATA representam as associações dos dados clínicos em si a partir do slot. Figura 4.2: Utilização das regras de persistência no arquétipo “openEHR-EHRCLUSTER.anatomical_location_clock.v0” 57 Figura 4.3: Exemplo de persistência do arquétipo “openEHREHR-CLUSTER.anatomical_location_clock.v0” 4.3.8 Regra R8: Nomenclatura do Esquema As regras de nomenclatura podem variar de acordo com a utilização do sistema de arquivos, ou mesmo de um Sistema de Gerenciamento de Banco de Dados (SGBD). Para tal, foram previstas diretrizes para esta nomenclatura, conforme a seguir: • Os nomes dos arquétipos são utilizados para nomear as suas tabelas bases; opcionalmente, este nome pode ser concatenado com a natureza do arquétipo (entry, composition, cluster, etc.); • Cada atributo (coluna em uma tabela) deve ter nome único na tabela e associado ao seu significado; • Os atributos podem utilizar o nome textual fornecidos dentro do arquétipo, na seção ontology; • Se os nomes gerados para as tabelas (bases e complementares) e atributos são longos o bastante para violar as restrições de nomenclatura do sistema de arquivos (ou SGBD), estes devem ser reduzidos de forma consistente, desde que ainda ofereçam o devido significado. 58 4.4 Comparação da Abordagem de Mapeamento Direto Proposta com a Literatura Como apresentado no Capítulo 3, o Mapeamento Sistemático(MS) encontrou quatro trabalhos relacionados com a presente pesquisa, porém dois trabalhos -Späth e Grimson [37] e Min et al. [22]- propunham um caminho inverso à proposta apresentada: de bases de dados legadas para a estrutura de arquétipos. Assim, apenas os trabalhos de Wang et al. [39] e Wang et al. [40] determinam uma maneira de desenvolver uma estrutura de persistência diretamente a partir das definições ADL dos arquétipos do openEHR. Contudo, Wang et al [40] é uma evolução do Wang et al. [39]. Desta forma a presente seção irá confrontar o modelo de persistência desenvolvido por Wang et al. [40] com a proposta nesta pesquisa. Para tal, a Tabela 4.3 foi construída para ressaltar as características de ambas as propostas. A primeira coluna aborda os critérios comparativos entre as abordagens, a segunda coluna apresenta a proposta apresentada neste trabalho e na terceira coluna é reapresentada pela a abordagem de Wang et al. [40]. 59 Tabela 4.3: Comparação entre da abordagem proposta nesta pesquisa e o trabalho Wang et al. [40]. Critérios para comparação Abordagem proposta Wang et al. [40] Aplica estrutura de persistência direta, sem dependência direta do MR sim sim Usa métodos de mapeamento dos conceitos clínicos, conforme definições ADL sim sim Gera tabelas base e complementares, conforme definições ADL de cada arquétipo sim sim Prevê o mapeamento de elementos, coleções e slots sobre conceitos clínicos sim sim Produz registros clínicos não identificados, em relação ao paciente SIM NÃO Promove a redução de atributos de referência (integridade referencial) SIM NÃO Possui tabelas de metadados, que apoiam melhorias no mapeamento SIM NÃO Promove a reutilização de tabelas pertinentes a slots SIM NÃO Promove a reutilização de tabelas por recursividade de slots SIM NÃO Prevê ocorrência de várias versões do mesmo arquétipo sim sim Produz mapeamento que não afeta a arquitetura multinível do SRES sim sim As definições dos critérios comparativos entre as abordagens são apresentados a seguir: Aplica estrutura de persistência direta, sem dependência do MR: Sendo um pressuposto básico para a persistência direta de arquétipos, significa que o “código” ADL que define arquétipos é a “única” fonte de conhecimento para a definição de regras de mapeamento. Assim, a análise deste código deve ser criteriosa e sistematizada através de regras de mapeamentos. Ambas as abordagens desenvolvem protocolos diferentes que não dependem diretamente do MR. Usa métodos de mapeamento dos conceitos clínicos, conforme definições ADL: Realiza mapeamento de forma sistemática dos elementos de um arquétipo, através de pressupostos, critérios básicos e regras “bem definidas”, para gerar a estrutura 60 de persistência (tabelas, atributos, atributos de identificação e atributos de referência). Ambas as abordagens desenvolvem regras para que utilizam as definições ADL, sendo que a proposta deste trabalho aprimora essas regras. Gera tabelas base e complementares, conforme definições ADL de cada arquétipo: As definições ADL de cada arquétipo, em geral, estabelecem hierarquias de conceitos clínicos, para o modelo de persistência direta. Cada arquétipo é composto por elementos clínicos simples, podendo ainda possuir subárvores de dados, coleções de elementos e slots, que caracterizam o uso das definições de outros arquétipos. Todo este cabedal que descreve a estrutura do conhecimento clínico é coberto pela geração de tabelas – classificadas como base e complementar – tal que suas linhas materializem dados de RES. Ambas as abordagens seguem esta direção. Prevê o mapeamento de elementos, coleções e slots sobre conceitos clínicos: Os arquétipos escritos em ADL representam estruturas hierárquicas que podem ter em sua composição: elementos simples, coleções de elementos e slots. Cobrir definições ADL em sua completude significa estabelecer um mapeamento de todo este potencial de composição, e ambas as abordagens seguem esta linha. Produz registros clínicos não identificados, em relação ao paciente: Conforme já mencionado, um único registro clínico, em geral, é decomposto em diversas linhas de diversas tabelas. Cada uma destas linhas, em tese, não deveria ter a identificação do paciente, argumento que é justificado por muitos aspectos: (i) redundância da identificação do paciente nas linhas de um mesmo RES; (ii) redução do número de atributos nas tabelas da estrutura de persistência; (iii) elevação da segurança dos dados em relação à identificação do paciente; (iv) promoção de consultas aos dados clínicos que por natureza não requer a identificação do paciente (por exemplo, busca epidemiológica), etc. Tal aspecto está previsto nos pressupostos (Seção 4.1), denominado como “confidencialidade”, cuja importância é evidenciada em [19]. Apenas a abordagem proposta atende a este critério de comparação. Promove a redução de atributos de referência (integridade referencial): Os atributos de referência dizem respeito à integridade referencial e, consequentemente, estão ligados ao pressuposto “integridade” (vide Seção 4.1). Na abordagem de [40], observa-se a redundância de atributos de referência: a redundância em uma base de dados, diz respeito à repetição não necessária dos dados nela contidos [11]. Nesse aspecto, a abordagem proposta promove a redução de atributos de referência, pois a abordagem de [40] possui um número relativamente elevado destes atributos. Além disso, com relação às tabelas que possuem dados clínicos propriamente ditos, a abordagem proposta inclui atributos de referência somente nas tabelas complementares (a tabela base ligada a cada arquétipo não possui atributos de referência). 61 Possui tabelas de metadados, que apoiam melhorias no mapeamento: A abordagem proposta inclui um conjunto de tabelas com metadados, que produz alguns benefícios ao mapeamento, tais como: (i) os arquétipos efetivamente usados nos registros clínicos são conhecidos, isto é, sabe-se que arquétipos são utilizados para os RESs da base de dados clínicos; (ii) o isolamento da identificação única do paciente dos seus dados clínicos; (iii) redução do número de tabelas, pois promove a racionalização do mapeamento quando há uso de slots na definição dos arquétipos. Promove a reutilização de tabelas pertinentes a slots: Outro pressuposto básico para a persistência de arquétipos é a reutilização de componentes dos RESs (Seção 4.1) e, consequentemente, das estruturas de persistência. Na abordagem de Wang et al. [40], se um arquétipo é utilizado “n” vezes na forma de slot em definições ADL, serão geradas “n” tabelas base para este arquétipo. Na abordagem proposta, cada arquétipo possui somente uma tabela base, mesmo que o arquétipo seja usado “n” vezes na forma de slot. Promove a reutilização de tabelas por recursividade de slots: A recursão a partir de slots é caracterizada quando um arquétipo insere ele mesmo, de forma direta ou indireta. A presente proposta não possui impacto no número de tabelas geradas, mesmo quando há a recursão por meio de slots, diferentemente da abordagem de Wang et al. [40]. Tal aspecto é mostrado na prática no Capítulo 5. Prevê ocorrência de várias versões do mesmo arquétipo: Uma dificuldade para o mapeamento direto dos arquétipos para sua persistência é a potencial ocorrência de varias versões de um mesmo arquétipo. Ambas as abordagens cobrem igualmente esse aspecto, mas com enfoque limitado a análise das mudanças necessárias no esquema das tabelas, para que se possa cobrir várias versões. Produz mapeamento que não afeta a arquitetura multinível do SRES: Conservar o aspecto multinível da arquitetura multinível do SRES é um dos pressupostos do mapeamento direto para a persistência (Seção 4.1). As abordagens produzem distintos protocolos para o mapeamento direto de arquétipo, porém, ambas não afetam a arquitetura multinível do SRES. 4.5 Considerações finais Este capítulo apresentou a proposta desta pesquisa. Em relação ao texto apresentado em Wang et al. [40], este capítulo procurou ser mais didático, tornando a descrição da presente pesquisa mais clara para seu entendimento e sua evolução. A proposta foi apresentada na forma de pressupostos, critérios e regras. Uma comparação entre as propostas (esta pesquisa e Wang et al. [40]) foi produzida. Como 62 vantagens da presente proposta, destaca-se: produção de registros clínicos não identificados, em relação ao paciente; promoção da redução de atributos de referência (integridade referencial); emprego de tabelas de metadados, que apoiam melhorias no mapeamento; preservação do número de tabelas da base de dados clínicos, mesmo na ocorrência de recursividade por meio de slots; e reutilização de tabelas pertinentes a slots. O próximo capítulo explora a aplicação de ambas as abordagens, pelo mapeamento direto de arquétipos para a estrutura de persistência, visando evidenciar suas semelhanças e diferenças. São usados arquétipos selecionados de Clinical Knowledge Manager (CKM) 1 . 1 http://www.openehr.org/ckm 63 CAPÍTULO 5 Prova de Conceito: um estudo comparativo Este capítulo apresenta uma prova de conceito, pela comparação de ambas as abordagens – a abordagem proposta nesta pesquisa e o trabalho de Wang [40]. Para tal, foram usados arquétipos selecionados do Clinical Knowledge Manager (CKM) 1 para o mapeamento direto a partir das definições ADL desses arquétipos. As definições ADL dos arquétipos selecionados são apresentadas nos Anexos A, B, C e D, em que suas linhas estão numeradas para citação nas seções seguintes. Na estrutura de persistência proposta nesta pesquisa, observa-se a presença de tabelas com metadados (ARCHETYPE, HEALTH_RECORD, SLOT_METADATA e SLOT_DATA), cujo papel foi introduzido no Capítulo 4, e tabelas dedicadas aos dados clínicos. Para fins de comparação entre ambas as abordagens, o foco será o esquema das tabelas próprias dos dados clínicos. Vale ressaltar que a persistência refere-se à geração de tabelas base e complementares, tal que possa cobrir com eficácia a estrutura do conhecimento clínico posto nas definições ADL. Os atributos representam os comentários que dão significados aos elementos clínicos; por exemplo, os atributos Goalname e Goaldescription da Tabela E_Goal (Figuras 5.1 e 5.2) referem-se aos comentários Goal name e Goal description presentes nas Linhas 6 e 11 da Figura A.1, respectivamente. A Seção 5.1 aborda um arquétipo cuja estrutura possui a inclusão de elementos simples, coleção e slot. A Seção 5.2 explora dois arquétipos distintos, em que ambos incluem um terceiro arquétipo na forma de slot. A Seção 5.3 utiliza um arquétipo mais complexo em relação às seções anteriores, em cuja definição se observa a inclusão repetitiva de um arquétipo na forma de slot, e permite realçar, principalmente, a diferença do número de tabelas entre ambas abordagens. A Seção 5.4 explora a recursividade oriunda da presença de slots. A Seção 5.5 sintetiza o presente capítulo. 1 http://www.openehr.org/ckm 5.1 Um arquétipo com a presença de coleção e slot em sua definição Para a demostração de mapeamento direto de arquétipos com a presença de coleção e slot em sua definição, foi selecionado “openEHR-EHR-EVALUATION.goal.v1”, que é um arquétipo composto por elementos clínicos simples, coleção de elementos e slot. A partir da análise do código ADL do arquétipo, cuja definição ADL, a qual está disponível no Anexo A, foram empregadas ambas as abordagens para a geração da estrutura de persistência. Na Figura 5.1 está a estrutura de persistência criada segundo a abordagem apresentada no trabalho [40]. Na Figura 5.2 é apresentada a estrutura de persistência gerada a partir da presente pesquisa. De acordo com a definição ADL do arquétipo (Anexo A), vale salientar sobre ambas as figuras: a Tabela E_Goal refere-se à tabela base do arquétipo; a Tabela C_change denota a introdução do arquétipo “openEHR-EHR-CLUSTER.change.v1” por meio de um slot (Linhas 54 a 56 da Figura A.1); e a Tabela Col_Target refere-se à coleção cujo significado é target (Linhas 58 a 134 das Figuras A.1 e A.2). Sobre a comparação da estrutura de persistência gerada a partir de ambas as abordagens: • Todas as tabelas apresentadas na abordagem de Wang et al. [40] (Figura 5.1) possuem o atributo ID_PersonalPatient, que é um atributo de referência à identificação do paciente. Tal atributo não está presente nas tabelas de dados clínicos criadas a partir da presente pesquisa (Figura 5.2), promovendo o isolamento da identificação única do paciente dos seus dados clínicos. • A redução do número de atributos de referência é outra característica positiva relativa à presente pesquisa. Na abordagem de Wang et al. [40], há cinco atributos de referência (na Figura 5.1, são os atributos marcados com “(ref)”). Na presente pesquisa, há apenas um atributo de refêrencia: ID_Goal na Tabela Col_Target (Figura 5.2). • A presença de slots eleva o número de tabelas da estrutura de persistência na proposta de Wang et al. [40]. Vale ressaltar que se o arquétipo “openEHR-EHRCLUSTER.change.v1” for inserido na forma de slot por n outros arquétipos, tal abordagem resultará na criação de pelo menos n tabelas em sua estrutura de persistência. Na presente pesquisa, cada arquétipo terá somente uma única tabela base, mesmo que ele seja utilizado várias vezes na forma de slots. Em síntese, há uma racionalização do número de tabelas na ocorrência de slots. Esse aspecto é realçado na Seção 5.2. 65 • A redução do número de atributos de referência relativo à presente pesquisa possui o efeito colateral pertinente à diminuição de redundância na base de dados clínicos. Para ilustrar, na abordagem de Wang et al. [40]: (i) há a presença de atributos de referência nas tabelas oriundas da inclusão de slots; e (ii) a identificação do paciente está em todas as tabelas da base de dados. Figura 5.1: Estrutura de persistência do arquétipo “openEHREHR-EVALUATION.goal.v1”, segundo a abordagem apresentada no trabalho de Wang et al. [40]. 66 Figura 5.2: Estrutura de persistência do arquétipo “openEHREHR-EVALUATION.goal.v1”, que emprega a abordagem apresentada no Capítulo 4. 5.2 Dois arquétipos distintos com slots que referenciam um mesmo terceiro arquétipo Esta seção aborda o mapeamento do arquétipo “openEHR-EHRCLUSTER.multimedia.v1”, que é introduzido, na forma de slot, nos arquétipos “openEHR-EHR-CLUSTER.anatomical_location_clock.v0” e “openEHR-EHRCLUSTER.anatomical_location_relative.v1”. As definições ADLs desses arquétipos estão disponíveis no Anexo B. Segundo a abordagem de Wang et al. [40], cada ocorrência de inclusão das definições de um arquétipo, por meio de slot, resulta na criação de uma nova tabela para esse mesmo arquétipo: conforme já ressaltado, se um arquétipo é utilizado “n” vezes na forma de slot, serão geradas “n” tabelas base para esse arquétipo. Na abordagem proposta, cada arquétipo possui somente uma tabela base, independente se o mesmo foi usado na forma de slot. Nas Figuras 5.3 e 5.4 estão as estruturas de persistência criadas segundo a abordagem de Wang et al. [40] e a proposta nesta pesquisa, respectivamente. De acordo com a definições ADL dos arquétipos (Anexo B), vale salientar: a tabela CClockAnatomicalLocation (Figuras 5.3 e 5.4) é a tabela base pertinente ao arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0”; o arquétipo “CLUS- 67 TER.anatomical_location_relative” possui a tabela base denominada CRelativeAnatomicalLocation (Figuras 5.3 e 5.4); e Direction é uma tabela complementar do arquétipo “CLUSTER.anatomical_location_relative”, devido à presença de elementos clínicos cuja cardinalidade máxima é superior a 1 (um) (Linhas 40 a 63 da Figura B.3). No arquétipo “openEHR-EHR-CLUSTER.anatomical_location_clock.v0”, o slot é observado na Linha 35 da Figura B.2. A Linha 73 da Figura B.3 está o slot no arquétipo “CLUSTER.anatomical_location_relative”. Como consequência, o mapeamento segundo Wang et al. [40] resulta na criação de duas tabelas: C_multimedia_Clock e a C_multimedia_relative (Figura 5.3). A presente pesquisa realiza esse mapeamento criando uma única tabela: C_multimedia (Figura 5.4). Neste caso, na abordagem de Wang et al. [40], a elevação relativa do número de tabelas resulta, também, no aumento de atributos de referência e em uma maior redundância de dados. Figura 5.3: Estrutura de persistência dos arquétipos “openEHREHR-CLUSTER.anatomical_location_clock.v0” e “openEHR-EHR-CLUSTER.anatomical_location_relative.v1”, que empregam a abordagem Wang et al. [40] 68 Figura 5.4: Estrutura de persistência dos arquétipos “openEHREHR-CLUSTER.anatomical_location_clock.v0” e “openEHR-EHR-CLUSTER.anatomical_location_relative.v1” , que empregam a abordagem apresentada no Capítulo 4. 5.3 Arquétipo com a presença de múltiplos slots em sua definição O arquétipo “openEHR-EHR-CLUSTER.exam_eye.v0” foi selecionado nesta seção, e sua ADL se encontra no Anexo C. A estrutura deste arquétipo possui slots, que incluem vários outros arquétipos (por exemplo, Linhas 27 a 36 da Figura C.1). Os arquétipos incluídos também possuem slots, os quais referenciam alguns daqueles inseridos por “openEHR-EHR-CLUSTER.exam_eye.v0” A Figura 5.5 representa a estrutura hierárquica do arquétipo “openEHR-EHRCLUSTER.exam_eye.v0”; cada nó da figura, exceto o nó raiz, refere-se à inclusão por meio de slot. Observa-se que os arquétipos “openEHR-EHR-CLUSTER.multimedia.v1” e “openEHR-EHR-CLUSTER.exclusion_exam.v1” são os que mais se repetem na estrutura, somando dez nós presentes para cada um desses arquétipos. Os arquétipos “openEHR-EHR-CLUSTER.exam_eye_aqueous.v0” e “openEHR-EHRCLUSTER.exam_eye_lens.v0” aparecem duas vezes na estrutura. Sobre a estrutura de persistência gerada, a abordagem de Wang et al. [40] gerará uma nova tabela para cada nó da Figura 5.5. O mapeamento irá criar 47 tabelas em todo o esquema do banco de dados: uma tabela base, 29 tabelas oriundas da presença de slots e 17 tabelas complementares. Na abordagem da presente pesquisa, além das quatro tabelas próprias para metadados (ARCHETYPE, HEALTH_RECORD, SLOT_METADATA e SLOT_DATA), serão geradas 24 tabelas no esquema de banco de dados. Tal número representa, praticamente, a metade do número de tabelas segundo a abordagem de Wang et al. [40], denotando 69 significativa redução na estrutura de persistência. Figura 5.5: Representação hierárquica da estrutura definida para o arquétipo “openEHR-EHRCLUSTER.exam_eye.v0”. 5.4 Arquétipo com recursividade oriunda da presença de slots Nesta seção, foi utilizado o arquétipo “openEHR-EHR-CLUSTER.symptom_sign.v1”, cujo código ADL está disponível no Anexo D. Na definição desse arquétipo: (i) existem vários slots; e (ii) há recursividade na inclusão de slots. A recursão é caracterizada, por exemplo, quando um arquétipo insere ele mesmo, de forma direta ou indireta, através da inclusão de slots. Para que haja tal recursividade, a cardinalidade mínima do slot incluído, necessariamente, deve ser igual a 0 (zero), sendo, portanto, a condição base de parada da estrutura recursiva. A Figura 5.6 representa a estrutura hierárquica do arquétipo “openEHR-EHRCLUSTER.symptom_sign.v1”; cada nó da figura, exceto o nó raiz, refere-se à inclusão por meio de slot. Sobre a recursividade observável nessa figura: • o arquétipo “openEHR-EHR-CLUSTER.symptom_sign.v1”, representado no nó raiz da hierarquia, é referenciado cinco vezes: três recursões diretas e duas indiretas; • o arquétipo “openEHR-EHR-CLUSTER.health_event.v0”, é referenciado duas vezes, na forma de recursão direta. 70 Sobre o impacto da recursividade por meio de slots na estrutura de persistência, ressalta-se: • no exemplo, a árvore disposta na Figura 5.6, poderá ser expandida, para refletir novas sub-árvores devido à presença da recursão por meio de slots; • na abordagem de Wang et al. [40], cada nó da árvore representa uma nova tabela base do arquétipo pertinente ao nó e, portanto, conforme haja a expansão da árvore, o número de tabelas geradas para a estrutura de persistência cresce de forma importante; • na presente pesquisa, a proposta não eleva o número de tabelas geradas, mesmo na ocorrência de recursividade por meio de slots. Figura 5.6: Representação hierárquica da estrutura definida para o arquétipo “openEHR-EHR-CLUSTER.symptom_sign.v1” 5.5 Considerações finais O capítulo anterior (Capítulo 4) apresentou a proposta desta pesquisa. Em relação ao texto apresentado em Wang et al. [40], o referido capítulo possui conteúdo mais didático, trazendo uma descrição da presente pesquisa de uma maneira clara para seu entendimento e sua evolução. Esta constatação possui impacto importante no entendimento relativo com respeito ao presente capítulo. Este capítulo explorou a estrutura de persistência oriunda desta pesquisa, por meio do mapeamentos de arquétipos selecionados, e efetua comparações em relação à estrutura gerada por Wang et al. [40]. Para tal, foram usados arquétipos do Clinical 71 Knowledge Manager (CKM) 2 para o mapeamento direto a partir das definições ADL destes arquétipos. A partir dos mapeamentos diretos realizados nos arquétipos selecionados, algumas constatações importantes sobre a abordagem proposta nesta pesquisa, em relação a abordagem de Wang et al. [40], são: • • • • redução de atributos de referência (integridade referencial); diminuição de redundância na base de dados clínicos; produção registros clínicos não identificados, em relação ao paciente; criação de única tabela base para cada arquétipo, independente de sua utilização na forma de slots; • preservação do número de tabelas da base de dados clínicos, mesmo na ocorrência de recursividade por meio de slots. 2 http://www.openehr.org/ckm 72 CAPÍTULO 6 Conclusão Os Registros Eletrônicos de Saúde (RESs) do modelo openEHR expôs um grande obstáculo quando se discute sobre armazenamento e recuperação de RES, não existindo especificação para o mapeamento entre conceitos clínicos e a persistência de dados em si. Assim, é pertinente que sejam estabelecidas estratégias de persistência que se aproximem da estrutura em que estão representados os conceitos clínicos. Este trabalho tem seu foco na persistência de dados clínicos, seguindo o eixo de persistência direta dos arquétipos com base na ADL, reduzindo a dependência do modelo de referência do openEHR. Para reunir trabalhos relacionados e compreender o estado da arte, foi conduzido um mapeamento sistemático sobre a persistência de dados clínicos baseada nas definições ADL de arquétipos do openEHR. Com o conjunto de estudos obtidos, quatro trabalhos relacionados foram detalhados para identificar seus principais avanços e limitações. Concluiu-se que existem poucos estudos que mapeiam diretamente as definições ADL de arquétipos do openEHR para estruturas de armazenamento. Dos trabalhos encontrados na literatura, muitos pertenciam a um eixo distinto, que emprega o MR para a persistência. Os trabalhos Späth e Grimson [37] e Min et al. [22] não fazem persistência a partir dos arquétipos e sim exploram a conversão de bases de dados existentes para a estrutura de arquétipos. Ainda assim o trabalho de Min et al. [22] é o único que estabelece regras para a conversão dos bancos de dados para arquétipos. Contudo, apenas os trabalhos de Wang et al. [39] e Wang et al. [40] determinam uma maneira de desenvolver um banco de dados a partir das definições ADL dos arquétipos do openEHR. Eles estabelecem algumas regras para o mapeamento para um banco de dados relacional, porém estas regras ainda se enquadravam em uma fase inicial. A proposta de persistência deste trabalho foi apresentada na forma de pressupostos, critérios e regras, podendo se destacar em uma comparação a proposta de Wang et al. [40]. Posteriormente foi explorada a estrutura de persistência oriunda desta pesquisa, por meio do mapeamento de arquétipos selecionados, efetuando comparações em relação à estrutura gerada por Wang et al. [40]. Para tal, foram usados arquétipos do Clinical Knowledge Manager (CKM) 1 para o mapeamento direto a partir das definições ADL destes arquétipos. Em uma visão global, o objetivo dos esforços descritos neste trabalho foi tornar possível a persistência de RES levando em conta a estrutura das definições ADL dos arquétipos disponibilizados no CKM. 6.1 Contribuições Algumas contribuições deste trabalho estão elencadas abaixo. • foi realizado um mapeamento sistemático para conhecer melhor os aspectos de persistência de dados clínicos, podendo destacar-se a identificação de trabalhos correlatos, constatando-se que poucas pesquisas utilizam o mapeamento direto de arquétipos para as estruturas de persistência; • introdução de nova abordagem para o mapeamento direto de arquétipos, foi exposta na forma de pressupostos, critérios e regras, como já mencionado; • avaliação da abordagem proposta, expondo suas vantagens em relação às pesquisas encontradas na literatura, tais como a produção de registros clínicos não identificados, em relação ao paciente; promoção da redução de atributos de referência (integridade referencial); emprego de tabelas de metadados, que apoiam melhorias no mapeamento; preservação do número de tabelas da base de dados clínicos, mesmo na ocorrência de recursividade por meio de slots; escalabilidade do esquema de banco de dados (número estável de tabelas de banco de dados), mesmo na ocorrência de recursão através de slots. 6.2 Trabalhos Futuros Os seguintes desdobramentos podem ser agregados à presente pesquisa: • aprimorar os critérios de mapeamento de diferentes versões do mesmo arquétipo, o trabalho apresentado incluiu os critérios de mapeamento de diferentes versões do mesmo arquétipo conforme o trabalho do Wang et al. [40], estes critérios devem ser aprimorados afim que desenvolvam meios para estabelecer a compatibilidade das estruturas de persistência em relação às distintas versões do mesmo arquétipo. • medir o desempenho em consultas de recuperação de dados clínicos deste mapeamento, podendo medir o impacto da abordagem proposta nas consultas aos dados clínicos em uma instituição de saúde; 1 http://www.openehr.org/ckm 74 • automatizar do protocolo para o mapeamento direto de arquétipos, deste modo o uso de meios automáticos facilitará na execução da proposta da dissertação; • comparar a estratégia de persistência de arquétipos proposta neste trabalho com outros eixos de pesquisa encontrados na literatura como exemplo: Freire et al. [13] e Silva et al. [36], que utilizam o MR do openEHR para persistir os dados de saúde; • aprimorar o protocolo apresentado no artigo [22], este protocolo explora a conversão de bases de dados existentes para a estrutura de arquétipos; • incluir na automatização do protocolo para o mapeamento direto de arquétipos as regras apresentadas no artigo [22], que regem a conversão de bases de dados existentes para a estrutura de arquétipos; • tratar a perda de informações resultante do achatamento dos arquétipos, sendo esta uma limitação encontrada nas abordagens que exploram a conversão das bases de dados existentes para estruturas de arquétipos. 75 Referências Bibliográficas [1] ATALAG , K.; YANG , H. Y.; T EMPERO, E.; WARRENA , J. Evaluation of software maintainability with openehr – a comparison of architectures, 2014. [2] B ARBARITO, F.; P INCIROLI , F.; M ASON , J.; M ARCEGLIA , S.; M AZZOLA , L.; B ONA CINA , S. Implementing standards for the interoperability among healthcare pro- viders in the public regionalized healthcare information system of the lombardy region, 2012. [3] B EALE , T. Archetypes: Constraint-based domain models for future-proof information systems, 2002. Archetype definition language 2 (adl2) specification. [4] B EALE , T. = <http://www.openehr.org/releases/AM/latest/docs/ADL2/ADL2.html>, 2003-2016. [5] B EALE , T. Ehr information model. = <http://www.openehr.org/releases/RM/latest /docs/ehr/ehr.html>, 2003-2016. [6] B EALE , T. Openehr architecture overview. = http://openehr.org/releases/BASE/latest/docs/architecture_overview/architecture_ overview.html, 2003-2016. [7] B IOLCHINI , J., A . M. P. G. A . N. A. C. C.; T RAVASSOS , G. H. Scientific research ontology to support systematic review in software engineering. In: Elsevier Science Publisher, 2007. [8] B RAGA , R. D.; L UCENA , FÁBIO N OGUEIRA AND, P. S. L.-J. Registro eletrônico em saúde interoperável: os desafios do padrão openehr. In: Journal Health Informatic v. 8, n. 3, 2016. [9] CEN, T. C. . European standardization of health informatics v. 1064 n02-015, 2002. [10] DA U NIÃO (DOU), D. O. Portaria nº 2073. In: Diário Oficial da União nº 169, pág. 6364, 31 de agosto de 2011. [11] E LMASRI , R.; N AVATHE , S. Sistemas de banco de dados. In: São Paulo, SP (Brazil) Pearson Addison Wesley. 4. ed.. 724 p.., 2005. [12] F RADE , S.; F REIRE , S. M.; S UNDVALL , E.; PATRIARCA -A LMEIDA , J.; C RUZ C ORREIA , R. Survey of openehr storage implementations. In: Proceedings of the 26th IEEE International Symposium on Computer-Based Medical Systems, 2013. [13] F REIRE S. M., S UNDVALL E., K. D.-L. P. Performance of xml databases for epidemiological queries in archetype-based ehrs. In: Scandinavian Conference on Health Informatics, 2012. [14] G AETE , R. A. C. Modelo de interoperabilidade semântica aplicado ao domínio da saúde: um estudo de caso na vigilância alimentar e nutricional., 2012. [15] G ARDE , S.; K NAUP, P.; H OVENGA , E. J.; H EARD, S. Towards semantic interoperability for electronic health records: Domain knowledge governance for openehr archetypes. In: Methods of Information in Medicine, 2007. [16] K ALRA , D. Electronic health record standards, 2006. [17] K ITCHENHAM , B. Procedures for performing systematic reviews. In: Engineering Group, Keele University, Australia, 2004. [18] KONDO, M. N. S. Mapeamento da base de conhecimento fundamentado em arquétipos: contribuição à informática em saúde., 2012. [19] L EITÃO -J ÚNIOR , P. S.; DE L UCENA , F. N.; B RAGA , R. D.; N EIRA , R. A. Q. Regulação de segurança da informação eletrônica em saúde: visão geral, 2016. [20] L OZANO -RUBÍ , R.; C ARRERO, A. M.; B ALAZOTE , P. S.; PASTOR , X. Ontocr: A cen/iso-13606 clinical repository based on ontologies. In: Journal of Biomedical Informatics, 2016. [21] M ARCOS , M.; S ALVADOR , B. M. Towards the interoperability of computerised guidelines and electronic health records: An experiment with openehr archetypes and a chronic heart failure guideline, 2010. [22] M IN , L., L. X. L. . H. D. Case study: Applying openehr archetypes to a clinical data repository in a chinese hospital. In: MEDINFO 2015: EHealth-enabled Health: Proceedings of the 15th World Congress on Health and Biomedical Informatics, volume 216, p. 207, 2015. [23] M UÑOZ , A.; S OMOLINOS , R.; PASCUAL , M.; F RAGUA , J. A.; G ONZÁLEZ , M. A.; M ONTEAGUDO, J. L.; S ALVADOR , C. H. Proof-of-concept design and development of an en13606-based electronic health care record service, 2007. 77 [24] O LIVEIRA -N ETO, A. M. Renderização de arquétipos: um estudo de caso em sumário de alta hospitalar. = http://repositorio.unb.br/handle/10482/16761, 2014. [25] O PEN EHR. Clinical knowledge manager, ckm. = <http://www.openehr.org/ckm/>. [26] OPEN EHR. Documentation. = <http://www.openehr.org/programs/clinicalmodels/ documentation.php>. [27] OPEN EHR. Slots, naming and merging. = <https://openehr.atlassian.net/wiki/display/spec/Slots,+naming+and+merging>. [28] OPEN EHR. What is openehr? = <http://www.openehr.org/what_is_openehr>. [29] O ZGUR K ILIC, V ELI B ICER , A. D. Mapping archetypes to owl, 2006. [30] P RADO, J. L. C. M. W. L. S. L. T. C. L. F. P. A. F. Uma abordagem para troca de mensagens usando arquÉtipos, 2013. [31] PĂUN , I. D. D. G. S. N.; I OSIF, O.; S TAN , O.; P ER ŞE , A.; D EHELEAN , C.; M ICLEA , L. Local ehr management based on openehr and en13606. In: Journal of medical systems, 2009. [32] RUIZ , L. M. Editor gráfico de correspondencias de alto nivel para arquetipos de historia clínica electrónica, 2010. [33] S ACHDEVA , S.; B HALLA , S. Semantic interoperability in standardized electronic health record databases. In: Journal of Data and Information Quality (JDIQ), 2012. [34] S ANTOS M., B AX M. P., P. C. Codificando arquétipos em linguagem adl com base no modelo de referência da norma iso 13606. In: X Workshop de Informática Médica, 2010. [35] S ERAPIÃO, P. R. B. Investigação da aplicabilidade da mineração de texto como apoio ao desenvolvimento de modelos de arquétipos para exames de radiologia e diagnóstico por imagem, 2015. [36] S ILVA A.V.P., M ARTINS B. P., L. F. N. L.-J. P. S. S. J. C. Estratégias para persistência de dados clínicos baseada no openehr. In: XV Congresso Brasileiro de Informática em Saúde - CBIS ., 2016. [37] S PATH , M. B.; G RIMSON , J. Applying the archetype approach to the database of a biobank information management system. In: International journal of medical informatics, p. 205–226, 2011. 78 [38] S UDHANSHU K ULSHRESTHA , S. S. Performance comparison for data storage db4o and mysql databases. In: Contemporary Computing (IC3), 2014. [39] WANG , L., M. L. W. R. L. X. . D. H. Archetype relational mapping based on openehr. In: Chin J Biomed Eng, 2014. [40] WANG , L., M. L. W. R. L. X. . D. H. Archetype relational mapping-a practical openehr persistence solution. In: BMC medical informatics and decision making,, 2015. [41] W OLLERSHEIM , D.; A NNY, S.; R AHAYU, W. Archetype-based electronic health records: a literature review and evaluation of their applicability to health data interoperability and access. In: Health Information Management Journal, 2009. 79 ANEXO A ADL do arquétipo: openEHR-EHR-EVALUATION.goal.v1 Nesta seção é apresentada a ADL extraída do arquétipo “openEHR-EHREVALUATION.goal.v1”(Figuras A.1 e A.2), que foi utilizado no Capítulo 5 na seção 5.1, desta dissertação. Figura A.1: Código ADL do arquétipo EVALUATION.goal.v1” parte 1 “openEHR-EHR- Figura A.2: Código ADL do arquétipo EVALUATION.goal.v1” parte 2 81 “openEHR-EHR- ANEXO B ADL dos dois arquétipos e do slots que eles referenciam Nesta tipo seção são apresentadas as “‘openEHR-EHR-CLUSTER.multimedia.v1” EHR-CLUSTER.anatomical_location_clock.v0” ADLs (Figura (Figura B.2) extraídas B.1) ,e , do arqué- “openEHR- “openEHR-EHR- CLUSTER.anatomical_location_relative.v1” (Figura A.2), que foram utilizado no Capítulo 5 na seção 5.2, desta dissertação. Figura B.1: Código ADL do arquétipo CLUSTER.multimedia.v1” “openEHR-EHR- Figura B.2: Código ADL do arquétipo CLUSTER.anatomical_location_ clock.v0” 83 “openEHR-EHR- Figura B.3: Código ADL do arquétipo CLUSTER.anatomical_location _relative.v1” 84 “openEHR-EHR- ANEXO C ADL do Arquétipo “openEHR-EHR-CLUSTER.exam_eye.v0” Nesta seção é apresentada a ADL extraída do arquétipo “openEHR-EHRCLUSTER.exam_eye.v0” (Figura C.1), que foi utilizado no Capítulo 5 na seção 5.3, desta dissertação. Figura C.1: Código ADL do arquétipo CLUSTER.exam_eye.v0” “openEHR-EHR- ANEXO D ADL do arquétipo: “openEHR-EHR-CLUSTER.sympto_sign.v1” Nesta seção é apresentada a ADL extraída do arquétipo “openEHR-EHRCLUSTER.sympto_sign.v1” (Figuras D.1, D.2 e D.3), que foi utilizado no Capítulo 5 na seção 5.4, desta dissertação. Figura D.1: Código ADL do arquétipo “openEHR-EHRCLUSTER.sympto_sign.v1” parte 1 Figura D.2: Código ADL do arquétipo “openEHR-EHRCLUSTER.sympto_sign.v1” parte 2 87 Figura D.3: Código ADL do arquétipo “openEHR-EHRCLUSTER.sympto_sign.v1” parte 3 88 89