Agrupamento de Arritmias Cardíacas Utilizando ART2

Propaganda
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Agrupamento de Arritmias Cardíacas Utilizando ART2 Sérgio R. Rogal Jr.1, Emerson C. Paraiso1, Celso A. A. Kaestner2, Marcus V. M. Figueredo1, Alfredo B. Neto1 1
Pontifícia Universidade Católica do Paraná – PUCPR Programa de Pós-Graduação em Informática – PPGIa 2
Universidade Tecnológica Federal do Paraná – UTFPR Departamento de Informática {rogal,paraiso,marcus}@ppgia.pucpr.br, [email protected], [email protected] Abstract. The arrhythmias or abnormal rhythms of the heart are common cardiac riots and may cause serious risks to the life of people, being one of the main causes of death. These deaths could be avoided if a previous monitoring of these arrhythmias was carried through, using the Electrocardiogram (ECG) exam. This work raises the hypothesis that ART2 artificial neural networks (ANN) can be used in the clustering of the cardiac arrhythmias. This ANN allows that, at any time, other groups of arrhythmias may be added, without the necessity of a new training phase. In this work, an ART2 neural network is used to detect the normal beatings, the atrial premature contractions (APC) and the premature ventricular contractions (PVC). Resumo. As arritmias ou ritmos anormais do coração são distúrbios cardíacos comuns e podem causar sérios riscos à vida das pessoas, sendo uma das principais causas de óbito. Muitos destes óbitos poderiam ser evitados se fosse realizado um monitoramento prévio dessas arritmias, a partir do Eletrocardiograma (ECG). Este trabalho levanta a hipótese de que redes neurais artificiais (RNA) ART2 podem ser utilizadas no agrupamento das arritmias cardíacas. Esta RNA permite que, a qualquer momento, possam ser adicionados outros grupos de arritmias, sem a necessidade de um novo treinamento da rede neural. Neste trabalho serão detectados os batimentos normais, as contrações prematuras atriais (CPA) e as contrações prematuras ventriculares (CPV). 1. Introdução As doenças cardiovasculares são hoje em dia uma das principais causas de óbitos em países desenvolvidos e em desenvolvimento [Uni 2006]. Estes óbitos poderiam ser reduzidos se fossem realizados a detecção e o monitoramento prévio dessas arritmias a partir do Eletrocardiograma (ECG). O ECG é o registro de potenciais elétricos emitidos pelo coração que atingem a superfície do corpo [Guyton et al. 1996]. As arritmias ou ritmos anormais do coração são distúrbios cardíacos comuns e podem causar sérios riscos à vida das pessoas. Estes distúrbios são caracterizados pela alteração da freqüência ou ritmo dos batimentos cardíacos e podem ocorrer por várias 27
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
razões [Frownfelter et al. 2004]. A análise automática de arritmias a partir do ECG pode ser obtida de várias maneiras, utilizando-se algoritmos específicos e métodos inteligentes [Osowski et al. 2004], [Wang et al. 2003], [Zhou et al. 2005], [Zhang et al. 2004], [Lettnin et al. 2002], [Han et al. 1996], [Lee et al. 2005], [Srinivasan et al. 2003], [Capua et al. 2006]. Na maior parte dos trabalhos que aplicam os algoritmos de aprendizagem de máquina na análise automática de arritmias, este procedimento é dividido em três etapas: pré-processamento, extração de características e processamento.
Em nossa abordagem, nas etapas de pré-processamento e de extração de características dos sinais de entrada, optamos pela utilização da transformada Wavelet por fornecer informação suficiente para analisar o ECG de entrada, mostrando claramente onde ocorre cada freqüência. Com esta transformada, a análise do sinal é feita nos domínios do tempo e da freqüência ao mesmo tempo. [Polikar 1996]. Através de uma transformação do sinal para o domínio tempo-freqüência, as amostras dos batimentos são convertidas para coeficientes Wavelet. Em seguida, estes coeficientes são utilizados na entrada da ART2, que irá agrupá-los, ou seja, os dados similares serão colocados no mesmo grupo. Para os dados não similares, novos grupos são criados. Na seqüência deste artigo, a seção 2 mostrará a análise automática do ECG com métodos inteligentes. A seção 3 apresentará a metodologia desenvolvida durante este trabalho. Os resultados obtidos serão apresentados na seção 4. Ao final, oferecemos uma conclusão e as perspectivas de trabalhos futuros. 2. Análise Automática do ECG Diversas abordagens para a análise automática do ECG têm sido propostas na literatura. Incluem abordagens estatísticas [Chazal et al. 2004] e sintáticas [Tümer et al. 2003]. As RNAs também são muito empregadas na tarefa de reconhecimento de padrões do ECG [Ozbay et al. 2001]. O Multilayer Perceptron (MLP) é um dos modelos mais utilizados em abordagens com Redes Neurais. Em [Vargas et al. 2002] as principais características do sinal de ECG foram extraídas através de técnicas de análise das componentes principais e, em seguida, foram aplicados a um MLP para a classificação. Em [Minami et al. 1999] utilizou-se a transformada de Fourier para extrair as características do complexo QRS que foram utilizados em um MLP de cinco entradas e duas saídas. Mapas auto-organizáveis também estão sendo utilizados para a análise dos batimentos cardíacos. Em [Hu et al. 1997] mapas auto-organizáveis foram utilizados para a concepção de um classificador personalizado para um paciente específico e para um classificador global, no final os dois classificadores foram combinados. Em [Lagerholm et al. 2000] um mapa auto-organizável (5X5) foi empregado para o agrupamento dos batimentos em 25 grupos, na qual o complexo QRS foi representado pela função ortogonal de Hermite. Alguns trabalhos [Lin et al. 2005], [Wen et al. 2006] utilizaram algoritmos específicos para o agrupamento do ECG. Em [Wen et al. 2006] desenvolveu-se um algotitmo para a análise das arritmias cardíacas baseado no agrupamento das ondas do complexo QRS. Este algoritmo atingiu uma taxa de agrupamentos corretos acima de 90%. A seção seguinte mostrará a metodologia proposta neste trabalho. 28
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
3. Agrupamento de Arritmias Cardíacas Utilizando Redes Neurais AutoOrganizáveis Este trabalho levanta a hipótese de que uma RNA auto-organizável pode ser utilizada para agrupar as arritmias de um sinal de ECG, obtendo resultados semelhantes aos trabalhos que utilizaram outras abordagens (ver tabela 3). A figura 1 apresenta o diagrama para o processo de agrupamento utilizado neste trabalho. Figura 1. Diagrama de todo o processo para o agrupamento do sinal de ECG Para este trabalho foi escolhida a base de dados MIT-BIH Arrythmia Database [Physionet], que é uma base de dados utilizada para o desenvolvimento e avaliação de monitores de arritmias. Esta base é referência para o desenvolvimento de pesquisas na área de análise de arritmias. Ela foi criada pelo Boston's Beth Israel Hospital entre os anos de 1975 e 1979 [BIH], tendo sido publicada em 1980. Esta base possui 48 registros de ECG com arritmias, cada registro contendo duas derivações. O Boston's Beth Israel Hospital digitalizou os sinais com uma freqüência de amostragem de 360 Hz e com 11 bits de resolução. Destes 48 registros, 25 foram coletados de um conjunto específico de exames e os outros 23 registros foram selecionados aleatoriamente para representar outras arritmias [Physionet]. Especialistas da área avaliaram cada batimento cardíaco dos registros, informando a ocorrência de uma arritmia ou não, totalizando 110000 anotações de batimentos cardíacos [MIT]. Todo o sinal da base de dados foi segmentado na fase de pré-processamento por um algoritmo implementado em Java. Este algoritmo selecionou as amostras para a análise do ECG. Este processo é representado na figura 2. Figura 2. Diagrama do processo de segmentação do ECG O processo de segmentação inicia-se pela detecção de picos. No caso da base utilizada, a detecção de picos não foi necessária, visto que os mesmos já estão anotados. Para a seleção das amostras, foi definido um intervalo contendo 100 amostras, 50 amostras antes do pico e 50 amostras depois do pico. O critério utilizado para a escolha deste intervalo baseou-se em trabalhos anteriores [Prasad et al. 2003], [Lettnin et al. 2002] que utilizaram métodos semelhantes. Este intervalo contém todas as ondas possíveis para o agrupamento de uma arritmia. Após o processo de seleção das 29
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
amostras, estas serão submetidas à transformada Wavelet para o processo de extração de características. Este processo é apresentado na seção seguinte. 3.1. Transformada Wavelet Discreta Utilizou-se uma transformada Wavelet discreta (TWD) do tipo Coiflet com 4 níveis de resolução para processar as amostras de ECG da janela selecionada. As 100 amostras da janela selecionada são observadas na figura 3. Figura 3. Janela com amostras do sinal de ECG original Os coeficientes resultantes da transformada Wavelet apresentados na figura 4, são utilizados para formar o vetor de características do sinal de ECG analisado que será processado pela RNA. Figura 4. Vetor de características formado com os coeficientes Wavelet da janela selecionada. Este vetor inicia-se com os coeficientes de aproximação seguido dos coeficientes de detalhe. A TWD foi parametrizada até a quarta camada. Este número foi escolhido com base em trabalhos anteriores [Prasad et al. 2003], [Jung et al. 2003] que obtiveram bons resultados. Obtidos os coeficientes, estes são submetidos a RNA para o processamento. 3.2. Rede Neural Artificial Auto Organizável Utilizou-se uma RNA auto-organizável do tipo ART2 (Adaptive Ressonance Theory). A figura 5 apresenta a arquitetura simplificada desta rede. 30
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Figura 5. Arquitetura simplificada da RNA ART2 A arquitetura da rede ART2 pode ser dividida em três camadas: - F1: camada de processamento de entrada; - F2: camada de unidade de agrupamento; - RESET: camada que controla o grau de similaridade. A camada F1 está conectada à camada F2 através dos pesos bij. A camada F2, por sua vez, está conectada à camada F1 através dos pesos tji. Estas conexões duplicadas são utilizadas para controlar a similaridade dos padrões de um mesmo grupo. Como o modelo ART2 possui mecanismos de normalização e filtragem de ruídos incluídos na camada F1, ele se torna mais complexo que o modelo ART1. O parâmetro � controla a eliminação dos ruídos, ajudando a rede a se tornar estável. Na ART2 a aprendizagem pode ser rápida ou lenta. Esta variação de velocidade afeta, além da aprendizagem, as características dos grupos e dos vetores de pesos que serão formados. Quando a aprendizagem é rápida, os pesos são atualizados durante a ressonância (comentada abaixo). O tempo para esta atualização é equivalente ao tempo de apresentação de um padrão. Nesta aprendizagem poucas épocas são necessárias e são necessárias várias iterações para a alteração dos pesos entre a camada F1 e a entrada [Carpenter et al. 1998]. O modo lento altera os pesos em um tempo equivalente ao tempo de aprendizagem. Antes de se obter a estabilidade da rede, são necessárias muitas apresentações dos padrões. A ressonância ocorre apenas no modo de aprendizagem rápido, após a escolha do grupo vencedor. Sua caracterização ocorre pela repetição alternada no processo de atualização dos pesos nos dois sentidos (F1 �� F2) e na atualização da camada F1. O RESET não pode ocorrer durante a ressonância [Carpenter et al. 1998]. A velocidade de aprendizagem na ART2 pode ser controlada também através do parâmetro � (taxa de aprendizagem). A velocidade reduz com valores pequenos de �, mas garante que os pesos alcancem equilíbrio no modo lento. 31
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Neste trabalho, criou-se a ART2 com o auxílio da ferramenta BigNet, existente no software SNNS. Para a fase de treinamento e testes utilizou-se uma versão recompilada do software JavaNNS. O vetor de características formado pelos coeficientes Wavelet foi disponibilizado à entrada da RNA (uma característica por entrada). Os parâmetros da ART2 foram ajustados empiricamente, chegando a um nível de agrupamentos adequados. A tabela 1 mostra o valor dos parâmetros utilizados na ART2. Tabela 1. Valor dos parâmetros utilizados na RNA ART2 Parâmetro Valor Descrição t 100 Ciclos de treinamento a 10 Peso fixo da primeira camada b 10 Peso fixo da primeira camada c 0.1 Peso fixo utilizado no teste de reset d 0.9 Ativação da unidade vencedora de saída � 0.99 Determina a taxa de formação dos clusters � 0.1 Supressor de ruídos O uso desta rede é muito importante neste trabalho, visto que a ART2 é uma rede “plástica”, não sendo necessário treiná-la novamente desde o início para a adição de outros grupos [Carpenter et al. 1998]. Ela se ajusta automaticamente, formando novos grupos se necessário. A RNA foi treinada com um conjunto de 5070 batimentos (1690 CPA, 1690 CPV e 1690 normal) e foi testada com um conjunto de 2535 (845 CPA, 845 CPV e 845 normal). 4. Resultados Obtidos Os resultados obtidos são apresentados na tabela 2. Já na tabela 3 os resultados obtidos são confrontados com outros trabalhos. Para a etapa de testes, utilizou-se uma versão re-compilada do JavaNNS com algumas modificações. Assim, possibilitou-se anotar em qual unidade de saída os dados de entrada estavam sendo agrupados. Tabela 2. Resultados obtidos neste trabalho Sinal de ECG Agrupamentos Corretos Batimento Normal 86% Arritmia CPA 92% Arritmia CPV 95% A metodologia adotada obteve bons resultados, similares aos trabalhos que utilizaram a mesma base. A tabela 3 apresenta uma comparação entre os resultados de outros trabalhos e os resultados obtidos com a RNA auto-organizável. 32
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
O valor médio de agrupamentos corretos foi calculado a partir da média das N classes (arritmias). Alguns aspectos podem ser relevantes para explicar os resultados obtidos e nos guiar para pesquisa futura. Com relação à segmentação, pensamos em variar o número de amostras ou mesmo selecionar amostras específicas do sinal de ECG. Isso poderia melhorar os resultados. Tabela 3. Comparação entre a RNA auto-organizável e outros trabalhos Trabalho Arritmias Nº total de arritmias CPA CPV analisadas Processamento Correto RNA ART2 x x 2 93,50% [Lettnin et al. 2002] x 2 80% [Han et al. 1996] x 1 96,90% [Lee et al. 2005] x 1 98,60% [Zhang et al. 2004] x x 4 98,30% [Srinivasan et al. 2003] x 4 93,70% [Lin et al. 2005] x x 2 90% A utilização da transformada Wavelet Coiflet provou-se ser muito eficiente para representar a onda de ECG e suas arritmias. A análise com Wavelet é mais aprofundada, já que mostra efetivamente onde cada freqüência do ECG está ocorrendo. Porém, existem outras famílias de transformada Wavelet que poderiam ser utilizadas, como Daubechies, Haar e Symmlet. A utilização da transformada Wavelet Daubechies possui eficiência similar a Coiflet, como observado em [Jung et al. 2003]. Durante os testes foram utilizadas diversas configurações para a RNA ART2. Inicialmente, uma ART2 com 100 unidades de entrada e 3 clusters foi treinada, porém os resultados não foram bons. Isso aconteceu devido à grande similaridade entre o ECG normal e a arritmia CPA. Teoricamente o número de unidades de saída da ART2 deve ser igual ao conjunto de dados analisados. Neste caso três tipos de sinais (CPA, CPV e batimento normal). Assim, é necessário formar um cluster com mais unidades de saída e não apenas uma. Após os testes iniciais, variou-se o número de unidades de saída, especificamente com 5, 10, 15, 20, 30 e 40 unidades. Após vários testes, a rede com 15 unidades de saída obteve os melhores clusters. A tabela 4 apresenta a formação de cada cluster. 33
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Tabela 4. Descrição dos clusters formados na ART2 com 15 unidades de saída Cluster Sinal Correspondente Unidades de saída contidas no cluster 1 CPA Unidades 1, 4 e 5 2 Batimento Normal Unidades 2 e 3 3 CPV Unidades 7, 8, 9, 11, 12 e 13 5. Conclusões e Trabalhos Futuros A principal contribuição deste trabalho é mostrar que redes neurais artificiais autoorganizáveis do tipo ART2 em conjunto com a transformada Wavelet podem ser aplicadas nas tarefas de agrupamento de arritmias. Os resultados obtidos são similares aos do estado da arte, o que indica que melhores resultados podem ser encontrados em estudos futuros envolvendo RNA e Wavelets no agrupamento de arritmias. Outras configurações da rede ART2 podem ser criadas e testadas, para obter melhores resultados. Além disso, existem outras famílias da transformada Wavelet que podem ser testadas além da Coiflet. Por último, é relevante ressaltar que outros tipos de arritmias poderão ser adicionados, além das contrações prematuras atriais e ventriculares. Agradecimentos Sérgio Rogal gostaria de agradecer o apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) – Brasil, que apoiou o desenvolvimento deste projeto através de bolsa de estudos. Referências BIH. Beth Israel Hospital Inc. Disponível em: http://www.bih.harvard.edu. Acesso em: 15 de dezembro de 2006. Capua, C.D., Falco, S.D., Morello, R. (2006). A Soft Computing-Based Measurement System for Medical Applications in Diagnosis of Cardiac Arrhythmias by ECG Signals Analysis. Computational Intelligence for Measurement Systems and Applications. Proceedings of the IEEE International Conference on July. On page(s): 2-7. Carpenter, G.A., Grossberg, S. (1998). Adaptive Resonance Theory. Department of Cognitive and Neural Systems. September. Chazal, D.P., O'Dwyer, M. and Ropella, K.M. (2004). Automatic classification of heartbeats using ECG morphology and heartbeat interval features, IEEE Trans. Biomed. Eng. Volume 51, Issue 7, July 2004 Page(s): 1196 - 1206 Frownfelter, D., Dean, E. (2004). Fisioterapia Cardiopulmonar – Princípios e Prática. Terceira Edição. Editora Revinter. 34
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Guyton, A.C., Hall, J.E. (1996). Tratado de Fisiologia Médica. Guanabara & Koogan. Ham, F.M, Han, S. (1996). Classification of Cardiac Arrhythmias Using Fuzzy ARTMAP. Biomedical Engineering, IEEE Transactions on Volume 43, Issue 4, Apr 1996 Page(s):425 - 429 Hu, Y.H., Palreddy, S. and Tompkins, W.J. (1997). A patientadaptable ECG beat classifier using a mixture of experts approach, IEEE Trans. Biomed. Eng. on Volume 44, Issue 9, Sep 1997 Page(s):891 - 900 Jung, Y.K., Tompkins, W.J. (2003). Detecting and classifying life-threatening ECG ventricular arrythmias using wavelet decomposition. Engineering in Medicine and Biology Society. Proceedings of the 25th Annual International Conference of the IEEE , vol.3, no.pp. 2390- 2393 Vol.3, 17-21 Sept. Lagerholm, M., Peterson, C., Braccini, G., Edenbrandt, L. and Sörnmo, L. (2000). Clustering ECG complexes using Hermite functions and self-organizing maps, IEEE Trans. Biomed. Eng.; 47: 838-848. Lee, J.,Park, K.L., Song, M.H., Lee, K.J. (2005). Arrhythmia Classification with Reduced Features by Linear Discriminant Analysis. Engineering in Medicine and Biology Society. IEEE-EMB. 27th Annual International Conference of the , vol., no.pp. 1142- 1144, 01-04 Sept. Lettnin, D.V.,Vargas, F.,Macarthy, M. (2002). Estudo de um Sistema para Classificação de Batimentos Cardíacos Utilizando Redes Neurais. Universidade Federal de Pelotas (UFPel), Pontifica Universidade Católica do Rio Grande do Sul (PUCRS). Lin, Z., Ge, Y., Tao, G. (2005). Algorithm for Clustering Analysis of ECG Data. Engineering in Medicine and Biology Society. IEEE-EMBS. 27th Annual International Conference of the 01-04 Sept. Page(s):3857 – 3860. Minami, K., Nakajima, H. and Toyoshima, T. (1999). Realtime discrimination of ventricular tachyarrhythmia with Fourier-transform neural network, IEEE Trans. Biomed. Eng.; 46: 179-185. MIT. Massachussetts Institute of Technology. Disponível em http://www.mit.edu. Acesso em: 15 de dezembro de 2006. Osowski, S.,Hoai, L.T. (2004). Analysis of Features for Efficient ECG Signal Classification Using Neuro-fuzzy Network. Neural Networks. Proceedings. 2004 IEEE International Joint Conference on Volume 3, 25-29 July. Page(s):2443 – 2448. Ozbay, Y, Karlik, B. (2001). A RECOGNITION OF ECG ARRHYTHMIAS USING ARTIFICIAL NEURAL NETWORKS. Engineering in Medicine and Biology Society. Proceedings of the 23rd Annual International Conference of the IEEE.Volume 2, 25-28 Oct. Page(s):1680 - 1683 vol.2. Physionet. PhysioBank. MIT-BIH Arrhythmia Database. Disponível em: http://www.physionet.org/physiobank/database/mitdb. Acesso em: 15 de dezembro de 2006. 35
IV Workshop em Algoritmos e Aplicações de Mineração de Dados
Polikar, R. (1996). The Wavelet Tutorial. Rowan University, College of Engineering Web Servers. Disponível em: http://users.rowan.edu/~polikar/WAVELETS/WTpart1.html. Prasad, G.K., Sahambi, J.S. (2003). Classification of ECG arrhythmias using multiresolution analysis and neural networks. TENCON 2003. Conference on Convergent Technologies for Asia-Pacific Region , vol.1, no.pp. 227- 231 Vol.1, 15-17 Oct. Srinivasan, N., Wong, M.T., Krishnan, S.M. (2003). A new phase space analysis algorithm for cardiac arrhythmia detection. Engineering in Medicine and Biology Society. Proceedings of the 25th Annual International Conference of the IEEE , vol.1, no.pp. 82- 85 Vol.1, 17-21 Sept. Tümer, M.B., Belfore, L.A. and Ropella, K.M. (2003). A syntactic methodology for automatic diagnosis by analysis of continuous time measurements using hierarchical signal representations, IEEE Trans. Syst., Man, Cybern. Volume 33, Issue 6, Dec. 2003 Page(s): 951 - 965 Uni 2006 - Jornal da Unicamp. (2006). Edição 348 - dezembro de 2006. Disponível em: http://www.unicamp.br/unicamp/unicamp_hoje/ju/dezembro2006/ju348pag9a.html Acessado em 2006. Vargas, F., Lettnin, D., de Castro M.C.F. and Macarthy, M. (2002). Electrocardiogram pattern recognition by means of MLP network and PCA: A case study on equal amount of input signal types, in Proc. of the VII Brazilian Symposium on Neural Networks. Wang, F.,Carrault, G., Quiniou, R., Cordier, M., Luo, L. (2003). Temporal reasoning based automatic arrhythmias recognition. Robotics, Intelligent Systems and Signal Processing. Proceedings of the IEEE International Conference on Volume 2, 8-13 Oct. Page(s):1114 - 1119 vol.2. Wen, C., Huang, C.H., Yeh, M.F. and Chang, K.C. (2006). Clustering ECG Complexes Using Self-Organizing CMAC. Em BIOMEDICAL ENGINEERINGAPPLICATIONS, BASIS & COMMUNICATIONS (December). Zhang, Z.G., Jiang, H.Z., Ge, D.F., Xiang, X.J. (2004). Pattern Recognition of Cardiac Arrhythmias Using Scalar Autoregressive Modeling. Intelligent Control and Automation. WCICA 2004. Fifth World Congress on Volume 6, 15-19 June 2004 Page(s):5545 - 5548 Vol.6. Zhou, H., Hou, K.M., Ponsonnaille, J., Gineste, L.,Valux, C. De. (2005). A Real-Time Continuous Cardiac Arrhythmias Detection System RECAD. Engineering in Medicine and Biology Society. IEEE-EMBS. 27th Annual International Conference. Page(s):875 – 881. 36
Download