Descoberta de Conhecimento em Prontuários Eletrônicos

Propaganda
Descoberta de Conhecimento em Prontuários Eletrônicos
Stanley Loh1,2, Maurício Almeida Gameiro4,6, Fábio Leite Gastal4,5, José
Palazzo M. de Oliveira3
1
Universidade Católica de Pelotas (UCPEL) – Escola de Informática
Universidade Luterana do Brasil (ULBRA) – Faculdade de Informática
3
Universidade Federal do Rio Grande do Sul (UFRGS) - Instituto de Informática
4
Clínica Olivé Leite, Pelotas – RS
5
Universidade Católica de Pelotas (UCPEL) – Escola de Medicina
6
Agência Nacional de Vigilância Sanitária (ANVISA) – Gerência Geral de Medicamentos
Genéricos
2
Resumo. Este trabalho apresenta uma estratégia para descoberta de conhecimento em
prontuários eletrônicos. Os prontuários contêm informações textuais sobre os pacientes. O
fundamento é identificar características dos pacientes nos textos, para depois realizar análises
estatísticas sobre as características extraídas. Isto permite explorar o conhecimento disponível
em textos para aquisição de conhecimento novo ou para validação do conhecimento contido
nos prontuários. Experimentos de descoberta de conhecimento foram realizados com
prontuários de uma clínica psiquiátrica. A validação da estratégia consistiu em embutir o
conhecimento descoberto num sistema automatizado de apoio à decisão e depois avaliar a
margem de erro deste sistema para classificação de novos casos.
Palavras-chave: análise de textos, prontuários eletrônicos, descoberta de conhecimento.
Abstract: This work presents an approach for knowledge discovery from electronic medical
records. Medical records have textual information about patients. The hypothesis is that
software tools can extract patient’s characteristics analyzing the texts and after that identify
statistical patterns. The benefit is to explore the knowledge available in textual records in order
to find new knowledge or to validate the knowledge codified in the records. Knowledge
discovery experiments were carried out with medical records of a psychiatric hospital. For
evaluating the approach, the discovered knowledge was embedded in an automated system
whose goal was to find the diagnosis of new cases.
Key-words: text analysis, electronic medical records, knowledge discovery.
Uma dificuldade para este tipo de análise
é que boa parte das informações em um
prontuário aparece de forma textual. Isto
não chega a ser anormal, já que 80% das
informações de uma organização estão
contidas em textos (TAN, 1999).
Na área de Informática, há estudos de
técnicas e ferramentas para Descoberta de
Conhecimento
em
Textos
(Knowledge
Discovery in Texts - KDT). Tais técnicas e
ferramentas permitem analisar textos e
descobrir conhecimento novo que encontrase implícito (FELDMAN & DAGAN, 1995).
Este trabalho apresenta uma estratégia
para análise qualitativa e quantitativa de
conhecimento
contido
em
prontuários
Introdução
Com o crescente uso de computadores
na área de saúde, como em hospitais e
clínicas, cada vez mais informações estão
sendo armazenadas em meios eletrônicos.
Um desafio especial é manter todas as
informações do paciente em um prontuário
eletrônico. Tal prontuário pode auxiliar na
tomada de decisões e no melhor controle do
tratamento de pacientes. Além disto, o
conjunto de informações disponíveis nos
prontuários pode ser analisado para a
descoberta de conhecimento novo ou
validação de informações.
1
eletrônicos de uma clínica psiquiátrica. Os
prontuários contêm informações sobre os
pacientes internados (laudos de internação
e evoluções) e são escritos em textos livres
por profissionais da área de saúde
(médicos, psicólogos, enfermeiros, etc.). A
análise qualitativa permite identificar sobre o
que os textos tratam. No caso dos
prontuários,
podem
ser
identificadas
características dos pacientes ou o que estes
mencionaram durante a entrevista de
avaliação inicial. Já a análise quantitativa
permite identificar padrões estatísticos sobre
estas características, de acordo com grupos
de pacientes (por exemplo, divididos por tipo
de diagnóstico).
A hipótese deste trabalho é que a
aplicação de ferramentas de software, mais
especificamente de KDT, sobre prontuários
textuais permite extrair conhecimentos
sobre doenças, padrões de preenchimento
dos
prontuários,
comportamento
dos
pacientes, perfil, entre outros. Neste artigo,
é discutida a aplicação da estratégia na
área de psiquiatria. A avaliação da
qualidade da estratégia foi feita através da
incorporação do conhecimento descoberto
em um sistema automático para apoio à
decisão. O rendimento satisfatório deste
sistema no diagnóstico de novos casos
confirma a hipótese inicial.
não possuem explicitamente conceitos, mas
sim palavras (SOWA, 2000), a extração de
conceitos deve ser feita analisando-se o
conjunto todo de termos presentes no texto.
Nas seções a seguir, estas etapas são
descritas em maiores detalhes. Os métodos
computacionais utilizados são discutidos em
LOH et al. (2001).
Análise Qualitativa
O objetivo desta etapa é identificar os
conceitos presentes nos textos. Este é um
processo semi-automático, ou seja, é
realizado por pessoas com auxílio de
ferramentas de software.
É necessário definir os conceitos
relevantes
e
as
regras
para
sua
identificação no texto.
A definição de um conceito deve ser feita
através de uma ou mais regras, nas quais
devem ser indicados termos positivos e
termos negativos. Para um conceito estar
presente numa frase, todos os termos
positivos devem estar presentes na frase e
nenhum termo negativo pode aparecer. Se
uma das regras for verdadeira para a rfase
sendo analisada, então o conceito está
presente na frase e, conseqüentemente, no
texto. Por exemplo, o conceito “alcoolismo”
pode ser definido em parte pelas regras (o
símbolo “–” indica um termo negativo):
(i) álcool –nega
(ii) hálito etílico
O termo negativo “nega” aparece para
eliminar frases como “o paciente nega uso
de álcool”.
Estratégia para Descoberta de
Conhecimento
A estratégia para descoberta de
conhecimento é dividida em duas etapas.
Primeiro é feita uma análise qualitativa dos
textos contidos nos prontuários eletrônicos,
procurando identificar conceitos do mundo
real, ou seja, que temas são mencionados
nos textos. A segunda etapa realiza a
análise quantitativa sobre os conceitos
identificados,
para
extrair
padrões
estatísticos.
O fundamento básico é aplicar técnicas
estatísticas sobre conceitos extraídos de
textos, ao invés de trabalhar diretamente
com as palavras dos textos. Palavras
podem gerar problemas de ambigüidade
devido ao uso de sinônimos, de termos
polisêmicos (com mais de um significado) e
de variações léxicas (gênero, número e
conjugações
verbais).
Conceitos
representam melhor que palavras os
objetos, eventos, sentimentos, ações, etc.
do mundo real. Entretanto, como os textos
Análise Quantitativa
Esta etapa aplica técnicas estatísticas
sobre os conceitos identificados na etapa
anterior. Duas técnicas específicas estão
sendo usadas nesta estratégia: a análise de
distribuição e a técnica associativa.
A técnica de análise de distribuição
verifica a freqüência com que ocorrem os
conceitos num conjunto de textos (pode ser
a coleção toda ou parte dela). O resultado é
uma lista de conceitos e suas freqüências.
Isto permite analisar que temas são mais
dominantes e quais aparecem menos.
Também é possível comparar uma lista com
outra (por exemplo, listas de duas subcoleções diferentes). Assim, podem ser
encontrados temas comuns em duas
coleções ou temas exclusivos e também
disparidades
ou
similaridades
nas
freqüências dos conceitos.
2
Já a técnica associativa descobre
relações ou associações entre conceitos.
Isto funciona como uma probabilidade
condicional, permitindo predizer a presença
de um conceito em função da presença de
outro.
Os resultados são expressos na forma
de regras do tipo X è Y (onde X pode ser
um ou mais conceitos e Y somente um
conceito). A regra significa que “se X está
presente em um texto, então Y também está
presente com um certo grau de certeza”.
O grau de certeza é dado por valores de
confiança (confidence) e suporte (support).
De acordo com a analogia proposta por LIN
et al. (1998), a interpretação do grau de
confiança (confidence) para uma regra
associativa do tipo X è Y é a proporção de
textos que possuem X e Y em relação ao
número de textos que possuem somente X.
Da mesma forma, o suporte da mesma
regra (support) é interpretado como o
número de textos onde X e Y estão
presentes (ou a proporção em relação à
coleção toda).
Para cada prontuário havia associado
um
diagnóstico,
para
representar
o
transtorno mental ou comportamental do
paciente, o qual foi definido por um médico
da clínica em um processo real e prévio de
diagnóstico. Entretanto, a indicação do
diagnóstico não estava explicitamente
expressa no texto. A classificação usada
para o diagnóstico segue a Classificação
Internacional de Doenças, décima revisão
(CID-10),
conforme
o
CENTRO
BRASILEIRO DE CLASSIFICAÇÃO DE
DOENÇAS (1989). Foram usadas somente
as classes de primeiro nível do CID-10, as
quais correspondem aos diagnósticos mais
freqüentes na clínica estudada, a saber:
a) esquizofrenia,
b) transtornos mentais orgânicos,
c) transtornos do humor (afetivos) e
d) transtornos
mentais
e
comportamentais devidos ao uso
de substância psicoativa.
Os conceitos foram selecionados e
definidos a partir do CID-10, o qual foi
refinado
com
termos
extraídos
de
dicionários técnicos. Além disto, foi
necessário ampliar o conjunto de termos
para identificação dos conceitos, uma vez
que termos muito específicos do local eram
usados.
Por
exemplo,
o
conceito
“alcoolismo” poderia aparecer em frases
como “o paciente faz uso de destilados”.
Neste caso, ferramentas automatizadas de
análise
léxica
puderam
auxiliar
na
identificação dos termos usados pelos
profissionais do local para descrição de
sintomas e sinais.
As definições finais dos conceitos e das
regras de extração foram validadas por
profissionais da área. Foram selecionados
65 conceitos referentes a características do
paciente e 32 conceitos referentes a
remédios.
Primeiro, a coleção de treino foi dividida
em 4 sub-coleções, correspondendo aos 4
grandes
grupos
de
diagnóstico
(esquizofrenia,
transtornos
orgânicos,
afetivos e devidos a substâncias). Cada
sub-coleção continha os textos referentes
aos laudos de internação de pacientes com
o determinado diagnóstico associado.
Depois,
foi
feita
a
descoberta
de
conhecimento
(análises
qualitativa
e
quantitativa) sobre cada sub-coleção de
textos (etapa de treino), resultando em listas
de distribuição de conceitos e associações
entre conceitos. Este resultados foram
tomados para representar as características
Experimentos e resultados
Experimentos foram realizados aplicando
a
estratégia
de
descoberta
sobre
prontuários
eletrônicos
da
Clínica
Psiquiátrica Olivé Leite. Foram utilizados os
laudos de internação dos pacientes da
clínica. Estes laudos contêm textos escritos
em linguagem natural livre pelos médicos a
partir de informações colhidas na entrevista
de internação do paciente. O laudo procura
especificar a histórica pregressa do
paciente, seu comportamento social e
familiar, seus hábitos e os sintomas e sinais
identificados pelo médico durante a
entrevista. Na entrevista, também pode
participar algum familiar ou a pessoa que
acompanha o paciente. Neste caso, o laudo
ainda contém impressões destas pessoas
sobre o paciente.
Foram
coletados
400
prontuários,
correspondendo a internações feitas na
clínica durante aproximadamente 4 meses.
Cada prontuário é referente a um único
paciente. A coleção foi dividida em duas
partes, com 200 textos cada. A primeira
parte foi usada para descoberta de
conhecimento (coleção de treino) e a
segunda sub-coleção foi utilizada para
avaliação do conhecimento descoberto,
através do sistema automatizado de apoio à
decisão (coleção de teste).
3
dos
pacientes
de
cada
grupo
de
diagnóstico.
Para
validação
do
conhecimento
descoberto, foram feitas as seguintes
avaliações:
- o grau de acerto na identificação dos
conceitos foi avaliado; e
- o conhecimento descoberto foi avaliado
indiretamente, sendo embutido num sistema
automatizado de apoio à decisão e este
sendo avaliado por seus resultados.
O sistema
automatizado é um
classificador que associa um diagnóstico a
textos da coleção de teste, analisando os
conceitos presentes no texto. Neste
processo de classificação, o sistema
automatizado
deveria
identificar
características (conceitos) nos textos e
compará-las com as que descrevem cada
grupo de diagnóstico.
A extração dos conceitos foi feita da
mesma maneira que na etapa de
descoberta do conhecimento (sobre a
coleção de treino).
Os resultados foram medidos utilizando
os graus de abrangência (recall) e precisão
(precision). O grau de abrangência (ABR) é
calculado
pelo
número
de
textos
corretamente associados a uma classe
dividido pelo número de textos que
realmente pertencem à classe. Já a
precisão (PR) é o número de textos
corretamente associados a uma classe
dividido pelo número de textos que foram
associados à mesma classe (LEWIS, 1991).
Admitindo que ambas as medidas são
igualmente importantes, utilizou-se ainda a
medida F-measure, calculada por
entre os valores de Microaveraging
measure e Macroaveraging F-measure.
F-
Avaliação da Identificação de
Conceitos
Especialistas do domínio analisaram 50
textos extraídos da coleção de teste,
tomados como amostra representativa desta
coleção. Os especialistas indicaram os
conceitos
específicos,
relativos
às
características
dos
pacientes,
que
apareciam em cada texto. Não foram
avaliados todos os conceitos, mas somente
os 12 mais complexos. Os demais conceitos
foram considerados simples por terem
descrições simples.
A média entre Microaveraging Fmeasure e Macroaveraging F-measure
resultou no valor de 91%, ou seja, a
identificação dos conceitos pela estratégia
obteve uma margem de erro menor que
10%.
Avaliação do Conhecimento
Descoberto
Diferentes métodos foram avaliados para
caracterizar cada grupo de diagnóstico.
Lembrando
que
os
resultados
da
descoberta de conhecimento (etapa de
treino) eram, para cada grupo de
diagnóstico, uma lista de conceitos e suas
freqüências e as associações entre
conceitos, diferentes combinações destes
conceitos poderiam ser usadas para
caracterizar os pacientes da classe.
A seguir são descritos os métodos
avaliados e apresentados os valores
resultantes
para
a
média
entre
Microaveraging
F-measure
e
Macroaveraging F-measure:
2 * PR * ABR / (PR + ABR)
conforme LEWIS & GALE (1994).
Uma vez que havia 4 classes, foram
também
utilizadas
as
medidas
de
microaveraging e macroaveraging (LEWIS,
1991) para se obter o resultado geral de
cada método para a coleção toda.
Microaveraging considera a coleção toda
como uma única classe e então avalia os
graus de abrangência e precisão sem
distinção de classes. Já a medida de
Macroaveraging primeiro calcula a precisão
e abrangência em cada classe e então
extrai os valores médios para a coleção
toda.
Para comparação dos resultados finais,
uma medida adicional foi usada para
encontrar o melhor desempenho: a média
a) utilizando todos os conceitos de cada
lista para caracterizar cada classe de
diagnóstico è 0,44;
b) usando apenas os conceitos menos
freqüentes (probabilidade < 50%) de cada
lista è 0,62;
c) usando pares de conceitos presentes
nas associações è 0,51;
d) usando pares de conceitos presentes
nas associações, mas somente os pares
exclusivos de cada classe è 0,57;
4
e) usando todos os conceitos de cada lista
mais os pares de conceitos extraídos das
associações è 0,52.
O trabalho também demonstrou ser
importante registrar informações sobre
pacientes em prontuários eletrônicos. Com
auxílio de ferramentas de KDT, é possível
descobrir conhecimento implícito nos textos.
Nos experimentos realizados, foi possível
descobrir conhecimento sobre diagnósticos.
Este conhecimento apresentava-se na
forma de distribuições e associações de
características presentes em pacientes com
determinado
diagnóstico.
Também
foi
possível identificar o perfil dos pacientes da
Clínica
estudada.
Tais
descobertas
permitem avaliar as decisões tomadas e
podem suportar decisões futuras.
Entre os planos para o futuro está o
estudo de técnicas de seqüência de tempo,
as quais analisam conceitos em coleções
contendo textos em seqüência. Desta forma,
espera-se descobrir conhecimento sobre a
internação dos pacientes analisando os
laudos de evolução contidos no prontuário
eletrônico. A hipótese é que deve haver
padrões nas seqüências de conceitos de
uma evolução para outra, durante a
internação do paciente.
O método que utiliza somente conceitos
exclusivos de cada lista não foi avaliado por
não terem sido encontrados conceitos
exclusivos (todos os conceitos apareciam
em mais de um grupo de diagnóstico).
O melhor método de caracterização
obteve uma média de 62% de acertos (uma
margem de erro próxima de 38%).
Apresentando estes resultados para os
médicos especialistas que participaram do
experimento,
eles
consideraram
os
resultados numéricos satisfatórios, uma vez
que desempenhos maiores que 60% são
melhores que algumas decisões de
especialistas humanos.
Conclusões
Este trabalho apresentou uma estratégia
para descoberta de conhecimento em
prontuários
eletrônicos.
Como
os
prontuários contêm informações em formato
textual, a estratégia utiliza ferramentas de
software, mais especificamente de KDT,
para
realizar
análises
qualitativa
e
quantitativa dos textos.
A
estratégia
identifica
padrões
estatísticos sobre conceitos identificados
nos textos. Conceitos referem-se a “coisas”
do mundo que foram mencionadas nos
textos. Na análise dos prontuários, os
conceitos representavam características dos
pacientes da clínica psiquiátrica.
Nos experimentos realizados, os textos
foram separados por diagnóstico. Isto
permitiu identificar características dos
grupos de pacientes, ou seja, o perfil dos
pacientes de cada diagnóstico.
Uma das vantagens da estratégia é
minimizar o esforço humano para codificar e
depois analisar informações em textos.
Assim, as pessoas podem gerar textos
livres, sem preocupações com formatos ou
estilos de linguagem, e estes podem depois
serem
analisados
com
auxílio
de
ferramentas automatizadas.
Os
resultados
das
avaliações
demonstraram que a estratégia é viável para
extrair conhecimento confiável de coleções
textuais. Uma margem de erro de 38% no
sistema automatizado utilizado para teste
confirma que o conhecimento descoberto (e
embutido no sistema) era de qualidade e
condizente com a realidade.
Agradecimentos
A Clínica Psiquiátrica Olivé Leite de
Pelotas, RS, desenvolve pesquisas com o
apoio
do
Fundo
de
Incentivo
ao
Desenvolvimento do Ensino e da Pesquisa
em Saúde (FIDEPS, Ministério da Saúde).
Referências Bibliográficas
CENTRO
BRASILEIRO
DE
CLASSIFICAÇÃO DE DOENÇAS Centro Colaborador da OMS para a
Classificação de Doenças em Português
(1989), Classificação Internacional de
Doenças e de Problemas Relacionados
a Saúde. 10. ver. São Paulo: EDUSP.
Feldman, Ronen & Dagan, Ido. (1995),
“Knowledge
discovery
in
textual
databases (KDT)”, Proceedings of the
International Conference on Knowledge
Discovery, Montreal, 1995.
Lewis, David D. (1991), “Evaluating text
categorization”, Proceedings of the
Speech
and
Natural
Language
Workshop, Asilomar, p.312-318, 1991.
5
Lewis, David D. & Gale, William A. (1994),
“A sequential algorithm for training text
classifiers”, Proceedings of the ACMSIGIR Conference on Research and
Development in Information Retrieval,
Dublin, p.3-12, 1994.
Lin, Shian-Hua et al. (1998), “Extracting
classification knowledge of Internet
documents
with
mining
term
associations: a semantic approach”,
Proceedings
of
the
ACM-SIGIR
Conference
on
Research
and
Development in Information Retrieval,
1998.
Loh, Stanley; Moreira, José P. M. ; Gastal,
Fábio L. (2001). "Knowledge discovery
in textual documentation: qualitative and
quantitative
analyses".
Journal
of
Documentation, v.57, n.5, Setembro,
pp.577-590.
Sowa, John F. (2000) Knowledge
representation: logical, philosophical,
and
computational
foundations.
Pacific Grove: Brooks/Cole Publishing
Co., 2000.
Tan, Ah-Hwee. (2001), “Text mining: the
state of the art and the challenges”,
Proceedings
of
the
Pacific-Asia
Workshop on Knowledge Discovery
from Advanced Databases, Beijing,
p.65-70, 1999.
Contatos
Os autores podem ser contatados pelos
seguintes endereços de e-mails:
Stanley Loh:
[email protected]
Maurício Almeida Gameiro:
[email protected]
Fábio Leite Gastal:
[email protected]
José Palazzo M. de Oliveira:
[email protected]
6
Download