Universidade Federal de Santa Catarina

Propaganda
Universidade Federal de Santa Catarina
Florianópolis, 12 de outubro de 2005.
Departamento de Informática e Estatística
Disciplina: Projetos 1
Aluno: Herman Ignácio Ferber Pineyrua
Matrícula: 0123823-0
Resumo do artigo: “Implementações de Data Warehouse na Área da Saúde”.
Autores: Ricardo S. Santos1, Marco Antônio Gutierrez2.
1 Departamento
2 Serviço
de Informática em Saúde (DIS), Universidade Federal de São Paulo (UNIFESP).
de Informática, Instituto do Coração (INCOR), Universidade de São Paulo (USP).
As técnicas de data warehousing para produção de informações gerenciais são
utilizadas desde o início dos anos 90 em diversos setores da economia. Na área da
saúde, também existem iniciativas para a adoção desta tecnologia.
O sucesso ou fracasso no processo de implementação de uma nova tecnologia
depende de uma série de fatores, mas, o conhecimento prévio de casos similares, pode
evitar vários problemas ou situações desastrosas. O objetivo deste trabalho é apresentar
uma revisão dos esforços na implementação de um data warehouse na área da saúde.
CATCH
Um dos projetos para a saúde pública de maior destaque é o DW para o CATCH
(Comprehensive Assessment for Tracking Community Health) desenvolvido pela USF
(University of South Florida’s). O DW fornece informação para análise sobre mais de
250 indicadores.Um ponto que merece destaque no projeto é
a introdução de duas técnicas inovadoras para o processo de carga do DW (ETL Extracting,Transformation and Loading). São elas: “Estrelas Gêmeas” e “Filtros de
Qualidade dos Dados”.
O processo de Estrelas Gêmeas consiste, basicamente, em utilizar um modelo de
dados temporário, idêntico ao modelo de dados do DW, o qual será carregado num
primeiro estágio onde serão aplicadas todas a regras de validações e testes, e a partir
dele será carregado o modelo permanente.
Os “Filtros de Qualidade dos Dados” são rotinas inseridas no processo de carga
(ETL), para efetuar validações no conteúdo dos dados. Estas verificações analisam:
“fatos”; “agregados” e “dimensões”.
SARA
Programas de gerenciamento de doenças têm proliferado com o advento do
“managed care” e as tecnologias para gerenciamento de dados. O objetivo destes
programas é a identificação de indivíduos doentes ou com potencial de contrair doenças,
e assim aplicar programas preventivos.
Neste contexto, sistemas DW encaixam-se perfeitamente. Dentre os casos
apresentados, destaca-se o projeto da companhia de seguros “Empire Blue Cross –Blue
Shield” denominado SARA (Systematic Analysis Review and Assistance system), que
utiliza um software desenvolvido pela empresa “Active Health Management” para
sinalizar pacientes com valores que indicam uma situação médica indesejada.
SUS
Foi desenvolvido um protótipo de um DW para atender o sistema de informação
ambulatorial do SUS como parte integrante de uma dissertação de mestrado da
Universidade Federal do Rio Grande do Sul (UFRGS). O protótipo foi desenvolvido
com o objetivo de apresentar ao usuário final, num curto espaço de tempo, as vantagens
obtidas no processo decisório com a implementação de um DW.
Para desenvolvimento do protótipo foram utilizadas as seguintes ferramentas:
MS-SQL Server 6.5 como “Sistema Gerenciador de Banco de Dados” (SGBD);
Warehouse Architect da Sybase como “Ferramenta Case”; WizRule 3.0 da Wizsoft para
auxiliar na limpeza dos dados; Star Trecker (exemplar do livro de Kimball) e db Probe
2.0 da InterNetivity para implementação da interface do usuário e, finalmente, o
Microsoft Access 97 como o repositório e gerenciador de “Metadados”.
Horizon Mercy of Trenton
A “Horizon Mercy of Trenton”, uma empresa de seguros de saúde responsável
pela assistência à saúde de 170.000 associados, em 1997, através de seu médico chefe
Robert N. Robinson, decidiu procurar no mercado uma solução DW.
A principal preocupação de Robinson não era a árdua tarefa de integração e
limpeza dos dados, mas, o desenho do modelo clínico. As soluções apresentadas
possuíam, basicamente, três aspectos negativos: extremamente caras; tecnologia
ultrapassada, e os fornecedores não compreendiam os desafios específicos da área. Após
uma extensa busca, optou pela solução de uma pequena empresa, na época, denominada
Infominers. A solução combina uma interface simples (desenvolvida com Cognos),
utiliza o SGBD Oracle, e apresenta o seu próprio modelo clínico baseado em sua vasta
experiência.
Inglis Innovative Services
A organização Inglis Innovative Services, destinada ao atendimento de
deficientes físicos, percebeu a necessidade de implementação de um DW devido à
proliferação de aplicações MS-Access na organização.
Os dados de origem para o DW eram provenientes de duas aplicações: Um
sistema de recursos humanos, denominado “VISTA”, com dados em MS-SQL Server, e
um sistema clínico e financeiro denominado “SOS”, com dados em Progress. O IIS
escolheu o MS-SQL Server para implementação do DW, e, como interface do usuário,
foram desenvolvidas algumas aplicações Web.
Breen et. al, cita uma lista de pontos que devem ser observados na
implementação de um DW, entre eles: a preparação prévia da infra-estrutura; a
identificação de um profissional com disponibilidade integral para o projeto; a
identificação dos dados, dos respectivos proprietários e dos problemas que o DW pode
resolver; e finalmente, implementar algo rapidamente para que os usuários possam
visualizar os benefícios.
Conclusões:
Desafios na implementação de um DW na área da saúde:
a) Dados provenientes de muitas fontes;
b) Diversidade de formatos de dados, principalmente devido às diversas
aplicações específicas da área;
c) Grande volume de informação armazenado em imagens;
d) Pouca padronização;
e) Relatórios (saídas) devem ser disseminados para diversas localidades
separadas geograficamente;
f) Fornecedores de soluções não compreendem os desafios específicos da área;
g) Limitação de recursos financeiros.
Foi observada a preferência pelo desenvolvimento interno de rotinas para carga e
análise dos dados. Em 78% dos casos, não foi utilizada nenhuma ferramenta ETL para
auxílio no processo de carga, e apenas 67% optaram por ferramentas OLAP existentes.
O SGBD mais utilizado, nos casos estudados, é o SQL Server com 45% ,
seguido do Oracle com 34%.
Pelos números apresentados, pode-se concluir que as implementações de DW na
área da saúde, geralmente, não utilizam as ferramentas sofisticadas existentes no
mercado. Isto induz à hipótese que o universo da saúde é razoavelmente diferente dos
demais setores da economia e a metodologia para implementação de um DW com
sucesso em outras áreas, pode não garantir o êxito na área da saúde.
Download