Universidade Federal de Santa Catarina Florianópolis, 12 de outubro de 2005. Departamento de Informática e Estatística Disciplina: Projetos 1 Aluno: Herman Ignácio Ferber Pineyrua Matrícula: 0123823-0 Resumo do artigo: “Implementações de Data Warehouse na Área da Saúde”. Autores: Ricardo S. Santos1, Marco Antônio Gutierrez2. 1 Departamento 2 Serviço de Informática em Saúde (DIS), Universidade Federal de São Paulo (UNIFESP). de Informática, Instituto do Coração (INCOR), Universidade de São Paulo (USP). As técnicas de data warehousing para produção de informações gerenciais são utilizadas desde o início dos anos 90 em diversos setores da economia. Na área da saúde, também existem iniciativas para a adoção desta tecnologia. O sucesso ou fracasso no processo de implementação de uma nova tecnologia depende de uma série de fatores, mas, o conhecimento prévio de casos similares, pode evitar vários problemas ou situações desastrosas. O objetivo deste trabalho é apresentar uma revisão dos esforços na implementação de um data warehouse na área da saúde. CATCH Um dos projetos para a saúde pública de maior destaque é o DW para o CATCH (Comprehensive Assessment for Tracking Community Health) desenvolvido pela USF (University of South Florida’s). O DW fornece informação para análise sobre mais de 250 indicadores.Um ponto que merece destaque no projeto é a introdução de duas técnicas inovadoras para o processo de carga do DW (ETL Extracting,Transformation and Loading). São elas: “Estrelas Gêmeas” e “Filtros de Qualidade dos Dados”. O processo de Estrelas Gêmeas consiste, basicamente, em utilizar um modelo de dados temporário, idêntico ao modelo de dados do DW, o qual será carregado num primeiro estágio onde serão aplicadas todas a regras de validações e testes, e a partir dele será carregado o modelo permanente. Os “Filtros de Qualidade dos Dados” são rotinas inseridas no processo de carga (ETL), para efetuar validações no conteúdo dos dados. Estas verificações analisam: “fatos”; “agregados” e “dimensões”. SARA Programas de gerenciamento de doenças têm proliferado com o advento do “managed care” e as tecnologias para gerenciamento de dados. O objetivo destes programas é a identificação de indivíduos doentes ou com potencial de contrair doenças, e assim aplicar programas preventivos. Neste contexto, sistemas DW encaixam-se perfeitamente. Dentre os casos apresentados, destaca-se o projeto da companhia de seguros “Empire Blue Cross –Blue Shield” denominado SARA (Systematic Analysis Review and Assistance system), que utiliza um software desenvolvido pela empresa “Active Health Management” para sinalizar pacientes com valores que indicam uma situação médica indesejada. SUS Foi desenvolvido um protótipo de um DW para atender o sistema de informação ambulatorial do SUS como parte integrante de uma dissertação de mestrado da Universidade Federal do Rio Grande do Sul (UFRGS). O protótipo foi desenvolvido com o objetivo de apresentar ao usuário final, num curto espaço de tempo, as vantagens obtidas no processo decisório com a implementação de um DW. Para desenvolvimento do protótipo foram utilizadas as seguintes ferramentas: MS-SQL Server 6.5 como “Sistema Gerenciador de Banco de Dados” (SGBD); Warehouse Architect da Sybase como “Ferramenta Case”; WizRule 3.0 da Wizsoft para auxiliar na limpeza dos dados; Star Trecker (exemplar do livro de Kimball) e db Probe 2.0 da InterNetivity para implementação da interface do usuário e, finalmente, o Microsoft Access 97 como o repositório e gerenciador de “Metadados”. Horizon Mercy of Trenton A “Horizon Mercy of Trenton”, uma empresa de seguros de saúde responsável pela assistência à saúde de 170.000 associados, em 1997, através de seu médico chefe Robert N. Robinson, decidiu procurar no mercado uma solução DW. A principal preocupação de Robinson não era a árdua tarefa de integração e limpeza dos dados, mas, o desenho do modelo clínico. As soluções apresentadas possuíam, basicamente, três aspectos negativos: extremamente caras; tecnologia ultrapassada, e os fornecedores não compreendiam os desafios específicos da área. Após uma extensa busca, optou pela solução de uma pequena empresa, na época, denominada Infominers. A solução combina uma interface simples (desenvolvida com Cognos), utiliza o SGBD Oracle, e apresenta o seu próprio modelo clínico baseado em sua vasta experiência. Inglis Innovative Services A organização Inglis Innovative Services, destinada ao atendimento de deficientes físicos, percebeu a necessidade de implementação de um DW devido à proliferação de aplicações MS-Access na organização. Os dados de origem para o DW eram provenientes de duas aplicações: Um sistema de recursos humanos, denominado “VISTA”, com dados em MS-SQL Server, e um sistema clínico e financeiro denominado “SOS”, com dados em Progress. O IIS escolheu o MS-SQL Server para implementação do DW, e, como interface do usuário, foram desenvolvidas algumas aplicações Web. Breen et. al, cita uma lista de pontos que devem ser observados na implementação de um DW, entre eles: a preparação prévia da infra-estrutura; a identificação de um profissional com disponibilidade integral para o projeto; a identificação dos dados, dos respectivos proprietários e dos problemas que o DW pode resolver; e finalmente, implementar algo rapidamente para que os usuários possam visualizar os benefícios. Conclusões: Desafios na implementação de um DW na área da saúde: a) Dados provenientes de muitas fontes; b) Diversidade de formatos de dados, principalmente devido às diversas aplicações específicas da área; c) Grande volume de informação armazenado em imagens; d) Pouca padronização; e) Relatórios (saídas) devem ser disseminados para diversas localidades separadas geograficamente; f) Fornecedores de soluções não compreendem os desafios específicos da área; g) Limitação de recursos financeiros. Foi observada a preferência pelo desenvolvimento interno de rotinas para carga e análise dos dados. Em 78% dos casos, não foi utilizada nenhuma ferramenta ETL para auxílio no processo de carga, e apenas 67% optaram por ferramentas OLAP existentes. O SGBD mais utilizado, nos casos estudados, é o SQL Server com 45% , seguido do Oracle com 34%. Pelos números apresentados, pode-se concluir que as implementações de DW na área da saúde, geralmente, não utilizam as ferramentas sofisticadas existentes no mercado. Isto induz à hipótese que o universo da saúde é razoavelmente diferente dos demais setores da economia e a metodologia para implementação de um DW com sucesso em outras áreas, pode não garantir o êxito na área da saúde.