Modelagem Matemática utilizando Banco de Dados: problemas de ajuste linear Everton de Rezende Universidade Nove de Julho - Departamento dos Cursos de Informática 01156-050, Campus Memorial, São Paulo, SP E-mail: [email protected] Ana Leda Silva Moraes Claudia Courtouké Universidade Nove de Julho - Departamento dos Cursos de Informática 01156-050, Campus Memorial, São Paulo, SP E-mail: [email protected] RESUMO A utilização de modelos matemáticos teóricos para explicar fenômenos naturais se faz presente em estudos relacionados às mais diversas áreas do conhecimento, tais como, a Física, a Engenharia, as Ciências Sociais, Econômicas, da Saúde e Biológicas [1], [2], [3]. O uso bem sucedido desses modelos requer o entendimento da base teórica do fenômeno, das características matemáticas e estatísticas do modelo e os problemas práticos que podem ocorrer, caso esses modelos sejam utilizados em situações reais. Na prática, parte-se de um conjunto de observações que descrevem o fenômeno que se quer estudar, ou seja, de um conjunto de dados. Deseja-se encontrar um modelo que seja capaz de descrever a tendência existente entre os dados, ou ainda, entre as variáveis, dependente e independente, que são usadas no modelo. Na maior parte das vezes, os dados a serem utilizados na modelagem advêm de experimentações físicas e, como tais, estão sujeitas a erros, pequenos desvios, que devem ser considerados no momento da escolha do modelo. Uma vez que o modelo é escolhido o próximo passo consiste em se obter os melhores ajustes para os parâmetros, ou seja, parâmetros que minimizam as diferenças entre o valor real e o valor da estimativa obtida pela aplicação do modelo. Os intervalos de confiança ou as incertezas associadas a cada parâmetro devem ser calculados, pois há a propagação dos erros, inerentes ao processo de obtenção do conjunto de dados. Finalmente, é necessária a aplicação de um teste estatístico capaz de avaliar a qualidade do modelo ajustado ao conjunto de dados e, dessa forma, garantir a integridade e a confiabilidade das estimativas calculadas. Esse tipo de abordagem, descrita nos últimos parágrafos, está presente na maioria dos estudos que visa ajustar dados experimentais a modelos pré-estabelecidos com posterior análise de resultados [4]. Além disso, se aplicada em conjunto com técnicas de Cálculo Numérico [5], [6], [7] e utilização de um banco de dados robusto, constitui uma das mais poderosas ferramentas de análise estatística. Como objetivo do estudo, construímos um aplicativo computacional que, a partir de uma base de dados, é capaz de ajustar aos dados o modelo linear, estimar as incertezas associadas aos parâmetros, aplicar um critério para verificação da qualidade do ajuste [4] e armazenar resultados para a realização de análises comparativas. Os dados de entrada são compostos por n (n 2) pares, tipicamente, constituídos por uma variável independente (x) e outra dependente (y), além da introdução, se desejado, do erro cometido na medição de y, denominado σ. Para cada conjunto de n pares de dados, o ajuste da curva correspondente ao modelo linear é feito, numericamente, a partir do algoritmo do método dos mínimos quadrados [5], [6], [7]. O método dos mínimos quadrados fornece as estimativas dos parâmetros que compõem o modelo linear. Uma vez calculadas tais estimativas, são computadas as incertezas associadas a cada uma delas e guardadas em um banco denominado de banco de resultados. Para investigarmos a qualidade do ajuste linear ao conjunto de dados, 1013 usamos um critério baseado na estatística χ2 [4]. Inicialmente, a codificação para cumprir tal tarefa, foi feita usando-se a linguagem C/C++, por ser robusta e capaz de operar no sistema de ponto flutuante massivamente [8], [9]. A validação dos algoritmos, numericamente, foi realizada a partir de problemas disponíveis em livros e cujas soluções analíticas são conhecidas [4], [5], [6], [7]. O banco de dados que armazena os parâmetros para validação desse experimento foi desenvolvido em SQL Server Compact 3.5. Essa é uma versão gratuita disponibilizada pela Microsoft para utilização de pequenas empresas ou estudantes, não gerando nenhuma necessidade de licença ou custo adicional. O aplicativo foi escrito na linguagem C# pacote Microsoft Visual C# 2008 Express Edition, acessando o banco de dados SQL Server. Com a utilização deste aplicativo é possível, a partir de uma base de dados, o ajuste do modelo linear a esses dados, as estimavas das incertezas associadas a cada parâmetro do modelo, a verificação da qualidade do ajuste linear e o armazenamento dos resultados para a realização de análises comparativas. Além disso, o aplicativo permite a introdução dos dados via arquivo de texto, ou ainda, digitada pelo usuário, sua interface gráfica é amigável e de fácil manipulação. Palavras-chave: Modelos matemáticos, Ajustes de curvas, Construção de Banco de Dados. Referências [1] A. Grafen A, R. Hails, "Modern Statistics for the Life Sciences", Oxford: Oxford University Press, 2002. [2] C. Courtouké, "Identificação de tendências evolutivas de marcadores de replicação viral e do status imunológico de pacientes vivendo com HIV: impacto da terapia anti-retroviral inicial sobre a resposta ao tratamento", Tese de Doutorado, FMUSP, 2008. [3] E.S.A. de Araújo, C. Courtouké, "Conceitos e utilização clínica de cinética do HCV", In: Roberto Focaccia. (Org.). Tratado de Hepatites Virais, 2ª ed. São Paulo: Editora Atheneu, pp. 187-194, 2007. [4] P.R. Bevington, D.K. Robinson, "Data Reduction and Error Analysis for the Physical Sciences", New York: McGraw-Hill, 2003. [5] D. Sperandio, J.T. Mendes, L.H. Monken e Silva, "Cálculo Numérico: características matemáticas e computacionais dos métodos numéricos", São Paulo: Prentice Hall, 2006. [6] W.L. Roque, "Introdução ao Cálculo Numérico: um texto integrado com o Derive®", São Paulo: Atlas, 2000. [7] M.A.G. Ruggiero, V.L.R. Lopes, "Cálculo Numérico: Aspectos Teóricos Computacionais", 2ª ed. São Paulo: Pearson Education, 1996. [8] W.H. Press, "Numerical recipes in C: the art of Scientific Computing". New York: Cambridge University Press, 2006. [9] B.H. Flowers, "An Introduction to Numerical Methods in C++", Oxford: Oxford University Press, 2000. 1014