Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Identificação de padrão na ocorrência das doenças infecciosas em Minas Gerais por meio de técnicas de mineração de dados Clarice Murta Dias 1 Fernanda Mara Coelho 1 Sandro Jerônimo de Almeida 1 1 Pontifícia Universidade Católica de Minas Gerais - PUC Minas Rua Walter Ianni, 255 - São Gabriel - 31980110 - Belo Horizonte - MG, Brasil {claricemurta, fm.coelho}@yahoo.com.br, [email protected] Abstract. The occurrence of infectious diseases related to sanitation is associated with poor sanitary and environment conditions in the cities, which is an ideal environment for proliferation of vectors. The objective of this study is to identify patterns in the occurrence of infectious diseases in the state of Minas Gerais. The development of this research is justified to direct public health programs to cities analyzed. The methodology involves the application of KDD process (Knowledge Discovery in databases), involving the collection, treatment, processing and data analysis. The patterns of disease occurrence and patterns of the status of sanitation were obtained by applying the data mining techniques as Clustering and Associations Rules. As a result, were obtained patterns of disease occurrence, where the space distribution showed a concentration of diversified groups in the administrative mesoregions of Jequitinhonha, Norte de Minas and Vale do Rio Doce. The sanitation status points to a health deficiency in the north of Minas Gerais. The techniques of knowledge discovery in databases revealed an adequate regional space analysis methodology. Palavras-chave: health geography, sanitation. clustering, geografia da saúde, saneamento básico, agrupamento. 1. Introdução As doenças infecciosas relacionadas ao saneamento básico são causadas por vírus, bactérias ou bacilos que em sua grande maioria são transmitidas aos humanos pela picada de insetos ou pela ingestão de água ou alimento contaminado (SBI, 2011). Cerca de 40% dos municípios brasileiros diagnosticaram a ocorrência destas doenças em sua população (IBGE, 2008a). O Governo do Brasil afirma que “a maioria dos problemas sanitários que afetam a população mundial estão intrinsecamente relacionados com o meio ambiente”, sendo a diarreia a doença mais comum na humanidade (BRASIL, 2006, p.10). Ribeiro (2005) aborda a importância da análise geográfica para o entendimento da distribuição espacial das doenças, assim como a relação existente com as variáveis ecológicas, demográficas, sociais, culturais e econômicas. A busca deste conhecimento em saúde pública, para Ribeiro (2005), inicia-se pelo mapeamento das condições de saúde e doença. Martinelli citado por Costa (2005, p. 82) considera que “os mapas constituem o primeiro processo acurado de análise, tendo-se em vista que participam do processo de conhecimento e compreensão da realidade”. O meio geográfico para Lacaz (1972) deve ser considerado no estudo patológico, uma vez que os fatores ambientais, humanos, biológicos e as condições sociais negativas são determinantes na ocorrência de doenças. As condições sociais negativas referem-se a “falta de instalações sanitárias e de água encanada, péssimas condições de higiene, deficiência em alimentação e de assistência médica” (LACAZ, 1972, p. 32). Neste contexto a Geografia da Saúde, ou Geografia Médica, utiliza o espaço como elemento de análise para compreensão da ocorrência e distribuição das doenças na coletividade, por meio da percepção da relação entre as doenças e as condições ambientais e sanitárias prevalecentes (SILVA, 1997). 2274 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Percebe-se que em Minas Gerais cerca de 38% dos municípios diagnosticaram algum tipo de doença infecciosa (IBGE, 2008a), valor próximo da média nacional. Com uma grande extensão territorial, o estado apresenta uma diversificação fisiográfica, social, política e econômica, o que especifica a ocorrência de doenças e sua distribuição espacial, dificultando o direcionamento de políticas públicas de promoção à saúde. O objetivo do presente trabalho é a aplicação de técnicas de mineração de dados para identificar o padrão de ocorrência de doenças infecciosas no estado de Minas Gerais. O desenvolvimento desta pesquisa justifica-se a medida que seus resultados permitem por que os agentes públicos de Saúde proponham o direcionamento dos programas de saúde pública ao contexto territorial abordado. Diagnosticar padrão na ocorrência das doenças e entender sua distribuição espacial poderá proporcionar um avanço nestas políticas, possibilitando análise das condições ambientais e suas implicações diretas com a saúde e a qualidade de vida da população. 2. Descoberta de conhecimento em banco de dados Um dos processos de descoberta de conhecimento em banco de dados é denominado Knowledge Discovery in Database, (KDD), que pode assim ser definido: “é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válido, novos e potencialmente úteis a partir de grandes conjuntos de dados” (FAYYAD et al. apud BAÇÃO, 2003, p. 137; GOLDSCHMIDT; PASSOS, 2005, p. 3). O processo KDD, muitas vezes referido erroneamente por diferentes autores como mineração de dados ou data mining, é obtido por meio de diversas etapas, dentre elas a mineração de dados, que envolvem o pré-processamento dos dados até o pós-processamento dos resultados da mineração de dados (TAN; STEINBACH; KUMAR, 2009; GOLDSCHMIDT; PASSOS, 2005). A mineração de dados para Elmasri e Navathe (2002, p. 711) corresponde a “garimpagem ou descoberta de novas informações em termos de padrões ou regras oriundas de grandes quantidades de dados”, regras que incluem “análises estatísticas e a otimização sujeita a restrições, bem como aprendizagem de máquina” (ELMASRI; NAVATHE, 2002, p. 713). Carvalho (2005) identifica o processo de descoberta de conhecimento como: 1. Identificação de um problema ou definição de um objetivo a ser alcançado; 2. Descobertas de novas relações por técnicas de data mining; 3. Análise humana das novas relações descobertas; 4. Uso racional das novas relações descobertas; 5. Avaliação dos resultados (CARVALHO, 2005, p. 12-13). Elmasri e Navathe (2002, p. 712) definem seis fases para o processo de descoberta de conhecimento: “seleção de dados, limpeza de dados, pré-processamento (enriquecimento), transformação ou codificação de dados, data mining e análise, assimilação, interpretação, avaliação, divulgação e exposição das informações descobertas”. A etapa de pré-processamento para Goldschmidt e Passos (2005, p. 11) “compreende todas as funções relacionadas à captação, à organização e ao tratamento dos dados” necessárias à mineração de dados. A visualização é uma importante técnica para análise dos resultados da mineração de dados, por meio da “interpretação da informação visualizada por uma pessoa e a formação de um modelo mental das informações” (TAN et al., 2009, p. 125). Tan et a. (2009, p. 127) sugere o mapeamento das informações para um formato visual, onde “os objetos de dados, seus atributos e os relacionamentos entre os objetos de dados são traduzidos para elementos gráficos como pontos, retas, formatos e cores”. 2275 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Bação (2003) expõe a relação entre a Geografia e a Mineração de Dados, onde neste momento a mineração é encarada, “por grande parte da comunidade da Ciência da Informação Geográfica (CIG), como a grande esperança para aumentar a qualidade e sofisticação da análise espacial” (BAÇÃO, 2003, p. 139). 3. Metodologia Para se identificar os padrões de ocorrência de doenças infecciosas no Estado de Minas Gerais, utilizou-se o processo KDD e suas etapas. A base de dados selecionada para o desenvolvimento do presente trabalho contém informações sobre municípios e suas ocorrências de doenças associadas ao saneamento básico, pertencente à Pesquisa Nacional de Saneamento Básico (IBGE, 2008a). Por meio do Sistema IBGE de Recuperação Automática, SIDRA, foi obtida uma planilha com os dados dos municípios brasileiros. Essa planilha possui três tipos de informações (o município, os tipo de doença e suas ocorrências) distribuídas em 12.800 linhas. Os dados indicam a existência [1] ou inexistência [-] de determinada doença em cada município. Com um número excessivo de linhas na planilha original, fez-se necessária a limpeza da base de dados, eliminando dados referentes a municípios que não pertencem a Minas Gerais. O pré-processamentos dos dados consistiu em padronizar as informações sobre ocorrências de doenças em valores binários (0 ou 1), indicando a existência ou não de doenças. Na etapa de transformação do processo KDD, optou-se por decompor os dados referentes ao tipo de doença em novas colunas. Desta forma a planilha resultante apresenta 13 colunas referentes ao município e suas ocorrências de doença por tipo (cólera, dengue, dermatite, diarreia, difteria, doença do aparelho respiratório, febre amarela, hepatite, leptospirose, malária, tifo e verminoses), e 853 linhas, valor definido pelo número de municípios do estado de Minas Gerais. A mineração dos dados foi realizada utilizando o Sistema Gerenciados de Banco de Dados (SGBD) Microsoft SQL Server 2008 R2 e sua ferramenta de Mineração de Dados intitulada Analysis Services 1 . Utilizou-se nessa etapa os algoritmos para Agrupamento (clustering) e extração de Regras de Associação, ambos de propriedade da empresa Microsoft. A opção pela utilização do algoritmo de agrupamento reflete a necessidade em agrupar municípios com semelhança na ocorrência de doenças, sendo que o presente trabalho tem por objetivo diagnosticar padrões na ocorrência destas doenças, e a forma que se distribuem espacialmente. Carvalho (2005, p.23) afirma que agrupar “é simplesmente [...] classificar uma massa de dados em classes desconhecidas a priori em número ou forma. Uma tarefa é, dadas várias categorias ou classes conhecidas, dizer a qual delas um certo dado pertence”. O algoritmo de extração de regras de associação foi utilizado para identificara-se as relações estabelecidas entre as doenças e os serviços de saneamento básico existentes. As regras de associação “são padrões descritivos eficazes na busca por relações entre conjuntos de itens em uma transação. Uma regra desse tipo é representada por uma expressão do tipo A B” (PITONE, 2002, p. 16). 4. Resultados Ao aplicar ao algoritmo de agrupamento de dados do SQL Server foram gerados dez grupos em que seus objetos apresentam semelhança na ocorrência de doenças infecciosas. O mapa 1 representa a distribuição espacial dos clusters encontrados. 1 Fornece múltiplos algoritmos a serem usados nas soluções de mineração de dados 2276 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Mapa 1: Padrão de ocorrência de doenças infecciosas Fonte: Elaborada pelo autor Os clusters encontrados possuem o seguinte perfil: Cluster 1 – O agrupamento considerou a inexistência de qualquer tipo de doença infecciosa. Cerca de 62% dos municípios estão representados neste cluster. As mesorregiões administrativas Sul/Sudoeste de Minas e Triângulo/Alto Paranaíba apresentam mais de 80% de seus municípios pertencentes a este cluster. Cluster 2 – Prevalece a ocorrência de verminoses em 52 municípios. O Vale do Rio Doce apresenta a maior concentração de municípios pertencentes a este agrupamento. Percebe-se que 18 municípios estabeleceram proximidade espacial limítrofe a Governador Valadares, município não pertencente ao cluster. Cluster 3 – O grupo corresponde a 75 municípios, sendo que a dengue prevalece em 73% deles. Nos demais municípios foi registrada a ocorrência de diarreia. Este padrão está presente em todas as mesorregiões administrativas, exceto no Vale do Mucuri. Cluster 4 – Agrupamento definido pela ocorrência de diarreia e verminoses em 66 municípios. Entretanto em 15% dos casos foi diagnosticada apenas uma destas doenças. Padrão expressivo nas mesorregiões Jequitinhonha, Norte de Minas, e Vale do Mucuri. Cluster 5 – O grupo representa 51 municípios, sendo que todos apresentam a ocorrência de diarreia e verminose, associadas a dermatite e doença do aparelho respiratório, em 20% dos casos, ou a doença do aparelho respiratório, em 49%, ou dermatite, que corresponde a 21% da amostra, ou ainda, estão associadas apenas a ocorrência de hepatite, em 10%. Padrão significativo no Norte de Minas e Jequitinhonha. Cluster 6 – Grupo formado por 23 municípios, sendo que a ocorrência de verminoses, doença do aparelho respiratório, diarreia e hepatite foi identificada em 70% dos casos, já em 17% dos municípios não se diagnosticou hepatite. Nos demais casos não foi 2277 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE registrada a ocorrência de doença do aparelho respiratório. Agrupamento expressivo no Norte de Minas e Vale do Mucuri. Cluster 7 – Grupo formado por 28 municípios com a ocorrência de diarreia, dengue, dermatite, doença do aparelho respiratório, hepatite e verminoses, em 32%. Para os demais municípios excluem-se dermatite, em 32%, hepatite, em 18%, doenças do aparelho respiratório, em 10%, dengue, em 4%, e hepatite e dermatite, em 4%. Agrupamento significativo no Jequitinhonha. Cluster 8 – Agrupamento definido pela ocorrência de verminoses e diarreia em 12 municípios, associadas a dengue, em 92%, e hepatite, em 75% dos casos. A Zona da Mata e Campo das Vertentes são significativas neste cluster. Cluster 9 – Ocorrência de diarreia, dengue e hepatite associadas a difteria, febre amarela e verminose, em 88% da amostra. Em 63% dos casos, existe a associação com doença do aparelho respiratório e leptospirose. É importante ressaltar que este agrupamento registrou ainda a ocorrência média de 64% de toda a cólera, tifo e malária registrada no estado. O grupo é composto por 8 municípios localizados no Campo da Vertentes, Metropolitana de Belo Horizonte, Norte de Minas, Vale do Rio Doce, Zona da Mata, e Jequitinhonha, sendo esta mesorregião a mais expressiva neste grupo. Cluster 10 – Grupo composto por 7 municípios, onde diagnosticou-se a diarreia associada a 71% da ocorrência de hepatite, 57% da dengue, dermatite, doença do aparelho respiratório e verminoses, 43% da febre amarela e leptospirose, e 29% da difteria, malária e tifo. Estão presentes neste cluster as mesorregiões Metropolitana de Belo Horizonte, Norte de Minas, Vale do Rio Doce, Zona da Mata e Jequitinhonha, sendo esta a mais expressiva neste grupo. Para análise espacial dos padrões da ocorrência de doenças optou-se pela escala regional, neste caso a mesorregião administrativa do estado, uma vez que sua definição é dada por processo social, quadro natural e rede de comunicação e de lugares como elemento da articulação espacial (IBGE apud MINAS GERAIS, 2012). Os padrões identificados revelam que as mesorregiões Sul/Sudoeste de Minas e Triângulo/Alto Paranaíba apresentam a menor ocorrência de doenças no estado, entretanto o Jequitinhonha, Norte de Minas e Vale do Rio Doce apresentam a maior concentração de doenças. Para estas mesorregiões diagnosticou-se que 75, 67 e 52% dos municípios, respectivamente, apresentam doenças infecciosas. É importante destacar que os municípios agrupados nos clusters 9 e 10 apresentaram a pior situação de saúde, no que se refere às doenças infecciosas, sendo que nestes clusters se concentram a malária, tifo e cólera (particularidade do cluster 9). Os municípios que compõem este cluster são: Resende Costa (Campo das Vertentes), Diamantina, São Gonçalo do Rio Preto, Almenara e Virgem da Lapa (Jequitinhonha), Ribeirão das Neves e São José da Lapa (Metropolitana de Belo Horizonte), Pirapora, Coração de Jesus e Francisco Sá (Norte de Minas), Carmésia, Timóteo e Mantena (Vale do Rio Doce) e, Belmiro Braga e Durandé (Zona da Mata). Nota-se que não existe uma proximidade espacial entre os municípios, e que por pertencerem a mesorregiões administrativas diferentes, pressupõem-se que, apresentam características fisiográficas, sociais, culturais e econômicas distintas, e que, por conseguinte, precisam de uma pesquisa mais detalhada. Desta forma é necessária que a análise espacial seja realizada na escala local para cada município, considerando-se dados de população, PIB, IDH, estruturação urbana, condições ambientais e sanitárias, para que seja possível entender a distribuição espacial destas doenças e a correlação com o ambiente em que se desenvolvem. Com o intuito de entender a distribuição espacial dos clusters identificados para a ocorrência de doenças infecciosas relacionadas ao saneamento básico, o algoritmo de 2278 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE clustering foi aplicado em uma nova base de dados, onde analisou-se a situação do saneamento básico no estado, com base nos serviços municipais existentes. Para análise do saneamento básico optou-se pela mineração de dados referentes aos serviços básicos atribuídos ao saneamento, como acesso a água tratada, esgotamento sanitário e manejo de resíduos sólidos e águas pluviais (IBGE, 2008b). O padrão da situação do saneamento básico foi gerado pela aplicação da técnica de cluster, onde foram identificados quatro agrupamentos, conforme representado no mapa 2. Mapa 2: Padrão da situação do saneamento básico Fonte: Elaborada pelo autor Os agrupamentos mostram que 90% dos municípios apresentam todos os serviços básicos atribuídos ao saneamento (cluster 1), 63 municípios não possuem rede coletora de esgoto e concentram-se no Norte de Minas (cluster 2), 13 municípios não possuem manejo de águas pluviais, destes 38% estão localizados no Jequitinhonha (cluster 3), e 9 municípios não possuem manejo de águas pluviais e rede coletora de esgoto (cluster 4), localizados nas mesorregiões administrativas Central Mineira, Noroeste de Minas, Norte de Minas e Triângulo Mineiro/Alto Paranaíba. Percebe-se que, por meio do algoritmo de cluster, foi possível estabelecer uma correlação entre a ocorrência de doenças infecciosas e prestação de serviços de saneamento básico, sendo o Norte de Minas uma mesorregião com diversificação de doenças atreladas a falta de esgotamento sanitário. Já para o Jequitinhonha e Vale do Rio Doce, não foi possível estabelecer nenhuma correlação com o saneamento básico. A fim de procurar novos padrões e evidências que pudessem confirmar a relação entre doenças e serviços de saneamanto nos munícios de mineiros, aplicou-se algoritmo de Extração de Regras de Associação. Nesse caso, foi realizado previamente a junção dos dados referentes a ocorrência de doenças associadas ao saneamento básico (IBGE, 2008a) e serviço de saneamento básico (IBGE, 2008b). Ao aplicar o algoritmo proprietário do SGBD SQL Server, 2000 relações foram estabelecidas, entretanto considerando-se apenas relações do tipo 2279 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE doença serviço, ou vice-versa, pode-se reduzir para 37% o percentual de regras de associação consideradas. Nesse universo, as principais regras de associação geradas foram: 82% das associações consideradas revelam que onde existe uma doença, também existe prestação de serviço sanitário; 15% das associações consideradas revelam que onde não existem doenças, existe prestação de serviço sanitário; 2% das associações consideradas revelam que onde não existem doenças também não existem serviço sanitário; 1% das associações consideradas revelam que onde existe uma doença, não existe prestação de serviço. Observa-se que independente de prestação de serviços sanitários, as doenças existem consideravelmente. Sugere-se nesse sentido, que uma análise mais detalhada sobre tipos específicos de doenças e serviços sejam considerados na análise, assim como sua localização e distribuição espacial. 5. Considerações finais As técnicas de descoberta de conhecimento em banco de dados revelaram uma adequada metodologia de análise espacial regional. Os agrupamentos extraídos das bases de dados de doenças infecciosas e serviços de saneamento básico apontaram o Norte de Minas como a mesorregião com maior deficiência sanitária e consequentemente uma diversificação na ocorrência de doenças infecciosas relacionadas ao saneamento básico. O Jequitinhonha e Vale do Rio Doce também apresentaram uma diversificação na ocorrência de doenças infecciosas, entretanto os padrões da situação do saneamento básico gerado pela técnica de mineração de dados cluster não revelaram uma relação entre as doenças e à deficiência sanitária, sendo necessária uma investigação mais aprofundada para identificar o motivo desta diversificação. Sugere-se para os municípios que apresentaram a concentração de doenças, que sejam realizadas análises mais específicas em escala local, levando-se em consideração dados sociais, culturais, econômicos e ambientais. Para os administradores públicos estaduais, recomenda-se o desenvolvimento de políticas que visam excluir a deficiência sanitária presente em 10% dos municípios mineiros, principalmente no Norte de Minas, sendo necessária a ampliação do serviço de esgotamento sanitário nestes municípios. Para o Jequitinhonha e Vale do Rio Doce recomenda-se uma investigação detalhada da existência de esgotamento sanitário clandestino e educação sanitária e alimentar, sendo estas ferramentas importantes para promoção da saúde pública. Como trabalho futuro, sugere-se aplicar novamente os algoritmos de agrupamento e extração de regras de associação, variando seus parâmetros de configuração, tais como número de clusters desejados e as taxas de suporte e confiança adotadas. Outros algoritmos também poderiam ser aplicados, vislumbrando a descoberta de novos padrões. No que diz respeito aos dados utilizados, esses poderiam ser enriquecidos incluindo dados complementares, tais como índices socioeconômicos. O estudo poderia ser ampliado também para todos os municípios brasileiros. Referências bibliográficas BAÇÃO, Fernando Lucas; PAINHO, Marco. Aspectos metodológicos da utilização do data mining no âmbito da geografia. Finisterra, Lisboa, v. 38, n. 75, p. 135-147, 2003. Disponível em: <http://www.ceg.ul.pt/finisterra/>. Acesso em 20 mar. 2012. BRASIL. Fundação Nacional de Saúde. Manual de saneamento: orientações técnicas. 3. ed. Brasília: Fundação Nacional de Saúde, 2006. 408 p. 2280 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE CARVALHO, Luís Alfredo Vidal de. Data mining: a mineração de dados no marketing, medicina, economia, engenharia e administração. Rio de Janeiro: Editora Ciência Moderna Ltda, 2005. 225 p. COSTA, Giseli Fernandes da. Geoprocessamento: uso e aplicação na saúde pública e na saúde ambiental. In: RIBEIRO, Helena (Org.). Olhares geográficos: meio ambiente e saúde. São Paulo: Editora Senac São Paulo, 2005. 81-104 p. ELMASRI, Ramez; NAVATHE, Shamkant B. Sistemas de banco de dados: fundamentos e aplicações. 3. ed. Rio de Janeiro: LTC, 2002. 837 p. GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel Lopes. Data mining: um guia prático: conceitos, técnicas, ferramentas, orientações e aplicações. Rio de Janeiro: Elsevier, 2005. 261 p. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATISTICA. Pesquisa Nacional de Saneamento Básico: número de municípios com ocorrência de doenças associadas ao saneamento básico, por tipo de doença. 2008a. Disponível em: <http://www.sidra.ibge.gov.br/bda/tabela/listabl.asp?z=t&c=354>. Acesso em 11 out. 2011. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATISTICA. Pesquisa Nacional de Saneamento Básico: número de municípios com algum serviço de saneamento básico, por tipo de serviço. 2008b. Disponível em: <http://www.sidra.ibge.gov.br/bda/tabela/listabl.asp?z=t&c=1238>. Acesso em 11 out. 2011. LACAZ, Carlos da Silva. Relações entre o homem e o meio geográfico. In.: LACAZ, Carlos da Silva; BARUZZI, Robert G.; SIQUEIRA JÚNIOR, Waldomiro. Introdução à geográfica médica do Brasil. São Paulo: Edgard Blücher; Editora da Universidade de São Paulo, 1972. Cap. 2, p. 23-38. MICROSOFT. SQL Server, versão 2008 R2. Microsoft Corporation, 2008. Sistema de Gerenciamento de Banco de Dados. MINAS GERAIS, Governo do Estado. Mesorregiões e microrregiões. Disponível em: <http://www.mg.gov.br/governomg/ecp/contents.do?evento=conteudo&idConteudo=69547&chPlc=69547&ter mos=s&app=governomg&tax=0&taxp=5922>. Acesso em 23 abr. 2012. PITONE, Rafael Moreira. Mineração de regras de associação nos canais de informação do direto. 2002. 61f. Monografia (Conclusão do curso). Universidade Ferderal do Rio Grande do Sul, Instituto de Informática, Porto Alegre. RIBEIRO, Helena. Geografia da saúde e da doença aplicada à poluição do ar em São Paulo. In: RIBEIRO, Helena (Org.). Olhares geográficos: meio ambiente e saúde. São Paulo: Editora Senac São Paulo, 2005. 65-80 p. SILVA, Luiz Jacintho da. O conceito de espaço na epidemiologia das doenças infecciosas. Caderno de Saúde Pública, Rio de Janeiro, n. 13, p. 585-593, out-dez. 1997. SOCIEDADE BRASILEIRA DE INFECTOLOGIA. Guia de doenças. Disponível em: <http://www.sbinfecto.org.br/publicoleigo/default.asp?site_Acao=mostraPagina&paginaId=9>. Acesso em 28 dez. 2011. TAN, Pang-Ning; STEINBACH, Michal; KUMAR, Vipin. Introdução ao data mining: mineração de dados. Rio de Janeiro: Editora Ciência Moderna Ltda, 2009. 900 p. 2281