RESUMO A mineração de dados é o processo de descoberta de

Propaganda
RESUMO
A mineração de dados é o processo de descoberta de padrões correlacionados entre os
diversos dados existentes em uma base. O GEO é uma base de dados biológicos público,
mantido pelo NCBI, onde se buscou as informações referentes a trinta e dois pacientes de
Adenoma de colo de intestino, com leituras da expressão de sondas referentes aos genes,
extraídas do RNA. Os dados depositados em bancos biológicos, por si só, não produzem
informação útil, e por isto, foram selecionados respeitando diversos fatores, como a
confiabilidade da informação colhida, a quantidade de informações presentes no maior numero
de sondas, e finalmente filtrados pela leitura de maior expressão. Após a base de dados ser
tratada e com os genes selecionados, foi então aplicada a ferramenta R com o classificador SVM
com o objetivo de identificar, neste pequeno conjunto de genes, a possibilidade de associação
deles com a presença do adenoma de colo de intestino.
A partir dos resultados obtidos através da classificação dos dados percebeu-se que as
características dos genes são bem distintas e que a atividade varia bastante de gene para gene.
Porém, isto ocorre de forma padronizada, o que permitiu que o algoritmo pudesse identificar
estes padrões e sugerir sua participação no processo do adenoma.
Palavras-chave: Bioinformática, Mineração de dados, Câncer, Adenoma, SVM.
Download