INSTITUTO POLITÉCNICO DE COIMBRA INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÂO DE COIMBRA Aprovação do Conselho Pedagógico Aprovação do Conselho Técnico-Científico 28/10/2015 16/12/2015 Ficha de Unidade Curricular (FUC) de Sistemas Baseados em Conhecimento Im-183-05 Curso(s): Licenciatura em Informática de Gestão Ano Curricular: 3ºano Semestre curricular: 1º Semestre Ano lectivo: 201516 Docente Responsável: Fernando Paulo dos Santos Rodrigues Belfo 1 Unidade Curricular Designação: Sistemas Baseados em Conhecimento Curso(s): Licenciatura em Informática de Gestão Ano curricular: 3ºano Semestre curricular: 1º Semestre Número de ECTS: 6 Horas de contacto: 67,5 1.Corpo Docente ***Replicar pelo nº de docentes, sendo que o primeiro deverá ser o responsável da UC. Nome: Fernando Paulo dos Santos Rodrigues Belfo Gabinete: 2.10 Email: [email protected] Nome: Isabel Maria Mendes Pedrosa Email: [email protected] Im-183-05 2 2.Funcionamento a) Objectivos: Esta disciplina introduz os princípios dos Sistemas baseados em Conhecimento, bem como a teoria da Descoberta de Conhecimento em base de dados, apresentando seus conceitos, fases, principais tarefas e algoritmos envolvidos, e a sua possível aplicação em problemas reais, tais como, planeamento financeiro, gestão de produção, diagnóstico, previsão ou deteção de fraude. A Descoberta do Conhecimento é uma subárea da inteligência artificial que trata de descobrir relacionamentos e padrões em grandes massas de dados e texto. A descoberta do conhecimento envolve tecnologias como a mineração dos dados, mineração do texto, indução de regras, agrupamento de dados, e outras técnicas relacionadas. Esta unidade curricular prevê ainda um projeto prático a desenvolver pelo aluno, onde se irá utilizar uma de várias ferramentas disponíveis, sobre uma problema com dados reais ligados a uma área, como a área económica, social, gestão de produção, diagnóstico, previsão, etc. b) Regime de frequencia e metodologia de avaliação: Os conteúdos teóricos da unidade curricular serão proferidos por meio de aulas expositivas, complementadas com casos práticos, sempre que possível. Os alunos serão motivados para aplicar as competências adquiridas através de atividades práticas, incluindo a análise e discussão de estudos de caso e exercícios. Esta disciplina terá um regime de frequência que consiste em 4,5 horas semanais num total de 67,5 horas de aulas teórico práticas no semestre. Não é obrigatória, embora desejável, a participação nas aulas. A metodologia de avaliação terá 3 componentes: participação nas aulas (PA), uma componente de trabalho prático (TP) e exame final escrito (EFE). Os pesos proporcionais destas componentes na nota final serão respectivamente de 1 valor (5%), 6 valores (30%) e 13 valores (65%), num total de 20 valores possíveis (100%). A nota final é calculada como 5% x PA + 30% x TP+ 65% x EFE. A participação nas aulas não é obrigatória, embora desejável. Assim, a componente de PA apenas contará no caso de contribuir para uma melhor nota final, ou seja, caso seja superior à restante nota (30% x TP+ 65% x EFE). No caso da componente PA ser inferior a 30% x TP+ 65% x EFE, então a nota final será calculada como 30% x TP+ 70% x EFE. c) Programa: 1. Introdução aos Sistemas Baseados em Conhecimento - Conceitos e definições - Estrutura Geral de um Sistema Baseado em Conhecimento - Processo de desenvolvimento de sistemas baseados em conhecimento - Planeamento, Representação de Conhecimento e Inferência - Ferramentas de suporte à construção de sistemas baseados no conhecimento 2. Sistemas Baseados em Regras 3. Data Mining e Descoberta de Conhecimento em Bases de Dados (DCBD) - O que é o Data Mining - Definição de Data Mining - Áreas relacionadas com o Data Mining - Abordagens do Data Mining - Objectivos do Data Mining - O processo de Descoberta de conhecimento em base de dados - Problemas inerentes ao processo de DCBD 4. Metodologias e Especificações - Metodologia CRISP-DM - Metodologia SEMMA - Especificação PMML 5. Modelos e Técnicas - Árvores de decisão - Redes neuronais artificiais Im-183-05 3 - Algoritmos genéticos - Indução de regras - Conjuntos difusos - Redes de Bayes - Regressão - Sistemas de classificação - Avaliação de algoritmos - Avaliação de modelos - Matriz de confusão 6. Ferramentas e Tecnologias 7. Domínios de Aplicação d) Bibliografia: Fernandes, Anita Maria da Rocha. (2005). Inteligência Artificial: Noções Gerais. Brasil: Visual Books. Santos, M. e Azevedo, C., 2005, Data Mining - Descoberta de Conhecimento em Bases de Dados, FCA Publisher, ISBN 972-722-509-8 Larose, Daniel T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. Hoboken, New Jersey: John Wiley & Sons, Inc. Berry, Michael J, & Linoff, Gordon. (1997). Data Mining Techniques: For Marketing, Sales, and Customer Support. New York, USA: John Wiley & Sons, Inc. Bigus, Joseph P. (1996). Data Mining with Neural Networks: Solving Business Problems from Application Development to Decision Support. Crawfordsville, Indiana, USA: McGraw-Hill, Inc. Chakrabarti, Soumen, Cox, Earl, Frank, Eibe, Güting, Ralf Hartmut, Han, Jiawei, Jiang, Xia, Neapolitan, Richard E. (2008). Data Mining: Know It All. Burlinghton, Massachusetts: Morgan Kaufmann Publishers. Santos, Maribel Yasmina, & Ramos, Isabel. (2009). Business Intelligence: Tecnologias da informação na gestão de conhecimento (2ª ed.). Lisboa: FCA. North, Matthew. (2012). Data mining for the masses: A Global Text Project Book. Turban, Efraim, Aronson, Jay, & Liang, Ting-Peng. (2007). Decision Support Systems and Intelligent Systems (7th ed.). New Delhi, India: Prentice Hall. Pearson Education, Inc. Witten, Ian H, & Frank, Eibe. (2005). Data Mining: Practical machine learning tools and techniques (2nd ed.). San Francisco: Elsevier. Im-183-05 4