UNIVERSIDADE DO ESTADO DE SANTA CATARINA – UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ – CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI – Departamento de Sistema de Informação DISCIPLINA: Data Warehouse e Data Mining SIGLA: DAD PROFESSOR: Osmar de Oliveira Braz Junior E-MAIL: [email protected] CARGA HORÁRIA TOTAL: 72 PRÁTICA: 0 TEORIA: 72 CURSO(S): Sistemas de Informação SEMESTRE/ANO: 2/2012 PRÉ-REQUISITOS: ENS OBJETIVO GERAL DO CURSO: O curso de Bacharelado em Sistemas de Informação objetiva formar profissionais críticos, criativos, investigativos, éticos e empreendedores. Além disso, deverão ser capazes de atuar em ambientes gerais de informática, como no desenvolvimento, análise, implementação, gerenciamento, gestão de contratos, modelagem e gestão de projetos. Inclusive, os profissionais deverão ter a capacidade de desenvolver soluções apoiadas em tecnologias de informação (computação e comunicação), dados e sistemas que abordem processos administrativos e de negócios das organizações. EMENTA: Gestão de Conhecimento. Processo Decisório. Informações Gerenciais e Táticas. Construção de Data Warehouse. Carga, Limpeza e Transformação. Inteligência Artificial. Mineração de Dados. Técnicas de Mineração de Dados. OBJETIVO GERAL DA DISCIPLINA: O aluno estará apto a reconhecer, projetar e implementar os elementos da arquitetura do Data Warehouse. OBJETIVOS ESPECÍFICOS/DISCIPLINA: (i) Projetar um ambiente DW, dado um problema; (ii) Implementar seus principais componentes (ETL, Metadados, Modelagem Dimensional); (iii) Analisar os dados de um modelo dimensional através de uma ferramenta OLAP; (iv) Definir a melhor técnica de Data Mining no processo de KDD; (v) Utilizar alguma ferramenta de suporte em mineração de dados. CRONOGRAMA DAS ATIVIDADES: Aula Data Horário Conteúdo 24/07 20:40 Apresentação do Plano de Ensino, Metodologia de Ensino e Métodos 01 de Avaliação. A Evolução dos Sistemas de Informação Atividades de um Sistema Ambientes e sistemas 26/07 20:40 Componentes de um Sistema de Informação 02 Classificação dos Sistemas de Informação Tipos de Decisões Sistemas Gerenciadores de Banco de Dados Gestão da Informação Conhecimento e Estratégia Sistemas de Informação como elemento de apoio na tomada de decisão 31/07 20:40 Resolução de exercícios em sala de aula 03 02/08 20:40 Data Warehouse 04 Porque Data Warehouse Crise dos Dados Evolução Programa de Extração Mudança de Enfoque Ciclo de Desenvolvimento Padrões de utilização de Hardware 07/08 20:40 Resolução de exercícios em sala de aula 05 09/08 20:40 Data Warehouse 06 Orientado a assuntos, Integrado, Não volátil, Variável em relação do tempo, Estrutura do Data Warehouse Granularidade Estruturação dos Dados 14/08 20:40 Resolução de exercícios em sala de aula 07 16/08 20:40 Modelagem de Dados 08 Modelo Entidade e Relacionamento Modelo Relacional 21/08 20:40 Resolução de exercícios em sala de aula, modelagem do modelo 09 relacional 23/08 20:40 Ferramenta case para modelagem de dados relacional 10 Sistema gerenciador de banco de dados 28/08 20:40 Resolução de exercícios em sala de aula criação e povoamento do 11 modelo relacional 30/08 20:40 Modelagem Dimensional 12 Elementos Cubo Diferenças com o modelo relacional Representação Esquema estrela e floco de neve Passos para construção do modelo dimensional 04/09 20:40 Exercícios aplicando o conteúdo da aula anterior, modelagem e 13 criação do modelo dimensional. 06/09 20:40 Revisão para a Prova 1 14 11/09 20:40 1ª Prova (P1): Prova Individual e sem consulta 15 16 13/09 20:40 17 18 19 18/09 20/09 25/09 20:40 20:40 20:40 20 27/09 20:40 21 22 20:40 20:40 23 24 02/10 04/10 09/10 11/10 16/10 18/10 25 23/10 20:40 26 27 28 25/10 30/10 01/11 20:40 20:40 20:40 29 06/11 20:40 30 08/11 20:40 31 13/11 20:40 32 15/11 20/11 20:40 33 22/11 20:40 34 35 36 27/11 29/11 04/12 20:40 20:40 20:40 37 11/12 20:40 20:40 20:40 Evolução, Gestão, Data Warehouse, Modelagem Relacional e Dimensional. Área de Staging Tarefas do staging ETL Software de ETL, Transformação de dimensões comuns Transformação da dimensão tempo Transformação de fatos e agendamento de tarefas. Resolução de exercícios em sala de aula OLAP Histórico, Arquiteturas, Cubo de decisão Características, OLAP, Drill Across, Drill Down, Drill Up, Drill Throught Atividade do Trabalho Semestral, Tema e Contextualização Software de OLAP, Instalação e configuração, exemplo Semana Acadêmica de Sistema de Informação Semana Acadêmica de Sistema de Informação Resolução de exercícios em sala de aula DataMarts Conceitos Processos Metadados Conceitos Tipos de metadados Software de especificação de metadados Resolução de exercícios em sala de aula Revisão para a Prova 2 2ª Prova (P2): Individual e sem Consulta. Área de Staging, OLAP, Data Marts e Metadados. Arquitetura de Data Warehouse Organização da Base de Dados, Armazenamento e Camadas Projeto de Data Warehouse Atividade a distância a ser enviado via AAGI sobre Arquitetura e Projeto de Data Warehouse Mineração de Dados Processo de descobrimento de conhecimento em base de dados KDD Aprendizado de máquina Técnicas de mineração de dados, Classificação, Predição, Agrupamento e Associação. FERIADO NACIONAL - Proclamação da República Ferramenta para aplicação de Mineração de Dados Exemplos das técnicas de mineração Atividade a distância a ser enviado via AAGI sobre Mineração de Dados Entrega e Apresentação do Trabalho Semestral Revisão para a avaliação 3ª Prova (P3): Individual e sem Consulta. Arquitetura, Projeto e Data Mining. Exame Final da Disciplina METODOLOGIA PROPOSTA: Aula expositiva e dialogada para apresentação do conteúdo utilizando retroprojetor ou datashow. Resolução de listas de exercícios individualmente e em grupo. Resolução de estudos de casos com debate em sala de aula. Complementado com atividades em laboratório com softwares que permitem implementar os conceitos de Data Warehouse e Data Mining. AVALIAÇÃO: No transcorrer do semestre teremos cinco avaliações. Serão três avaliações escritas individuais e sem consulta referentes ao conteúdo lecionado, listas de exercícios para fixação de temas específicos e um trabalho a ser desenvolvido em dupla e apresentado a turma na forma de um seminário. As avaliações escritas serão avaliadas a clareza e objetividade, demonstração de conhecimento suficiente, capacidade de sistematização das idéias, ausência de dispersão ou de redundância das informações, observância das regras da norma culta. O Trabalho será avaliado os seguintes critérios: - Apresentação Escrita: fundamentação teórica, clareza de idéias e correção gramatical. - Apresentação Oral: fundamentação teórica, clareza de idéias e argumentação. A média é feita através de calculo: Média = (P1 * 20 + P2 * 20 + P3 * 20 + L1 * 10 + T1 * 30) / 100 Onde P1, P2 e P3 são as provas, L1 listas de exercícios e T1 um Trabalho. O exame final será escrito e individual, referente ao conteúdo apresentado durante todo o semestre. Observações: As avaliações escritas após a sua correção serão entregues aos alunos para conferência e depois devolvidos ao professor. O aluno (a) que não realizar as provas na data estabelecida deverá preencher requerimento junto à secretaria para realização de avaliação em nova data. BIBLIOGRAFIA BÁSICA: INMON, W. H. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997. KIMBALL, R. The Data Warehouse Toolkit: guia completo para modelagem dimensional. Rio de Janeiro: Campus, 2002. LEME FILHO, T. Business Intelligence no Microsoft Excel. Rio de Janeiro: Axcel Books do Brasil, 2004. Machado, F. N. Tecnologia e projeto de Data Warehouse: uma visão multidimensional. São Paulo: Érica, 2004. TURBAN, E.; SHARDA, R.; ARONSON, J.; KING, D. BUSINESS INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman, 2009. BIBLIOGRAFIA COMPLEMENTAR: BARBIERI, C. BI-Business Intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001. DATE, C.J. Introdução a Sistemas de Banco de Dados. 7. ed. Rio de Janeiro: Campus, 2004. ELMASRI, S.N. ; NAVATHE, B.S. Sistemas de Banco de Dados: Fundamentos e Aplicações. 3. ed. Rio de Janeiro: Livros Técnicos e Científicos, 2002. LAUDON, K. C.; LAUDON, J. P. Sistemas de informação com Internet. 4. ed. Rio de Janeiro: LTC, 1999. O’BRIAN, J. A. Sistemas de informação e as decisões gerenciais na era da Internet. São Paulo: Saraiva, 2001. SILBERSCHATZ, A.; KORTH, H.F.; SUDARSHAN, S. Sistema de Banco de Dados. 3. ed. São Paulo: Makron Books, 1999.