FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público Alvo Este curso de Pós-Graduação Lato Sensu é destinado especialmente a alunos graduados em cursos da área de Informática, Matemática, Estatística, Administração e Gestão empresarial, assim como de Engenharias. Profissionais formados em outras áreas tecnológicas que desejam especializar-se em Mineração e Ciência de dados. 2. Vagas e Quantidade Mínima de Inscritos Serão oferecidas, no total, 40 vagas. A Instituição reserva-se ao direito de não constituir turmas com uma quantidade de alunos menor do que 30. 3. Duração O curso tem uma carga horária de 360 horas e calendário escolar que possibilita a sua conclusão em, aproximadamente 1 ano. 4. Modalidade de Oferecimento Presencial com aulas ministradas na sede da Faculdade Campo Limpo Paulista, à rua Guatemala, 167, Jardim América, Campo Limpo Paulista, São Paulo. 5. Certificado de Conclusão Aos alunos que concluírem com aproveitamento de conteúdo e freqüência mínima de 75% cada uma das disciplinas do curso e obtiverem aprovação de trabalho monográfico, terão direito a um certificado de Pós-Graduação Lato Sensu em Mineração e Análise de Dados nível de especialização, com validade em todo território nacional, nos termos da Resolução CNE-CES número 1 de 8 de junho de 2007. 6. Objetivos Mineração de dados é o conjunto de técnicas utilizadas para a captura, organização, armazenamento, processamento e análise de grandes volumes de dados. Estas técnicas permitem extrair novas informações e conhecimentos a partir desses dados, com o objetivo de ajudar na tomada de decisões das organizações. Na área empresarial, estas técnicas tem sido exploradas sob o termo de Inteligência de Negócios ou Bussiness Inteligence (BI). O uso destas técnicas tem aumentado de forma significativa nos últimos anos, motivado pelo uso generalizado de aplicações baseadas na internet e pela facilidade das organizações em gerar e armazenar dados associados aos seus processos. Algumas destas novas aplicações começaram a gerar volumes muito significativos de dados, em curtos períodos de tempo, provocando novos desafios tecnológicos para o processamento e armazenamento destes dados. Este fenômeno tem sido descrito sob o termo Bigdata e dentre as técnicas que estão sendo utilizadas para o processamento desse volume de dados, temos as de mineração de dados. Esta combinação de problemas, tecnologias e soluções nas empresas tem motivado o surgimento de novas profissões multidisciplinares como: Cientista de Dados, Especialista em BI, Analista de Dados, dentre outros. Este curso de pós-graduação tem por objetivo promover a formação profissional básica nos conceitos, metodologias, técnicas e ferramentas para mineração de dados e seu uso no processamento de grandes volumes de dados gerados pelas organizações. No curso serão abordadas as etapas e processos para a mineração de dados assim como técnicas baseadas em estatística e aprendizado de máquina para o processamento e análise dos dados. Adicionalmente, será explorado o uso destas técnicas no contexto de Big Data e com o uso fundamentalmente de técnicas e serviços de Computação em Nuvens. 7. Matriz Curricular A matriz curricular propõe 360 horas a serem cursadas em disciplinas e 32 horas para realização de uma monografia. Componente Curricular C.H. Introdução à Mineração de dados e inteligência de Negocio 32 Fundamentos de Estatística 40 Fundamentos de Aprendizado de Máquina 32 Bancos de Dados e Mineração de dados. 32 Pré-processamento, preparação e visualização dos dados 32 Métodos estatísticos para Mineração de dados 40 Métodos de aprendizado de maquina para mineração de dados. 48 Big Data e Data Analytics 40 Didática da Educação Superior 32 Metodologia do Trabalho Científico 32 Total em disciplinas: 360 Desenvolvimento de Monografia 32 Total Geral 392 8. Ementas Introdução à Mineração de dados e Inteligencia de Negocio. Objetivos da mineração de dados. Análise de Dados. Aplicações empresariais. Mineração de dados nas decisões empresariais. Colaboração e Experimentação (Design Thinking), Sistemas de Informações Estratégicas. Casos de uso. BigData e Mineração de dados. Fundamentos de Estatística Distribuições de frequência. Medidas de tendência, variação e dispersão. Medidas de posição, Modelos probabilísticos. Distribuições de probabilidade, . binomiais e distribuições normais. Distribuições de amostragem. Intervalo de confiança. Estatística multivariada. Ferramentas. Fundamentos de Aprendizado de Máquina: Aprendizado de máquina, descoberta de conhecimento e mineração de dados. Representação de conceitos, instâncias e atributos. Treinamento e função alvo. Avaliação de hipóteses. Aprendizado de Máquina indutivo, supervisionado, não supervisionado por reforço. Modelos de Bancos de Dados para mineração de dados. . Sistemas de bancos de dados transacionais e analíticos ( OLPT vc OLAP). Modelos de dados e linguagens de consulta em sistemas transacionais e analíticos. Data Warehouse. Desafios do BigData. Bancos de dados NoSQL. Ferramentas analíticas em Bancos de Dados. Pré-processamento, preparação e visualização de dados Seleção de atributos. Limpeza dos dados. Integração e transformação de Dados. Normalização e agregação. Redução de dimensionalidade. Principal Component Analysis (PCA). Discretização. Seleção de dados para visualização. Tipos de gráficos. Propriedades perceptuais e visuais dos gráficos. Interação dinâmica com os dados. Ferramentas. Métodos de aprendizado de máquina para Mineração de Dados Classificação e Predição. Padrões sequenciais. Clusters (Agrupamentos). Análise de Outliers. Aprendizagem Bayesiana; Aprendizagem de Regras; Regras de Associação. Aprendizagem por Reforço. Support Vector Machines (SVM). Linear Discriminant Analysis (LDA) Redes Neurais. Deep Learning. Mineração de texto. Ferramentas; Métodos estatísticos para Mineração de Dados Introdução à inferência estatística paramétrica e não paramétrica. Introdução à regressão linear simples e múltipla. Regressão logística, Testes estatísticos. Análise discriminante, Método do vizinho mais próximo. Ferramentas. Big Data e Analytics: Algoritmos para Big Data. Armazenamento e processamento de dados para Big Data. Bancos de dados em nuvem (PaaS). Computação em Nuvens para mineração de dados. Modelo de programação Map-Reduce. Ferramentas. 9. Coordenação Prof. Dr. Luis Mariano del Val Cura (Dr. Pelo IC/UNICAMP) 10. Corpo Docente Prof. Dr. Alex Rodrigo Souza (Doutor pelo IMECC/UNICAMP) Prof. Drª Ana Maria Monteiro (Doutora pelo IC/UNICAMP) Prof. Dr. Eduardo Javier Huerta Yero (Doutor pelo FEEC/UNICAMP) Prof. Me. Everton Gago (Mestre pela FEEC/UNICAMP) Prof. Dr. Luis Mariano del Val Cura (Doutor pelo IC/UNICAMP) Prof. Dr. Osvaldo Luiz de Oliveira (Doutor pelo IC/UNICAMP) Prof. Dr. Rodrigo Bonacin (Doutor pelo IC/UNICAMP) 1. Biblioteca A biblioteca da Instituição conta um acervo de aproximadamente 30.000 obras. Tendo sido uma das pioneiras da Instituição, a área de Computação coleciona obras desde o ano de 1999. Hoje, são aproximadamente 2500 livros e 25 assinaturas de revistas científicas de Computação. Tem acesso às bibliotecas digitais da ACM e da IEEE.