Pós-graduação em Mineração e Ciência de Dados 26

Propaganda
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP)
COORDENADORIA DE EXTENSÃO E PESQUISA
CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E
CIÊNCIA DOS DADOS
PROJETO PEDAGÓGICO
CAMPO LIMPO PAULISTA
2015
1. Público Alvo
Este curso de Pós-Graduação Lato Sensu é destinado especialmente a alunos
graduados em cursos da área de Informática, Matemática, Estatística, Administração e
Gestão empresarial, assim como de Engenharias. Profissionais formados em outras
áreas tecnológicas que desejam especializar-se em Mineração e Ciência de dados.
2. Vagas e Quantidade Mínima de Inscritos
Serão oferecidas, no total, 40 vagas. A Instituição reserva-se ao direito de não
constituir turmas com uma quantidade de alunos menor do que 30.
3. Duração
O curso tem uma carga horária de 360 horas e calendário escolar que possibilita
a sua conclusão em, aproximadamente 1 ano.
4. Modalidade de Oferecimento
Presencial com aulas ministradas na sede da Faculdade Campo Limpo Paulista,
à rua Guatemala, 167, Jardim América, Campo Limpo Paulista, São Paulo.
5. Certificado de Conclusão
Aos alunos que concluírem com aproveitamento de conteúdo e freqüência
mínima de 75% cada uma das disciplinas do curso e obtiverem aprovação de trabalho
monográfico, terão direito a um certificado de Pós-Graduação Lato Sensu em
Mineração e Análise de Dados nível de especialização, com validade em todo território
nacional, nos termos da Resolução CNE-CES número 1 de 8 de junho de 2007.
6. Objetivos
Mineração de dados é o conjunto de técnicas utilizadas para a captura,
organização, armazenamento, processamento e análise de grandes volumes de dados.
Estas técnicas permitem extrair novas informações e conhecimentos a partir desses
dados, com o objetivo de ajudar na tomada de decisões das organizações. Na área
empresarial, estas técnicas tem sido exploradas sob o termo de Inteligência de
Negócios ou Bussiness Inteligence (BI).
O uso destas técnicas tem aumentado de forma significativa nos últimos anos,
motivado pelo uso generalizado de aplicações baseadas na internet e pela facilidade
das organizações em gerar e armazenar dados associados aos seus processos.
Algumas destas novas aplicações começaram a gerar volumes muito significativos de
dados, em curtos períodos de tempo, provocando novos desafios tecnológicos para o
processamento e armazenamento destes dados. Este fenômeno tem sido descrito sob
o termo Bigdata e dentre as técnicas que estão sendo utilizadas para o processamento
desse volume de dados, temos as de mineração de dados. Esta combinação de
problemas, tecnologias e soluções nas empresas tem motivado o surgimento de novas
profissões multidisciplinares como: Cientista de Dados, Especialista em BI, Analista de
Dados, dentre outros.
Este curso de pós-graduação tem por objetivo promover a formação profissional
básica nos conceitos, metodologias, técnicas e ferramentas para mineração de dados
e seu uso no processamento de grandes volumes de dados gerados pelas
organizações. No curso serão abordadas as etapas e processos para a mineração de
dados assim como técnicas baseadas em estatística e aprendizado de máquina para o
processamento e análise dos dados. Adicionalmente, será explorado o uso destas
técnicas no contexto de Big Data e com o uso fundamentalmente de técnicas e
serviços de Computação em Nuvens.
7. Matriz Curricular
A matriz curricular propõe 360 horas a serem cursadas em disciplinas e 32 horas para
realização de uma monografia.
Componente Curricular
C.H.
Introdução à Mineração de dados e inteligência de Negocio
32
Fundamentos de Estatística
40
Fundamentos de Aprendizado de Máquina
32
Bancos de Dados e Mineração de dados.
32
Pré-processamento, preparação e visualização dos dados
32
Métodos estatísticos para Mineração de dados
40
Métodos de aprendizado de maquina para mineração de dados.
48
Big Data e Data Analytics
40
Didática da Educação Superior
32
Metodologia do Trabalho Científico
32
Total em disciplinas:
360
Desenvolvimento de Monografia
32
Total Geral 392
8. Ementas
Introdução à Mineração de dados e Inteligencia de Negocio.
Objetivos da mineração de dados. Análise de Dados. Aplicações empresariais.
Mineração de dados nas decisões empresariais. Colaboração e
Experimentação (Design Thinking), Sistemas de Informações Estratégicas.
Casos de uso. BigData e Mineração de dados.
Fundamentos de Estatística
Distribuições de frequência. Medidas de tendência, variação e dispersão.
Medidas de posição, Modelos probabilísticos. Distribuições de probabilidade, .
binomiais e distribuições normais. Distribuições de amostragem. Intervalo de
confiança. Estatística multivariada. Ferramentas.
Fundamentos de Aprendizado de Máquina:
Aprendizado de máquina, descoberta de conhecimento e mineração de dados.
Representação de conceitos, instâncias e atributos. Treinamento e função alvo.
Avaliação de hipóteses. Aprendizado de Máquina indutivo, supervisionado, não
supervisionado por reforço.
Modelos de Bancos de Dados para mineração de dados. .
Sistemas de bancos de dados transacionais e analíticos ( OLPT vc OLAP).
Modelos de dados e linguagens de consulta em sistemas transacionais e
analíticos. Data Warehouse. Desafios do BigData. Bancos de dados NoSQL.
Ferramentas analíticas em Bancos de Dados.
Pré-processamento, preparação e visualização de dados
Seleção de atributos. Limpeza dos dados. Integração e transformação de Dados.
Normalização e agregação. Redução de dimensionalidade. Principal Component
Analysis (PCA). Discretização. Seleção de dados para visualização. Tipos de
gráficos. Propriedades perceptuais e visuais dos gráficos. Interação dinâmica
com os dados. Ferramentas.
Métodos de aprendizado de máquina para Mineração de Dados
Classificação e Predição. Padrões sequenciais. Clusters (Agrupamentos).
Análise de Outliers. Aprendizagem Bayesiana; Aprendizagem de Regras;
Regras de Associação. Aprendizagem por Reforço. Support Vector Machines
(SVM). Linear Discriminant Analysis (LDA) Redes Neurais. Deep Learning.
Mineração de texto. Ferramentas;
Métodos estatísticos para Mineração de Dados
Introdução à inferência estatística paramétrica e não paramétrica. Introdução à
regressão linear simples e múltipla. Regressão logística, Testes estatísticos.
Análise discriminante, Método do vizinho mais próximo. Ferramentas.
Big Data e Analytics:
Algoritmos para Big Data. Armazenamento e processamento de dados para Big
Data. Bancos de dados em nuvem (PaaS). Computação em Nuvens para
mineração de dados. Modelo de programação Map-Reduce. Ferramentas.
9. Coordenação
Prof. Dr. Luis Mariano del Val Cura (Dr. Pelo IC/UNICAMP)
10. Corpo Docente
Prof. Dr. Alex Rodrigo Souza (Doutor pelo IMECC/UNICAMP)
Prof. Drª Ana Maria Monteiro (Doutora pelo IC/UNICAMP)
Prof. Dr. Eduardo Javier Huerta Yero (Doutor pelo FEEC/UNICAMP)
Prof. Me. Everton Gago (Mestre pela FEEC/UNICAMP)
Prof. Dr. Luis Mariano del Val Cura (Doutor pelo IC/UNICAMP)
Prof. Dr. Osvaldo Luiz de Oliveira (Doutor pelo IC/UNICAMP)
Prof. Dr. Rodrigo Bonacin (Doutor pelo IC/UNICAMP)
1. Biblioteca
A biblioteca da Instituição conta um acervo de aproximadamente 30.000 obras.
Tendo sido uma das pioneiras da Instituição, a área de Computação coleciona obras
desde o ano de 1999. Hoje, são aproximadamente 2500 livros e 25 assinaturas de
revistas científicas de Computação. Tem acesso às bibliotecas digitais da ACM e da
IEEE.
Download