UPE – Caruaru – Sistemas de Informação Disciplina: Mineração de Dados Prof.: Paulemir G. Campos Mineração de Dados Empresarial 31/05/2017 MD - Prof. Paulemir Campos 1 Introdução Empresas usam bancos de dados para: 31/05/2017 Monitorar transações básicas, como pagamento a fornecedores, processamento de pedidos, atendimento a clientes e pagamento a funcionários; E, obter informações que ajudem a administrar o negócio com mais eficiência, auxiliando gerentes e funcionários a tomar melhores decisões. MD - Prof. Paulemir Campos 2 Introdução Se uma empresa quiser saber: Qual produto é mais aceito pelo mercado? Ou, quais clientes são mais lucrativos? A resposta estará nos dados. 31/05/2017 MD - Prof. Paulemir Campos 3 Introdução Numa grande empresa, com grandes bancos de dados ou grandes sistemas para funções separadas (manufatura, vendas e contabilidade), são necessários recursos e ferramentas especiais para analisar vastas quantidades de dados e extraí-los de múltiplos sistemas. 31/05/2017 MD - Prof. Paulemir Campos 4 Introdução Entre esses recursos destacam-se: 31/05/2017 Data warehouse (armazém de dados); Data mining (mineração de dados); Acesso a bancos de dados internos via Web. MD - Prof. Paulemir Campos 5 Data Warehouses Banco de dados que armazena dados correntes e históricos de potencial interesse para os tomadores de decisão de toda a empresa. Indicado para: 31/05/2017 Obtenção de informações concisas e confiáveis sobre operações correntes, tendências e mudanças organizacionais. MD - Prof. Paulemir Campos 6 Data Warehouses Consolida e padroniza as informações oriundas de diferentes bancos de dados operacionais, facilitando a análise gerencial e a tomada de decisões. Dispõem de ferramentas para consulta, análise e geração de relatórios gráficos. 31/05/2017 MD - Prof. Paulemir Campos 7 Data Warehouses: Componentes 31/05/2017 MD - Prof. Paulemir Campos 8 Data Warehouses Data marts 31/05/2017 Subconjunto de um data warehouse, no qual uma porção resumida ou altamente focalizada dos dados da organização é colocada em um banco separado destinado a uma população específica de usuários. Criação mais rápida e menor custo do que um data warehouse de âmbito empresarial. MD - Prof. Paulemir Campos 9 Inteligência Empresarial Usam ferramentas que consolidam, analisam e acessam grandes volumes de dados para ajudar os usuários a tomar melhores decisões empresariais. Também conhecida Intelligence (BI). 31/05/2017 MD - Prof. Paulemir Campos por Business 10 Inteligência Empresarial Principais ferramentas: 31/05/2017 Softwares para consulta e relatórios de bancos de dados; Processamento analítico on-line (OLAP: On-Line Analytical Processing); Data mining. MD - Prof. Paulemir Campos 11 Inteligência Empresarial 31/05/2017 MD - Prof. Paulemir Campos 12 OLAP: Processamento Analítico On-Line Permite a análise multidimensional de dados, proporcionando múltiplas visões dos mesmos dados pelos usuários. Exemplos de dimensões: 31/05/2017 Produto, região, tempo, etc. vendas, MD - Prof. Paulemir Campos período de 13 OLAP: Processamento Analítico On-Line Indicado para responder perguntas do tipo: 31/05/2017 “Quantos parafusos (ou outro produto) foram vendidos em cada região comparando os resultados reais com a projeção de vendas desse produto?” MD - Prof. Paulemir Campos 14 OLAP: Processamento Analítico On-Line Exemplo de modelo multidimensional de dados para representar as dimensões: Produtos; Regiões; Volume de vendas (real e projetada). 31/05/2017 MD - Prof. Paulemir Campos 15 Data Mining Pode ser definida como uma das etapas do processo de descoberta em bases de dados (KDD – Knowledge Discovery in Databases). Fornece percepções dos dados corporativos que não podem ser obtidos com o OLAP, por exemplo. 31/05/2017 MD - Prof. Paulemir Campos 16 Data Mining Possibilita: 31/05/2017 A descoberta de relacionamentos ocultos bancos de dados; padrões e em grandes E, inferir regras a partir dessas descobertas para prever comportamentos futuros. MD - Prof. Paulemir Campos 17 Data Mining Tipos de informações que podem ser obtidas: 31/05/2017 Associações (ocorrências num evento); Seqüências (eventos ao longo do tempo); Classificações (atributos relacionados com classe predefinida); MD - Prof. Paulemir Campos 18 Data Mining Tipos de informações que podem ser obtidas (Continuação): 31/05/2017 Aglomerações ou Clustering (similaridades entre padrões sem classes predefinidas); e, Prognósticos ou Previsões (prever valores futuros com base numa série de valores existentes). MD - Prof. Paulemir Campos 19 Data Mining Análise Preditiva: Usa técnicas de data mining, dados históricos e suposições sobre condições futuras para predizer resultados de eventos, tais como, a probabilidade de um dado cliente: 31/05/2017 responder a uma oferta; ou, comprar um determinado produto. MD - Prof. Paulemir Campos 20 Data Mining: Processo de KDD Avaliação dos Padrões Mineração de Dados Dados Relevantes Data Warehouse Seleção Limpeza de Dados Integração de Dados Bases de dados 31/05/2017 MD - Prof. Paulemir Campos 21 Banco de Dados e a Web Muitas empresas usam a web para disponibilizar algumas informações de seus bancos de dados internos a clientes e parceiros de negócios. 31/05/2017 MD - Prof. Paulemir Campos 22 Banco de Dados e a Web Middleware e outros softwares tornam possível o acesso a bancos de dados internos via web: Servidores de bancos de dados; CGI (Commom Gateway Interface). 31/05/2017 Recebe os pedidos em SQL e fornece os dados requisitados. Usa-se script CGI para processar dados num servidor web. MD - Prof. Paulemir Campos 23 Banco de Dados e a Web Exemplo de acesso a um banco de dados interno de uma organização via web. 31/05/2017 MD - Prof. Paulemir Campos 24 Banco de Dados e a Web Vantagens: 31/05/2017 Interfaces web (softwares de navegação web) são familiares aos usuários, facilitando o uso; E, poupam o redesenho ou a reconstrução de sistemas legados (que usam tecnologia de gerenciamento de dados ultrapassada) por adicionar uma interface web para acesso aos dados pelos usuários. MD - Prof. Paulemir Campos 25 Referências Laudon, K. C.; Laudon, J. P. Sistemas de Informação Gerenciais. 7 ed. São Paulo: Pearson Prentice Hall, 2007 Material de apoio ao professor disponível em http://wps.prenhall.com/br_laudon_sisi nfoger_7 acessado em 10/02/2010 31/05/2017 MD - Prof. Paulemir Campos 26 Referências Witten, I. H.; Frank, E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann, 1999. 31/05/2017 MD - Prof. Paulemir Campos 27