Data Mining

Propaganda
SIN - Sistemas de Informação
Revisão
Definições
Sistemas: Conjunto de elementos, materiais
ou ideais, entre os quais se possa encontrar ou
definir alguma relação. Um todo organizado ou
complexo; um conjunto ou combinação de
coisas ou partes, formando um todo complexo
ou unitário.
Um Sistema de Informação (SI): é um
sistema cujo elemento principal é a informação.
Seu objetivo é armazenar, tratar e fornecer
informações de tal modo a apoiar as funções
ou processos de uma organização.
2
Atividades básicas dos
Sistemas:
•
•
Entrada (input) – envolve a captação ou
coleta de fontes de dados brutos de
dentro da organização ou de seu
ambiente externo (formulários, registros,
edição);
Processamento – conversão da entrada
bruta em forma mais útil e apropriada
(dados classificados, analisados,
manipulados através de cálculos,
comparações...)
Atividades básicas dos
sistemas
•
Saída (output) –transferência da informação as
pessoas ou atividades que a usarão (gráficos
ou relatórios);
•
Realimentação (feedback) – é a saída que
retorna aos membros adequados da
organização para ajudá-los a refinar ou corrigir
os dados de entrada ou ao processamento.
•
Controle – envolve o monitoramento e
avaliação do feedback para determinar se o
sistema esta se dirigindo para a realização de
sua meta.
De um modo geral...
Histórico do Computador
redes de computador
A Estrutura Computacional
O Computador
HARDWARE
COMPUTADOR
+
PERIFÉRICOS
SOFTWARE
SISTEMA
OPERACIONAL
+
LINGUAGEM
+
Hardware: são todos componentes físicos (“peças”) que fazem
APLICATIVOS E
parte do equipamento ou aqueles que estejam conectados ao
UTILITÁRIOS
mesmo.
Software: são os elementos virtuais (programas) que garantem a funcionalidade e a
flexibilidade dos processos no computador. O software é responsável por criar a
interface de comunicação entre o usuário e a máquina.
Software Livre x Proprietário
•
Software proprietário ou não livre:
É aquele cuja cópia, redistribuição ou modificação
são em alguma medida restritos pelo seu criador ou
distribuidor. A expressão foi cunhada em oposição
ao conceito de software livre..
•
Software Livre:
São programas gratuitos que possuem o códigofonte aberto, desenvolvidos na maioria das vezes
por comunidades que dedicam seu tempo livre para
fazê-lo. Se você for programador, pode modificar o
código-fonte dos programas se quiser, desde que
mantenha os créditos aos criadores deles.
Sistemas Empresariais
•
Sistemas de Processamento de Transação:
•
São sistemas que servem o nível operacional da
organização, monitorando as atividades diárias ou
normais de uma empresa. O seu principal objetivo
é responder a questões rotineiras e acompanhar o
fluxo de transações através da organização.
Exemplos: Sistema de reserva de hotel,
Informações de clientes, Folha de pagamento.
•
Sistemas Empresariais
•
Sistemas de Informação Gerencial:
Suprem os tomadores de decisões de
informações necessárias para ajuda-los a
alcançar as metas da organização, gerando
diversos relatórios.
•
Essas informações são repassadas por
meio de relatórios, recursos gráficos e
outras ferramentas essenciais para
monitorar os processos.
Sistemas Empresariais
•
Vantagens dos Sistemas de Informação
Gerencial:

Redução de custos nas operações;
Melhoria na tomada de decisões;
Melhoria na resposta da empresa, perante
problemas potenciais.


Sistemas Empresariais

Sistemas de Apoio à Decisão:

Analisa um grande número de variáveis para que seja
possível o posicionamento a uma determinada
questão. Através desses sistemas é possível a tomada
de decisões com menores riscos futuros e com melhor
chance de sucesso, diminuindo a incerteza.
Vantagens: Consegue trabalhar com a complexidade
evolutiva do mundo moderno, a redução do tempo
disponível para a tomada de decisão, a velocidade das
comunicações e o melhoramento nos processos de
informações e com expectativa de resultados a curto
prazo.
Banco de dados



Banco de dados é uma coleção organizada de
dados que se relacionam de forma que crie um
sentido.
Exemplos: Lista telefônica, banco de dados
sobre clientes, empregados, estoque.
A abordagem de banco de dados é aquela em
que um conjunto de dados é compartilhado por
múltiplos programas aplicativos.
13
Vantagens da abordagem de
banco de dados

Controla a redundância dos dados

Usa o espaço de armazenamento
eficientemente

Garante a integridade dos dados

Localiza dados de forma facilitada

Compartilha dados
14
Sistema de gerenciamento de
banco de dados (SGBD)

Um sistema de gerenciamento de banco de
dados (SGBD) é um grupo de programas que
pode ser usado como uma interface entre:



um banco de dados e um usuário
um banco de dados e um programa aplicativo
SQL é a linguagem de consulta padrão para
banco de dados relacionais.
15
Data Mining
O que é Data Mining?
Basicamente: “Mineração de Dados”
Produzir conhecimento novo escondido em grandes
bases de dados.
A coleta de dados (transações bancárias, registros de compras, perfil de uso da
internet, integração das informações de diversos sistemas, código de barras, via
sensores remotos (sistemas fotográficos ou óptico-eletrônicos capazes de detectar e
registrar, sob a forma de imagens ou não, o fluxo de energia radiante refletido ou
emitido por objetos distantes), satélites, processamento analítico on line (OLAP),
documentos), tem atingido grandes proporções
acarretou problema na área
do conhecimento
novo ramo do conhecimento (KDD – Knowledge
Discovery in Databases), o qual visa otimizar e automatizar o processo de
descrição das tendências e dos padrões contidos neste processo, potencialmente
16
úteis e interpretáveis.
Estatística
Banco de dados
Outras Disciplinas
Mineração de dados
Visualização
Redes Neurais
Definição Forma de Data Mining:
Uso de técnicas, preferencialmente automáticas, de exploração de grandes
quantidades de dados de forma a descobrir novos padrões e relações que,
devido ao volume de dados, não seriam facilmente descobertos a olho nú
pelo ser humano (Carvalho, 2001).
17
Data Mining: a inteligência da empresa
Para o aprendizado ocorrer, uma série de informações de diferentes
formatos e fontes precisa ser organizada de maneira consistente na grande
memória empresarial denominada data warehouse.
Após isto, métodos de análise estatística e inteligência artificial precisam
ser aplicados sobre esses dados e relações novas e úteis à empresa
devem ser descobertas, ou seja, os dados devem ser minerados (data
mining).
A mineração dos dados consiste mais especificamente em descobrir
relações entre produtos, classificar consumidores, prever
vendas, localizar áreas geográficas potencialmente lucrativas
para novas filiais, inferir necessidades, entre outras.
18
Data Warehouse
Data Mining
Na grande empresa, a memória é o
data warehouse, enquanto a
inteligência é o data mining
19
Alguns resultados do data mining numa empresa:
 melhor relação entre empresa e cliente
 aumenta as vendas
 dirige as estratégias de marketing
 diminuir custos operacionais
Áreas de aplicação:
 Medicina
 Agronomia
 Economia
 Administração
 Geologia
 Outros.
É indispensável a presença de um analista com conhecimento profundo
da área de estudo.
20
Motivação:
 O volume de dados armazenados atualmente é muito grande
Data mining é uma técnica aplicável a grandes bancos de dados.
Estes são necessários para construir e treinar modelos que serão utilizados
para realizar alguma tarefa de data mining.
Exemplo: empresas de telefonia, cartões de crédito, bancos, televisão por
assinatura, comércio eletrônico e outros.
 Os dados estão sendo organizados
Com a tecnologia data warehousing os dados de várias fontes estão sendo
organizados e padronizados de forma a possibilitar sua organização dirigida
para o auxílio à decisão. As técnicas de data mining necessitam de bancos de
dados limpos, padronizados e organizados.
 Os recursos computacionais possuem grande capacidade
- Algoritmos computacionalmente intensivos (processos iterativos).
- Preços de memória, discos, etc. estão diminuindo.
 A competição empresarial exige técnicas mais modernas de decisão
21
 Programas de data mining já podem ser adquiridos
SIN - Sistemas de Informação
Dúvidas?
Download