Idade

Propaganda
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Aprendizado de Máquina
Uma Visão Geral
Profa. Dra. Maria Carolina Monard
LABIC - ICMC - USP São Carlos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Inteligência e Aprendizado
101100
100101
•
Engenharia
de
Conhecimento
e
SBC
001001
010011
• Dado, Informação e Conhecimento
010101
• Aprendizado de Máquina
100111
001101
• AM usando Árvores de Decisão
011010
• KDD e Data Mining
101010
100100
010101
110100
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
“Uma área de pesquisa que investiga
100101
formas de habilitar o computador a
001001
010011
realizar tarefas nas quais, até o
010101
momento, o ser humano tem um
100111
001101 melhor desempenho”.
011010
Elaine Rich
101010
100100
010101
110100
101100
O que é IA?
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100“Tão logo algum problema de IA é
100101
resolvido ele não é mais considerado
001001
um problema da área de IA...”
010011
010101
100111
Chuck Thorpe
001101
011010
CMU, Robotics Institute, 2000
101010
100100
010101
110100
101100
Inteligência Artificial
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Conjunto de técnicas para a construção de
101100
máquinas “inteligentes”, capazes de
100101
001001
resolver problemas que requerem
010011
inteligência humana. (Nilsson)
010101
• Ramo da Ciência da Computação dedicado
100111
à automação de comportamento
001101
011010
inteligente. (Luger e Stubble)
101010
• Tecnologia de processamento de
100100
informação que envolve processos de
010101
raciocínio, aprendizado e percepção.
110100
(Winston)
101100
Definições Adicionais
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
Sistemas que
001001
010011
pensam como os
010101
humanos
100111
Sistemas que
001101
011010atuam como
101010
100100 humanos
010101
110100
101100
As 4 categorias das definições
de Inteligência Artificial
LABIC - ICMC - USP São Carlos
Sistemas que
pensam
racionalmente
Sistemas que
atuam
racionalmente
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Agindo como humanos:
101100
A abordagem do Teste de Turing
100101
001001
• Pensando como humanos:
010011
A abordagem do modelamento cognitivo
010101
100111
001101
• Pensando racionalmente:
011010
A abordagem das leis do pensamento
101010
100100
• Agindo racionalmente:
010101
A abordagem de agentes racionais
110100
101100
As 4 categorias das definições
de Inteligência Artificial
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• A partir dos anos 80 foi percebido que,
101100
geralmente, o modelo de raciocínio utilizado
100101
001001
em IA era diferente do usado pelos seres
010011
humanos.
010101
• Mas essas diferenças não invalidam o uso
100111
de modelos não-humanos. Um bom
001101
011010
exemplo é o avião, que opera de uma
101010
forma muito diferente da dos pássaros,
100100
mas também voa.....
010101
110100
101100
Uma Nova Visão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Em outras palavras, para que alguém
101100
100101
quer construir uma cópia da mente
001001
humana? Não é suficiente a original?
010011
Não é a mente humana a mais difícil
010101
100111
de se auto-examinar?
001101
• A única solução aparentemente lógica
011010
101010
é separar a inteligência humana da
100100
inteligência artificial para construir
010101
algo completamente novo.
110100
101100
Uma Nova Visão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100 Entre as controvérsias que ainda
100101 persistem na área encontra-se a
001001
relacionada com o papel
010011
010101 desempenhado em IA pela lógica.
100111
001101
011010
A inteligência deriva primariamente do
101010
raciocínio
lógico
ou
do
conhecimento?
100100
010101
110100
101100
IA e Lógica
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
O
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
IA e Lógica
problema está em considerar que
esse ou é um ou exclusivo!
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• São diversas as lógicas
101100
100101
IA, tais como:
001001
– Lógica Fuzzy
010011
010101
– Lógica Paraconsistente
100111
– Lógica Temporal
001101
– e várias outras
011010
101010
100100
010101
110100
101100
IA e Lógica
LABIC - ICMC - USP São Carlos
ISISTAN-2001
utilizadas em
‹#
011010
101010
100100
010101
110100
• Ainda que forçados a utilizar muitas
101100
100101
variedades de lógica, alguns pesquisa001001
dores consideram que tanto a lingua010011
gem quanto a “máquina de inferência”
010101
100111
lógica é fundamental para IA.
001101
• O ideal seria conseguir integrar essa
011010
101010
grande variedade de mecanismos
100100
lógicos especializados dentro de um
010101
sistema único, poderoso e versátil,
110100
101100
porém uniforme.
IA e Lógica
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Paradigmas da Inteligência
O que é
inteligência?
Muito difícil!!!
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Aprende por experiência
101100
• Usa conhecimento adquirido por experiência
100101
• Soluciona problemas na ausência de alguma
001001
informação
010011
010101
• Reage rapidamente perante uma nova situação
100111
• Determina o que é importante
001101
• Raciocina e pensa
011010
101010
• Entende imagens visuais
100100
• Processa e manipula símbolos
010101
• É criativo e imaginativo
110100
• Usa heurísticas
101100
Procedimento Inteligente
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Aprendizado é a chave da
101100
100101
superioridade da Inteligência Humana
001001
– Aprendizado é a essência da Inteligência
010011
010101
• Para que uma máquina tenha
100111
Comportamento Inteligente, deve001101
se aumentar sua Capacidade de
011010
101010
Aprendizado
100100
010101
110100
101100
Inteligência x Aprendizado
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• O ser humano está pré-programado para o
101100
aprendizado. Aprende ampliando o alcance
100101
001001
do conhecimento que já possui, através de
010011
reordenações sucessivas
010101
• O computador não possui o programa inicial
100111
para procurar por informações e realizar
001101
011010
aprendizado em geral
101010
• Paradigmas e técnicas de AM possuem um
100100
alvo bem mais limitado do que o
010101
aprendizado humano
110100
101100
Inteligência x Aprendizado
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
O Teste de Turing
LABIC - ICMC - USP São Carlos
Sistema
Computacional
Barreira Física
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
Interrogador
010101
110100
101100
Interface
Humano
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Inteligência e Aprendizado
101100
100101
• Engenharia de Conhecimento e SBC
001001
• Dado, Informação e Conhecimento
010011
010101
• Aprendizado de Máquina
100111
001101
• AM usando Árvores de Decisão
011010
• KDD e Data Mining
101010
100100
010101
110100
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
Conceitos e técnicas de IA
010011
010101
100111
001101
011010
101010 Sistemas de IA
100100
010101
110100
101100
Sistemas de IA
LABIC - ICMC - USP São Carlos
Processo de
Aprendizado
Aquisição
Conhecimento
Representação
Manipulação
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• A seleção de um domínio apropriado
101100
100101
crucial para o êxito no
001001
desenvolvimento de um sistema
010011
inteligente.
010101
100111
• Os limites da tarefa devem ser
001101
claramente delineados.
011010
101010
100100
010101
110100
101100
Seleção do Domínio
LABIC - ICMC - USP São Carlos
ISISTAN-2001
é
‹#
011010
101010
100100
010101
110100
101100
Especialista(s)
100101
001001
010011
Aquisição do
010101
Conhecimento
100111
001101
011010
101010
Engenheiro do
100100
Conhecimento
010101
110100
101100
LABIC - ICMC - USP São Carlos
CONSTRUÇÃO DE BASES
DE CONHECIMENTO
Conhecimento
Adquirido
Representação do
Conhecimento
Base de Conhecimento
c/ Fatos e Relações
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
Estuda o processo de transferência de
101100
100101
conhecimento do especialista para o
001001
computador.
010011
010101
100111
001101
Transfor011010
mação
101010
100100
010101
110100
101100
Engenharia de Conhecimento
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• É o profissional que extrai o conhecimento
101100
do(s) especialista(s) --- ou de outra fonte
100101
001001
--- o interpreta e representa em tipos e
010011
estruturas de conhecimento na Base de
010101
Conhecimento.
100111
001101
011010
101010
100100
010101
110100
101100
Engenheiro de Conhecimento
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Especialista com dificuldades
101100
100101
para verbalizar conhecimento
001001
• Especialista pode não estar
010011
ciente de como usa o
010101
100111
conhecimento
001101
• Conhecimento Incompleto
011010
101010
• Conhecimento Incorreto
100100
010101
• Conhecimento Inconsistente
110100
101100
Problemas com AC
.
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
“Programas de computador que usam
101100
100101
conhecimento representado
001001
explicitamente para resolver
010011
problemas”
010101
100111
001101
011010
101010
100100
010101
110100
101100
Sistemas Baseados em
Conhecimento (SBC)
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
SBC e Sistemas
Especialistas
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
SBCs são desenvolvidos para serem
100101
001001
usados em problemas que requerem
010011
uma quantidade considerável de
010101
conhecimento humano e de “esperteza”
100111
001101
para serem resolvidos
011010
101010
100100
010101
110100
101100
SBC
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
“SEs são sistemas que são capazes de
100101
001001 oferecer soluções para problemas
010011
específicos num dado domínio ou que
010101
consigam aconselhar (dar conselhos), de
100111
uma maneira ou num nível comparável
001101
011010 ao de especialistas naquela área.”
101010
100100
010101
Lucas and van der Gaag
110100
Princípios de Sistemas Especialistas
101100
Sistemas Especialistas (SE)
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
“Um Sistema Especialista, ainda que
100101
projetado e implementado de forma
001001
010011
brilhante, se é incapaz de aprender a
010101
não repetir erros, então ele não é mais
100111
001101 inteligente que uma minhoca.”
011010
101010
100100
O.G. Selfridge
010101
“The
Garnen
of
Learning”
110100
AI Magazine 14(2), 1993
101100
Sistemas Especialistas
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
• Inteligência e Aprendizado
010101
• Engenharia de Conhecimento e SBC
100111
001101
• Dado, Informação e Conhecimento
011010
• Aprendizado de Máquina
101010
100100
• AM usando Árvores de Decisão
010101
110100
• KDD e Data Mining
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
Conhecimento
001001
010011
010101
Informação
100111
001101
011010
101010
Dados
100100
010101
110100
101100
Estrutura
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Dado é a estrutura fundamental sobre
101100
100101
a qual um sistema de informação é
001001
construído.
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
O que é DADO?
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• A transformação de dados em
101100
100101
informação é freqüentemente
001001
realizada através da apresentação dos
010011
dados em uma forma compreensível
010101
100111
ao usuário.
001101
011010
101010
100100
010101
110100
101100
O que é INFORMAÇÃO?
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Fornece a capacidade de resolver
101100
100101
problemas, inovar e aprender baseado
001001
em experiências prévias
010011
010101
• Uma combinação de instintos, idéias,
100111
regras e procedimentos que guiam as
001101
ações e decisões.
011010
101010
100100
010101
110100
101100
O que é
CONHECIMENTO?
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Dado não é Informação
101100
100101
001001
• Informação não é Conhecimento
010011
010101
100111
• Conhecimento não é Inteligência
001101
011010
101010
• Inteligência não é Sabedoria
100100
010101
110100
101100
Importante observar ....
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
• Inteligência e Aprendizado
010101
• Engenharia de Conhecimento e SBC
100111
001101
• Dado, Informação e Conhecimento
011010
• Aprendizado de Máquina
101010
100100
• AM usando Árvores de Decisão
010101
110100
• KDD e Data Mining
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
Conceitos e técnicas de IA
010011
010101
100111
001101
011010
101010 Sistemas de IA
100100
010101
110100
101100
Sistemas de IA
LABIC - ICMC - USP São Carlos
Aprendizado
de Máquina
Aquisição
Conhecimento
Representação
Manipulação
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
Pode ser utilizado como meio para
101100
100101
vencer um dos maiores problemas de
001001
Sistemas de IA - o gargalo da aquisição
010011
de conhecimento
010101
100111
001101
011010
101010
100100
010101
110100
101100
Aprendizado de Máquina
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101 Sub-área da Inteligência Artificial
001001
que pesquisa métodos computacionais
010011
010101
relacionados à aquisição de novos
100111
conhecimentos, novas habilidades e
001101
novas
formas
de
organizar
o
011010
101010
conhecimento já existente.
100100
010101
110100
101100
Aprendizado de Máquina

LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• um melhor entendimento dos
101100
100101
mecanismos de aprendizado humano
001001
010011
010101
• automação da aquisição do
100111
conhecimento
001101
011010
101010
100100
010101
110100
101100
Objetivos de AM
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
AM incorpora várias técnicas
de outras disciplinas
Ciência da
Computação
Ciências
Cognitivas
Reconhecimento de
Padrões
LABIC - ICMC - USP São Carlos
Aprendizado
de Máquina
Estatística
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
Modo de
001001
Aprendizado
- Supervisionado
010011
- Não
010101
Supervisionado
100111
001101
011010
101010
100100
010101
110100
101100
Sistemas de Aprendizado
de Máquina
Paradigmas de
Aprendizado
- Simbólico
- Estatístico
- Instance-Based
- Conexionista
- Genético
LABIC - ICMC - USP São Carlos
Linguagens de
Descrição
- Instâncias ou
Exemplos
- Conceitos
Aprendidos ou
Hipóteses
- Teoria de
Domínio ou
Conhecimento
de Fundo
ISISTAN-2001
Formas de
Aprendizado
- Incremental
- Não
Incremental
‹#
011010
101010
100100
010101
110100
Qualquer que seja o tipo de
101100
100101 aprendizado, é necessário uma
001001
linguagem para descrever objetos (ou
010011
possíveis eventos) e uma linguagem
010101
100111
para descrever conceitos. Em geral, é
001101
011010 possível distinguir dois tipos de
descrições para objetos:
101010
100100
010101
110100
101100
Características do
Aprendizado Indutivo
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010 1.Descrições estruturais: um objeto é descrito
100100 em termos de seus componentes e a relação
010101 entre eles
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
1010102.Descrições de atributos: um objeto é descrito
100100 em termos de suas características globais
como um vetor de valores de atributos
010101
110100
101100
100101
Cubo
001001
Número de faces
Polígono da face
010011
6
quadrado
010101
100111
001101
Pirâmide
011010
Número de faces
Polígono da face
101010
5
triângulo
100100
010101
110100
101100
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• regras se-então (if-then) para
101100
100101
representar conceitos
001001
010011
010101
100111
Se Nublado ou Chovendo
001101
011010
então Levar_Guarda-Chuva
101010
100100
010101
110100
101100
Formalismos usados em AM
para descrever conceitos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• árvores de decisão para representar
101100
100101
conceitos
001001
010011
inimigo
010101 sorri
amigo
100111
segura
001101
inimigo
011010
101010
• lógica de predicados
100100
010101
filha(X, Y) <-- mulher(X), pais(X,Y).
110100
101100
Formalismos usados em AM
para descrever conceitos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
1. Aprendizado Não Supervisionado:
100101
aprendizado por observação e
001001
descoberta.
010011
010101
100111
001101
011010
101010
2. Aprendizado Supervisionado:
100100
aprendizado por exemplos
010101
110100
101100
Aprendizado por Indução
??
?
?
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
Cada exemplo é expresso por
101100
um conjunto de features
100101
001001
010011 Exemplos
010101
100111
001101
011010
101010 Caso a ser
classificado: padrão
100100
de dados
010101
110100
101100
Aprendizado Supervisionado
LABIC - ICMC - USP São Carlos
Sistema
de
Aprendizado
Classificador
ou
Preditor
Classificador
Decisão da Classe
Associada ao Caso
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Aprendizado Supervisionado
Sistema
de
Aprendizado
Exemplos
Classificador
ou
Preditor
objetiva moldar a estrutura de classificação
para um problema específico, encontrando
uma forma genérica de relatar um conceito.
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
•• hh vista
vista como
como classificador
classificador
101100
100101
001001
010011
010101
100111
001101
• h vista como conjunto de regras
011010
101010
regra R 1
regra R
100100
regra R 2 1
regra
... R 2
010101
...
regra R i
regra R i
110100
101100
Conhecimento Adquirido
(Hipótese h)
h
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
Aprendizado Indutivo de
Conceitos - AIC
011010
101010
100100
010101
110100
Dados
101100
100101
+  - conjunto de exemplos de

=

001001
treinamento de um conceito C
010011
010101
encontrar uma hipótese H, expressa em
100111
uma linguagem de descrição L tal que:
001101
011010
101010
• cada exemplo e + é coberto por H
100100
•nenhum exemplo negativo e - é coberto
010101
110100
por H
101100
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
+ | cobre(H,e) = true}
cobre(H,

)
=
{e

001001
010011
(instância positiva)
010101
100111
001101
cobre(H,) = {e - | cobre(H,e) = false}
011010
(instância negativa)
101010
100100
010101
110100
101100
Aprendizado Indutivo de
Conceitos - AIC (Cont)
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
h consistente e completa.
110100
h consistente e incompleta.
101100
h inconsistente e completa.
100101
001001
h inconsistente e incompleta.
010011
010101
+
100111
+
001101
011010
+ +
+
101010
100100
+
+ +
010101
110100
101100
Consistência e Completeza de h
-
-
LABIC - ICMC - USP São Carlos
ISISTAN-2001
-
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
• Inteligência e Aprendizado
010101
• Engenharia de Conhecimento e SBC
100111
001101
• Dado, Informação e Conhecimento
011010
• Aprendizado de Máquina
101010
100100
• AM usando Árvores de Decisão
010101
110100
• KDD e Data Mining
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Dados sobre Crédito
Bancário
Idade
20
30
60
40
...
LABIC - ICMC - USP São Carlos
Renda
2000
5100
5000
6000
...
ISISTAN-2001
Classe
Ruim
Bom
Ruim
Bom
...
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
Renda
Idade
Ruim
Bom
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
Idade < 25
100101
Sim
Não
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
Renda
Idade
Ruim
Bom
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
Idade < 25
100101
Sim
Não
001001
14 - Ruim
010011
0 - Bom
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
Renda
Idade
Ruim
Bom
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
Renda
Idade
Ruim
Bom
ISISTAN-2001
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
29 - Ruim
010011Ruim
19 - Bom
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
8 - Ruim
001101
0 - Bom
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
011010
101010
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
10010015 - Ruim
010101 0 - Bom
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
010101
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
Renda > 5k
010101
Sim
Não
110100
101100
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
Renda > 5k
010101
Sim
Não
110100
5 - Ruim
101100
Árvore de Decisão
0 - Bom
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
Renda > 5k
010101
Sim
Não
110100
101100
Ruim
Árvore de Decisão
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
Renda > 5k
010101
Sim
Não
110100
1 - Ruim
101100
Ruim
Árvore de Decisão
LABIC - ICMC - USP São Carlos
19ISISTAN-2001
- Bom
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
Renda
110100
101100
Idade < 25
100101
Sim
Não
001001
010011Ruim
Renda > 1k
010101
Não
Sim
100111
001101
Ruim
Idade > 45
011010
101010 Sim
Não
100100 Ruim
Renda > 5k
010101
Sim
Não
110100
101100
Ruim
Árvore de Decisão
LABIC - ICMC - USP São Carlos
Bom
ISISTAN-2001
Idade
Ruim
Bom
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
LABIC - ICMC - USP São Carlos
Erro
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
LABIC - ICMC - USP São Carlos
Erro
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Principais fatores:
101100
100101
– Informação dos atributos
001001
– Adaptação do algoritmo de aprendizado
010011
010101 aos dados
100111
– Distribuição dos casos futuros
001101
– Quantidade de dados
011010
101010
100100
010101
110100
101100
Erro
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Árvore de Decisão (H1)
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
...Outra Possível H2
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
...Outra Possível H3
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
...Outra Possível H4
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Qual a Melhor H?
Não Esquecer o Erro...
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
H4...
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Erro de H4
Conjunto de Teste
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Erro de H1
Conjunto de Teste
Renda
LABIC - ICMC - USP São Carlos
Idade
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Todo algoritmo indutivo tem um bias
101100
100101
001001
• Desempenho de um algoritmo varia
010011
010101
com o domínio
100111
001101
011010
• Análise Experimental é Fundamental
101010
100100
010101
110100
101100
IMPORTANTE
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
• Inteligência e Aprendizado
010101
• Engenharia de Conhecimento e SBC
100111
001101
• Dado, Informação e Conhecimento
011010
• Aprendizado de Máquina
101010
100100
• AM usando Árvores de Decisão
010101
110100
• KDD e Data Mining
101100
Tópicos
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
• Avanço da tecnologia permitiu o
101100
100101
armazenamento deExtração
coleções
enormes
de Conhecimento
001001
de Bases de Dados
de dados
010011
010101
100111
001101
011010
101010
100100
010101
110100
101100
Data Mining
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
INTERPRETAÇÃO & AVALIAÇÃO
101100
100101
DATA MINING
001001
010011
PADRÕES
TRANSFORMAÇÃO
010101
100111
PRÉ-PROCESSAMENTO
DADO
001101
TRANSFORMADO
011010
SELEÇÃO
DADO
PROCESSADO
101010
DADO
100100
DADO
ANALISADO
010101
110100
101100
Processo de KDD
LABIC - ICMC - USP São Carlos
ISISTAN-2001
C
CONHECIMENTO
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
Muitos
001101
Exemplos
011010
101010
100100
010101
110100
101100
DM x AM
Data Mining
Aprendizado
de Máquina
Poucos
Exemplos
Poucos
Atributos
Muitos
Atributos
AM geralmente (mas não sempre)
trabalha com pequena quantidade
de dados, mas relevantes
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100
100101
001001
010011
010101
100111
Muitos
001101
Exemplos
011010
101010
100100
010101
110100
101100
DM x AM
Data Mining
Aprendizado
de Máquina
DM trabalha com grandes
Poucos
Poucos
bases
de dados reais,
sendo a
Exemplos
Atributos
eficiência muito importante
LABIC - ICMC - USP São Carlos
ISISTAN-2001
Muitos
Atributos
‹#
011010
101010
100100
010101
110100
• Pessoas diferentes vêem IA de uma
101100
100101
maneira diferente. Duas importantes
001001
questões são:
010011
010101
– Você está interessado em pensamento ou
100111 comportamento?
001101
– Você deseja modelar seres humanos ou
011010
101010 trabalhar a partir de um padrão ideal?
100100
010101
110100
101100
Considerações Finais
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
101100 “Se o cérebro [humano] fosse tão
100101
simples que pudéssemos
001001
010011 compreendê-lo, nós seríamos tão
010101simples que não o conseguiríamos.”
100111
001101
011010
101010
100100
010101
110100
101100
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
011010
101010
100100
010101
110100
Este material encontra-se
101100
disponível no site do LABIC:
100101
001001
http://labic.icmc.sc.usp.br/portugues/courses.htm
010011
010101
100111
Profa. Dra. Maria Carolina Monard
[email protected]
001101
011010
Design e Programação Visual:
101010
Marcos Roberto Geromini
100100
[email protected]
010101
110100
LABIC - ICMC - USP São Carlos
101100
LABIC - ICMC - USP São Carlos
ISISTAN-2001
‹#
Download