Paradigma Indutivo

Propaganda
O paradigma Indutivo
Álvaro Degas
[email protected]
O Paradigma Indutivo
• Idéia Geral
– Arrocha é baiano e faz música medíocre
– Pissirico é baiano e faz música medíocre
– Harmonia do Samba é baiano e faz música
medíocre

– Todo Baiano faz música medíocre
O Paradigma Indutivo
• Elementos do processo de KD
• Um aprendiz
– Programa
• Um conjunto de treinamento
– Dados
• Conhecimento sobre um domínio
– Regras
O Paradigma Indutivo
• Data Mining  Paradigma Indutivo
• Mais precisamente, DM PI
• Data Mining: O Conjunto de Treinamento é um
Banco de Dados
• Tipos de Classificação de Data Mining:
– Bancos de Dados – Relacional, Orientado a Objetos,
Web etc.
– Conhecimentos – Associativos, Classificativos,
Agrupadores, etc.
– Técnicas – Redes Neurais, Apriori, ID3, etc.
Tipos de Conhecimento Indutivo
• Regras de Classificação
• Agrupamento
• Regras de Associação
• Seqüências
• Etc...
Supervisão
• Métodos de Data Mining podem ser
supervisionados ou não
• Aprendizagem supervisionada
– O Aprendiz recebe informações a respeito do
domínio onde vai se dar o processo (classes)
• Aprendizagem não-supervisionada
– Cabe ao aprendiz descobrir as informações no
domínio onde vai se dar o processo (classes)
O Paradigma Indutivo
• Pode-se adquirir conhecimento espúrio em
decorrência do processo indutivo
• A expressão “induzir ao erro”
• Exemplos (reais):
– Se idade < 10 então diagnóstico=“Vaginite”
• Amostra mal-construída
– Se Sistema Operacional = “Linux” então
SGBD=“Sql Server”
• Dados mal-preparados
Formem suas equipes!
Total de 4 times
Cada time pega um tipo de
conhecimento e um dos
algoritmos associados
Mostrar: o tipo de conhecimento,
o funcionamento do algoritmo e
uma implementação funcional
Regras de Classificação
Agrupamento
Regras de Associação
Seqüências
Aplicações
•
•
•
•
•
•
•
Padrões de Comportamento de Clientes
Auxílio a especialistas
Prevenção e auditoria de fraudes
Meteorologia
Geologia
Marketing direto
Planejamento de sistemas de informações
distribuídas
• etc
Ética e Aprendizado Automático
• Ética
– “1. Estudos dos juízos de apreciação referentes à
conduta humana, do ponto de vista do bem e do mal. 2.
Conjuntos de normas e princípios que norteiam a boa
conduta do ser humano” Aurélio
• Bem e Mal?
– “Bem: Qualidade atribuída a ações e obras que lhes
confere um caráter moral. (...) Mal: (...) Antônimo de
bem” Aurélio
Ética e Aprendizado Automático
• Muitas questões éticas surgem no uso prático de
ferramentas desta natureza!
– De modo geral é a mesma ética que se impõe ao
profissional de TI mas...
• Data Mining é usado, em última análise, para
discriminar
– Uma aplicação de empréstimo que use sexo, religião,
raça, preferência sexual como determinantes
– Uma fábrica de produtos de consumo pede a seleção de
padrões de consumidores que não reinvindicam seus
direitos
Ética e Aprendizado Automático
• A ética é algo cultural e extremamente
contextualizado
– Informações positivas de exames em aplicações
médicas
• Atributos podem conter informações
problemáticas – “disfarçando” a
discriminação
– Bairro pode ser correlacionado com raça
Ética e Aprendizado Automático
• Questões cruciais:
– A quem é dado o acesso aos dados?
– Com que propósito houve a coleta de dados?
– Quais as conclusões são (ou não são) legítimas
sob o ponto de vista ético de serem extraídas
dali?
Ética e Aprendizado Automático
• Pode-se interpretar os resultados
– Se raça=“Negro” então mau-pagador=True
(C=0.5)
– Isso significa que é potencialmente um mau
negócio emprestar a negros?
– Se religião=“Umbanda” e
Música_Preferida=“Samba” então QI<100
– É razoável crer nesta correlação?
Ética e Aprendizado Automático
• Argumentos puramente estatísticos nunca
são suficientes
– Interpretar e contextualizar
– Validar semanticamente resultados
• Os recursos e os resultados servem a um
bom propósito?
– Militar, Questões científicas polêmicas
(clonagem, células-tronco, transgenia), etc.
Conclusões
• O paradigma indutivo, embora passivo de
erro é uma ferramenta cada vez mais
importante
• Há vários tipos de conhecimento - um
estudo para cada caso
Conclusões
• Os métodos são devoradores de recursos
computacionais
• Há muita pesquisa na área
• A última palavra ainda não foi dada
Paradigma Indutivo
FIM!
Escher
“Deixadas a si mesmas, as coisas irão de mal a pior. A
natureza conspira pela falha. Posto que a natureza é canalha,
para algo dar certo é preciso deixar de fazer por onde”
Lei de Murphy aplicada à Metafísica
Download