O paradigma Indutivo Álvaro Degas [email protected] O Paradigma Indutivo • Idéia Geral – Arrocha é baiano e faz música medíocre – Pissirico é baiano e faz música medíocre – Harmonia do Samba é baiano e faz música medíocre – Todo Baiano faz música medíocre O Paradigma Indutivo • Elementos do processo de KD • Um aprendiz – Programa • Um conjunto de treinamento – Dados • Conhecimento sobre um domínio – Regras O Paradigma Indutivo • Data Mining Paradigma Indutivo • Mais precisamente, DM PI • Data Mining: O Conjunto de Treinamento é um Banco de Dados • Tipos de Classificação de Data Mining: – Bancos de Dados – Relacional, Orientado a Objetos, Web etc. – Conhecimentos – Associativos, Classificativos, Agrupadores, etc. – Técnicas – Redes Neurais, Apriori, ID3, etc. Tipos de Conhecimento Indutivo • Regras de Classificação • Agrupamento • Regras de Associação • Seqüências • Etc... Supervisão • Métodos de Data Mining podem ser supervisionados ou não • Aprendizagem supervisionada – O Aprendiz recebe informações a respeito do domínio onde vai se dar o processo (classes) • Aprendizagem não-supervisionada – Cabe ao aprendiz descobrir as informações no domínio onde vai se dar o processo (classes) O Paradigma Indutivo • Pode-se adquirir conhecimento espúrio em decorrência do processo indutivo • A expressão “induzir ao erro” • Exemplos (reais): – Se idade < 10 então diagnóstico=“Vaginite” • Amostra mal-construída – Se Sistema Operacional = “Linux” então SGBD=“Sql Server” • Dados mal-preparados Formem suas equipes! Total de 4 times Cada time pega um tipo de conhecimento e um dos algoritmos associados Mostrar: o tipo de conhecimento, o funcionamento do algoritmo e uma implementação funcional Regras de Classificação Agrupamento Regras de Associação Seqüências Aplicações • • • • • • • Padrões de Comportamento de Clientes Auxílio a especialistas Prevenção e auditoria de fraudes Meteorologia Geologia Marketing direto Planejamento de sistemas de informações distribuídas • etc Ética e Aprendizado Automático • Ética – “1. Estudos dos juízos de apreciação referentes à conduta humana, do ponto de vista do bem e do mal. 2. Conjuntos de normas e princípios que norteiam a boa conduta do ser humano” Aurélio • Bem e Mal? – “Bem: Qualidade atribuída a ações e obras que lhes confere um caráter moral. (...) Mal: (...) Antônimo de bem” Aurélio Ética e Aprendizado Automático • Muitas questões éticas surgem no uso prático de ferramentas desta natureza! – De modo geral é a mesma ética que se impõe ao profissional de TI mas... • Data Mining é usado, em última análise, para discriminar – Uma aplicação de empréstimo que use sexo, religião, raça, preferência sexual como determinantes – Uma fábrica de produtos de consumo pede a seleção de padrões de consumidores que não reinvindicam seus direitos Ética e Aprendizado Automático • A ética é algo cultural e extremamente contextualizado – Informações positivas de exames em aplicações médicas • Atributos podem conter informações problemáticas – “disfarçando” a discriminação – Bairro pode ser correlacionado com raça Ética e Aprendizado Automático • Questões cruciais: – A quem é dado o acesso aos dados? – Com que propósito houve a coleta de dados? – Quais as conclusões são (ou não são) legítimas sob o ponto de vista ético de serem extraídas dali? Ética e Aprendizado Automático • Pode-se interpretar os resultados – Se raça=“Negro” então mau-pagador=True (C=0.5) – Isso significa que é potencialmente um mau negócio emprestar a negros? – Se religião=“Umbanda” e Música_Preferida=“Samba” então QI<100 – É razoável crer nesta correlação? Ética e Aprendizado Automático • Argumentos puramente estatísticos nunca são suficientes – Interpretar e contextualizar – Validar semanticamente resultados • Os recursos e os resultados servem a um bom propósito? – Militar, Questões científicas polêmicas (clonagem, células-tronco, transgenia), etc. Conclusões • O paradigma indutivo, embora passivo de erro é uma ferramenta cada vez mais importante • Há vários tipos de conhecimento - um estudo para cada caso Conclusões • Os métodos são devoradores de recursos computacionais • Há muita pesquisa na área • A última palavra ainda não foi dada Paradigma Indutivo FIM! Escher “Deixadas a si mesmas, as coisas irão de mal a pior. A natureza conspira pela falha. Posto que a natureza é canalha, para algo dar certo é preciso deixar de fazer por onde” Lei de Murphy aplicada à Metafísica