Inteligência artificial e data mining Resumo: Este artigo busca introduzir o conceito de Inteligência Artificial bem como a Mineração de Dados, que é o processo de descobrir informações relevantes, como padrões, associações, mudanças, anomalias e estruturas, em grandes quantidades de dados armazenados em banco de dados, depósitos de dados ou outros repositórios de informação. Devido a disponibilidade de enormes quantias de dados em formas eletrônicas, e à necessidade iminente de extrair delas informações e conhecimentos úteis a diversas aplicações, por exemplo na análise de mercado, administração empresarial, apoio à decisão, etc, data mining foi popularmente tratado como sinônimo de descoberta de conhecimento em bases de dados, apesar de, na visão de alguns pesquisadores, ser considerado como um passo essencial da descoberta de conhecimento. Inteligência artificial O termo Inteligência Artificial pode ser generalizado como a simulação da “inteligência” humana, na realização de atividades elaboradas por pessoas, que podem ser substituídas pelo uso dos recursos da ciência da computação e seus respectivos algoritmos inteligentes. A filosofia da Inteligência Artificial (IA) sempre foi o estudo das áreas do conhecimento que eram tão pouco compreendidas, tornando-se o estudo de como fazer os computadores realizarem coisas que no momento, as pessoas fazem melhor. Inicialmente ela estava focalizada em tarefas formais, tais como jogos, demonstrações de teoremas e raciocínios do senso comum. Posteriormente ela foi utilizada com uma maior manipulação de conhecimentos, com algoritmos de percepção (visão e fala), compreensão da linguagem natural e a solução de problemas em domínios especializados, como diagnósticos médicos e análise química. Atualmente a IA está sendo também utilizada em projetos na área de engenharia, descobertas científicas, planejamento financeiro, mineração e análise de dados para a geração de informações empresariais, sejam em Sistemas Especialistas ou Sistemas de Informação Executivos. O objetivo no desenvolvimento contemporâneo de sistemas de IA não é substituir completamente a tomada de decisões humana, e sim reaplicá-la em certos tipos de problemas bem definidos. Assim como em outros Sistemas de Informação, o propósito maior das aplicações da IA nas empresas é auxiliar as mesmas a alcançar as suas metas. A IA envolve o conceito de explorar um comportamento inteligente que possui características definidas como aprender com a experiência, aplicar o conhecimento adquirido da experiência, tratar situações complexas, resolver problemas quando faltam informações importantes, determinar o que é importante, ter capacidade de raciocinar e pensar, reagir rápida e corretamente a novas situações, compreender imagens visuais, processar e manipular símbolos, ser criativo e imaginativo e utilizar da heurística (normas práticas advindas da experiência. Este vasto campo possui diversos componentes importantes, como sistemas especialistas, robótica, sistemas de visão de imagens, processamento de linguagem natural, sistemas de aprendizagem, lógica difusa, redes neurais, algoritmos genéticos e agentes inteligentes. A Inteligência Artificial trabalha com o conhecimento, que é um conceito que vai além da informação. O conhecimento pode ser definido como um conjunto de ferramentas e tecnologias (materiais e humanas) capazes de criar, buscar, guardar e compartilhar informações específicas. Mineração de dados (data mining) 1 O grande volume de dados disponíveis cresce a cada dia e desafia a nossa capacidade de armazenamento, seleção e uso. Esta tecnologia com suas ferramentas permitem a "mineração" destes dados a fim de gerar um real valor do dado transformando-o em informação e conhecimento. Esta tecnologia é formada por um conjunto de ferramentas que através do uso de algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes de explorar um grande conjunto de dados, extraindo destes conhecimentos na forma de hipóteses e de regras. Diariamente acumulam-se diversos bancos de dados gigantescos, verdadeiros tesouros de informação sobre vários processos e procedimentos das mais diversas áreas. Todos estes dados podem contribuir para novos empreendimentos e decisões importantes, sugerindo tendências e particularidades pertinentes ao meio ambiente interno e externo da situação em questão, visando rápida ação. Data Mining (DM) é uma tecnologia nova e poderosa que agrega diversas áreas, tais como aprendizado de máquina, estatística e teoria da informação. Possui a habilidade de efetuar associações entre objetos, tais como agrupamento de elementos similares representados por um conjunto de características em espaços de elevada dimensão. Basicamente Mineração de Dados trata da extração de conhecimento de grandes bases de dados com o intuito de se encontrarem características e associações relevantes. O problema de descoberta de conhecimentos em bancos de dados constitui na aplicação de técnicas (ferramentas) que transformem, de maneira inteligente e automática, os dados disponíveis em informações úteis que representem conhecimento e possam gerar lucros para a empresa. O projeto Data Mining envolve todas as três principais tarefas em mineração de dados: associação, agrupamento (clusterização) e classificação de dados. Seus produtos são genéricos e podem ser utilizados por empresas das mais diversas áreas, como financeira, biológica, biomédica, marketing, engenharia e sistemas de informação. As aplicações são variadas, incluindo análise de riscos, determinação de perfis de clientes, predição, detecção de fraudes, entre muitas outras. Diariamente as empresas acumulam diversos dados em seus bancos de dados, tornando-os verdadeiros tesouros de informação sobre os vários processos e procedimentos das funções da empresa, inclusive com dados e hábitos de seus clientes, suas histórias de sucesso e fracassos. Todos estes dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela e seu meio ambiente interno e externo, visando uma rápida ação de seus gestores. (FELDENS, 1999) Com a geração de informações e conhecimentos úteis para as empresas, os seus negócios podem dar mais lucratividade para as mesmas. Os recursos da Tecnologia da Informação, mais precisamente a capacidade do hardware e software disponíveis podem efetuar atividades em horas o que tradicionalmente as pessoas levariam meses. Efetivamente o DM cumpre o papel de descoberta de conhecimentos. (CARVALHO, 1999) Os sistemas tradicionais de processamento de transações on-line (OLTP) das empresas são ferramentas capazes de manipular dados de forma rápida, segura e efetiva em bancos de dados, mas que apresentam restrições para gerar informações com análises significativas. Estas restrições são melhores trabalhadas quando as empresas se utilizam da tecnologia de Mineração de Dados aliada à outras tecnologias, tais como, Knowledge Discovery in Databases (KDD), Database Marketing e Inteligência de Negócios (business intelligence). 2 Dentre as principais técnicas comumente utilizadas no campo de data mining destacam-se aquelas oriundas da computação inspirada na biologia, como os algoritmos genéticos, inspirados na biologia possui como objetivo principal a utilização de idéias extraídas dos sistemas biológicos ou naturais para a solução de problemas de engenharia e computação. É muito difícil existir uma solução matematicamente ótima para um problema, porem existem soluções muito próximas da ótima, ou aceitáveis. Algoritmos genéticos são mais facilmente aplicados em problemas com muitas variáveis e restrições. Tais algoritmos empregam uma estratégia de busca paralela massiva e estruturada, porém aleatória, trabalhando não apenas com uma espécie (ou seja, uma possível solução para o problema em questão) de cada vez, mas testando e modificando milhões de espécies em paralelo. Apesar de aleatórios, os algoritmos genéticos efetuam caminhadas aleatórias direcionadas, que exploram informações anteriormente aprendidas de modo a encontrar novos pontos de busca onde são esperados melhores resultados através de processos iterativos. Em uma grande base de dados, há muitos padrões que o usuário pode praticamente nunca imaginar as perguntas certas para as respostas. Os Algoritmos Genéticos aplicados na Mineração de Dados trazem uma riqueza dos padrões que podem ser expressos e descobertos, além de proporcionam uma qualidade de entrada no tratamento de grande volume de registro bom e um aprendizado de regras transparente. Sua aplicação mais comum é na solução de problemas de otimização, buscando a evolução de sistemas. Opera de forma simultânea com várias soluções, usa operadores probabilísticos e não necessita de conhecimentos específicos sobre o problema que tenta resolver. Fonte ALVES, Lúcio; FERREIRA, Arnaldo. Inteligência artificial e data mining. [S.l.: s.n.]. 3