Presidência da RepúblicaCasa CivilSubchefia para Assuntos

Propaganda
Inteligência artificial e data mining
Resumo: Este artigo busca introduzir o conceito de Inteligência Artificial bem como
a Mineração de Dados, que é o processo de descobrir informações relevantes, como
padrões, associações, mudanças, anomalias e estruturas, em grandes quantidades
de dados armazenados em banco de dados, depósitos de dados ou outros
repositórios de informação. Devido a disponibilidade de enormes quantias de dados
em formas eletrônicas, e à necessidade iminente de extrair delas informações e
conhecimentos úteis a diversas aplicações, por exemplo na análise de mercado,
administração empresarial, apoio à decisão, etc, data mining foi popularmente
tratado como sinônimo de descoberta de conhecimento em bases de dados, apesar
de, na visão de alguns pesquisadores, ser considerado como um passo essencial da
descoberta de conhecimento.
Inteligência artificial
O termo Inteligência Artificial pode ser generalizado como a simulação da
“inteligência” humana, na realização de atividades elaboradas por pessoas, que
podem ser substituídas pelo uso dos recursos da ciência da computação e seus
respectivos algoritmos inteligentes.
A filosofia da Inteligência Artificial (IA) sempre foi o estudo das áreas do
conhecimento que eram tão pouco compreendidas, tornando-se o estudo de como
fazer os computadores realizarem coisas que no momento, as pessoas fazem
melhor. Inicialmente ela estava focalizada em tarefas formais, tais como jogos,
demonstrações de teoremas e raciocínios do senso comum. Posteriormente ela foi
utilizada com uma maior manipulação de conhecimentos, com algoritmos de
percepção (visão e fala), compreensão da linguagem natural e a solução de
problemas em domínios especializados, como diagnósticos médicos e análise
química. Atualmente a IA está sendo também utilizada em projetos na área de
engenharia, descobertas científicas, planejamento financeiro, mineração e análise
de dados para a geração de informações empresariais, sejam em Sistemas
Especialistas ou Sistemas de Informação Executivos.
O objetivo no desenvolvimento contemporâneo de sistemas de IA não é substituir
completamente a tomada de decisões humana, e sim reaplicá-la em certos tipos de
problemas bem definidos. Assim como em outros Sistemas de Informação, o
propósito maior das aplicações da IA nas empresas é auxiliar as mesmas a alcançar
as suas metas. A IA envolve o conceito de explorar um comportamento inteligente
que possui características definidas como aprender com a experiência, aplicar o
conhecimento adquirido da experiência, tratar situações complexas, resolver
problemas quando faltam informações importantes, determinar o que é importante,
ter capacidade de raciocinar e pensar, reagir rápida e corretamente a novas
situações, compreender imagens visuais, processar e manipular símbolos, ser
criativo e imaginativo e utilizar da heurística (normas práticas advindas da
experiência. Este vasto campo possui diversos componentes importantes, como
sistemas especialistas, robótica, sistemas de visão de imagens, processamento de
linguagem natural, sistemas de aprendizagem, lógica difusa, redes neurais,
algoritmos genéticos e agentes inteligentes.
A Inteligência Artificial trabalha com o conhecimento, que é um conceito que vai
além da informação. O conhecimento pode ser definido como um conjunto de
ferramentas e tecnologias (materiais e humanas) capazes de criar, buscar, guardar
e compartilhar informações específicas.
Mineração de dados (data mining)
1
O grande volume de dados disponíveis cresce a cada dia e desafia a nossa
capacidade de armazenamento, seleção e uso. Esta tecnologia com suas
ferramentas permitem a "mineração" destes dados a fim de gerar um real valor do
dado transformando-o em informação e conhecimento.
Esta tecnologia é formada por um conjunto de ferramentas que através do uso de
algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes
de explorar um grande conjunto de dados, extraindo destes conhecimentos na
forma de hipóteses e de regras. Diariamente acumulam-se diversos bancos de
dados gigantescos, verdadeiros tesouros de informação sobre vários processos e
procedimentos das mais diversas áreas. Todos estes dados podem contribuir para
novos empreendimentos e decisões importantes, sugerindo tendências e
particularidades pertinentes ao meio ambiente interno e externo da situação em
questão, visando rápida ação.
Data Mining (DM) é uma tecnologia nova e poderosa que agrega diversas áreas,
tais como aprendizado de máquina, estatística e teoria da informação. Possui a
habilidade de efetuar associações entre objetos, tais como agrupamento de
elementos similares representados por um conjunto de características em espaços
de elevada dimensão. Basicamente Mineração de Dados trata da extração de
conhecimento de grandes bases de dados com o intuito de se encontrarem
características e associações relevantes.
O problema de descoberta de conhecimentos em bancos de dados constitui na
aplicação de técnicas (ferramentas) que transformem, de maneira inteligente e
automática, os dados disponíveis em informações úteis que representem
conhecimento e possam gerar lucros para a empresa. O projeto Data Mining
envolve todas as três principais tarefas em mineração de dados: associação,
agrupamento (clusterização) e classificação de dados. Seus produtos são genéricos
e podem ser utilizados por empresas das mais diversas áreas, como financeira,
biológica, biomédica, marketing, engenharia e sistemas de informação. As
aplicações são variadas, incluindo análise de riscos, determinação de perfis de
clientes, predição, detecção de fraudes, entre muitas outras.
Diariamente as empresas acumulam diversos dados em seus bancos de dados,
tornando-os verdadeiros tesouros de informação sobre os vários processos e
procedimentos das funções da empresa, inclusive com dados e hábitos de seus
clientes, suas histórias de sucesso e fracassos. Todos estes dados podem contribuir
com a empresa, sugerindo tendências e particularidades pertinentes a ela e seu
meio ambiente interno e externo, visando uma rápida ação de seus gestores.
(FELDENS, 1999)
Com a geração de informações e conhecimentos úteis para as empresas, os seus
negócios podem dar mais lucratividade para as mesmas. Os recursos da Tecnologia
da Informação, mais precisamente a capacidade do hardware e software
disponíveis podem efetuar atividades em horas o que tradicionalmente as pessoas
levariam meses. Efetivamente o DM cumpre o papel de descoberta de
conhecimentos. (CARVALHO, 1999)
Os sistemas tradicionais de processamento de transações on-line (OLTP) das
empresas são ferramentas capazes de manipular dados de forma rápida, segura e
efetiva em bancos de dados, mas que apresentam restrições para gerar
informações com análises significativas. Estas restrições são melhores trabalhadas
quando as empresas se utilizam da tecnologia de Mineração de Dados aliada à
outras tecnologias, tais como, Knowledge Discovery in Databases (KDD), Database
Marketing e Inteligência de Negócios (business intelligence).
2
Dentre as principais técnicas comumente utilizadas no campo de data mining
destacam-se aquelas oriundas da computação inspirada na biologia, como os
algoritmos genéticos, inspirados na biologia possui como objetivo principal a
utilização de idéias extraídas dos sistemas biológicos ou naturais para a solução de
problemas de engenharia e computação.
É muito difícil existir uma solução matematicamente ótima para um problema,
porem existem soluções muito próximas da ótima, ou aceitáveis. Algoritmos
genéticos são mais facilmente aplicados em problemas com muitas variáveis e
restrições. Tais algoritmos empregam uma estratégia de busca paralela massiva e
estruturada, porém aleatória, trabalhando não apenas com uma espécie (ou seja,
uma possível solução para o problema em questão) de cada vez, mas testando e
modificando milhões de espécies em paralelo. Apesar de aleatórios, os algoritmos
genéticos efetuam caminhadas aleatórias direcionadas, que exploram informações
anteriormente aprendidas de modo a encontrar novos pontos de busca onde são
esperados melhores resultados através de processos iterativos.
Em uma grande base de dados, há muitos padrões que o usuário pode
praticamente nunca imaginar as perguntas certas para as respostas. Os Algoritmos
Genéticos aplicados na Mineração de Dados trazem uma riqueza dos padrões que
podem ser expressos e descobertos, além de proporcionam uma qualidade de
entrada no tratamento de grande volume de registro bom e um aprendizado de
regras transparente. Sua aplicação mais comum é na solução de problemas de
otimização, buscando a evolução de sistemas. Opera de forma simultânea com
várias soluções, usa operadores probabilísticos e não necessita de conhecimentos
específicos sobre o problema que tenta resolver.
Fonte
ALVES, Lúcio; FERREIRA, Arnaldo. Inteligência artificial e data mining. [S.l.: s.n.].
3
Download