Aprendizado por reforço aplicado a jogos Leandro C. Medeiros - Orientador • Alcione de Paiva Oliveira - Motivação • Interesse na área de Jogos Digitais e Inteligência Artificial • Utilidade do Aprendizado por Reforço para variados testes nos jogos onde seria inviável para um humano testar todas as possibilidades. ViZDoom • Plataforma que permite o desenvolvimento de bots usando algoritmos de aprendizado por reforço baseado apenas no buffer da tela. (“Reinforcement learning friendly”) • Apresentada na IEEE de 2016 • API’s documentadas: C++, Python e Java • Facilidade para criar cenários customizados • Cenários-padrão com exemplos. ViZDoom – Alguns exemplos “Basic Example” “Health gathering” “Defend the center” Objetivo e Método • Utilização da plataforma ViZDoom para observar o comportamento e desempenho de algoritmos de aprendizado por reforço em jogos digitais • Abordagem ainda não foi definida: • Implementar diferentes algoritmos a fim de fazer uma comparação entre eles • Utilização ou não de diferentes “modos de jogo” • Utilização do Q-Learning em uma abordagem mais aprofundada Cronograma (*) MAR ABR Estudo da linguagem Python X X Revisão da literatura X Domínio da plataforma Implementação de algoritmos Redação do artigo *Sujeito a mudanças MAI JUN JUL AGO X X X X X X SET OUT X X X X X X X X X X X X NOV X Referências - Michał Kempka, Marek Wydmuch, Grzegorz Runc, Jakub Toczek & Wojciech Jaśkowski, ViZDoom: A Doombased AI Research Platform for Visual Reinforcement Learning, IEEE Conference on Computational Intelligence and Games, pp. 341-348, Santorini, Greece, 2016 (arXiv:1605.02097) - ViZDoom website: http://vizdoom.cs.put.edu.pl/, acessado em 04/04/2017 - ViZDoom GitHub repository: https://github.com/mwydmuch/ViZDoom, acessado em 04/04/2017 - Prints dos modos de jogo retirado da conta do Youtube de uns dos criadores da plataforma: Michał Kempka , acessado em 04/04/2017 Dúvidas? Website: https://leandrocoutom.wordpress.com/