ViZDoom - WordPress.com

Propaganda
Aprendizado por reforço aplicado a jogos
Leandro C. Medeiros
- Orientador
• Alcione de Paiva Oliveira
- Motivação
• Interesse na área de Jogos Digitais e Inteligência Artificial
• Utilidade do Aprendizado por Reforço para variados testes
nos jogos onde seria inviável para um humano testar todas
as possibilidades.
ViZDoom
• Plataforma que permite o desenvolvimento de bots usando algoritmos
de aprendizado por reforço baseado apenas no buffer da tela.
(“Reinforcement learning friendly”)
• Apresentada na IEEE de 2016
• API’s documentadas: C++, Python e Java
• Facilidade para criar cenários customizados
• Cenários-padrão com exemplos.
ViZDoom – Alguns exemplos
“Basic Example”
“Health gathering”
“Defend the center”
Objetivo e Método
• Utilização da plataforma ViZDoom para observar o comportamento e
desempenho de algoritmos de aprendizado por reforço em jogos
digitais
• Abordagem ainda não foi definida:
• Implementar diferentes algoritmos a fim de fazer uma comparação entre eles
• Utilização ou não de diferentes “modos de jogo”
• Utilização do Q-Learning em uma abordagem mais aprofundada
Cronograma (*)
MAR
ABR
Estudo da linguagem Python
X
X
Revisão da literatura
X
Domínio da plataforma
Implementação de algoritmos
Redação do artigo
*Sujeito a mudanças
MAI
JUN
JUL
AGO
X
X
X
X
X
X
SET
OUT
X
X
X
X
X
X
X
X
X
X
X
X
NOV
X
Referências
- Michał Kempka, Marek Wydmuch, Grzegorz Runc, Jakub Toczek & Wojciech Jaśkowski, ViZDoom: A Doombased AI Research Platform for Visual Reinforcement Learning, IEEE Conference on Computational
Intelligence and Games, pp. 341-348, Santorini, Greece, 2016 (arXiv:1605.02097)
- ViZDoom website: http://vizdoom.cs.put.edu.pl/, acessado em 04/04/2017
- ViZDoom GitHub repository: https://github.com/mwydmuch/ViZDoom, acessado em 04/04/2017
- Prints dos modos de jogo retirado da conta do Youtube de uns dos criadores da plataforma: Michał Kempka ,
acessado em 04/04/2017
Dúvidas?
Website: https://leandrocoutom.wordpress.com/
Download