AlphaZero as a playtest tool

Authors

DOI:

https://doi.org/10.5902/2448190485269

Keywords:

Software testing, Tabletop games, Machine learning, Neural network

Abstract

The tabletop gaming market has maintained rapid growth in recent
years, reaching tens of billions of dollars. Balancing these games is a market
demand and a challenging discipline that requires significant analytical skill
from the game designer. This skill is built through the conduct and observation of
hundreds of playtests in test groups, in a error-prone process, due to the difficulty
in finding individuals willing to play prototypes repeatedly, with only minor rule
iterations. Additionally, not every game designer keeps a complete record of the
tests and can handle the cause-and-effect relationships that small rule changes
have on the outcomes. This work investigates AlphaZero as a computational
intelligence technique to alleviate the demand for human players in the game
creation and testing process. While existing research in the field seeks a more
efficient agent, this study applies the algorithm to generate a dataset to help
the game designer identify points of imbalance and explore creativity. At the
current stage, a version of AlphaZero is implemented for self-training. Finally,
we discuss areas in which the method can assist the game design process using
the data generated by the algorithm during training.

Downloads

Download data is not yet available.

Author Biographies

Celso Gabriel Dutra Almeida Malosto, Universidade Federal de Juiz de Fora

Celso Gabriel Dutra Almeida Malosto é estudante de Sistemas de Informação na Universidade Federal de Juiz de Fora. Membro do Grupo de Educação Tutorial em Sistemas de informação, trabalha com desenvolvimento tecnológico para a Web, em soluções que envolvem gestão de dados, modelagem computacional, e aprendizado de máquina.

Igor de Oliveira Knop, Universidade Federal de Juiz de Fora

Possui graduação em Engenharia Elétrica (2005), mestrado e doutorado em Modelagem Computacional (2009 e 2016) pela Universidade Federal de Juiz de Fora. Atualmente é professor adjunto da Universidade Federal de Juiz de Fora. Tem experiência na área de Ciência da Computação, com ênfase em Modelos Analíticos e de Simulação, atuando principalmente nos seguintes temas: desenvolvimento de software, desenvolvimento de jogos, software livre, modelagem computacional e tecnologias para web.

Luciana Conceição Dias Campos, Universidade Federal de Juiz de Fora

Possui graduação em Informática Bacharelado em Informática pela Universidade Federal de Juiz de Fora (2000) , mestrado em Engenharia de Sistemas e Computação (COPPE) pela Universidade Federal do Rio de Janeiro (2003) e doutorado em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (2010), com ênfase em Inteligência Computacional Aplicada. Atualmente é professora do Departamento de Ciência da Computação da Universidade Federal de Juiz de Fora. Atua na área de Ciência da Computação, com ênfase em Inteligência Computacional, especialmente em Redes Neurais, Inteligência de Colônias Artificiais e Algoritmos Genéticos. Atuou como Coordenadora do Curso de Sistemas de Informação da UFJF de 2014 até 2020.

References

BECKER, A.; GÖRLICH, D. What is Game Balancing? - An Examination of Concepts. ParadigmPlus, v. 1, n. 1, p. 22–41, abr. 2020. ISSN 2711-4627.

BOARDGAMEGEEK. SPIEL’22 Preview. 2022. Disponı́vel em: ⟨https://boardgamegeek.com/geekpreview/55/spiel-22-preview?sort=hot⟩. Acesso em: 7 Setembro de 2023.

BOARDGAMEGEEK. 2023. Disponı́vel em: ⟨https://boardgamegeek.com/⟩. Acesso em: 7 Setembro de 2023.

BRITANNICA, T. E. of E. Go. 2023. [Online; acesso em 3 setembro 2023]. Disponı́vel em: ⟨https://www.britannica.com/topic/go-game⟩.

COULOM, R. Efficient selectivity and backup operators in monte-carlo tree search. In: SPRINGER. International conference on computers and games. [S.l.], 2006. p. 72–83.

FöRSTER, R. AlphaZero from Scratch. 2023. [Online; acesso em 12 setembro 2023]. Disponı́vel em: ⟨https://github.com/foersterrobert/AlphaZeroFromScratch⟩.

HE, K. et al. Deep residual learning for image recognition. 2015.

KOCSIS, L.; SZEPESVÁRI, C. Bandit based monte-carlo planning. In: SPRINGER. European conference on machine learning. [S.l.], 2006. p. 282–293.

MARCELO, A.; PESCUITE, J. Design de jogos: Fundamentos. [S.l.: s.n.], 2009.

ROMERO, B.; SCHREIBER, I. Game Balance. 1st edition. ed. Boca Raton: CRC Press, 2021. ISBN 978-1-4987-9957-7 978-1-03-203400-3.

SILVER, D. et al. Mastering the game of Go with deep neural networks and tree search. Nature, v. 529, n. 7587, p. 484–489, jan. 2016. ISSN 0028-0836, 1476-4687.

SILVER, D. et al. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. 2017. Disponı́vel em: ⟨https://doi.org/10.48550/arXiv.1712.01815⟩.

SILVER, D. et al. A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play. Science, v. 362, n. 6419, p. 1140–1144, dez. 2018. ISSN 0036-8075, 1095-9203.

ŚWIECHOWSKI, M. et al. Monte carlo tree search: a review of recent modifications and applications. Artificial Intelligence Review, Springer Science and Business Media LLC, v. 56, n. 3, p. 2497–2562, jul 2022. Disponı́vel em: ⟨https://doi.org/10.1007% 2Fs10462-022-10228-y⟩.

TENSORFLOW, G. Get started with TensorFlow.js. 2023? [Online; acesso em 4 setembro 2023]. Disponı́vel em: ⟨https://www.tensorflow.org/js/tutorials⟩.

TEUBER, K. Colonizadores de Catan. 1995.

TRZEWICZEK, I. I play-tested it 100 times. [S.l.], 2017.

WOODS, S. Eurogames: The design, culture and play of modern European board games. [S.l.]: McFarland, 2012.

Published

2023-12-02

How to Cite

Malosto, C. G. D. A., Knop, I. de O., & Campos, L. C. D. (2023). AlphaZero as a playtest tool. Revista ComInG - Communications and Innovations Gazette, 7(1), 39–50. https://doi.org/10.5902/2448190485269