AlphaZero como ferramenta de playtest

Celso Gabriel Dutra Almeida Malosto; Igor de Oliveira Knop; Luciana Conceição Dias Campos

doi:10.5902/2448190485269

Autores

Celso Gabriel Dutra Almeida Malosto Universidade Federal de Juiz de Fora https://orcid.org/0000-0001-7448-8043
Igor de Oliveira Knop Universidade Federal de Juiz de Fora https://orcid.org/0000-0001-5647-8829
Luciana Conceição Dias Campos Universidade Federal de Juiz de Fora https://orcid.org/0000-0003-1025-6360

DOI:

https://doi.org/10.5902/2448190485269

Palavras-chave:

Jogos de tabuleiro, Rede neural, Teste de software, Aprendizado de máquina

Resumo

O mercado de jogos de mesa tem mantido acelerado crescimento nos
últimos anos e já atinge as dezenas de bilhões de dólares. O balanceamento
desses jogos é uma demanda de mercado e é uma disciplina difı́cil, que exige
uma grande habilidade analı́tica por parte do game designer. Essa habilidade é
construı́da com a condução e observação de centenas de partidas em grupos de
teste, em um processo propenso a erro, devido à grande dificuldade em encon-
trar pessoas dispostas a jogar protótipos repetidamente, apenas com pequenas
iterações nas regras. Adicionalmente, nem todo game designer mantém um re-
gistro completo dos testes e consegue lidar com as relações de causa e efeito
que pequenas mudanças nas regras causam nos resultados. Este trabalho in-
vestiga o AlphaZero, como técnica de inteligência computacional para aliviar
a demanda por jogadores humanos no processo de criação e testes de jogos.
Enquanto os trabalhos na área buscam um agente mais eficiente, este aplica o
algoritmo para gerar um conjunto de dados para auxiliar o game designer a
encontrar pontos de desequilı́brio e explorar a criatividade. No atual estágio,
uma versão do AlphaZero é implementada para realizar o autotreinamento. Por
fim, são discutidos pontos nos quais o método pode auxiliar o processo de game
design utilizando os dados gerados pelo algoritmo durante o treinamento.

Downloads

Não há dados estatísticos.

Biografia do Autor

Celso Gabriel Dutra Almeida Malosto, Universidade Federal de Juiz de Fora

Celso Gabriel Dutra Almeida Malosto é estudante de Sistemas de Informação na Universidade Federal de Juiz de Fora. Membro do Grupo de Educação Tutorial em Sistemas de informação, trabalha com desenvolvimento tecnológico para a Web, em soluções que envolvem gestão de dados, modelagem computacional, e aprendizado de máquina.

Igor de Oliveira Knop, Universidade Federal de Juiz de Fora

Possui graduação em Engenharia Elétrica (2005), mestrado e doutorado em Modelagem Computacional (2009 e 2016) pela Universidade Federal de Juiz de Fora. Atualmente é professor adjunto da Universidade Federal de Juiz de Fora. Tem experiência na área de Ciência da Computação, com ênfase em Modelos Analíticos e de Simulação, atuando principalmente nos seguintes temas: desenvolvimento de software, desenvolvimento de jogos, software livre, modelagem computacional e tecnologias para web.

Luciana Conceição Dias Campos, Universidade Federal de Juiz de Fora

Possui graduação em Informática Bacharelado em Informática pela Universidade Federal de Juiz de Fora (2000) , mestrado em Engenharia de Sistemas e Computação (COPPE) pela Universidade Federal do Rio de Janeiro (2003) e doutorado em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (2010), com ênfase em Inteligência Computacional Aplicada. Atualmente é professora do Departamento de Ciência da Computação da Universidade Federal de Juiz de Fora. Atua na área de Ciência da Computação, com ênfase em Inteligência Computacional, especialmente em Redes Neurais, Inteligência de Colônias Artificiais e Algoritmos Genéticos. Atuou como Coordenadora do Curso de Sistemas de Informação da UFJF de 2014 até 2020.

Referências

BECKER, A.; GÖRLICH, D. What is Game Balancing? - An Examination of Concepts. ParadigmPlus, v. 1, n. 1, p. 22–41, abr. 2020. ISSN 2711-4627. DOI: https://doi.org/10.55969/paradigmplus.v1n1a2

BOARDGAMEGEEK. SPIEL’22 Preview. 2022. Disponı́vel em: ⟨https://boardgamegeek.com/geekpreview/55/spiel-22-preview?sort=hot⟩. Acesso em: 7 Setembro de 2023.

BOARDGAMEGEEK. 2023. Disponı́vel em: ⟨https://boardgamegeek.com/⟩. Acesso em: 7 Setembro de 2023.

BRITANNICA, T. E. of E. Go. 2023. [Online; acesso em 3 setembro 2023]. Disponı́vel em: ⟨https://www.britannica.com/topic/go-game⟩.

COULOM, R. Efficient selectivity and backup operators in monte-carlo tree search. In: SPRINGER. International conference on computers and games. [S.l.], 2006. p. 72–83. DOI: https://doi.org/10.1007/978-3-540-75538-8_7

FöRSTER, R. AlphaZero from Scratch. 2023. [Online; acesso em 12 setembro 2023]. Disponı́vel em: ⟨https://github.com/foersterrobert/AlphaZeroFromScratch⟩.

HE, K. et al. Deep residual learning for image recognition. 2015. DOI: https://doi.org/10.1109/CVPR.2016.90

KOCSIS, L.; SZEPESVÁRI, C. Bandit based monte-carlo planning. In: SPRINGER. European conference on machine learning. [S.l.], 2006. p. 282–293. DOI: https://doi.org/10.1007/11871842_29

MARCELO, A.; PESCUITE, J. Design de jogos: Fundamentos. [S.l.: s.n.], 2009.

ROMERO, B.; SCHREIBER, I. Game Balance. 1st edition. ed. Boca Raton: CRC Press, 2021. ISBN 978-1-4987-9957-7 978-1-03-203400-3.

SILVER, D. et al. Mastering the game of Go with deep neural networks and tree search. Nature, v. 529, n. 7587, p. 484–489, jan. 2016. ISSN 0028-0836, 1476-4687. DOI: https://doi.org/10.1038/nature16961

SILVER, D. et al. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. 2017. Disponı́vel em: ⟨https://doi.org/10.48550/arXiv.1712.01815⟩.

SILVER, D. et al. A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play. Science, v. 362, n. 6419, p. 1140–1144, dez. 2018. ISSN 0036-8075, 1095-9203. DOI: https://doi.org/10.1126/science.aar6404

ŚWIECHOWSKI, M. et al. Monte carlo tree search: a review of recent modifications and applications. Artificial Intelligence Review, Springer Science and Business Media LLC, v. 56, n. 3, p. 2497–2562, jul 2022. Disponı́vel em: ⟨https://doi.org/10.1007% 2Fs10462-022-10228-y⟩. DOI: https://doi.org/10.1007/s10462-022-10228-y

TENSORFLOW, G. Get started with TensorFlow.js. 2023? [Online; acesso em 4 setembro 2023]. Disponı́vel em: ⟨https://www.tensorflow.org/js/tutorials⟩.

TEUBER, K. Colonizadores de Catan. 1995.

TRZEWICZEK, I. I play-tested it 100 times. [S.l.], 2017.

WOODS, S. Eurogames: The design, culture and play of modern European board games. [S.l.]: McFarland, 2012.

AlphaZero como ferramenta de playtest

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Biografia do Autor

Celso Gabriel Dutra Almeida Malosto, Universidade Federal de Juiz de Fora

Igor de Oliveira Knop, Universidade Federal de Juiz de Fora

Luciana Conceição Dias Campos, Universidade Federal de Juiz de Fora

Referências

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Artigos mais lidos pelo mesmo(s) autor(es)

Publicado por

Enviar Submissão

Sobre a Revista

clustrmaps

Idioma

Edição Atual