@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00240729, author = {吉村, 智陽 and 美添, 一樹 and Tomoya, Yoshimura and Kazuki, Yoshizoe}, book = {ゲームプログラミングワークショップ2024論文集}, month = {Nov}, note = {機械学習のゲームへの適用は盛んに行われているが、その中では多人数ゲーム・不完全情報ゲームの分野は発展の余地がある。本研究ではデッキ構築型であり、また用いるカードセットがプレイごとに変化する特徴を持つ Dominion を題材とする。このカードセットは数百万以上があり得るため、全てを学習対象とすると膨大な時間が必要となる。ゲームの知識を元にできるだけ多様な戦術が有効に働く少数のカードセットでモデルを訓練し、学習対象でないカードセットにおいて対戦実験を行った。モデルには LSTMを用い、 A3C をベースにした自己対戦に基づく強化学習手法により訓練した。実験の結果として少数のカードセットを適切に選択することで、学習したモデルは訓練時には使用しなかったカードセットにおいても勝率が向上した。これにより現実的な時間の学習での多様なカードセットに対して汎用的な強さを持つモデルの構築につながることが期待できる。, The application of machine learning to games is thriving. However, there is room for development in multiplayer and incomplete information games. This paper focuses on Dominion, a deck-building game that uses different card sets from play to play. Since there are more than several million possible card sets, applying machine learning to all of them would take an enormous amount of time. Based on the domain knowledge of the game we selected a small number of card sets in which various tactics are effective. Then we trained machine learning models on these card sets and measured the strength of the models on other card sets that were not included in the training environment. The models are based on LSTM and trained with a reinforcement learning method based on self-play using A3C. The experimental results show that by appropriately selecting a small number of card sets, the trained models improve their win rates even on card sets not used during training. The experimental results are promising for constructing models with generic strength for various card sets in realistic training time.}, pages = {72--79}, publisher = {情報処理学会}, title = {デッキ構築型カードゲーム Dominionにおいて多様なカードセットに対応可能な agent}, volume = {2024}, year = {2024} }