ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. ゲームプログラミングワークショップ(GPWS)
  4. 2022

2048へのMC Softmax探索の適用

https://ipsj.ixsq.nii.ac.jp/records/222023
https://ipsj.ixsq.nii.ac.jp/records/222023
499cf529-971d-482c-b3be-c01df3874dfc
名前 / ファイル ライセンス アクション
IPSJ-GPWS2022040.pdf IPSJ-GPWS2022040.pdf (1.4 MB)
Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2022-11-04
タイトル
タイトル 2048へのMC Softmax探索の適用
タイトル
言語 en
タイトル Adaption of MC Softmax Search for 2048
言語
言語 jpn
キーワード
主題Scheme Other
主題 ゲーム「2048」
キーワード
主題Scheme Other
主題 MC Softmax探索
キーワード
主題Scheme Other
主題 強化学習
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
高知工科大学大学院工学研究科
著者所属
高知工科大学情報学群
著者所属(英)
en
Graduate School of Engineering, Kochi University of Technology
著者所属(英)
en
School of Information, Kochi University of Technology
著者名 渡邊, 翔太

× 渡邊, 翔太

渡邊, 翔太

Search repository
松崎, 公紀

× 松崎, 公紀

松崎, 公紀

Search repository
著者名(英) Shota, Watanabe

× Shota, Watanabe

en Shota, Watanabe

Search repository
Kiminori, Matsuzaki

× Kiminori, Matsuzaki

en Kiminori, Matsuzaki

Search repository
論文抄録
内容記述タイプ Other
内容記述 MC Softmax 探索は,評価関数を併用するモンテカルロ木探索の一種である.本研究では,MC Softmax 探索と強化学習を用いて,確率的一人ゲーム2048 のコンピュータプレイヤを作成する.評価関数には,既存の畳み込みニューラルネットワークを用いる.まず,ランダム性を固定した複数の木に対してMC Softmax 探索を適用するアルゴリズムを設計し,木の数を変更して実験を行った.実験の結果,最も優れたプレイヤは平均スコア48 008 を達成した.次に,chance ノードを含む木に対してMC Softmax 探索を適用するアルゴリズムを設計し,いくつかの学習方法について実験を行った.これらの実験から,探索結果の木の値を直接学習すると,それにより得られる評価関数の返り値が無限大に発散してしまう問題が生じた.
論文抄録(英)
内容記述タイプ Other
内容記述 MC Softmax search is a Monte-Carlo Tree Search algorithm that uses an evaluation function. In this study, we develop a computer player for a stochastic single-player game 2048 based on reinforcement learning methods and MC Softmax search. We use an existing convolutional neural network for the evaluation function. Firstly, we developed an algorithm that applied MC Softmax search to multiple trees without randomness and conducted experiments by changing the number of trees. The best player achieved an average score of 48 008. Secondly, we developed an algorithm that applied MC Softmax search to a single tree with chance nodes and conducted experiments with several learning methods. The experiment results, however, showed an issue that the direct learning of values from search outcomes would result in evaluation functions returning infinitely large values.
書誌情報 ゲームプログラミングワークショップ2022論文集

巻 2022, p. 255-260, 発行日 2022-11-04
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 13:54:36.546078
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3