ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ゲーム情報学(GI)
  3. 2024
  4. 2024-GI-51

ローグライクゲームの強化学習を目標とする,行動の事前学習手法の評価

https://ipsj.ixsq.nii.ac.jp/records/232911
https://ipsj.ixsq.nii.ac.jp/records/232911
45fb5190-b890-43fb-8984-290cb30c37a5
名前 / ファイル ライセンス アクション
IPSJ-GI24051023.pdf IPSJ-GI24051023.pdf (1.2 MB)
 2026年3月1日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, GI:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-03-01
タイトル
タイトル ローグライクゲームの強化学習を目標とする,行動の事前学習手法の評価
タイトル
言語 en
タイトル Utilizing play-logs of a heuristic player to learn long-term strategies in a Rogue-like game
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
明治大学大学院
著者所属
明治大学大学院
著者所属(英)
en
Graduate School of Meiji Uniersity
著者所属(英)
en
Graduate School of Meiji Uniersity
著者名 山下, 興紀

× 山下, 興紀

山下, 興紀

Search repository
横山, 大作

× 横山, 大作

横山, 大作

Search repository
著者名(英) Koki, Yamashita

× Koki, Yamashita

en Koki, Yamashita

Search repository
Daisaku, Yokoyama

× Daisaku, Yokoyama

en Daisaku, Yokoyama

Search repository
論文抄録
内容記述タイプ Other
内容記述 ローグライクゲームは,報酬の発生がまれであること,エピソードごとにマップがランダムに変化することなど,近年主流の強化学習手法が苦手とする性質を持っている.特に,「階段を降りる」行動は,得点などのわかりやすい報酬が発生せず,エージェントにその行動をとらせる学習が困難であった.本研究では,この行動に焦点を絞り,事前学習を加えた強化学習手法の有効性を検証する.階段を降りることを重視するヒューリスティックプレイヤによる行動履歴を用意し,学習の前段階においてこの履歴で事前学習を行う手法を実装した.また,事前学習用の行動履歴において,「階段を降りる」行動の比率を高めた履歴を利用する場合の性能比較も行った.結果として,階段を降りる行動を 20 倍程度の頻度で生成出来るようなプレイヤの学習に成功した.しかし,この頻度は元となったヒューリスティックプレイヤと比較すると 1/2 程度に留まるという課題も明らかとなった.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11362144
書誌情報 研究報告ゲーム情報学(GI)

巻 2024-GI-51, 号 23, p. 1-7, 発行日 2024-03-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8736
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:16:47.294809
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3