Item type |
SIG Technical Reports(1) |
公開日 |
2020-09-07 |
タイトル |
|
|
タイトル |
深層強化学習を用いたサッカータスクにおける行動獲得に関する考察 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者名 |
阿部, 宇志
折原, 良平
清, 雄一
田原, 康之
大須賀, 昭彦
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
これまで,深層学習と強化学習を組み合わせた深層強化学習がチェスや囲碁,将棋といったゲームに対して適用され大きな成果が見られてきた.それに加え,近年ではサッカーゲームのような複数のエージェントが関わる問題に対して強化学習を行う研究が取り上げられてきている.サッカータスクのようなマルチエージェント強化学習は,自らの行動以外に加味する情報が多くあり,学習が難しいタスクであることから研究が盛んに行われている.本研究ではその中でも,DeepMind 社の物理演算エンジン Mujoco のサッカータスクを用いた深層強化学習での行動獲得を目指す.サッカータスクは報酬がスパースであるタスクであり,外部報酬だけでは学習に膨大な時間がかかるため,様々な研究がされてきた.ここでは,複雑なタスクに対応するために,スパースである外部報酬だけでなく,段階的に報酬を与える Shaping 強化学習を行うことで,学習に及ぼす影響を考察する. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11135936 |
書誌情報 |
研究報告知能システム(ICS)
巻 2020-ICS-200,
号 5,
p. 1-5,
発行日 2020-09-07
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-885X |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |