WEKO3
アイテム
二人零和マルコフゲームにおける状態抽象化法に関する研究
https://ipsj.ixsq.nii.ac.jp/records/235852
https://ipsj.ixsq.nii.ac.jp/records/23585220e06ca4-2952-4fa7-be22-b2310f7ba9ba
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 二人零和マルコフゲームにおける状態抽象化法に関する研究 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 無所属 | ||||||||||||||
| 著者所属 | ||||||||||||||
| サイバーエージェント | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者名 |
石橋, 宙希
× 石橋, 宙希
× 島野, 雄貴
× 阿部, 拳之
× 岩﨑, 敦
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 本研究は,規模が大きい二人零和マルコフゲームの均衡解を計算するため,マルコフゲームの状態を抽象化する方法について吟味する.二人零和マルコフゲームとは,エージェントの利得がお互いの行動だけでなく,環境を表す状態によって決まるゲームであり,その状態遷移はマルコフ過程にしたがう.例えば,サッカーのようなゲームでは,場面場面の状態によって行動の価値が変わるため,マルコフゲームとして記述する.しかし,それがもつ状態の数はゲームの要素の数に対して指数的に増加するため,その均衡計算が困難になる.そこで本研究では,通常のマルコフ過程の状態を抽象化する方法を拡張し、どの程度の情報が失われるかを吟味する. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 7-8, 発行日 2024-03-01 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||