WEKO3
アイテム
将棋の振り飛車の強化学習
https://ipsj.ixsq.nii.ac.jp/records/240744
https://ipsj.ixsq.nii.ac.jp/records/24074413dfdf1c-bcd7-4249-849a-a8254e0fd1df
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-11-15 | |||||||
| タイトル | ||||||||
| タイトル | 将棋の振り飛車の強化学習 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Reinforcement Learning for Ranging Rook in Shogi | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Shogi | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Ranging rook | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Deep Reinforcement Learning | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| freelance | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| freelance | ||||||||
| 著者名 |
山下, 宏
× 山下, 宏
|
|||||||
| 著者名(英) |
Hiroshi, Yamashita
× Hiroshi, Yamashita
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 将棋の振り飛車を人間の知識なしでゼロから深層強化学習を行った。指定した筋に振れた場合に報酬を与える AlphaZero型の学習によって、すべての筋に飛車を振る AI の作成に成功した。 1720 万棋譜の生成後、三間飛車では初と思われる指し方を見つけ、ゴキゲン中飛車が超速 37 銀によって衰退する過程を再現できた。ダイレクト向飛車の定跡を再発見し、居飛車は松尾流穴熊を好んで指すことが分かった。この手法により任意の戦型を指す AI が作成可能である。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Deep reinforcement learning of Shogi’s Ranging Rook was performed from scratch without human knowledge. By AlphaZero style learning, which rewards a player for moving the rook to the desired File, we succeeded in creating an AI that can move rook to any Files. After generating 17 million self-games, we were able to find what we believe to be the first way to play Third File Rook, and to reproduce the process of the decline of Cheerful Central Rook by Super High Speed Silver-37. We rediscovered the opening of Direct Opposing Rook, and found that Static Rook prefer Matsuo Anaguma. This method can be used to create a Shogi AI that plays any style of strategy. | |||||||
| 書誌情報 |
ゲームプログラミングワークショップ2024論文集 巻 2024, p. 179-186, 発行日 2024-11-15 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||