WEKO3
アイテム
転移学習エージェントにおける局所方策の選択的再利用法の提案
https://ipsj.ixsq.nii.ac.jp/records/231565
https://ipsj.ixsq.nii.ac.jp/records/2315656a6be4c4-5707-427c-a6c5-0d89e3085946
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
| DBS:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-12-19 | |||||||||
| タイトル | ||||||||||
| タイトル | 転移学習エージェントにおける局所方策の選択的再利用法の提案 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | データ工学 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 千葉工業大学大学院先進工学研究科 | ||||||||||
| 著者所属 | ||||||||||
| 千葉工業大学先進工学部 | ||||||||||
| 著者名 |
濱田, 大也
× 濱田, 大也
× 齊藤, 史哲
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 近年 AI の行動獲得に対して強化学習が注目されている.強化学習にはタスクの複雑化に伴い試行数が増加する問題がある.これを回避するため,事前に学習した知識を再利用し,試行数を減らす転移学習が注目されている.転移学習の方法の一つに適用可能な知識をランダム選択するεT グリーディがある.しかし,転移する知識の選択において再利用するべき知識とそうでない知識を同等に扱ってしまい,余分な行動選択が増えるという課題がある.そこで,本研究では選択するべき知識に価値を付与し,選択確率に比例させる方法を提案する. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10112482 | |||||||||
| 書誌情報 |
研究報告データベースシステム(DBS) 巻 2023-DBS-178, 号 4, p. 1-5, 発行日 2023-12-19 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-871X | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||