WEKO3
アイテム
実例に基づく強化学習法
https://ipsj.ixsq.nii.ac.jp/records/51111
https://ipsj.ixsq.nii.ac.jp/records/5111149919c26-0a41-4f88-a0c3-fa5f73e3cb26
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1991 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1991-09-12 | |||||||
タイトル | ||||||||
タイトル | 実例に基づく強化学習法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Instance - Based Reinforcement Learning Method | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
長岡技術科学大学工学部計画・経営系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Planning and Management Science, Nagaoka University of Technology | ||||||||
著者名 |
畝見, 達夫
× 畝見, 達夫
|
|||||||
著者名(英) |
Tatsuo, Unemi
× Tatsuo, Unemi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 強化学習法で扱われる制御問題に適用可能な実例に基づく学習の機構を提案する.各学習サイクルにおける入力は実数のベクトル,出力はあらかじめ決められた有限個のシンボルの中の1つであり,学習の目的は正の強化入力をできるだけ頻繁に得ることである.学習システムは,生のまま記憶されたすべての入出力対を走査し,現状から近い将来に正の強化入力が得られそうな出力データを見つけ,出力とする.さらに,記憶容量を制限し,実行結果のフィードバックを利用した忘却を導入することによって,学習能力を向上させることができる.適応行動シミュレーションへの応用を通して,この学習機構が有効に働くことを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a reinforcement learning method based on an instance-based learning approach. The objective of the learner is to get positive reinforcement from the environment more frequently, the input on each learning cycle is a vector of real numbers, and the output is a symbol selected from a priori known finite set. By scanning all of the past experiences stored in memory verbatim, the leaner searches a suitable output value which will likely lead to high positive reinforcement. Experimental results show these mechanisms work well to simulate an adaptive behavior, and some methods of forgetting is effective. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 1991, 号 75(1991-ICS-078), p. 1-10, 発行日 1991-09-12 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |