転移学習エージェントにおける局所方策の選択的再利用法の提案

濱田, 大也; 齊藤, 史哲

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

転移学習エージェントにおける局所方策の選択的再利用法の提案

https://ipsj.ixsq.nii.ac.jp/records/231565

名前 / ファイル	ライセンス	アクション
IPSJ-DBS23178004.pdf (1.3 MB)	Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
DBS:会員：¥0, DLIB:会員：¥0

Item type

SIG Technical Reports(1)

公開日

2023-12-19

タイトル

転移学習エージェントにおける局所方策の選択的再利用法の提案

言語

jpn

キーワード

主題Scheme

Other

主題

データ工学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

千葉工業大学大学院先進工学研究科

著者所属

千葉工業大学先進工学部

著者名

濱田, 大也
齊藤, 史哲

論文抄録

内容記述タイプ

Other

内容記述

近年 AI の行動獲得に対して強化学習が注目されている．強化学習にはタスクの複雑化に伴い試行数が増加する問題がある．これを回避するため，事前に学習した知識を再利用し，試行数を減らす転移学習が注目されている．転移学習の方法の一つに適用可能な知識をランダム選択するεT グリーディがある．しかし，転移する知識の選択において再利用するべき知識とそうでない知識を同等に扱ってしまい，余分な行動選択が増えるという課題がある．そこで，本研究では選択するべき知識に価値を付与し，選択確率に比例させる方法を提案する．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10112482

書誌情報

研究報告データベースシステム（DBS）

巻 2023-DBS-178, 号 4, p. 1-5, 発行日 2023-12-19

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-871X

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 10:43:15.873218

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

転移学習エージェントにおける局所方策の選択的再利用法の提案

× 濱田, 大也

× 齊藤, 史哲

Versions

Share

Cite as

エクスポート