畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

久保田, 英豊; 長名, 優子

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

https://ipsj.ixsq.nii.ac.jp/records/230213

名前 / ファイル	ライセンス	アクション
IPSJ-Z85-6W-05.pdf (100.9 kB)	Copyright (c) 2023 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2023-02-16

タイトル

畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

東京工科大

著者所属

東京工科大

著者名

久保田, 英豊
長名, 優子

論文抄録

内容記述タイプ

Other

内容記述

本研究では、畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用を提案する。Profit Sharingにおける行動価値を学習する場合には、Deep Q NetworkにおけるExperience Replayをそのまま利用することはできない。Profit Sharingにおける行動価値を学習する際の誤差関数では報酬分配量が教師信号として用いられるため、メモリに観測、行動、報酬分配量の3つを蓄積しておくこととする。こうすることで、メモリに蓄積したデータからランダムにとり出してミニバッチを生成することが可能となり、学習の際に何度もデータを利用することが可能になる。

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第85回全国大会講演論文集

巻 2023, 号 1, p. 855-856, 発行日 2023-02-16

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 11:14:32.657113

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

畳み込みニューラルネットワークを用いたProfit SharingにおけるExperience Replayの利用

× 久保田, 英豊

× 長名, 優子

Versions

Share

Cite as

エクスポート