ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 知能システム(ICS)
  3. 2022
  4. 2022-ICS-205

時間制限付き半順序作業における協調行動学習のための漸進的報酬設計の提案

https://ipsj.ixsq.nii.ac.jp/records/216463
https://ipsj.ixsq.nii.ac.jp/records/216463
9575188e-bb30-4972-babe-8c812e1cd5ca
名前 / ファイル ライセンス アクション
IPSJ-ICS22205010.pdf IPSJ-ICS22205010.pdf (1.4 MB)
Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2022-02-14
タイトル
タイトル 時間制限付き半順序作業における協調行動学習のための漸進的報酬設計の提案
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
早稲田大学
著者所属
早稲田大学
著者所属
早稲田大学
著者名 小國, 祥寛

× 小國, 祥寛

小國, 祥寛

Search repository
宮下, 裕貴

× 宮下, 裕貴

宮下, 裕貴

Search repository
菅原, 俊治

× 菅原, 俊治

菅原, 俊治

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,異なる能力と役割を持つ複数のエージェントが,決められた順序で作業することで完了するタスクにおいて,自分の作業の効率化の学習と自分の前後に作業するエージェントとの連携行動の学習を両立させる手法を提案する.近年,深層強化学習の研究が活発に行われているが,エージェント間の協調行動の学習については未だ十分とは言えない.特にエージェントが独立した深層ネットワークを持つ分散的なマルチエージェント強化学習 (MADRL) では,個々の作業に与える報酬の体系が協調行動に与える影響については不明な部分も多い.本稿で対象とする順序付きの作業では,特に初めのエージェントからは,かなり遅れてタスクが完了し,すでに他のタスクの作業中となることも多い.そのため,たとえば,自分の担当部分の完了時に報酬を与えるとタスクの完了という本来の目的と異なった報酬体系となり,自己中心の作業に特化し,他の行動を考慮しなくなる.一方で,全体の作業が終わったときにのみ報酬を与えると,自分の作業の学習が進まないばかりではなく,その後のエージェントの学習機会も失う.このような課題に対し,本提案では,報酬を 2 分割し,それを学習の遂行とともに変化させ,自分の作業の効率と協調行動をともに実現し,最終的には本来の目的と合致するように関連するすべての作業が完了したときにのみ報酬を与えるものとする.実験により,報酬比と収集した行動を比較し,提案手法が自己の作業と協調・連携行動のバランスのとれた行動学習を実現することを示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11135936
書誌情報 研究報告知能システム(ICS)

巻 2022-ICS-205, 号 10, p. 1-8, 発行日 2022-02-14
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-885X
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 15:50:21.565070
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3