ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 全国大会
  2. 83回
  3. 人工知能と認知科学

Half Field Offenseにおける探索ボーナス生成手法の検討

https://ipsj.ixsq.nii.ac.jp/records/215031
https://ipsj.ixsq.nii.ac.jp/records/215031
0ab251b0-f74f-4426-b772-b5308c14ed2f
名前 / ファイル ライセンス アクション
IPSJ-Z83-2R-04.pdf IPSJ-Z83-2R-04.pdf (353.2 kB)
Copyright (c) 2021 by the Information Processing Society of Japan
Item type National Convention(1)
公開日 2021-03-04
タイトル
タイトル Half Field Offenseにおける探索ボーナス生成手法の検討
言語
言語 jpn
キーワード
主題Scheme Other
主題 人工知能と認知科学
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
神奈川大
著者所属
神奈川大
著者所属
神奈川大
著者名 田村, 純一

× 田村, 純一

田村, 純一

Search repository
李, 嘉誠

× 李, 嘉誠

李, 嘉誠

Search repository
能登, 正人

× 能登, 正人

能登, 正人

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,RoboCup 2Dサッカーシミュレーションのサブタスクで強化学習問題として用いられているHalf Field Offense (HFO)へ強化学習法を適用する研究がされている.HFOへ強化学習法を適用する問題点として,複雑なタスクで効果的な報酬を設計する難しさが挙げられる.HFOにおいてエージェントがゴールを達成した時にのみ得られるような報酬であれば設計を必要としない.しかしながら,従来の強化学習法のみではゴールすることが困難であり,報酬を得ることができないため学習が進まない.本研究では,既存の探索ボーナス生成手法とパラメータ化された行動に適応した深層強化学習法を組み合わせ,報酬別の実験によってHFOにおける探索ボーナス生成手法の有効性を検討した.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00349328
書誌情報 第83回全国大会講演論文集

巻 2021, 号 1, p. 463-464, 発行日 2021-03-04
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 16:21:13.366526
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3