依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装

北河, 英己; 丁, 世堯

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装

https://ipsj.ixsq.nii.ac.jp/records/236007

名前 / ファイル	ライセンス	アクション
IPSJ-Z86-6Q-04.pdf (506.1 kB)	Copyright (c) 2024 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2024-03-01

タイトル

依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

京大

著者所属

京大

著者名

北河, 英己
丁, 世堯

論文抄録

内容記述タイプ

Other

内容記述

既存の強化学習タスクでは主に単一の目標を追求するものが多いが、実世界では依存関係を持つ複数の目標を同時に達成する必要があるシナリオが多く存在する。既存の強化学習手法でもこのような複雑なタスクへの適応は可能だが、単純なタスクと比較すると性能はよくない。本稿では、マインクラフト風強化学習環境「crafter」を用いて、複数の強化学習手法の性能を比較し評価する。「crafter」は、依存関係を持つ複数のゴールを同時に達成する必要がある複雑なタスクを提供するため、本研究に適している。この研究により、依存関係のある複数の目標を含む複雑なタスクに対する強化学習アプローチの可能性と限界を明らかにする。

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第86回全国大会講演論文集

巻 2024, 号 1, p. 327-328, 発行日 2024-03-01

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 09:25:54.850190

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装

× 北河, 英己

× 丁, 世堯

Versions

Share

Cite as

エクスポート