ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. インターネットと運用技術(IOT)
  3. 2025
  4. 2025-IOT-070

不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用

https://ipsj.ixsq.nii.ac.jp/records/2003108
https://ipsj.ixsq.nii.ac.jp/records/2003108
28da0aaf-dd0f-43ac-8230-08d9fd1d9cd8
名前 / ファイル ライセンス アクション
IPSJ-IOT25070005.pdf IPSJ-IOT25070005.pdf (374.6 KB)
 2027年7月21日からダウンロード可能です。
Copyright (c) 2025 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, IOT:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2025-07-21
タイトル
言語 ja
タイトル 不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用
タイトル
言語 en
タイトル Applying Continuous-Armed Bandits to Integrated Exploration of Goals and Means under Uncertainty
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
GMOペパボ株式会社ペパボ研究所
著者所属
GMOペパボ株式会社ペパボ研究所
著者所属(英)
en
Pepabo R&D Institute, GMO Pepabo, Inc.
著者所属(英)
en
Pepabo R&D Institute, GMO Pepabo, Inc.
著者名 三宅,悠介

× 三宅,悠介

三宅,悠介

Search repository
栗林,健太郎

× 栗林,健太郎

栗林,健太郎

Search repository
論文抄録
内容記述タイプ Other
内容記述 不確実性の高い課題領域においては,その領域の目的に対する手段の有用性は,実際の行動を通じてのみ明らかになる.こうした状況で多くの候補から有効な手段を効率的に見極めるために,多腕バンディット問題として定式化する手法が用いられてきた.従来の多腕バンディットでは,探索の効率を高める実用的な簡略化として,固定された目的を前提とした定式化が行われてきた.しかし実際の課題では,目的自体も流動的であり,検討の過程で見直されることも少なくない.目的と手段は相互に依存する関係にあり,検討すべき組み合わせは多岐にわたるうえ,その対応関係も単純には捉えられない.このような制約のもとでも効率的に目的と手段の有用性を見極めるためには,行動による評価結果を他の目的にも横断的に活かす知識の伝達に加え,許容できないリスクを伴う組み合わせを適切に回避する仕組みが求められる.本報告では,目的と手段の双方を探索対象とした,不確実性下における意思決定の枠組みを提案する.具体的には,両者の特徴量空間を統合した空間上で,ガウス過程モデルに基づく連続腕バンディットにより有用な組み合わせを効率的に探索し,推定の不確実性に基づくリスク制御を組み込むことで,実行可能性を高める.評価では,高次元空間における最適化問題を対象とし,既存手法との比較を通じて,探索精度と計算効率の両立を確認した.その結果,提案手法が高次元設定にも適用可能であることが示唆された.
論文抄録(英)
内容記述タイプ Other
内容記述 Only actions reveal how effective a means is for achieving a goal in uncertain domains. Prior work has modeled such problems using multi-armed bandits, often assuming a fixed goal to simplify exploration. In practice, goals may shift, and their relation to means is complex and interdependent. Effective decision-making requires models that transfer knowledge across goals and avoid risky combinations. This paper proposes a framework that jointly explores goals and means under uncertainty. It embeds both into a shared feature space and applies a continuous-armed bandit with a Gaussian process to identify promising pairs. The model incorporates risk control based on predictive uncertainty. Experiments on high-dimensional optimization tasks compare the proposed method with standard approaches. Results suggest that it balances accuracy and efficiency and scales to high-dimensional settings.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA12326962
書誌情報 研究報告インターネットと運用技術(IOT)

巻 2025-IOT-70, 号 5, p. 1-8, 発行日 2025-07-21
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8787
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-07-07 04:12:05.274607
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3