WEKO3
アイテム
悪腕存在チェック問題のアルゴリズム
https://ipsj.ixsq.nii.ac.jp/records/182372
https://ipsj.ixsq.nii.ac.jp/records/182372f1ada849-c87e-40ad-ad23-54815c6a39c9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2017 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
MPS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2017-06-16 | |||||||
タイトル | ||||||||
タイトル | 悪腕存在チェック問題のアルゴリズム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Algorithms for Bad Arm Existence Checking Problem | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Hokkaido University | ||||||||
著者名 |
中村, 篤祥
× 中村, 篤祥
|
|||||||
著者名(英) |
Atsuyoshi, Nakamura
× Atsuyoshi, Nakamura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 確率的 K 腕バンデイット問題の設定で,期待報酬が閾値以上のものが存在するか否かをできる限り少ないプレイ回数で判定する悪腕存在チェック問題を考える.これは,K 個の検査対象物の内 1 個でも異常なものがないかを,できるだけ少ない検査回数で判定する問題を定式化したものである.本稿では,まず,与えられたスロットマシン 1 台に対し,期待報酬が閾値以上であるか否かを判定する腕識別問題を考え,アルゴリズムを与えサンプル複雑度 (プレイ回数) の上界を示す.悪腕存在チェック問題に関しては,腕識別問題のアルゴリズムをサブルーチンとして用いる逐次削除アルゴリズムと逐次検査アルゴリズムを示し,各々のサンプル複雑度の上界を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We study a bad arm existence checking problem, in which a solver algorithm must judge whether an arm with an expected reward at least a given threshold exists or not by drawing as small number of arms as possible in the framework of stochastic K-armed bandit problem. This is a formalization of the checking problem for the existence of a bad object among K objects. In this manuscript, we first consider a simpler problem called an arm discrimination problem whose solver algorithm must discriminate whether a given slot machine has an expected reward at least a given threshold or not by drawing as small number of arms as possible. We give an algorithm for this problem and show an upper bound of the sample complexity (the number of arm draws). We construct a successive elimination algorithm and a successive checking algorithm that make use of the algorithm for the arm discrimination problem as a subroutine, and also show the sample complexity upper bounds of those algorithms. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2017-MPS-113, 号 22, p. 1-6, 発行日 2017-06-16 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8833 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |