Item type |
SIG Technical Reports(1) |
公開日 |
2015-06-16 |
タイトル |
|
|
タイトル |
推薦の粒度を学習の進展に応じて切り替えるmulti-armed banditアルゴリズム |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Multi-armed Bandit Algorithm to Switch Recommendation Granularity Based on Learning Progress |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
バイオデータマイニング |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
NTTソフトウェアイノベーションセンタ |
著者所属 |
|
|
|
ヱヂリウム株式会社 |
著者所属 |
|
|
|
NTTソフトウェアイノベーションセンタ |
著者所属 |
|
|
|
ヱヂリウム株式会社 |
著者所属 |
|
|
|
NTTデータ先端技術株式会社 |
著者所属 |
|
|
|
NTTソフトウェアイノベーションセンタ |
著者所属 |
|
|
|
株式会社ドワンゴ |
著者所属 |
|
|
|
株式会社ドワンゴ |
著者所属 |
|
|
|
株式会社ドワンゴ |
著者所属 |
|
|
|
NTTソフトウェアイノベーションセンタ |
著者所属(英) |
|
|
|
en |
|
|
NTT Software Innovation Center |
著者所属(英) |
|
|
|
en |
|
|
Edirium K.K. |
著者所属(英) |
|
|
|
en |
|
|
NTT Software Innovation Center |
著者所属(英) |
|
|
|
en |
|
|
Edirium K.K. |
著者所属(英) |
|
|
|
en |
|
|
NTT DATA INTELLILINK Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT Software Innovation Center |
著者所属(英) |
|
|
|
en |
|
|
DWANGO Co., Ltd. |
著者所属(英) |
|
|
|
en |
|
|
DWANGO Co., Ltd. |
著者所属(英) |
|
|
|
en |
|
|
DWANGO Co., Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NTT Software Innovation Center |
著者名 |
宇田川, 拓郎
渡邉, 卓也
山中, 章裕
室井, 浩明
東山, 昌彦
小田, 哲
小田桐, 優理
宮井, 康宏
志村, 誠
本庄, 利守
|
著者名(英) |
Takuro, Udagawa
Watanabe, Takuya
Akihiro, Yamanaka
Hiroaki, Muroi
Masahiko, Higashiyama
Satoshi, Oda
Yuri, Odagiri
Yoshihiro, Miyai
Makoto, Shimura
Toshimori, Honjo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Multi-armed bandit アルゴリズムは,複数の選択肢から一つを選ぶ試行を繰り返しつつ,選択結果に応じて与えられる報酬を元に,選択肢の選び方を最適化する為のアルゴリズムである.同アルゴリズムは,ユーザへの推薦内容とそれに対する応答を元に,推薦内容をオンラインで最適化できることから,リアルタイム性の必要なニュースサイトにおける記事の推薦等に利用されている.その際,嗜好の多様なユーザを対象とするサービスにおいては,ユーザ個々の嗜好に合わせた推薦を行うことが望ましい.しかし,まだ行動履歴が十分に集まっていないユーザに対しては嗜好の学習が十分行われておらず,初期段階においては適切な推薦が行えないことが課題となる.そこで,そうしたユーザについてはまずユーザ集団全体の嗜好に基づいた推薦を行い,ある程度学習が進んだ段階で個別の嗜好に基づく推薦に切り替える multi-armed bandit アルゴリズムを提案する.また,ユーザ集団の行動をシミュレートした実験を通じて,提案アルゴリズムの有効性を示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Multi-armed bandit algorithms optimise a way to choose an option from several alternatives through the iteration of choice, based on observed rewards for each choice. They have been used as recommendation algorithms for online services such as web-based news article recommendations in order to optimise recommendations online based on what they recommended to users and their responses. For those services that target users having a wide variety of preferences, it is desirable to produce recommendations according to specific preferences of each user. However, it would be problematic that personalised recommenders tend to produce inappropriate recommendations for those users of whom not enough number of behavioural records have been accumulated. We propose a new multi-armed bandit algorithm that produce recommendations for those new users based on a global preference at first, and then offer personalised recommendations after enough preference of the user is obtained. We also show that the proposed algorithm is effective by conducting a simulation experiment. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
書誌情報 |
研究報告バイオ情報学(BIO)
巻 2015-BIO-42,
号 30,
p. 1-6,
発行日 2015-06-16
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |