WEKO3
アイテム
同行者に応じたトピックモデル
https://ipsj.ixsq.nii.ac.jp/records/98375
https://ipsj.ixsq.nii.ac.jp/records/983759fa2cd16-d50d-4446-b239-609a81c994cf
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Journal(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2014-01-15 | |||||||
| タイトル | ||||||||
| タイトル | 同行者に応じたトピックモデル | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Companion-aware Topic Model | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | [特集:社会と共に絆を支える高度交通システムとモバイル通信] トピックモデル,コンテキストアウェア,同行者,Webマイニング,Collapsed Gibbs Sampling | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 株式会社NTTドコモ | ||||||||
| 著者所属 | ||||||||
| 東京大学人工物工学研究センター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| NTT DOCOMO, Inc. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Research into Artifacts, Center for Engineering, The University of Tokyo | ||||||||
| 著者名 |
深澤, 佑介
太田, 順
× 深澤, 佑介 太田, 順
|
|||||||
| 著者名(英) |
Yusuke, Fukazawa
Jun, Ota
× Yusuke, Fukazawa Jun, Ota
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | コンテキストはユーザの興味・嗜好に影響する重要な要因の1つである.本稿では,コンテキストの中でも特に家族や同僚など同行者に注目し,同行者依存のトピックモデルを提案する.第一に同行者クラスを考慮したモデル(CTM)を提案する.次にスイッチ変数を導入し同行者依存の単語を自動学習する仕組みを取り入れたモデルを提案する(sCTM).さらに,同行者依存の単語をWeb全体から事前学習し,それをモデル内に反映するモデルを提案する(fCTM).それぞれのモデルはCollapsed Gibbs Sampling(CGS)に基づき推論を行う.Webから同行者依存の投稿データを抽出し,提案モデル間の比較実験を実施した.文書の予測精度(Perplexity)の観点でCTM(ベースライン)とfCTM,sCTMを比較評価し提案手法の優位性を示した.また,質的評価としてfCTMの同行者のトピックに含まれる単語を確認し,妥当なモデル化が行われていることを確認した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Context is understood as an important factor that affects topics to be generated. We focus on companion of users (friends, wife, husband etc.) as one of the most important factors to determine the topic. Different from location and time context, context of companion does not appear explicitly with the documents but appears inside the document in the form of contextual words (e.g. friends). To discriminate contextual words, topical words and background words from documents, and obtain both precise and discriminative topics, we propose three kinds of context aware topic models. Firstly, we introduce context class (CTM) to extract context dominant topics from text. Secondly, we introduce switch variable (sCTM) to discriminate background words from contextual and topical words. Thirdly, we introduce fixed Dirichlet parameter learned from the web to sCTM (fCTM). We conduct experiments on data set extracted from the web, and they show that the proposed model (sCTM and fCTM) can capture interpretable and discriminative sets of topics than baseline CTM from the view point of perplexity and KL-Divergence. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN00116647 | |||||||
| 書誌情報 |
情報処理学会論文誌 巻 55, 号 1, p. 413-424, 発行日 2014-01-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7764 | |||||||