| Item type |
Journal(1) |
| 公開日 |
2015-06-15 |
| タイトル |
|
|
タイトル |
実生活ツイートに対する局面推定の精度向上に関する検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
A Study on Upgrading Precision of Aspect Estimation for Real Life Tweets |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文(推薦論文)] Twitter,実生活,LDA,階層的推定法,マルチラベル分類 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| 著者所属 |
|
|
|
筑波大学大学院図書館情報メディア研究科 |
| 著者所属 |
|
|
|
筑波大学大学院図書館情報メディア研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Library, Information and Media Studies, University of Tsukuba |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Library, Information and Media Studies, University of Tsukuba |
| 著者名 |
山本, 修平
佐藤, 哲司
|
| 著者名(英) |
Shuhei, Yamamoto
Tetsuji, Satoh
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
身近な出来事や関心事を投稿し共有するTwitter上には,食事や交通,災害など,様々な生活の局面で有益なツイートが数多く投稿されている.著者らは,未知のツイートに適切な複数の局面を付与できる階層的推定法を提案している.階層的推定法は,教師なし学習として知られるLDAを用いて,大量ツイートからトピックを抽出する第1段階と,少量の訓練データを用いてトピックと局面の関連度を算出し,対応関係を構築する第2段階からなる.本論文では,対応付くトピックが競合する局面で推定精度が低下する問題を解決するため,新たな関連度の算出方法を提案する.関連度を各トピックで正規化することで,トピックが強く結び付く局面を同定し,局面に対応付くトピックの競合を防ぐ.トピック側で正規化した関連度を,さらに局面側で正規化することで,局面から見て強く結び付くトピックを同定する.収集した大量のツイートを用いた評価実験を行った結果,これまで推定精度が低かった局面も適切に推定でき,すべての局面におけるF値の平均も向上できることを明らかにした. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, lots of users share their current events and opinions by using the Twitter. Hence, some of these tweets are beneficial in several aspects of user's real life, i.e., eating, traffic, disaster, weather, and so on. We proposed hierarchical estimation framework to estimate appropriate several aspects for unknown tweets. Hierarchical estimation framework is composed of both unsupervised and supervised machine learnings. In the first phase, it extracts topics from a sea of tweets using latent Dirichlet allocation (LDA). In the second phase, it calculates the relevance between topics and aspects using a small set of labeled tweets to build associations among them. In this paper, we propose new relevance calculation method to conquer the problem of competitve associations among aspects, which estimating precisions decrease. We identify the aspcects associated to topics by normalizing relevance in each topic and prevent association competitive. Moreover, we identify the topics strongly associated to aspects by besides normalizing in each aspect. Our sophisticated experimental evaluations with a large amount of actual tweets demonstrate the high efficiency of our proposed method in aspects that estimating precisions ever lowed. We clarify that our proposed method upgrades an average value of F-measure in all aspects. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 56,
号 6,
p. 1496-1506,
発行日 2015-06-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |