WEKO3
アイテム
マイクロブログを対象とした著者推定手法の提案-10,000人レベルでの著者推定-
https://ipsj.ixsq.nii.ac.jp/records/102430
https://ipsj.ixsq.nii.ac.jp/records/1024300d5f43fe-b9c7-49c0-bef9-9bb06aeacaae
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2014-07-25 | |||||||
| タイトル | ||||||||
| タイトル | マイクロブログを対象とした著者推定手法の提案-10,000人レベルでの著者推定- | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | ソーシャルメディア | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 早稲田大学大学院基幹理工学研究科 | ||||||||
| 著者所属 | ||||||||
| 早稲田大学大学院基幹理工学研究科早稲田大学グローバルエデュケーションセンター | ||||||||
| 著者所属 | ||||||||
| 早稲田大学理工学術院/国立情報学研究所 | ||||||||
| 著者名 |
奥野峻弥
浅井洋樹
山名早人
× 奥野峻弥 浅井洋樹 山名早人
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 従来,著者推定研究は小説に対する著者推定を中心に研究が行われており,推定対象を限定した,少人数に対する著者候補者群が取り扱われてきた.これに対し,我々はマイクロブログを対象にした,不特定多数の候補者群に対する著者推定の提案を行った.その際,精度向上のためマイクロブログ特有の叫喚フレーズに対する正規化手法,および計算量削減のため推定に必要となるメッセージ数を削減する手法を提案してきた.本稿では,より多くのマイクロブログ利用者を対象にした著者推定を行う上での問題点,特に学習用データとテストデータの取得期間の差異が精度に与える影響について検証し,学習用データの取得期間が精度に与える影響を小さくする手法を提案する.実験では Twitter ユーザ 10,000 人に対して著者推定を行い,Precision@1 で 0.535,MRR で 0.602 を達成した. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10114171 | |||||||
| 書誌情報 |
研究報告情報基礎とアクセス技術(IFAT) 巻 2014-IFAT-115, 号 12, p. 1-6, 発行日 2014-07-25 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||