Item type |
Trans(1) |
公開日 |
2016-06-29 |
タイトル |
|
|
タイトル |
Twitter投稿文章とプロフィール情報を用いたPOI公式アカウント分類手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
POI Official Account Classification Method Using Twitter Posts and Profile Information |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[研究論文] Twitter,Point-of-Interest,ユーザ属性推定 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
株式会社NTTドコモ/東京大学 |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
東京大学 |
著者所属(英) |
|
|
|
en |
|
|
NTT DOCOMO, INC. / The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
NTT DOCOMO, INC. |
著者所属(英) |
|
|
|
en |
|
|
NTT DOCOMO, INC. |
著者所属(英) |
|
|
|
en |
|
|
NTT DOCOMO, INC. |
著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
著者名 |
落合, 桂一
山田, 渉
深澤, 佑介
菊地, 悠
松尾, 豊
|
著者名(英) |
Keiichi, Ochiai
Wataru, Yamada
Yusuke, Fukazawa
Haruka, Kikuchi
Yutaka, Matsuo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,Twitterの投稿文章とプロフィール情報から生成した特徴量に基づき,機械学習によりPoint-of-Interest(POI)の公式アカウントを判定する方法を提案する.公式アカウントを判定するため,あらかじめ用意したPOIデータベースを使いPOI名称とTwitterのユーザ名を比較する方法では,1)POIデータベースにないPOIは抽出されないという課題,2)POI名称が正式名称のために通称や略称などが使われるユーザ名と一致しないという課題,3)一般ユーザがユーザ名にPOI名称を利用している場合があるという課題がある.そこで,Twitterの投稿内容やプロフィール情報に基づいてPOI公式アカウントを判定する手法を提案する.本研究では,POI公式アカウント抽出のための特徴量として,従来用いられていた投稿文章や自己紹介文のBag-of-Wordsに加え,POI固有特徴量(場所情報,営業時間,連絡先など),知名度に関する特徴量(フォロワ数やリストに登録されている数など),プロフィール画像の画像特徴量を提案する.実験によりPOIデータベースを利用した場合と比較し,約3倍のPOI公式アカウントが抽出可能であることを示した.また,提案した特徴量を利用した場合,従来手法の特徴量を利用した場合と比較し分類性能を表す再現率0.933,F値0.938で最大になることを示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we propose a machine learning method for classifying Point-of-Interest (POI) official twitter account using Twitter posts and profile information. There are three issues to classify POI official account by using prepared POI database. 1) POIs which are not in POI database cannot be extracted, 2) POI name which is in POI database doesn't match the name of twitter account which is often abbreviated, 3) even if the user name matches the POI name, in some cases, the account may not be POI official account. Therefore, we classify these accounts by using twitter posts and profile information. In this study, we use POI-related information such as location, business hour, and contact information etc., popularity such as number of followers, listed counts etc., and profile image as features for machine learning in addition to conventional method (Bag-of-Words of tweets and profile text). We evaluated our method with the method which uses POI database. The result showed that proposed method can extract three times as much account as baseline. In addition, the result which we evaluated classification performance showed that the recall and F-measure are higher than that of conventional method. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464847 |
書誌情報 |
情報処理学会論文誌データベース(TOD)
巻 9,
号 2,
p. 11-22,
発行日 2016-06-29
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7799 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |