Item type |
SIG Technical Reports(1) |
公開日 |
2017-07-15 |
タイトル |
|
|
タイトル |
Twitterからの有用情報抽出のための学習データのマルチクラス化 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Classifying Training Data for Extracting Important Tweets |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
NHK放送技術研究所 |
著者所属 |
|
|
|
東京都市大学 |
著者所属 |
|
|
|
NHK放送技術研究所 |
著者所属 |
|
|
|
NHK放送技術研究所 |
著者所属 |
|
|
|
NHK放送技術研究所 |
著者所属(英) |
|
|
|
en |
|
|
NHK Science and Technology Research Laboratories |
著者所属(英) |
|
|
|
en |
|
|
Tokyo City University |
著者所属(英) |
|
|
|
en |
|
|
NHK Science and Technology Research Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NHK Science and Technology Research Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NHK Science and Technology Research Laboratories |
著者名 |
宮﨑, 太郎
鳥海, 心
武井, 友香
山田, 一郎
後藤, 淳
|
著者名(英) |
Taro, Miyazaki
Shin, Toriumi
Yuka, Takei
Ichiro, Yamada
Jun, Goto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Twitter などのソーシャルメディアの情報は,現在ではニュース制作者にとって重要な取材源となっている.NHK ではソーシャルメディアを活用し,ニュースに役立つ情報を迅速に抽出するためのプロジェクトを立ち上げ,積極的に活用しているが,人手に依るところが多く,その労力は大きい.そこで我々は,ニュース制作に役立つ情報をソーシャルメディアから自動で抽出する研究を進めている.再帰型ニューラルネットワークを用い,ニュースに役立つ情報を自動で抽出する手法の研究を進めてきたが,従来は 「ニュースに役立つか役立たないか」 という 2 値分類をタスクとしてきた.しかし,実際の 「ニュースに役立つ tweet」 には 「火事」 「事故」 など多様な情報が含まれており,それらを一つに括って扱うのは性能の劣化につながることが考えられる.そこで,本稿では 「ニュースに役立つ tweet」 を分野ごとに細分化して学習する手法を提案する.学習データについて,人手でニュースに役立つ tweet をニュースの分野ごとに分類した場合には情報抽出の精度が F 値の最大で 0.744 となり,ニュースに役立つ tweet を一括りにした場合と比較して 0.033 ポイントの性能向上が得られた.また,自動で分類した場合には F 値が最大で 0.732 となり,同じく 0.021 ポイントの性能向上が得られた.本稿の貢献として,学習データを人手,または自動で細分化して学習することで,識別の性能が向上することを明らかにしたことが挙げられる. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10114171 |
書誌情報 |
研究報告情報基礎とアクセス技術(IFAT)
巻 2017-IFAT-127,
号 1,
p. 1-6,
発行日 2017-07-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8884 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |