@techreport{oai:ipsj.ixsq.nii.ac.jp:00099096, author = {邱, 起仁 and 櫨山, 淳雄 and Qiren, Qiu and Atsuo, Hazeyama}, issue = {57}, month = {Mar}, note = {Twitter には,ニュース記事の話題に対する意見や感想を含む投稿が多数存在している.そこで本研究では,それらの意見や感想を抽出するため,ニュース記事に関連するツイートを収集する手法を提案する.ツイートはリンク付きツイート,リンクなしツイートに分類できる.提案手法では,まずリンク先のテキストを利用し,リンク付きツイートとニュース記事を関連づける.次に,リンク付きツイートがニュース記事を言及する際に,ニュース記事から引用した語を重要語とし,それらの語の重要度を考慮し,リンクなしツイートとニュース記事の関連づけを行う.また,ニュース記事の作成時刻とツイートの投稿時刻が近ければ近いほど,同じ話題に関連する可能性が高いと考えられる.そこで本研究では,ニュース記事とツイートの内容的類似性のみではなく,時間的類似性を合わせて考慮することで,関連づけの精度を向上させる.評価実験により,提案手法は 88.1%の適合率を保ちながら 98.1%の再現率でニュース記事に関連するリンク付きツイートを抽出することができ,65.2%の適合率を保ちながら 93.8%の再現率でニュース記事に関連するリンクなしツイートを抽出することができた., Many tweets including opinions and comments regarding the topic of news articles exist in Twitter. In order to extract these opinions and comments, this paper proposes a method for collecting the tweets related to news articles. We classify the tweets into ‘tweet with urls' and ‘tweet without urls.' In the proposed method, at first, we associate news article with ‘tweet with urls' by using texts that are linked to the tweet. Next, if ‘tweet with urls' refers to a news article, the words quoted from the news article are regarded as important, and then the association of ‘tweet without urls' with the news article is performed in consideration of the importance of those words. Moreover, we take not only the contents similarity between tweets and news articles, but aslo the time similarity into consideration to improve accuracy of the association. The evaluation experiment shows that our method can extract ‘tweet with urls' related to news articles on the ratio of recall of 98.1% while maintaining the ratio of precision of 88.1%, and extract ‘tweet without urls' related to news articles on the ratio of recall of 93.8% while maintaining the ratio of precision of 65.2%.}, title = {ニュース記事に関連するツイート収集手法の提案とその評価}, year = {2014} }