@techreport{oai:ipsj.ixsq.nii.ac.jp:00047657,
 author = {吉田, 光範 and 藤沢, 匡哉 and 八嶋, 弘幸 and Mitsunori, Yoshida and Masaya, Fujisawa and Hiroyuki, Yashima},
 issue = {113(2008-NL-188)},
 month = {Nov},
 note = {近年,World Wide Web へのアクセス環境の多様化と普及により,Web によるニュース閲覧は一般化してきている.ニュースポータルサイトを使うことで,各々の Web ニュースサイトに個別にアクセスすることなく,幅広い内容のニュースを一度に閲覧することができる.一方,複数の Web ニュースサイトが配信するニュース記事の中には,しばしば同じ情報が記述された記事 (冗長記事) が存在している.そのため,大量の冗長記事の中から,ユーザが自身の関心がある記事のみを選別するには手間がかかる.本研究では,ニュース記事間の相互類似性と配信時間差に基づく 2 つの冗長記事フィルタ手法を提案する.提案手法は,配信時間差に基づき冗長性の判定に制限を加えることで,続報記事を選別除去することなく,冗長記事のみを選別除去する.実際の Web ニュース記事を使った実験により,提案手法が冗長記事と続報記事を区別し,従来法よりも高い精度で冗長記事のみを選別できることを示す., Recently, WWW (World Wide Web) is widely spread all over the world. It is getting common to browse news articles on WWW. In the news portal site, we can read news articles which plural news sites published, without visiting in those news sites. However, it is often seen that news articles with the same information appear in several news sites. Therefore, it is difficult to select only appropriate news articles with interest among large amount of redundant articles. In this paper, we propose two redundancy news filtering methods which are based on similarity and published time difference. Theae filtering methods considers the published time of the news article in order to limit the article to judge as the redundant article. The first method uses window function and the second method uses machine learning. In the experiment, we show that our methods enable to distinguish redundant articles and follow up articles.},
 title = {相互類似性と配信時間差に基づくWebニュース冗長記事のフィルタリング},
 year = {2008}
}