WEKO3
アイテム
異なる発信元からのWWWニュース記事の内容に基づく対応付け
https://ipsj.ixsq.nii.ac.jp/records/48466
https://ipsj.ixsq.nii.ac.jp/records/48466610d00f2-47bd-4a88-95ee-18ada0b7256f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-11-20 | |||||||
タイトル | ||||||||
タイトル | 異なる発信元からのWWWニュース記事の内容に基づく対応付け | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Paring of WWW News Articles from Multiple Sources by Bipartite Matching | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属 | ||||||||
東京大学情報学環 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Center, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interfaculty Initiative in Information Studies, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Center, The University of Tokyo | ||||||||
著者名 |
谷村, 正剛
× 谷村, 正剛
|
|||||||
著者名(英) |
Seigo, Tanimura
× Seigo, Tanimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在多くの新聞社等がWWWニュースサイトにて記事を配信している。配信される記事には同一内容のものがあるため、単純に記事を読むと同一内容の記事を複数回無駄に読んでしまう問題がある。これを避けるには、発信元が異なる同一内容の記事を対にする必要がある。具体的には、記事を発信元により分割し、2部グラフを構成する。その上で、2部グラフのマッチング問題を解くことにより対応付けを得る。本稿では、読売新聞と朝日新聞の記事を用いた対応付け結果を報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Many news paper companies submit their articles on the WWW. Because each company has its own site, one news story often appears in several sites. This forces news readers to read the identical news stories redundantly. In order to avoid this problem, we need to find articles with the same stories submitted from two distinct sources. Specifically, we model article relations with a bipartite graph. We then pair the same news stories by bipartite maching. We experimentally evaluate such matching on the articles submitted from Yomiuri Shimbun and Asahi Shimbun. The results show that our method pairs news articles at more than 86% of recall and 100% of precision at best. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2001, 号 112(2001-NL-146), p. 89-94, 発行日 2001-11-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |