WEKO3
アイテム
キャプションと記事テキストの文字列照合による報道番組と新聞記事との対応づけの自動化
https://ipsj.ixsq.nii.ac.jp/records/13390
https://ipsj.ixsq.nii.ac.jp/records/13390ba77fef0-6a97-43f0-8d1c-02949b5612e5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-06-15 | |||||||
タイトル | ||||||||
タイトル | キャプションと記事テキストの文字列照合による報道番組と新聞記事との対応づけの自動化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Alignment between TV News and Newspaper Articles by String Matching between Captions and Article Texts | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | メディア情報処理 | |||||||
著者所属 | ||||||||
東京大学医科学研究所 | ||||||||
著者所属 | ||||||||
京都大学工学研究科電子通信工学 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部電子情報学科 | ||||||||
著者所属 | ||||||||
京都大学工学研究科電子通信工学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Institute of Medical Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electronics and Communication, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electronics and Informatics, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electronics and Communication, Kyoto University | ||||||||
著者名 |
角田, 達彦
× 角田, 達彦
|
|||||||
著者名(英) |
Tatsuhiko, Tsunoda
× Tatsuhiko, Tsunoda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,ニュースの各報道に対応する新聞記事をキャプションと記事の文字列照合により特定する手法を提案する.キャプションと記事中に共通に現れた文字列の長さと出現位置,出現頻度により重みづけし,類似度を計算する.そして類似度が最大で閾値以上のものを選ぶ。学習サンプルによって各パラメータの値を決定した結果,学習サンプルで再現率100%,適合率93.2%,約2週間後のテストサンプルで再現率98.0%,適合率77.8%(閾値のみ決め直した場合,再現率98.0%,適合率84.5%),約7カ月後のテストサンプルで再現率97.1%,適合率79.5%(閾値のみ決め直した場合,再現率94.1%,適合率85.3%),という精度が得られた.また事例を検討し,長い文字列に重みを与えすぎることの弊害を明確にした. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a method of automatic alignment of newspaper articles with corresponding TV news.The method extracts maximum length strings matched between the artcles and the caption texts.Then it calculates similarity and picks up the nearest article if the similarity exceeds a given threshold.The similarity is based on the information of the string,i.e.its length,position and frequency in the text.By adjusting the weighting values,our method achieved 100% recall and 93.2% precision for learning samples,98.0% recall and 77.8%(84.5% if the threshold was readjusted) precision for unseen samples which is about two weeks from the learning samples,and 97.1% recall and 79.5% (94.1% recall and 85.3% precision if the threshold was readjusted) precision for unseen samples which is about seven months from the learning samples.We also clarfied the problem of excessive weighting for long strings. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 38, 号 6, p. 1149-1162, 発行日 1997-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |