WEKO3
アイテム
テレビニュース番組電子化原稿を題材とした自動要約手法の大規模評価
https://ipsj.ixsq.nii.ac.jp/records/48978
https://ipsj.ixsq.nii.ac.jp/records/489786077dc65-cfc2-4848-bda2-c045461e153a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-05-26 | |||||||
タイトル | ||||||||
タイトル | テレビニュース番組電子化原稿を題材とした自動要約手法の大規模評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Evaluation of Methods of Sentence Extraction on TV News Texts | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
渋谷・上原リサーチセンター | ||||||||
著者所属 | ||||||||
TAO | ||||||||
著者所属 | ||||||||
TAO | ||||||||
著者所属 | ||||||||
TAO | ||||||||
著者所属(英) | ||||||||
en | ||||||||
TAO of Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK/TAO | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NEC/TAO | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda University/TAO | ||||||||
著者名 |
若尾, 孝博
× 若尾, 孝博
|
|||||||
著者名(英) |
Takahiro, Wakao
× Takahiro, Wakao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 電子化された情報が増大し、テキストの要約や重要文の抽出に関する研究が、最近注目されるようになって来ている。本研究では、テレビニュース番組の電子化原稿を題材として、テキストから重要文を選び出す基本的な手法の評価を行った。基本的手法としては、重要文抽出の伝統的手法である重要語密度法、及び情報検索分野で知られているTF・IDF法に基づいた重要文抽出法を用いた。テストデータは1万件のテレビニュース番組電子化原稿で、第1文が最も重要であるというニュース原稿の特徴を利用して自動評価を行った。評価の結果は、全体的に重要度密度法がTF・IDF法に基づいた手法よりも良い結果を示すことが判明した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We describe and evaluate methods for automatically selecting important sentences in TV news texts in Japanese. High-frequency word ratio method and a method based on TF-IDF are used to rank the sentences in a text. One of the features of TV news texts is that the first sentence is the most important. We take advantage of the feature and evaluate the methods automatically by using 10000 texts. On the whole, the high-frequency word ratio is better than the TF-IDF based method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1997, 号 53(1997-NL-119), p. 31-36, 発行日 1997-05-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |