WEKO3
アイテム
重要文抽出に基づく講義音声の自動要約
https://ipsj.ixsq.nii.ac.jp/records/68731
https://ipsj.ixsq.nii.ac.jp/records/68731333905ed-eeb9-49ea-ab05-61d8306657f4
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Journal(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2010-03-15 | |||||||
| タイトル | ||||||||
| タイトル | 重要文抽出に基づく講義音声の自動要約 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Class Lecture Summarization Based on Important Sentence Extraction | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 一般論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系 | ||||||||
| 著者所属 | ||||||||
| 名古屋大学大学院情報科学研究科メディア科学専攻 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Media Science, Graduate School of Information Science, Nagoya University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
| 著者名 |
藤井, 康寿
山本, 一公
北岡, 教英
中川, 聖一
× 藤井, 康寿 山本, 一公 北岡, 教英 中川, 聖一
|
|||||||
| 著者名(英) |
Yasuhisa, Fujii
Kazumasa, Yamamoto
Norihide, Kitaoka
Seiichi, Nakagawa
× Yasuhisa, Fujii Kazumasa, Yamamoto Norihide, Kitaoka Seiichi, Nakagawa
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では,大学院における講義音声を対象とした,重要文抽出に基づく自動要約手法を述べる.本論文ではまず,音声要約においてよく使われているMaximal Marginal Relevance(MMR)と識別器にSupport Vector Machine(SVM)を用いたfeature-basedを比較し,feature-basedの方が優れた結果を与えることを示す.次に,feature-basedの改善手法に関して述べる.Feature-basedの改善のために,3つのアプローチを試みた.1つ目は,重要文中によく出現するような重要文の手がかり表現(Cue Phrase for important sentences; CP)を自動抽出し,自動要約の素性とする手法である.CPの抽出はConditional Random Fields(CRF)を用いてラベリング問題として定式化される.2つ目は,人間による要約は重要文が連続しやすいという観測に基づき,重要文の連続性を考慮した要約を行う方法である.連続性を考慮するために,連続性をとらえる新たな素性を使用する.3つ目は,冗長性を排除する枠組みの導入である.これらの3手法を用いることで,feature-basedによる要約を改善できた. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper describes summarization methods based on important sentence extraction for the summarization of class-room lecture. First, we compare two summarization techniques; a Maximal Marginal Relevance and a feature-based method which uses a Support Vector Machine (SVM) as a classifier. We show that the latter is superior to the former. Second, we improve the feature-based summarizer by three different types of approaches. In the first approach, we propose a technique that extracts “cue phrases for important sentences (CPs)” that often appear in important sentences and thus can be used as a feature to the summarizer. We formulate CP extraction as a labeling problem of word sequences and use Conditional Random Fields (CRF) for labeling. The second approach presents a novel sentence extraction framework that takes into account the consecutiveness of important sentences based on the observation that important sentences tend to be extracted consecutively by human. We deal with this consecutiveness by applying this new features to a feature-based summarizer. The third approach provides a way to reduce redundancy in the summary. Experimental result shows that our method outperforms traditional sentence extraction methods using these aproaches. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN00116647 | |||||||
| 書誌情報 |
情報処理学会論文誌 巻 51, 号 3, p. 1094-1106, 発行日 2010-03-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7764 | |||||||