WEKO3
アイテム
利用者の情報要求を考慮した観点に基づく複数文書要約とその評価
https://ipsj.ixsq.nii.ac.jp/records/17516
https://ipsj.ixsq.nii.ac.jp/records/175166908233a-69f7-46a7-9709-ef84d784d479
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-06-15 | |||||||
タイトル | ||||||||
タイトル | 利用者の情報要求を考慮した観点に基づく複数文書要約とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Multi-document Viewpoint Summarization Based on Users’ Information Needs and Its Evaluation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 研究論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
総合研究大学院大学情報学専攻 国立情報学研究所 現在,豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
国立情報学研究所 総合研究大学院大学情報学専攻 | ||||||||
著者所属 | ||||||||
国立情報学研究所 総合研究大学院大学情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Informatics The Graduate University for Advanced Studies,National Institute of Informatics,Presently with Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics,Department of Informatics The Graduate University for Advanced Studies | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics,Department of Informatics The Graduate University for Advanced Studies | ||||||||
著者名 |
関, 洋平
× 関, 洋平
|
|||||||
著者名(英) |
Yohei, Seki
× Yohei, Seki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究の目的は,利用者が指定した要約の観点に応じて,複数文書要約を作成するシステムの実現である.要約の観点にはさまざまなとらえ方があるが,本稿では,ある文書集合中で利用者が関心を持ったトピック(話題)と利用者が重視する情報のタイプの2 つに着目した.本システムは,文書集合が与えられると,その文書集合に含まれるトピックのリストを提示する.利用者がこのリストから興味のあるトピックを選び,重視する情報のタイプに応じて,事実報告型,意見重視型,知識重視型のなかから適当なものを選択すると,システムは,利用者が選択したトピックと情報のタイプを重視して当該文書集合の内容をまとめた要約を作成する.要約作成において重視するタイプの情報を抽出するための手がかりとして“文タイプ” と“文書ジャンル” を使用した.提案手法の有用性を検討するために,利用者が重視する情報のタイプを指示して作成した人手作成参照要約を持つ要約実験用データセットViewSumm30 を作成し,評価実験を行った.Closed な実験ではあるが,提案手法の,情報のタイプを考慮しないベースラインシステムに対するカバレッジの向上率は,事実報告型,意見重視型,知識重視型の要約について,30 文書集合の平均で,それぞれ5.4%,33.6%,24.6%だった.また,元文書中の事実,意見,知識を問う質問の集合を作成し,要約を読んだだけで解答できるか調べたところ,提案手法は,ベースラインシステムと比べて,解答率が有意に向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The purpose of this study is to build a multi-document summarizer depending on userspecified summary viewpoints. Once a set of documents is provided to our system, a list of topics discussed in the given document set is presented, so that the user can select a topic or topics of interest as well as the information type to focus on in the summaries, such as facts, opinions, or knowledge, according to the user’s information needs. We assume that sentence types and document genres are related to the types of information included in the source documents and they are useful to differentiate appropriate information types to focus on in the summaries. We evaluated the effectiveness of our proposal with the experimental dataset ViewSumm30. We found improvements of 5.4%, 33.6% and 24.6% for the coverage in fact-reporting, opinion-focused, and knowledge-focused summaries, respectively, compared with our baseline system. For extrinsic evaluation, we prepared sets of questions which can be answered only reading to ask facts, opinions, or knowledge described in the original documents for each of the 30 document sets. The correct answer rates are significantlly increased on the summaries produced by the proposed system than those by the baseline. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 46, 号 SIG8(TOD26), p. 106-119, 発行日 2005-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |