WEKO3
アイテム
単語ベクトルを用いた文書要約の検討
https://ipsj.ixsq.nii.ac.jp/records/101158
https://ipsj.ixsq.nii.ac.jp/records/1011586dc2de94-b9ea-4111-a23d-f2c818d519d2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2014 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
SPT:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-05-08 | |||||||
タイトル | ||||||||
タイトル | 単語ベクトルを用いた文書要約の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Document Summarization Using Word Vectors | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話株式会社NTTメディアインテリジェンス研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTメディアインテリジェンス研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTメディアインテリジェンス研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTメディアインテリジェンス研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Media Intelligence Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Media Intelligence Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Media Intelligence Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Media Intelligence Laboratories | ||||||||
著者名 |
別所, 克人
× 別所, 克人
|
|||||||
著者名(英) |
Katsuji, Bessho
× Katsuji, Bessho
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文書要約の手法として、単語をトピックベクトルとして表現し、文や文書を構成単語のベクトルの合成として表し、文のスコアを、対象文書のベクトルとの類似度として、スコアの高い文を要約テキストとして出力する手法を検証した。テキストブロックのリストからなる文書を入力とし、話題ごとに 1 文ないし 1 語の要約テキストを出力するという制約条件下で実験を行ったところ、単語ベクトルに基づく手法は、単語スコアの和ないし平均に基づく手法よりも、高精度となったことを報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As a technique of document summarization, we verified a technique of expressing a word as a topic vector, and expressing a sentence and a document as a composition of the vectors of constituent words, and computing the score of a sentence based on a similarity with the vector of the subject document, and outputting a high-scored sentence as a summary text. We conducted an experiment under the constraints of inputting a document which consists of the list of text blocks, and of outputting the summary text as one sentence or one word for every topic. The results indicate that our proposed method of using a word vector achieved a higher F-score compared to the baseline technique that uses the sum or the average of a word score. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA12628305 | |||||||
書誌情報 |
研究報告セキュリティ心理学とトラスト(SPT) 巻 2014-SPT-9, 号 9, p. 1-6, 発行日 2014-05-08 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |