WEKO3
アイテム
単語重要度と語彙的結束性を利用したテキストセグメンテーション
https://ipsj.ixsq.nii.ac.jp/records/48764
https://ipsj.ixsq.nii.ac.jp/records/48764250c41aa-7ea0-4fdb-ae6a-e1afad444d23
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-03-04 | |||||||
タイトル | ||||||||
タイトル | 単語重要度と語彙的結束性を利用したテキストセグメンテーション | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Segmentation Based on Word Importance and Lexical Cohesion | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)NTTデータ情報科学研究所 | ||||||||
著者所属 | ||||||||
(株)NTTデータ情報科学研究所 | ||||||||
著者所属 | ||||||||
(株)NTTデータ情報科学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Laboratory for Information Technology NTT DATA Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Laboratory for Information Technology NTT DATA Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Laboratory for Information Technology NTT DATA Corporation | ||||||||
著者名 |
平尾, 努
× 平尾, 努
|
|||||||
著者名(英) |
Tsutomu, Hirao
× Tsutomu, Hirao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,単語重要度と語彙的結束性に基づきテキストを段落に分割する手法を示し,更に両手法を統合した精度向上手法を提案する.新聞記事を対象として実験を行い,記事の形式段落を正解としてセグメンテーションの精度を適合率・再現率で評価した.訓練セットを用いてパラメータを決定し評価した結果,語彙的結束性を用いた手法では適合率39%,再現率26%,単語重要度を用いた手法では適合率40%,再現率36%であった.両手法を統合した結果,適合率は39%,再現率は52%に向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we first describe a text segmentation method based on lexical cohesion and word importance, and then propose merging results from the both methods to raise the segmentation accuracy. This proposed technique was evaluated using newspaper articles. Recall and precision rates were used to compare the paragraph borders extracted by the techique with those in newspaper articles. Segmentaion parameters were determined using training data results. Precision and recall using lexical cohesion was 39% and 26%, while those using word importance was 40% and 36%, respectively. For merged results, precision was 39% and recall jumped to 52%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1999, 号 22(1998-NL-130), p. 41-48, 発行日 1999-03-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |