ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2003
  4. 124(2003-SLP-049)

談話標識の統計的選択に基づいたCSJの講演からの重要文抽出

https://ipsj.ixsq.nii.ac.jp/records/57163
https://ipsj.ixsq.nii.ac.jp/records/57163
885eb984-84bd-4b54-984c-0d3a2c80fbcb
名前 / ファイル ライセンス アクション
IPSJ-SLP03049013.pdf IPSJ-SLP03049013.pdf (799.8 kB)
Copyright (c) 2003 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2003-12-18
タイトル
タイトル 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出
タイトル
言語 en
タイトル Automatic Extraction of Key Sentences from CSJ Lectures using Statistics of Presumed Discourse Markers
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学情報学研究科知能情報学専攻
著者所属
京都大学情報学研究科知能情報学専攻
著者所属
京都大学情報学研究科知能情報学専攻
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者名 南條浩輝 北出, 祐 河原, 達也

× 南條浩輝 北出, 祐 河原, 達也

南條浩輝
北出, 祐
河原, 達也

Search repository
著者名(英) Hiroaki, Nanjo Tasuku, Kitade Tatsuya, Kawahara

× Hiroaki, Nanjo Tasuku, Kitade Tatsuya, Kawahara

en Hiroaki, Nanjo
Tasuku, Kitade
Tatsuya, Kawahara

Search repository
論文抄録
内容記述タイプ Other
内容記述 講演の自動インデキシングを目的として,談話標識の統計的選択に基づく手法をCSJ(日本語話し言葉コーパス)の重要分セットに適用した結果について報告する.本手法は,学会講演特有の談話構造の境界に頻出する談話標識を自動的に求めた上で,これに基づく統計的な重要度尺度を定義するものである.さらに話題語(キーワード)の統計量の基づく重要度尺度と統合も行う.CSJの19件の学会講演を対象に重要分抽出精度の評価を行い,(1)談話構造に基づく手法が有効であること,(2)話題語に基づく手法と統合することで相乗効果が得られること,(3)提案手法が音声認識誤りに対して頑健であること,(4)人間による抽出制度と比較して10-15%の低下であること,を確認した.また,文区切りの精度が重要分抽出に影響が大きいことが判明したので,韻律情報を用いることで文区切り精度および重要文抽出精度の改善を行った.
論文抄録(英)
内容記述タイプ Other
内容記述 Automatic extraction of key sentences from lecture audio archives is addressed. The method makes use of the characteristic expressions used in initial utterance of sections, which are defined as discourse markers and derived in a totally unsupervised manner based on word statistics. The statistics of the presumed discourse markers are then used to define the importance of the sentences. It is also combined with the conventional tf-idf measure of content words. Experimental results using lectures of CSJ (Corpus of Spontaneous Japanese) confirm the effectiveness of the method based on the discourse markers and its combination with the keyword-based method. It is also shown that the method is robust against ASR errors and sentence segmentation accuracy is more vital. Thus, we enhance the segmentation using prosodic information.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 情報処理学会研究報告音声言語情報処理(SLP)

巻 2003, 号 124(2003-SLP-049), p. 73-78, 発行日 2003-12-18
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 04:36:48.521795
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3