WEKO3
アイテム
講演に対する読点の複数アノテーションに基づく自動挿入
https://ipsj.ixsq.nii.ac.jp/records/75427
https://ipsj.ixsq.nii.ac.jp/records/754277204c24c-a85a-412c-a297-802198eb386e
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2011-07-14 | |||||||
| タイトル | ||||||||
| タイトル | 講演に対する読点の複数アノテーションに基づく自動挿入 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Automatic Comma Insertion in Lecture Transcripts Based on Multiple Annotations | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 音声ドキュメント・検索 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies, Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies, Kyoto University | ||||||||
| 著者名 |
秋田, 祐哉
河原, 達也
× 秋田, 祐哉 河原, 達也
|
|||||||
| 著者名(英) |
Yuya, Akita
Tatsuya, Kawahara
× Yuya, Akita Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 音声認識結果の可読性と有用性を高めるためには,句読点を自動的に挿入することが不可欠である.本稿では,単語・係り受け・ポーズの情報を素性とする条件付き確率場 (Conditional Random Fields, CRF)に基づく読点の自動挿入について述べる.読点の挿入箇所は人により大きく異なるため,我々は複数のアノテータによる句読点ラベルを利用して,各アノテータの挿入傾向をモデル化した.そして,これらを投票と補間の枠組みにより組み合わせる.日本語話し言葉コーパス (CSJ) の講演を用いた評価実験では,個々の句読点モデルを組み合わせることで,それぞれのアノテータの読点と,全てのアノテータに共通する読点について高い挿入精度が得られることが示された. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | To enhance readability and usability of speech recognition results, automatic punctuation is an essential process. In this paper, we address automatic comma prediction based on conditional random fields (CRF) using lexical, syntactic and pause information. Since there is large disagreement in comma insertion between humans, we model individual tendencies of punctuation using annotations given by multiple annotators, and combine these models by voting and interpolation frameworks. Experimental evaluations using lectures of the CSJ demonstrated that the combination of individual punctuation models achieves higher prediction accuracy for commas agreed by all annotators and those given by individual annotators. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2011-SLP-87, 号 4, p. 1-6, 発行日 2011-07-14 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||