WEKO3
アイテム
書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
https://ipsj.ixsq.nii.ac.jp/records/9265
https://ipsj.ixsq.nii.ac.jp/records/9265a501dadf-7e19-46b1-98d7-15e77f63c141
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-02-15 | |||||||
タイトル | ||||||||
タイトル | 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Analysis of Utterance Impressions in Speech and Text for Indexing to Transcriptions | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:音声ドキュメント処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | コーパス分析 | |||||||
著者所属 | ||||||||
千葉大学 | ||||||||
著者所属 | ||||||||
千葉大学 | ||||||||
著者所属 | ||||||||
千葉大学 | ||||||||
著者所属 | ||||||||
早稲田大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda University | ||||||||
著者名 |
西田, 昌史
× 西田, 昌史
|
|||||||
著者名(英) |
Masafumi, Nishida
× Masafumi, Nishida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,音声から書き起こしを自動的に作成するシステムに関する研究がさかんに行われている.これまでは,音声を正確に書き起こすことに重点をおいて研究されてきているが,見た者にとって議論の内容をより理解しやすい書き起こしの作成が重要であると考えられる.議論の内容を正確に伝えるには言語情報だけでは不十分であり,議論の場面や発話意図,感情といった情報も必要であると考えられる.そこで,本研究では会議や討論などの書き起こしに発話意図を付与することを目指し,テキストと音声の両方から発話印象について分析することを目的とした.まず,文字の太さや大きさの変化といった文字の装飾や,「!」,「?」などの記号に着目し,そのようなテキストの変化を書き起こしに付与する形で主観評価実験を行うことにより「疑問」,「驚き」などの発話印象がどの程度感じられるのかを調べた.また,音声についても同様に主観評価実験を行い,その結果と「F0」や「パワー」などの韻律パラメータを使って重回帰分析を行い,韻律パラメータと発話印象の関係を分析した.その結果,各テキスト変化,韻律パラメータとそれぞれの発話印象との関係が明らかになった.さらにそれらを総合的に分析することで,テキストと音声では発話印象の受け方が異なるものと,同じ傾向のものがあることが明らかになった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In recent years, a great amount of research has been done on systems that transcribe utterances through automatic speech recognition. This research has generally been focused on transcribing utterances correctly. What is presently required, however, is a transcription method that enables the overall content of a given discourse to be more easily understood by readers. It is generally considered that linguistic information by itself is insufficient for this purpose, and that a way of showing speaker's intentions and emotions is also required. In this study, we analyzed user's impressions of utterances from both text and speech, with the aim of at indexing the impressions to the transcriptions of discourse forums such as meetings and discussions. We investigated how impressions such as “doubt” and “surprise” are felt by changing the size of written characters and indexing signs such as question marks and exclamation marks in the text. The relation between prosody parameters and utterance impressions was analyzed by using multiple linear regression. As a result, we were able to clarify the relationship between variations of text, prosody parameters, and utterance impressions. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 50, 号 2, p. 460-468, 発行日 2009-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |