WEKO3
アイテム
韻律構造を考慮した対話音声の発話速度の分析と合成
https://ipsj.ixsq.nii.ac.jp/records/57682
https://ipsj.ixsq.nii.ac.jp/records/57682df240917-645b-4859-8506-c351e6874b93
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-24 | |||||||
タイトル | ||||||||
タイトル | 韻律構造を考慮した対話音声の発話速度の分析と合成 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Analysis and Synthesis of Speech Rate in Dialogue Speech Based on Prosodic Structures | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学工学系研究科電子情報工学専攻 | ||||||||
著者所属 | ||||||||
東京大学工学系研究科電子情報工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Communication Engineering, School of Engineering, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Communication Engineering, School of Engineering, University of Tokyo | ||||||||
著者名 |
川波, 弘道
× 川波, 弘道
|
|||||||
著者名(英) |
Hiromichi, Kawanami
× Hiromichi, Kawanami
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 対話音声合成の韻律規則作成のために、対話調音声と朗読調音声の比較研究を進めている。すでに発話速度の合成規則も作成しているが,これは一韻律文に対して一律の持続時間制御を行うものであった.ここでは朗読音声との比較による対話音声のモーラ持続時間短縮率を中心に,発話速度と基本周波数パターン(F_0パターン)により定義される韻律構造との対応を調べた。具体的には,F_0パターン重畳モデルに基づく韻律文,韻律節,韻律句,韻律語の4つの韻律単位と発話速度との関係を分析した.韻律文では、対話音声の発話速度は、文頭で朗読音声程度の発話速度であり,それが徐々に大きくなった後再び文末に向けて減少するが、同様の傾向が、程度は小さくなるものの下位レベルでも見られることが分かった.その結果に基づき,韻律構造を反映した発話速度制御規則に対すら考察を行った. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have been conducting a comparative study on the dialogue-study and reading-style, to construct prosodic rules for the synthesis of dialogue speech. In the current report, analyses were conducted for the speech rate and rules were constructed with respect to the prosodic structure defined based on the F_0 contours. We have formerly defined 4 levels in prosodic units based on the F_0 contour modeling (so called Fujisaki's modeling); prosodic sentence, prosodic clause, prosodic phrase and prosodic word. These units are adopted for the current analysis. In a prosodic sentence, the speech rate of dialogue-style speech stared with a value close to the case of reading-style, gradually increased, and then slowed down toward the end of the sentence. Similar tendency was also observed in lower level units, but the degree of speech rate change in a unit was smaller for minor levels. Based on the result, we give consideration to the prosodic rules for synthesizing dialogue-style speech rate reflecting their prosodic structure. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1998, 号 68(1998-SLP-022), p. 49-54, 発行日 1998-07-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |