Item type |
SIG Technical Reports(1) |
公開日 |
2021-06-11 |
タイトル |
|
|
タイトル |
聴取によって心が和む音声の合成に向けた基礎検討~認識・想起した感情および音響特徴量の観点から~ |
タイトル |
|
|
言語 |
en |
|
タイトル |
Preliminary study on synthesizing relaxing voices– from a perspective of recognized/evoked emotions and acoustic features - |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般発表 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東北大学電気通信研究所/大学院情報科学研究科 |
著者所属 |
|
|
|
東北大学電気通信研究所/大学院情報科学研究科 |
著者所属 |
|
|
|
ピクシーダストテクノロジーズ株式会社 |
著者所属 |
|
|
|
ピクシーダストテクノロジーズ株式会社 |
著者所属 |
|
|
|
ピクシーダストテクノロジーズ株式会社 |
著者所属(英) |
|
|
|
en |
|
|
Research Institute of Electrical Communication and Graduate School of Information Sciences, Tohoku University |
著者所属(英) |
|
|
|
en |
|
|
Research Institute of Electrical Communication and Graduate School of Information Sciences, Tohoku University |
著者所属(英) |
|
|
|
en |
|
|
Pixie Dust Technologies, Inc. |
著者所属(英) |
|
|
|
en |
|
|
Pixie Dust Technologies, Inc. |
著者所属(英) |
|
|
|
en |
|
|
Pixie Dust Technologies, Inc. |
著者名 |
渡邊, 悠希
坂本, 修一
星, 貴之
長谷, 芳樹
中野, 学
|
著者名(英) |
Yuki, Watanabe
Shuichi, Sakamoto
Takayuki, Hoshi
Yoshiki, Nagatani
Manabu, Nakano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
聴取により心が和む音声の合成を最終的な目的として,様々な感情を想定して発話された音声から認識・想起した感情を評価するとともに,その音声のもつ音響特徴量を分析した.感情評価実験の結果,癒やしの感情は感情次元の valence が正,activation が負の象限に付置されること,癒やしの程度において認識した感情と想起した感情との間に正の相関があることが明らかとなった.加えて,癒やしの感情とある程度の相関を有する音響特徴量は明らかとなった一方で,通常の音声合成等に用いられる低次の音響特徴量との強い相関は見られなかった.このことは, 癒やしの感情を想起させる音声を安定して合成するためには,より適切な音響特徴量を探索する必要があることを示唆している. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The goal of this study is to synthesize speech sound which induces relaxed emotion. As the preliminary study, we investigated how listeners felt when they heard speech sounds with various emotions. In addition, we analyzed the relationship between perceived emotions and the acoustic features of the speech sound with emotions. The results of the experiment revealed that relaxed emotion was categorized in the quadrant of positive valance and negative activation. Moreover, a positive correlation was observed between the recognized and evoked relaxed emotions. On the other hand, the strong correlation between low-order acoustic features commonly used to synthesize emotional speech sound and the amount of perceived relaxed emotion was not seen. These results suggest that more appropriate acoustic features need to be considered for the stable synthesis of the speech sound that induces relaxed emotions in the future work. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2021-SLP-137,
号 59,
p. 1-6,
発行日 2021-06-11
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |