WEKO3
アイテム
合成音声歌唱のポルタメントの統計的性質に基づくLSTMに入力する特徴量の検討
https://ipsj.ixsq.nii.ac.jp/records/210214
https://ipsj.ixsq.nii.ac.jp/records/210214b9ddc6b1-b213-4d5d-877d-70e2d1e3cd99
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-03-09 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 合成音声歌唱のポルタメントの統計的性質に基づくLSTMに入力する特徴量の検討 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 公立はこだて未来大学 | ||||||||||||
| 著者所属 | ||||||||||||
| 公立はこだて未来大学 | ||||||||||||
| 著者所属 | ||||||||||||
| 公立はこだて未来大学 | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Future University Hakodate | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Future University Hakodate | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Future University Hakodate | ||||||||||||
| 著者名 |
田中, 瑞穂
× 田中, 瑞穂
× 竹川, 佳成
× 平田, 圭二
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 近年,音声合成ソフトによる歌唱を用いた楽曲が増加している.それに伴い,人間歌唱を模倣する歌声自動合成システムが開発されている.しかし,合成音声歌唱には,歌唱の平坦さを軽減するためにユーザが生み出した固有の歌唱技術(急なピッチ変化や短いヴィブラートなど)が存在する.これらの歌唱技術は人間が歌唱することが想定されていないため,従来の人間歌唱を対象とした歌唱モデルでは効率よく学習,推定することが難しいと考えられる.そこで本研究では,UTAU のポルタメントについて統計を取り,その統計結果から特徴量を検討し,音声合成歌唱の表情付けのためのパラメータを LSTM を使用して学習,推定する.ポルタメントの統計では,各要素ごとのポルタメントの出現率とポルタメントの要素の傾向について調べた.その結果,音のタイプ,音高,音価がポルタメントの出現率に影響を与えていることがわかった.また,ポルタメントに用いる線の形状は重要視されていなかった.これらの統計的性質の観察結果から,学習に用いる特徴量を決定し,LSTM モデルで学習,推定を行う.このモデルを使用してポルタメントを付与した音声と従来手法で付与した音声の比較実験を行ったところ,抑揚の有無と歌唱の自然さ共に従来手法の方が高い評価を得た.しかし,一部楽曲の歌唱の自然さは,提案手法の方が高い評価を得た. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10438388 | |||||||||||
| 書誌情報 |
研究報告音楽情報科学(MUS) 巻 2021-MUS-130, 号 25, p. 1-8, 発行日 2021-03-09 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8752 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||