| Item type |
SIG Technical Reports(1) |
| 公開日 |
2018-08-14 |
| タイトル |
|
|
タイトル |
WaveNetを用いた楽譜情報に基づく歌唱F0軌跡の生成 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
深層学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者名 |
和田, 雄介
錦見, 亮
中村, 栄太
糸山, 克寿
吉井, 和佳
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,音符系列 (楽譜) から,WaveNet と呼ばれる深層自己回帰モデルを用いて歌唱 F0 軌跡を生成する手法を示す.歌唱 F0 軌跡には,ビブラートやポルタメントなど,時間 ・ 周波数方向の複雑な変動が含まれる.従来は,このような変動を表現するのに隠れマルコフモデル (HMM) が用いられていたが,歌唱 F0 軌跡の複雑な変動を正確に捉えるためには,より表現力の高いモデルが必要である.この問題を解決するため,近年,深層自己回帰モデル WaveNet を用いて,楽譜と歌詞から歌唱 F0 軌跡を生成する手法が提案された.この手法を基に,本研究では,WaveNet の歌詞情報なしに歌唱 F0 軌跡を生成する能力を調査する.提案手法では,WaveNet による歌唱 F0 軌跡の生成を,音符系列および楽譜から抽出した特徴量によって条件付ける.また,オリジナルの WaveNet では学習時にクロスエントロピー誤差が用いられているが,生成される歌唱 F0 軌跡の自然さを高めるため,提案手法では,正解 F0 軌跡と予測との平均二乗誤差に比例する重みがついたクロスエントロピーを損失関数として用いる.実験の結果,楽譜から抽出した特徴量の追加および損失関数の変更が,どちらも生成された歌唱 F0 軌跡の品質向上に寄与することを示した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
| 書誌情報 |
研究報告音楽情報科学(MUS)
巻 2018-MUS-120,
号 8,
p. 1-7,
発行日 2018-08-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |