| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-06-16 |
| タイトル |
|
|
タイトル |
深層学習を用いたアカペラ歌声分離における歌声合成による教師データ拡張の検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Data Augmentation by Synthesised Voice for Deep Learning-based A Cappella Separation |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般発表 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京都立大学 |
| 著者所属 |
|
|
|
東海大学 |
| 著者所属 |
|
|
|
東京都立大学 |
| 著者所属 |
|
|
|
東京都立大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Tokyo Metropolitan University |
| 著者所属(英) |
|
|
|
en |
|
|
Tokai University |
| 著者所属(英) |
|
|
|
en |
|
|
Tokyo Metropolitan University |
| 著者所属(英) |
|
|
|
en |
|
|
Tokyo Metropolitan University |
| 著者名 |
風間, 香伽
木下, 裕磨
植野, 夏樹
小野, 順貴
|
| 著者名(英) |
Kyoka, Kazama
Yuma, Kinoshita
Natsuki, Ueno
Nobutaka, Ono
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,深層学習を用いたアカペラ歌声分離に有効な教師データを検討する.アカペラや合唱など楽器を用いない歌唱データセットは少なく実環境での収録も困難であるため,歌声合成を利用してアカペラ歌唱データを作成し,そのデータを教師として深層学習モデルを訓練する.まず,アカペラアレンジされた楽曲の楽譜を MuseScore から入手し,歌声合成ツール UTAU を用いて計 100 分の歌唱データセットを作成する.作成した歌声合成データがアカペラ歌声分離に有効であるかを調査するため,教師データとして日本語アカペラ歌唱コーパスを使用した場合と,作成した歌声合成データを使用した場合との比較実験を行う.実験の結果,歌声合成による教師データの生成が教師データの不足を補い,アカペラ歌声分離の性能向上に有用であることが示される. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this study, we examine efficacy of training data augmentation for a cappella singing voice separation using deep learning. Since there are few singing voice datasets without musical instruments such as a cappella and chorus, and it is difficult to record these in a real environment, we create an a cappella singing voice data using singing voice synthesis and train a deep neural network (DNN) using this data. First, we obtain a cappella-arranged musical scores from MuseScore, and create a singing voice data of 100 minutes in total using the singing voice synthesis tool UTAU. In order to investigate whether the created synthesized singing voice data is effective for a cappella singing voice separation, we conducted a comparative experiment using Japanese a cappella vocal ensemble corpus as training data and a synthesized singing voice data. Experimental results show that the data augmentation by singing voice synthesis compensates for the lack of training data and is useful for improving the performance of a cappella singing voice separation. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
| 書誌情報 |
研究報告音楽情報科学(MUS)
巻 2023-MUS-137,
号 23,
p. 1-6,
発行日 2023-06-16
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |