| Item type |
SIG Technical Reports(1) |
| 公開日 |
2018-08-14 |
| タイトル |
|
|
タイトル |
注意機構を用いたエンコーダ・デコーダモデルに基づく歌声の音符推定 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
深層学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
産業技術総合研究所(AIST) |
| 著者所属 |
|
|
|
産業技術総合研究所(AIST) |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科/理化学研究所革新知能統合研究センター(理研AIP) |
| 著者名 |
錦見, 亮
中村, 栄太
深山, 覚
後藤, 真孝
吉井, 和佳
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,楽曲の主旋律を構成する音符系列を歌声から推定する手法について述べる.歌声は楽曲の主旋律を担うことが多く楽曲の印象に密接に関連しているため,歌声から音符推定することは楽曲解析において重要な技術である.従来は,音楽音響信号から歌声の連続的な音高軌跡 (F0 軌跡)を予め推定し,F0 軌跡を時間 ・ 周波数方向に離散化することで音符の推定が行われる.しかし,歌声には歌唱表現 (ビブラートやこぶし等) が含まれ,他の楽器に比べて音高のダイナミクスが非常に大きいため,音符推定には歌声変動を複雑かつ精密なモデル化する必要がある.また,事前に抽出される F0 軌跡を推定精度が,音符推定の精度にも影響する.そこで本研究では,DNN を用いて歌声から直接メロディ音符を推定する手法を提案する.具体的には,近年音声認識などで注目されている注意機構を用いたエンコーダ ・ デコーダモデルに基づき問題に取り組む.このモデルを使用するにあたり,音声認識 (音声 (信号) を文字や単語 (記号) に変換) のアナロジーとして,歌声音符推定 (歌声 (信号) を音符 (記号) に変換) を捉えた.人工的に合成した MIDI データと伴奏がないクリーンな歌声データを用いて,提案法の動作と性能を確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
| 書誌情報 |
研究報告音楽情報科学(MUS)
巻 2018-MUS-120,
号 7,
p. 1-6,
発行日 2018-08-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |