WEKO3
アイテム
音楽言語モデルを用いた歌声MIDI採譜の定式化と比較
https://ipsj.ixsq.nii.ac.jp/records/2003742
https://ipsj.ixsq.nii.ac.jp/records/2003742f1acce3f-3b7a-47f8-bb7b-9ca36ba0dee6
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2027年8月24日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-08-24 | |||||||||||||
| タイトル | ||||||||||||||
| 言語 | ja | |||||||||||||
| タイトル | 音楽言語モデルを用いた歌声MIDI採譜の定式化と比較 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 音楽理解 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 九州大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 台湾中央研究院 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 台湾中央研究院 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 九州大学 | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Kyushu University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Academia Sinica | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Academia Sinica | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Kyushu University | ||||||||||||||
| 著者名 |
杉本,悠
× 杉本,悠
× Jun-You,Wang
× Li,Su
× 中村,栄太
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 本研究では,歌声MIDI採譜に音楽言語モデルを適用する方法について調べる.歌声MIDI採譜は,音楽音響信号から,歌声パートにおける各音符の音高,発音時刻,消音時刻を推定するタスクである.近年の研究では,深層ニューラルネットワーク(DNN)を用いて音高をフレームごとに予測する音響モデルが研究されてきたが,歌唱における大きな音高の変動や不明瞭な音符の境界のため,依然として誤推定が発生している.この課題に対処するために,本研究では音符レベルで音高確率を推定するマルコフモデルおよびDNNベースの言語モデルを構築し,DNNベースの音響モデルに統合する.統合方法として,生成モデリングとトランスデューサによる2つの手法の定式化を行う.実験結果から,いずれの統合方法においても,ベースラインの音響モデルと比較して採譜精度が有意に向上することが示された.さらに,各言語モデルおよび各統合手法ごとに異なる長所と短所についても議論する. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN10438388 | |||||||||||||
| 書誌情報 |
研究報告音楽情報科学(MUS) 巻 2025-MUS-144, 号 8, p. 1-7, 発行日 2025-08-24 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8752 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||