WEKO3
アイテム
Melisma: 楽譜ラベルに基づく単一モデルによるDNN多楽器・多歌唱者音合成システム
https://ipsj.ixsq.nii.ac.jp/records/238196
https://ipsj.ixsq.nii.ac.jp/records/238196b1ccf9f1-e17e-4a97-ac92-5d202355f4f5
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年8月19日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-08-19 | |||||||
| タイトル | ||||||||
| タイトル | Melisma: 楽譜ラベルに基づく単一モデルによるDNN多楽器・多歌唱者音合成システム | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Melisma: Single-DNN-based multi-instrument and multi-speaker sound synthesis system using score embedding | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 音声・音響処理1 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 神楽音楽出版 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KAGURA Music Pub. | ||||||||
| 著者名 |
中迫, 酒菜
× 中迫, 酒菜
|
|||||||
| 著者名(英) |
Sakana, Nakasako
× Sakana, Nakasako
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本稿では楽器音・歌唱音声を統一的かつ柔軟に合成可能なシステムである Melisma を紹介する.楽器は歌唱と違い従来の音素ラベルを付与することが困難なものも多いため,本システムでは音素ラベルと継続長モデルを使用しない.また,一般的な音楽制作に十分な速度を出すため,全ての楽器と歌唱を総パラメーター数およそ 8M のひとつのモデルで取り扱えること,長いフレーズを情緒的に表現するための楽譜の解釈など,音楽制作現場で求められる条件を充たすための方法を紹介する. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper introduces Melisma, a system capable of synthesizing instrumental and vocal sounds in a unified and flexible manner. Unlike vocals, many instruments have difficulties in assigning phoneme labels. Therefore this system does not use phoneme labels and duration models. The report introduces methods to meet the conditions required in music production, such as integrating all instruments and vocals into a single model with approximately 8 million parameters in total to achieve sufficient speed for general music production, and interpreting musical scores to express long phrases emotively. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10438388 | |||||||
| 書誌情報 |
研究報告音楽情報科学(MUS) 巻 2024-MUS-141, 号 2, p. 1-6, 発行日 2024-08-19 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8752 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||