Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Amplitude Spectrogram Prediction from MFCC and Loudness Using Bidirectional RNN |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション4 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
香川高等専門学校 |
著者所属 |
|
|
|
香川高等専門学校 |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Technology, Kagawa College |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Technology, Kagawa College |
著者名 |
川口, 翔也
北村, 大地
|
著者名(英) |
Shoya, Kawaguchi
Daichi, Kitamura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
変分自己符号化器(variational autoencoder: VAE)は入力データの潜在的な特徴量を教師無しで学習できる DNN であり,潜在特徴量に複数クラスの相対関係を表す構造を導入することで,一定の解釈性を持たせることができる.例えば,複数楽器音の音色特徴量を表すメル周波数ケプストラム係数(mel-frequency cepstrum coefficient: MFCC)の潜在特徴量を VAE で学習することで,各楽器音の特徴量を併せ持つような新しい音響信号の MFCC を新たに生成できる.我々は現在,VAE を用いて楽器音の音色を変換するシステムの構築を目指しており,その一例として,入力信号の MFCC を VAE で生成した MFCC に置き換える音色変換を検討している.このようなシステムでは,基本周波数,MFCC,及び音量変化の 3 つの音響特徴量を入力とすることを想定しているが,MFCC を置き換えた後に音響信号に戻すためには,前述の 3 つの音響特徴量からスペクトログラムを生成する必要があり,これは解析的な処理ではない.そこで本稿では,基本周波数,MFCC,及び音量から振幅スペクトログラムを予測する手法について検討する.特に,前述の音響特徴量を入力とする双方向再帰型ニューラルネットワークを用いた振幅スペクトログラムの予測について実験的に調査する.ピアノ及びギターを用いた実験では,両楽器において比較的高精度に振幅スペクトログラムが予測可能であることを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2022-MUS-134,
号 60,
p. 1-6,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |