ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音楽情報科学(MUS)
  3. 2022
  4. 2022-MUS-134

双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測

https://ipsj.ixsq.nii.ac.jp/records/218452
https://ipsj.ixsq.nii.ac.jp/records/218452
429e9c7c-9b27-4627-aa1d-f05f6f1fff34
名前 / ファイル ライセンス アクション
IPSJ-MUS22134060.pdf IPSJ-MUS22134060.pdf (1.7 MB)
Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2022-06-10
タイトル
タイトル 双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測
タイトル
言語 en
タイトル Amplitude Spectrogram Prediction from MFCC and Loudness Using Bidirectional RNN
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション4
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
香川高等専門学校
著者所属
香川高等専門学校
著者所属(英)
en
National Institute of Technology, Kagawa College
著者所属(英)
en
National Institute of Technology, Kagawa College
著者名 川口, 翔也

× 川口, 翔也

川口, 翔也

Search repository
北村, 大地

× 北村, 大地

北村, 大地

Search repository
著者名(英) Shoya, Kawaguchi

× Shoya, Kawaguchi

en Shoya, Kawaguchi

Search repository
Daichi, Kitamura

× Daichi, Kitamura

en Daichi, Kitamura

Search repository
論文抄録
内容記述タイプ Other
内容記述 変分自己符号化器(variational autoencoder: VAE)は入力データの潜在的な特徴量を教師無しで学習できる DNN であり,潜在特徴量に複数クラスの相対関係を表す構造を導入することで,一定の解釈性を持たせることができる.例えば,複数楽器音の音色特徴量を表すメル周波数ケプストラム係数(mel-frequency cepstrum coefficient: MFCC)の潜在特徴量を VAE で学習することで,各楽器音の特徴量を併せ持つような新しい音響信号の MFCC を新たに生成できる.我々は現在,VAE を用いて楽器音の音色を変換するシステムの構築を目指しており,その一例として,入力信号の MFCC を VAE で生成した MFCC に置き換える音色変換を検討している.このようなシステムでは,基本周波数,MFCC,及び音量変化の 3 つの音響特徴量を入力とすることを想定しているが,MFCC を置き換えた後に音響信号に戻すためには,前述の 3 つの音響特徴量からスペクトログラムを生成する必要があり,これは解析的な処理ではない.そこで本稿では,基本周波数,MFCC,及び音量から振幅スペクトログラムを予測する手法について検討する.特に,前述の音響特徴量を入力とする双方向再帰型ニューラルネットワークを用いた振幅スペクトログラムの予測について実験的に調査する.ピアノ及びギターを用いた実験では,両楽器において比較的高精度に振幅スペクトログラムが予測可能であることを示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10438388
書誌情報 研究報告音楽情報科学(MUS)

巻 2022-MUS-134, 号 60, p. 1-6, 発行日 2022-06-10
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8752
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 15:09:25.784889
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3