双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測

川口, 翔也; 北村, 大地; Shoya, Kawaguchi; Daichi, Kitamura

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測

https://ipsj.ixsq.nii.ac.jp/records/218452

名前 / ファイル	ライセンス	アクション
IPSJ-MUS22134060.pdf (1.7 MB)	Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2022-06-10

タイトル

双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測

タイトル

言語

タイトル

Amplitude Spectrogram Prediction from MFCC and Loudness Using Bidirectional RNN

言語

jpn

キーワード

主題Scheme

Other

主題

ポスターセッション4

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

香川高等専門学校

著者所属

香川高等専門学校

著者所属(英)

National Institute of Technology, Kagawa College

著者所属(英)

National Institute of Technology, Kagawa College

著者名

川口, 翔也
北村, 大地

著者名(英)

Shoya, Kawaguchi
Daichi, Kitamura

論文抄録

内容記述タイプ

Other

内容記述

変分自己符号化器（variational autoencoder: VAE）は入力データの潜在的な特徴量を教師無しで学習できる DNN であり，潜在特徴量に複数クラスの相対関係を表す構造を導入することで，一定の解釈性を持たせることができる．例えば，複数楽器音の音色特徴量を表すメル周波数ケプストラム係数（mel-frequency cepstrum coefficient: MFCC）の潜在特徴量を VAE で学習することで，各楽器音の特徴量を併せ持つような新しい音響信号の MFCC を新たに生成できる．我々は現在，VAE を用いて楽器音の音色を変換するシステムの構築を目指しており，その一例として，入力信号の MFCC を VAE で生成した MFCC に置き換える音色変換を検討している．このようなシステムでは，基本周波数，MFCC，及び音量変化の 3 つの音響特徴量を入力とすることを想定しているが，MFCC を置き換えた後に音響信号に戻すためには，前述の 3 つの音響特徴量からスペクトログラムを生成する必要があり，これは解析的な処理ではない．そこで本稿では，基本周波数，MFCC，及び音量から振幅スペクトログラムを予測する手法について検討する．特に，前述の音響特徴量を入力とする双方向再帰型ニューラルネットワークを用いた振幅スペクトログラムの予測について実験的に調査する．ピアノ及びギターを用いた実験では，両楽器において比較的高精度に振幅スペクトログラムが予測可能であることを示す．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10438388

書誌情報

研究報告音楽情報科学（MUS）

巻 2022-MUS-134, 号 60, p. 1-6, 発行日 2022-06-10

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8752

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 15:09:25.784889

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

双方向RNNによるMFCC及びラウドネスからの振幅スペクトログラム予測

× 川口, 翔也

× 北村, 大地

× Shoya, Kawaguchi

× Daichi, Kitamura

Versions

Share

Cite as

エクスポート