| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-06-07 |
| タイトル |
|
|
タイトル |
非整数ストライド処理アルゴリズムを用いたサンプリング周波数非依存畳み込み層による楽音分離の実験的評価 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション2 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学/産業技術総合研究所 |
| 著者所属 |
|
|
|
産業技術総合研究所 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京農工大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo / National Institute of Advanced Industrial Science and Technology (AIST) |
| 著者所属(英) |
|
|
|
en |
|
|
National Institute of Advanced Industrial Science and Technology (AIST) |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Tokyo University of Agriculture and Technology (TUAT) |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者名 |
今村, 奏海
中村, 友彦
高宗, 典玄
矢田部, 浩平
猿渡, 洋
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
我々はこれまでに,単一の深層ニューラルネットワーク(deep neural network: DNN)で複数のサンプリング周波数(sampling-frequency: SF)を扱うため,SF 非依存(sampling-frequency-independet: SFI)畳み込み層を提案してきた.SF に応じて畳み込み層の重みを生成する手法であり,学習時の SF とは異なる SF も扱うことができる.SFI 畳み込み層は,通常の畳み込み層と置換可能であり,畳み込み層を用いた様々な DNN に適用できる.SFI 畳み込み層とSFIではない層を併用する場合,SFI ではない層の入力の時間解像度が変化しないように,SFI 畳み込み層のカーネルサイズとストライドを調整する必要がある.しかし,この調整法では,学習時と推論時の SF の組み合わせによっては,カーネルサイズとストライドが非整数になりうる.畳み込み層の計算アルゴリズムは整数のカーネルサイズとストライドを仮定しており,そのままでは計算することができない.この問題に対し,我々は過去に窓付き sinc 補間を用いて非整数のストライドに対処する計算アルゴリズムを提案した.窓付き sinc 補間により,離散時間信号の連続時間での表現を得ることができるため,所望のストライドで処理可能となる.本稿では,窓付き sinc 補間だけではなく,より一般の補間手法も利用できるように本アルゴリズムを拡張し,補間手法がアルゴリズムの性能に与える影響を検証する.さらに,本アルゴリズムのより詳細な分析のため,楽音分離実験により分離性能および計算時間の観点から評価する. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2024-SLP-152,
号 67,
p. 1-9,
発行日 2024-06-07
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |