Item type |
SIG Technical Reports(1) |
公開日 |
2022-02-22 |
タイトル |
|
|
タイトル |
球波動関数展開を用いた深層学習による少数測定データからの頭部伝達関数補間 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Interpolation of head-related transfer function from small amount of observation data using deep learning based on spherical wavefunction expansion |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション3 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者名 |
伊藤, 悠貴
中村, 友彦
小山, 翔一
猿渡, 洋
|
著者名(英) |
Yuki, Ito
Tomohiko, Nakamura
Shoichi, Koyama
Hiroshi, Saruwatari
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
臨場感のあるバイノーラル信号を合成するためには受聴者本人の頭部伝達関数(head-related transfer function: HRTF)を用いることが望ましい.HRTF の計測には時間がかかるため,少数の観測から HRTF を補間できればより簡便な測定で済み利便性が向上する.従来の球波動関数展開による HRTF 補間方法では任意音源位置の HRTF を簡便に補間できるものの,観測点が少なくなるに従い補間性能が低下する傾向にあった.そこで本稿では,球波動関数展開による HRTF の表現方法とメタ学習を組み合わせた,深層学習に基づく少数観測点からの HRTF 補間手法を提案する.メタ学習では少数観測点から補間を行う状況を模倣して深層ニューラルネットワークを訓練するため,提案法は観測点数が少ない場合でも安定して動作できる.HRTF 補間実験により,提案法は観測点数が少ない場合に従来法よりも高精度に補間が可能であることを示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In binaural synthesis, listeners’ individual head-related transfer functions (HRTFs) are necessary for highly-immersive spatial audio. Since HRTF measurement is generally time-consuming, it will be helpful if high-resolution HRTFs are interpolated from a small number of HRTFs obtained by a simple measurement procedure. One of the established HRTF interpolation methods is the method based on spherical wavefunction expansion, which allows estimating HRTFs at arbitrary direction and distance in a simple manner; however, its interpolation accuracy deteriorates as the number of measurements decreases. We propose a deep-neural-network (DNN)-based HRTF interpolation method combining the representation using spherical wavefunction expansion and meta-learning . Since meta-learning simulates the process of interpolation from a small number of measurements to learn DNN using training data, the proposed method will stably estimate HRTFs even when the number of measurements is insufficient. Experimental results indicated that the proposed method achieves high interpolation accuracy compared with the current method when the number of measurements is small. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-140,
号 33,
p. 1-8,
発行日 2022-02-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |