Item type |
SIG Technical Reports(1) |
公開日 |
2019-06-15 |
タイトル |
|
|
タイトル |
深層音声生成モデルと同時対角化可能な空間相関行列に基づく高速マルチチャネル音声強調 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション1 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
理化学研究所AIP/京都大学大学院情報学研究科 |
著者所属 |
|
|
|
理化学研究所AIP |
著者所属 |
|
|
|
産業技術総合研究所 |
著者所属 |
|
|
|
理化学研究所AIP/京都大学大学院情報学研究科 |
著者名 |
關口, 航平
Aditya, Arie Nugraha
坂東, 宜昭
吉井, 和佳
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,フルランク空間相関行列に基づくマルチチャネル音源分離を高速に実行するための,収束保証付きの汎用的なアルゴリズムについて述べる.代表的な音源分離法であるマルチチャネル非負値行列因子分解 (MNMF) では,各音源スペクトログラムのパワースペクトル密度が低ランク構造を持つと仮定している.音声スペクトログラムに対してこの仮定は成り立たないため,最近では,音声に対しては事前学習した深層生成モデルを用い,雑音に対してはNMFに基づく低ランクモデルを用いた音声強調法が提案されている.これらの手法は,フルランクの空間相関行列を直接取り扱う上で計算量が大きく,実用上の課題となっていた.本稿では,各周波数において,各音源に対応する空間相関行列が同時対角化可能であるという制約のもとでは,観測スペクトログラムを線形変換することで,各チャネルを独立化でき,共分散行列演算が回避できることを示す.具体的には,独立ベクトル分析 (IVA) で提案された反復射影法 (IP) を用いた変換行列の推定と,変換後の空間での非負値テンソル分解 (NTF) との反復を行うことで,収束保証付きの最適化アルゴリズムを導出できる.提案する同時対角化可能フルランク空間モデルは,独立低ランク行列分析 (ILRMA) で用いられるランク 1 空間モデルと深い関係がある.実験では,ILRMA と同等の計算量に削減しつつ,初期値依存性が小さく,より高精度な音声強調ができることを確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2019-MUS-123,
号 29,
p. 1-6,
発行日 2019-06-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |