| Item type |
National Convention(1) |
| 公開日 |
2020-02-20 |
| タイトル |
|
|
タイトル |
バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
人工知能と認知科学 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大/ホンダRIJ |
| 著者名 |
日下, 湧太
糸山, 克寿
西田, 健次
中臺, 一博
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,目的音源の発音時刻を事前情報として利用するバイナリマスク付き非負値行列因子分解による音源分離手法において,入力される発音時刻に時間のずれが含まれている際の分離精度の変化について評価を行う.複数の楽器により構成されるモノラル音響信号から特定の音源のみを分離する処理には目的音源の事前情報を利用する手法が主流となっており,ユーザが容易に作成可能な事前情報として目的音源の発音時刻を利用する音源分離手法を提案した.これまでの報告では,提案法に入力する発音時刻はMIDIやアノテーションから作成した理想的な状況に限られていた.本報告では人間が発音時刻を作成する際に発生する時間のずれをモデル化し,これを用いて音源分離のシミュレーションと分離精度評価を行った. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
| 書誌情報 |
第82回全国大会講演論文集
巻 2020,
号 1,
p. 361-362,
発行日 2020-02-20
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |