バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価

日下, 湧太; 糸山, 克寿; 西田, 健次; 中臺, 一博

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価

https://ipsj.ixsq.nii.ac.jp/records/205299

名前 / ファイル	ライセンス	アクション
IPSJ-Z82-5S-01.pdf (264.2 kB)	Copyright (c) 2020 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2020-02-20

タイトル

バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

東工大

著者所属

東工大

著者所属

東工大

著者所属

東工大／ホンダRIJ

著者名

日下, 湧太
糸山, 克寿
西田, 健次
中臺, 一博

論文抄録

内容記述タイプ

Other

内容記述

本稿では，目的音源の発音時刻を事前情報として利用するバイナリマスク付き非負値行列因子分解による音源分離手法において，入力される発音時刻に時間のずれが含まれている際の分離精度の変化について評価を行う．複数の楽器により構成されるモノラル音響信号から特定の音源のみを分離する処理には目的音源の事前情報を利用する手法が主流となっており，ユーザが容易に作成可能な事前情報として目的音源の発音時刻を利用する音源分離手法を提案した．これまでの報告では，提案法に入力する発音時刻はMIDIやアノテーションから作成した理想的な状況に限られていた．本報告では人間が発音時刻を作成する際に発生する時間のずれをモデル化し，これを用いて音源分離のシミュレーションと分離精度評価を行った．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第82回全国大会講演論文集

巻 2020, 号 1, p. 361-362, 発行日 2020-02-20

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 19:54:16.284595

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価

× 日下, 湧太

× 糸山, 克寿

× 西田, 健次

× 中臺, 一博

Versions

Share

Cite as

エクスポート