WEKO3
アイテム
深層学習を用いた音をクエリとする類似効果音検索システム
https://ipsj.ixsq.nii.ac.jp/records/210252
https://ipsj.ixsq.nii.ac.jp/records/210252587bbdef-2fea-4f72-a48b-d94d946e5881
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-09 | |||||||||
タイトル | ||||||||||
タイトル | 深層学習を用いた音をクエリとする類似効果音検索システム | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東京電機大学大学院 | ||||||||||
著者所属 | ||||||||||
東京電機大学大学院 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Graduate School of Tokyo Denki University | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Graduate School of Tokyo Denki University | ||||||||||
著者名 |
小宮, 寛季
× 小宮, 寛季
× 小坂, 直敏
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 環境音の検索を行う際,求める音を正確に言語化することは不可能であり,ゆえにテキストのみによる検索は困難である.そこで我々は CNN ベースの環境音分類モデルを用いて,クエリとなる音と検索対象の持つ特徴量をスペクトルから取り出し,それを基に環境音同士の類似度を算出し,3D 空間上に可視化することにより,容易に環境音の検索が行えるシステムを提案する.音データから提案モデルを用いて 128 次元の特徴ベクトルを抽出し,主成分分析を用いて 20 次元に圧縮した後,ユークリッド距離 / コサイン距離を基準として類似音検索を行った.15 種類の環境音をクエリとして 2339 個の音から上位 10 個の類似音検索を行ったところ,クエリと類似した音が提示された例は全体の 79.3% であった.さらに 27699 個の音を検索対象として用いて,既存手法との比較を行ったところ,提案手法はより正確な類似音検索が行えると示された. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA12049625 | |||||||||
書誌情報 |
研究報告エンタテインメントコンピューティング(EC) 巻 2021-EC-59, 号 17, p. 1-10, 発行日 2021-03-09 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8914 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |