WEKO3
アイテム
擬似正弦波成分を用いた残響・雑音にロバストなオーディオフィンガープリンティング
https://ipsj.ixsq.nii.ac.jp/records/91808
https://ipsj.ixsq.nii.ac.jp/records/91808c2fbeafa-8ecf-475d-9620-202403663d18
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-05-04 | |||||||
タイトル | ||||||||
タイトル | 擬似正弦波成分を用いた残響・雑音にロバストなオーディオフィンガープリンティング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Audio Fingerprinting Robust Against Reverberation and Noise using Pseudo-Sinusoidal Components | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ポスターセッション | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ソニー株式会社 | ||||||||
著者所属 | ||||||||
ソニー株式会社 | ||||||||
著者所属 | ||||||||
ソニー株式会社 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sony Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sony Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sony Corporation | ||||||||
著者名 |
澁谷, 崇
× 澁谷, 崇
|
|||||||
著者名(英) |
Takashi, Shibuya
× Takashi, Shibuya
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テレビ番組に関連する情報を視聴者のモバイル端末に表示・提供するセカンドスクリーンサービスを運用するためには,ユーザの視聴している番組を把握する必要がある.その一つの実現方法として,ユーザのモバイル端末で録音した視聴環境の音を参照データベースと照合する方法がある.しかしながら,残響や外来雑音の影響により,正確な照合・検索が非常に困難であるという問題がある.本稿では,残響や雑音に頑健なコンテンツ検索を実現する,新たなフィンガープリンティング手法を提案する.我々は,微小時間区間において正弦波と見なせる“擬似正弦波成分”に着目し,擬似正弦波性分の時間周波数分布を表現するフィンガープリントを提案する.実験では,提案手法によって,1台のPCで5secの入力信号を792h分の参照信号と1.29secでマッチングを行うことができ,実環境において92%以上の再現率,100%の適合率で検索が可能であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The implementation of second-screen service requires a technology for quick, accurate content identification. This enables the service to trace the channel of a broadcast program that a user is watching or listening to. One approach is to record an audio signal from the user's mobile device, and match it with one in a reference database. However, reverberation and exogenous noise distort a recorded audio signal, making accurate identification more difficult. This paper presents a new fingerprinting method for content identification that is robust against reverberation and noise. It employs pseudo-sinusoidal components, which are components that can be regarded as sinusoidal over a short period of time. The method generates a fingerprint that represents the distribution of pseudo-sinusoidal components in the time-frequency domain. Experimental results show that the method can match a 5-s-long input signal against 792 hours of reference signals in 1.56 s on a single PC, and can identify the correct program with a recall of over 92% and a precision of 100% in a realistic setting. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2013-MUS-99, 号 13, p. 1-6, 発行日 2013-05-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |