WEKO3
アイテム
ポッドキャストを対象とした音リアクションイベント検出
https://ipsj.ixsq.nii.ac.jp/records/62685
https://ipsj.ixsq.nii.ac.jp/records/6268570535cf1-7893-476b-8a00-39d9f3a2d1ac
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-07-10 | |||||||
タイトル | ||||||||
タイトル | ポッドキャストを対象とした音リアクションイベント検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Acoustic Event Detection for Finding Hot Spots in Podcasts | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 韻律・パラ言語 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者名 |
須見, 康平
× 須見, 康平
|
|||||||
著者名(英) |
Kouhei, Sumi
× Kouhei, Sumi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ポッドキャスト中の重要な箇所 (ホットスポット) を抽出するための手掛かりとなる音響イベントの検出手法を提案する.本研究では,視聴者が興味を持ちそうな箇所と密接に関係すると思われる,発話者や対話参加者のリアクションに基づく笑い声やあいづちなどの音響イベント (音リアクションイベント) に着目し,ホットスポットの候補区間となる先行発話の区間とともに抽出することを考える.背景音楽が頻繁に混在するポッドキャストにおいて,頑健に区分化と分類を行うために,背景音に応じて分割重みを自動推定した BIC に基づく分割と GMM による識別を組み合わせた手法を提案する.評価実験において,大分類を行って分割重みを切り替える提案手法により,分類・識別の精度が改善され,笑い声やあいづちの検出精度も向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a method to detect acoustic events that can be used to find “hot spots” in podcast programs. We focus on meaningful non-verbal audible reactions which suggest hot spots such as laughter and reactive tokens. In order to detect this kind of short events and segment the counterpart utterances, we need accurate audio segmentation and classification, dealing with various recording environments and background music. Thus, we propose a method for automatically estimating and switching penalty weights for the BIC-based segmentation depending on background environments. Experimental results show significant improvement in detection accuracy by the proposed method compared to when using a constant penalty weight. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-77, 号 24, p. 1-6, 発行日 2009-07-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |