WEKO3
アイテム
視聴覚自己教師あり学習に基づく音響イベント検出
https://ipsj.ixsq.nii.ac.jp/records/230016
https://ipsj.ixsq.nii.ac.jp/records/230016cb2fe3f5-eee3-42d8-bcd2-c043ccd7c59f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2023 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-02-16 | |||||||||||||
タイトル | ||||||||||||||
タイトル | 視聴覚自己教師あり学習に基づく音響イベント検出 | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
キーワード | ||||||||||||||
主題Scheme | Other | |||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
資源タイプ | conference paper | |||||||||||||
著者所属 | ||||||||||||||
筑波大 | ||||||||||||||
著者所属 | ||||||||||||||
産総研 | ||||||||||||||
著者所属 | ||||||||||||||
同志社大学,産業技術総合研究所 | ||||||||||||||
著者所属 | ||||||||||||||
産総研 | ||||||||||||||
著者名 |
大田, 竹蔵
× 大田, 竹蔵
× 坂東, 宜昭
× 井本, 桂右
× 大西, 正輝
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | 本稿では自己教師あり学習に基づく音響イベント検出 (SED) について述べる.混合音から音響イベントの種類と発生時刻を推定するSEDは,これまで膨大なアノテーションコストを要する課題があった.そこで本研究では,視聴覚情報を用いた自己教師あり学習(AV-SSL)に基づくSEDの構築法を提案する.音響信号と動画の共起関係を学習するAV-SSLは,音響イベントの識別に有効であることが知られている.SEDの弱教師あり学習における知見を活用し,AV-SSLの学習済みモデルから音響イベントの発生時刻を推定する.動画配信サービスから収集した映像データセットを用いて提案手法の有効性を確認した. | |||||||||||||
書誌レコードID | ||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||
収録物識別子 | AN00349328 | |||||||||||||
書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 441-442, 発行日 2023-02-16 |
|||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |