| Item type |
National Convention(1) |
| 公開日 |
2023-02-16 |
| タイトル |
|
|
タイトル |
視聴覚自己教師あり学習に基づく音響イベント検出 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
人工知能と認知科学 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
筑波大 |
| 著者所属 |
|
|
|
産総研 |
| 著者所属 |
|
|
|
同志社大学,産業技術総合研究所 |
| 著者所属 |
|
|
|
産総研 |
| 著者名 |
大田, 竹蔵
坂東, 宜昭
井本, 桂右
大西, 正輝
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では自己教師あり学習に基づく音響イベント検出 (SED) について述べる.混合音から音響イベントの種類と発生時刻を推定するSEDは,これまで膨大なアノテーションコストを要する課題があった.そこで本研究では,視聴覚情報を用いた自己教師あり学習(AV-SSL)に基づくSEDの構築法を提案する.音響信号と動画の共起関係を学習するAV-SSLは,音響イベントの識別に有効であることが知られている.SEDの弱教師あり学習における知見を活用し,AV-SSLの学習済みモデルから音響イベントの発生時刻を推定する.動画配信サービスから収集した映像データセットを用いて提案手法の有効性を確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
| 書誌情報 |
第85回全国大会講演論文集
巻 2023,
号 1,
p. 441-442,
発行日 2023-02-16
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |