WEKO3
アイテム
実時間で動作する音響イベント検出の大規模事前学習
https://ipsj.ixsq.nii.ac.jp/records/236025
https://ipsj.ixsq.nii.ac.jp/records/236025d180bacf-7593-427a-bec6-95917c5c18fc
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 実時間で動作する音響イベント検出の大規模事前学習 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 筑波大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 産総研 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大,産総研 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 産総研 | ||||||||||||||
| 著者名 |
大田, 竹蔵
× 大田, 竹蔵
× 坂東, 宜昭
× 井本, 桂右
× 大西, 正輝
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 本稿では実時間で動作する音響イベント検出 (SED) について述べる.SEDでは Audio Spectrogram Transformer (AST) が高い性能を発揮しているが,ASTは観測信号全体を入力するオフライン型であり,実時間推論で必要な逐次処理には不向きだった.そこで本研究では,入力を短時間のチャンクに分割する逐次型ASTによるSEDを構築する.具体的には,チャンク内の情報を次チャンクへ伝播させる記憶トークンを導入し,逐次処理でも高い性能を維持する.さらに,学習済みのオフライン型ASTの知識蒸留および1万時間を超える大規模学習データでの分散学習を併用して性能を改善した. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 365-366, 発行日 2024-03-01 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||