@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00236025, author = {大田, 竹蔵 and 坂東, 宜昭 and 井本, 桂右 and 大西, 正輝}, book = {第86回全国大会講演論文集}, issue = {1}, month = {Mar}, note = {本稿では実時間で動作する音響イベント検出 (SED) について述べる.SEDでは Audio Spectrogram Transformer (AST) が高い性能を発揮しているが,ASTは観測信号全体を入力するオフライン型であり,実時間推論で必要な逐次処理には不向きだった.そこで本研究では,入力を短時間のチャンクに分割する逐次型ASTによるSEDを構築する.具体的には,チャンク内の情報を次チャンクへ伝播させる記憶トークンを導入し,逐次処理でも高い性能を維持する.さらに,学習済みのオフライン型ASTの知識蒸留および1万時間を超える大規模学習データでの分散学習を併用して性能を改善した.}, pages = {365--366}, publisher = {情報処理学会}, title = {実時間で動作する音響イベント検出の大規模事前学習}, volume = {2024}, year = {2024} }