WEKO3
アイテム
Hybrid H3-Conformerを用いた頑健な長時間音声認識
https://ipsj.ixsq.nii.ac.jp/records/241580
https://ipsj.ixsq.nii.ac.jp/records/24158050c90521-f510-4d5c-a5bb-09a9c97d6a1c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年12月5日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-12-05 | |||||||||||
タイトル | ||||||||||||
タイトル | Hybrid H3-Conformerを用いた頑健な長時間音声認識 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | ポスターセッション | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
京都大学 | ||||||||||||
著者所属 | ||||||||||||
京都大学 | ||||||||||||
著者所属 | ||||||||||||
京都大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
KU | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
KU | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
KU | ||||||||||||
著者名 |
本多, 智揮
× 本多, 智揮
× 坂井, 信輔
× 河原, 達也
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年,多くの音声認識タスクにおいて Conformer は非常に高い性能を達成している.一方で,Conformer のような自己注意機構をもつモデルは,長時間の音声入力に対しては処理時間が非常に長くなるだけでなく,認識精度も低下することが知られている.この問題を解決するため,本研究では,自己注意機構の代替として構造化状態空間モデルの一種である Hungry Hungry Hippos (H3) を導入することを提案する.H3 の入力に線形な計算量で長い入力系列を効果的にモデル化できる特長を活用することにより,提案モデルである H3-Conformer は,長時間音声の効率的かつ堅牢な認識を実現した.さらに,H3 と自己注意機構を組み合わせたハイブリッドモデルを提案し,H3 を上位層で,自己注意機構を下位層で使用することで,オンライン音声認識タスクの性能を大幅に向上させることを示した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2024-NL-262, 号 5, p. 1-6, 発行日 2024-12-05 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |