ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2024
  4. 2024-SLP-154

Hybrid H3-Conformerを用いた頑健な長時間音声認識

https://ipsj.ixsq.nii.ac.jp/records/241625
https://ipsj.ixsq.nii.ac.jp/records/241625
77046952-8fdb-4026-9a63-b294e3cc2d8e
名前 / ファイル ライセンス アクション
IPSJ-SLP24154005.pdf IPSJ-SLP24154005.pdf (546.3 kB)
 2026年12月5日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-12-05
タイトル
タイトル Hybrid H3-Conformerを用いた頑健な長時間音声認識
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学
著者所属
京都大学
著者所属
京都大学
著者所属(英)
en
KU
著者所属(英)
en
KU
著者所属(英)
en
KU
著者名 本多, 智揮

× 本多, 智揮

本多, 智揮

Search repository
坂井, 信輔

× 坂井, 信輔

坂井, 信輔

Search repository
河原, 達也

× 河原, 達也

河原, 達也

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,多くの音声認識タスクにおいて Conformer は非常に高い性能を達成している.一方で,Conformer のような自己注意機構をもつモデルは,長時間の音声入力に対しては処理時間が非常に長くなるだけでなく,認識精度も低下することが知られている.この問題を解決するため,本研究では,自己注意機構の代替として構造化状態空間モデルの一種である Hungry Hungry Hippos (H3) を導入することを提案する.H3 の入力に線形な計算量で長い入力系列を効果的にモデル化できる特長を活用することにより,提案モデルである H3-Conformer は,長時間音声の効率的かつ堅牢な認識を実現した.さらに,H3 と自己注意機構を組み合わせたハイブリッドモデルを提案し,H3 を上位層で,自己注意機構を下位層で使用することで,オンライン音声認識タスクの性能を大幅に向上させることを示した.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2024-SLP-154, 号 5, p. 1-6, 発行日 2024-12-05
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 07:35:58.073299
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3