WEKO3
アイテム
共有IPAエキスパートを持つswitch Conformerによる多言語音声認識
https://ipsj.ixsq.nii.ac.jp/records/2007684
https://ipsj.ixsq.nii.ac.jp/records/200768459752dc3-ca83-4315-9936-9188319daf97
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2028年2月24日からダウンロード可能です。
|
Copyright (c) 2026 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2026-02-24 | |||||||||||
| タイトル | ||||||||||||
| 言語 | ja | |||||||||||
| タイトル | 共有IPAエキスパートを持つswitch Conformerによる多言語音声認識 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | SLP | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| NTT | ||||||||||||
| 著者所属 | ||||||||||||
| NTT | ||||||||||||
| 著者所属 | ||||||||||||
| 京都大学情報学研究科 | ||||||||||||
| 著者名 |
三村,正人
× 三村,正人
× Lee,Jaeyoung
× 河原,達也
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 多言語対応のend-to-end音声認識(ASR)は、言語ごとに異なる文字体系、語彙、文法構造を扱う必要があるため、大きな課題を伴う。既存手法の多くは、言語間で十分な性能を得るために大規模モデルに依存しており、その結果、高い計算コストを要する。本研究では、この問題に対処するため、標準的なConformerとほぼ同等の推論コストを維持しつつ、モデル容量を拡張可能なSwitch Conformerを提案する。本手法では、各Conformerブロック内のFFNモジュールを、独立した複数のエキスパートからなる疎なmixtureに置き換え、入力ごとに1つのエキスパートのみを活性化することで、言語に依存した特徴を効率的にモデリングする。さらに、音素レベルの教師信号を用いて学習された共有エキスパートを導入し、言語に依存しない普遍的な音声特性を捉える。CommonVoiceデータセットを用いたストリーミングASRの実験により、これらのエキスパートが相互に補完的に機能し、追加される有効パラメータ数を最小限に抑えながら、ベースラインのConformerを上回る性能を達成することを示した。 | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10442647 | |||||||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2026-SLP-159, 号 115, p. 1-7, 発行日 2026-02-24 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8663 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||