WEKO3
アイテム
アダプタを用いた大規模事前学習モデルの話者適応
https://ipsj.ixsq.nii.ac.jp/records/231310
https://ipsj.ixsq.nii.ac.jp/records/2313103e449e86-baaf-4200-989f-cbd1753eed2e
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-11-25 | |||||||||
| タイトル | ||||||||||
| タイトル | アダプタを用いた大規模事前学習モデルの話者適応 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 分野横断(2) | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 京都大学大学院情報学研究科 | ||||||||||
| 著者所属 | ||||||||||
| 京都大学大学院情報学研究科 | ||||||||||
| 著者名 |
渋谷, 和樹
× 渋谷, 和樹
× 河原, 達也
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 音声認識を用いたアプリケーションの普及に伴い,各話者に適応した音声認識モデルの需要が高まっている.しかし,深層学習を用いた音声認識モデルは一般にパラメータ数が多く,各話者専用のモデルを保持することはメモリの観点から難しい.そこで,本研究では少ないパラメータ数で個別の話者に適応した音声認識モデルを提供する方法として,アダプタと呼ばれる小規模な追加ネットワークを用いた話者適応を実装する.また,実応用において,各話者の発話を大量に収集することは難しい.そこで,正解ラベルを用いてアダプタを学習する教師あり学習のみでなく,事前学習済みモデルの推論結果を利用する自己ラベル学習,および書き起こしを利用しない自己教師あり学習についても検討する. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10442647 | |||||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2023-SLP-149, 号 18, p. 1-5, 発行日 2023-11-25 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8663 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||