WEKO3
アイテム
調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善
https://ipsj.ixsq.nii.ac.jp/records/231270
https://ipsj.ixsq.nii.ac.jp/records/2312706831f119-ef36-4306-a5b5-a0a37f7fcdcc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年11月25日からダウンロード可能です。
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-11-25 | |||||||||
タイトル | ||||||||||
タイトル | 調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 分野横断(1) | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
京都大学大学院情報学研究科 | ||||||||||
著者所属 | ||||||||||
京都大学大学院情報学研究科 | ||||||||||
著者名 |
李, 在詠
× 李, 在詠
× 河原, 達也
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 本研究では,音素とその調音属性に関する知識を,低資源言語の自動音声認識の改善に活用する方法を提案する.まず,レイヤー初期化において音素と調音属性の関係の制約を埋め込むことで「調音属性予測レイヤー」を構築し,明示的な学習なしで調音属性を予測できるようにする.最終的な出力は,このレイヤーの出力と音響的特徴を組み合わせて推論する.この手法を大規模事前学習モデルに基づく End-to-End 音声認識に実装し,ファインチューニングを行う.アイヌ語の音声認識で評価を行い,ファインチューニングのデータが1時間しか利用できない場合に約 12% の相対的な改善を達成できた.これは,大規模事前学習モデルと組み合わせたときに音声学的な事前知識を取り入れるアプローチが有用であることを示している. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10115061 | |||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2023-NL-258, 号 12, p. 1-6, 発行日 2023-11-25 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8779 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |