@techreport{oai:ipsj.ixsq.nii.ac.jp:00231270, author = {李, 在詠 and 河原, 達也}, issue = {12}, month = {Nov}, note = {本研究では,音素とその調音属性に関する知識を,低資源言語の自動音声認識の改善に活用する方法を提案する.まず,レイヤー初期化において音素と調音属性の関係の制約を埋め込むことで「調音属性予測レイヤー」を構築し,明示的な学習なしで調音属性を予測できるようにする.最終的な出力は,このレイヤーの出力と音響的特徴を組み合わせて推論する.この手法を大規模事前学習モデルに基づく End-to-End 音声認識に実装し,ファインチューニングを行う.アイヌ語の音声認識で評価を行い,ファインチューニングのデータが1時間しか利用できない場合に約 12% の相対的な改善を達成できた.これは,大規模事前学習モデルと組み合わせたときに音声学的な事前知識を取り入れるアプローチが有用であることを示している.}, title = {調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善}, year = {2023} }