ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2023
  4. 2023-NL-258

調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善

https://ipsj.ixsq.nii.ac.jp/records/231270
https://ipsj.ixsq.nii.ac.jp/records/231270
6831f119-ef36-4306-a5b5-a0a37f7fcdcc
名前 / ファイル ライセンス アクション
IPSJ-NL23258012.pdf IPSJ-NL23258012.pdf (449.1 kB)
 2025年11月25日からダウンロード可能です。
Copyright (c) 2023 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-11-25
タイトル
タイトル 調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善
言語
言語 jpn
キーワード
主題Scheme Other
主題 分野横断(1)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学大学院情報学研究科
著者所属
京都大学大学院情報学研究科
著者名 李, 在詠

× 李, 在詠

李, 在詠

Search repository
河原, 達也

× 河原, 達也

河原, 達也

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では,音素とその調音属性に関する知識を,低資源言語の自動音声認識の改善に活用する方法を提案する.まず,レイヤー初期化において音素と調音属性の関係の制約を埋め込むことで「調音属性予測レイヤー」を構築し,明示的な学習なしで調音属性を予測できるようにする.最終的な出力は,このレイヤーの出力と音響的特徴を組み合わせて推論する.この手法を大規模事前学習モデルに基づく End-to-End 音声認識に実装し,ファインチューニングを行う.アイヌ語の音声認識で評価を行い,ファインチューニングのデータが1時間しか利用できない場合に約 12% の相対的な改善を達成できた.これは,大規模事前学習モデルと組み合わせたときに音声学的な事前知識を取り入れるアプローチが有用であることを示している.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2023-NL-258, 号 12, p. 1-6, 発行日 2023-11-25
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8779
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:49:44.976213
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3