WEKO3
アイテム
日本の消滅危機言語への事前学習済みASRモデルの適用:沖縄語首里方言とアイヌ語沙流方言を事例として
https://ipsj.ixsq.nii.ac.jp/records/2007685
https://ipsj.ixsq.nii.ac.jp/records/2007685c4129a2d-adfc-47b5-bd8b-8f69dc9b2d68
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2028年2月24日からダウンロード可能です。
|
Copyright (c) 2026 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2026-02-24 | |||||||||||
| タイトル | ||||||||||||
| 言語 | ja | |||||||||||
| タイトル | 日本の消滅危機言語への事前学習済みASRモデルの適用:沖縄語首里方言とアイヌ語沙流方言を事例として | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | SLP | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 京都大学大学院情報学研究科/日本電信電話株式会社 | ||||||||||||
| 著者所属 | ||||||||||||
| 日本電信電話株式会社 | ||||||||||||
| 著者所属 | ||||||||||||
| 京都大学大学院情報学研究科 | ||||||||||||
| 著者名 |
松浦,孝平
× 松浦,孝平
× 芦原,孝典
× 河原,達也
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 本研究では,日本の消滅危機言語である沖縄語の首里方言とアイヌ語の沙流方言を対象とした、事前学習済みモデルを用いた高精度な音声認識(ASR)モデルの構築について述べる。特に、本研究は沖縄語に対するASRモデルの実験と評価に関する初の試みである。具体的には、既存の多言語モデルであるWhisper SmallとXLS-R 300Mに加えて、両言語と関係の深い日本語の大規模弱教師ありデータを用いて独自に事前学習した日本語特化モデル(JP-90k)を比較検討する。これらのモデルを10時間(沖縄語)あるいは32時間(アイヌ語)の学習データでファインチューニングし,話者とドメインの異なる複数の評価セットを用いて文字誤り率(CER)を測定した.その結果,JP-90kモデルは両言語で一貫して最も低いCER(沖縄語4.1%/9.2%,アイヌ語7.3%/19.0%)を示し,学習データ量が極めて少ない(1時間未満)の条件で顕著な優位性を示した.ここから、目的の言語と関連性の高い言語での大規模事前学習は,未知話者や異ドメインに対する頑健性を含め,低資源ASRである可能性が示唆された。また、誤り分析によって、多言語事前学習モデルと日本語特化事前学習モデルの誤り傾向の違いの一端を明らかにした。 | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10442647 | |||||||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2026-SLP-159, 号 116, p. 1-7, 発行日 2026-02-24 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8663 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||