@techreport{oai:ipsj.ixsq.nii.ac.jp:02007685, author = {松浦,孝平 and 芦原,孝典 and 河原,達也}, issue = {116}, month = {Feb}, note = {本研究では,日本の消滅危機言語である沖縄語の首里方言とアイヌ語の沙流方言を対象とした、事前学習済みモデルを用いた高精度な音声認識(ASR)モデルの構築について述べる。特に、本研究は沖縄語に対するASRモデルの実験と評価に関する初の試みである。具体的には、既存の多言語モデルであるWhisper SmallとXLS-R 300Mに加えて、両言語と関係の深い日本語の大規模弱教師ありデータを用いて独自に事前学習した日本語特化モデル(JP-90k)を比較検討する。これらのモデルを10時間(沖縄語)あるいは32時間(アイヌ語)の学習データでファインチューニングし,話者とドメインの異なる複数の評価セットを用いて文字誤り率(CER)を測定した.その結果,JP-90kモデルは両言語で一貫して最も低いCER(沖縄語4.1%/9.2%,アイヌ語7.3%/19.0%)を示し,学習データ量が極めて少ない(1時間未満)の条件で顕著な優位性を示した.ここから、目的の言語と関連性の高い言語での大規模事前学習は,未知話者や異ドメインに対する頑健性を含め,低資源ASRである可能性が示唆された。また、誤り分析によって、多言語事前学習モデルと日本語特化事前学習モデルの誤り傾向の違いの一端を明らかにした。}, title = {日本の消滅危機言語への事前学習済みASRモデルの適用:沖縄語首里方言とアイヌ語沙流方言を事例として}, year = {2026} }