アダプタを用いた大規模事前学習モデルの話者適応

渋谷, 和樹; 河原, 達也

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

アダプタを用いた大規模事前学習モデルの話者適応

https://ipsj.ixsq.nii.ac.jp/records/231310

名前 / ファイル	ライセンス	アクション
IPSJ-SLP23149018.pdf (1.4 MB)	Copyright (c) 2023 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2023-11-25

タイトル

アダプタを用いた大規模事前学習モデルの話者適応

言語

jpn

キーワード

主題Scheme

Other

主題

分野横断（2）

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

京都大学大学院情報学研究科

著者所属

京都大学大学院情報学研究科

著者名

渋谷, 和樹
河原, 達也

論文抄録

内容記述タイプ

Other

内容記述

音声認識を用いたアプリケーションの普及に伴い，各話者に適応した音声認識モデルの需要が高まっている．しかし，深層学習を用いた音声認識モデルは一般にパラメータ数が多く，各話者専用のモデルを保持することはメモリの観点から難しい．そこで，本研究では少ないパラメータ数で個別の話者に適応した音声認識モデルを提供する方法として，アダプタと呼ばれる小規模な追加ネットワークを用いた話者適応を実装する．また，実応用において，各話者の発話を大量に収集することは難しい．そこで，正解ラベルを用いてアダプタを学習する教師あり学習のみでなく，事前学習済みモデルの推論結果を利用する自己ラベル学習，および書き起こしを利用しない自己教師あり学習についても検討する．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2023-SLP-149, 号 18, p. 1-5, 発行日 2023-11-25

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 10:48:54.362366

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

アダプタを用いた大規模事前学習モデルの話者適応

× 渋谷, 和樹

× 河原, 達也

Versions

Share

Cite as

エクスポート