WEKO3
アイテム
T5による特定キャラクター風発話への変換とその言語モデルの構築
https://ipsj.ixsq.nii.ac.jp/records/220243
https://ipsj.ixsq.nii.ac.jp/records/220243fefc648c-d7d2-4fcc-82bd-81e884222fd7
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-09-22 | |||||||||||
タイトル | ||||||||||||
タイトル | T5による特定キャラクター風発話への変換とその言語モデルの構築 | |||||||||||
タイトル | ||||||||||||
言語 | en | |||||||||||
タイトル | Conversion to Specific Character-like Speech Using T5 and Construction of Language Model of Utterances of Fictional Characters | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 言い換え,スタイル | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
茨城大学大学院理工学研究科情報工学専攻 | ||||||||||||
著者所属 | ||||||||||||
東京農工大学大学院工学研究院先端情報科学部門 | ||||||||||||
著者所属 | ||||||||||||
茨城大学大学院理工学研究科情報科学領域 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Major in Computer and Information Sciences, Graduate School of Science and Engineering, Ibaraki University | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Institute of Engineering, Tokyo University of Agriculture and Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Graduate School of Science and Engineering, Department of Computer and Information Sciences, Ibaraki University | ||||||||||||
著者名 |
岸野, 望叶
× 岸野, 望叶
× 古宮, 嘉那子
× 新納, 浩幸
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 現在,Siri などの対話エージェントが盛んに利用されていたり,RPG などのゲームで大量のセリフが必要になったりする.それらの発話はキャラクターらしさを含んでいることが求められる.しかし,特定のキャラクターに特化した言語モデルの構築を行うには学習データが限られており精度の向上は困難である.そのため本論文では対象の発話者と同作品に出てくる別人物の発話を T5 を用いて,対象発話者の発話風に変換し,学習データを増補する.その学習データを「ドメイン」の学習データ,対象の発話者の発話を「タスク」の学習データとし,TAPT-DAPT の手法でベースの言語モデルとなる GPT2 に Fine-tuning を行った.その結果,GPT2 に対象の発話者の発話のみで学習を行った場合のパープレキシティが 46.23 であったのに対し,この手法で行った場合のパープレキシティは 43.93 となり,精度を向上させることができた. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2022-NL-253, 号 13, p. 1-6, 発行日 2022-09-22 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |