@techreport{oai:ipsj.ixsq.nii.ac.jp:00220243, author = {岸野, 望叶 and 古宮, 嘉那子 and 新納, 浩幸}, issue = {13}, month = {Sep}, note = {現在,Siri などの対話エージェントが盛んに利用されていたり,RPG などのゲームで大量のセリフが必要になったりする.それらの発話はキャラクターらしさを含んでいることが求められる.しかし,特定のキャラクターに特化した言語モデルの構築を行うには学習データが限られており精度の向上は困難である.そのため本論文では対象の発話者と同作品に出てくる別人物の発話を T5 を用いて,対象発話者の発話風に変換し,学習データを増補する.その学習データを「ドメイン」の学習データ,対象の発話者の発話を「タスク」の学習データとし,TAPT-DAPT の手法でベースの言語モデルとなる GPT2 に Fine-tuning を行った.その結果,GPT2 に対象の発話者の発話のみで学習を行った場合のパープレキシティが 46.23 であったのに対し,この手法で行った場合のパープレキシティは 43.93 となり,精度を向上させることができた.}, title = {T5による特定キャラクター風発話への変換とその言語モデルの構築}, year = {2022} }