WEKO3
アイテム
スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善
https://ipsj.ixsq.nii.ac.jp/records/220242
https://ipsj.ixsq.nii.ac.jp/records/2202422d32532a-273a-47bb-ae13-fffabe843a1c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-09-22 | |||||||||||
タイトル | ||||||||||||
タイトル | スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 言い換え,スタイル | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
東京大学大学院情報理工学系研究科 | ||||||||||||
著者所属 | ||||||||||||
東京大学生産技術研究所 | ||||||||||||
著者所属 | ||||||||||||
東京大学生産技術研究所 | ||||||||||||
著者名 |
京野, 長彦
× 京野, 長彦
× 吉永, 直樹
× 佐藤, 翔悦
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 文書のスタイルは文書全体で一貫していることが望ましいが,意図せず不適切なスタイルの文が混入することも多い.そこで本研究では,文のスタイル分離に基づくスタイル変換器と自己教師あり学習に基づく異常検知器の同時学習を用いて,文書のスタイル一貫性を改善する手法を提案する.具体的にはまず既存のスタイル変換データセットを用い,対応関係にあるスタイルの文を無作為に組み合わせて擬似的にスタイルの一貫しない文書(文集合)を自動構築する.このようにして自動構築した文書を学習データとして用いて,その入力文書に含まれる各文のスタイルをベクトル表現として分離し,教師なしスタイル変換器と Transformer に基づく教師あり異常検知器にそれぞれ入力して各モデルを同時学習させる.推論時には後者の異常検知器を用いて異質なスタイルで書かれた文を検出し,検出された文のスタイルを,前者のスタイル変換器によって,入力中の他の文のスタイルを考慮しながら変換する.実験として,4 種類のスタイル変換データセットを用いて,上記の方法で人工的な学習・評価データを構築して性能を評価し,さらに実際の文書から構築した評価データセットを用いて実践的な評価を行う. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2022-NL-253, 号 12, p. 1-11, 発行日 2022-09-22 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |