Item type |
SIG Technical Reports(1) |
公開日 |
2020-11-25 |
タイトル |
|
|
タイトル |
疑似負例を用いたData-to-Textモデルの学習 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Learning with Contrastive Examples for Data-to-Text Generation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言い換え・文生成・要約 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
産業技術総合研究所 |
著者所属 |
|
|
|
産業技術総合研究所 |
著者所属 |
|
|
|
お茶の水女子大学 |
著者所属 |
|
|
|
産業技術総合研究所 |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
お茶の水女子大学/産業技術総合研究所 |
著者所属 |
|
|
|
東京大学/産業技術総合研究所 |
著者所属 |
|
|
|
東京工業大学/産業技術総合研究所 |
著者名 |
上原, 由衣
石垣, 達也
青木, 花純
能地, 宏
五島, 圭一
小林, 一郎
宮尾, 祐介
高村, 大也
|
著者名(英) |
Yui, Uehara
Tatsuya, Ishigaki
Kasumi, Aoki
Hiroshi, Noji
Keiichi, Goshima
Ichiro, Kobayashi
Yusuke, Miyao
Hiroya, Takamura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,日経平均データなどの時系列数値データを入力とし,その値動きを説明する市況テキストを出力するdata-to-text課題を扱う.従来,data-to-textモデルは時系列数値データと正解テキストの対を用いて学習される.既存モデルによる生成文は,例えば「日経平均,続落」を出力すべき入力に対し,「日経平均,反発」と出力するなど,値動きを表す重要語について致命的なエラーを含むことがある.本研究では,このようなエラーを軽減し生成文の正しさを向上させる目的で,正解文だけでなく間違いを含む文を疑似負例として自動生成し学習時に活用する枠組みを提案する.疑似負例は「続落」「反発」といった値動きを表現する語をあらかじめ定義し,正解文中の重要語を別の重要語で置き換えることで自動生成する.疑似負例の活用によるエラー削減の効果について,疑似負例の種類,および学習時に用いる損失関数という2つの観点から分析する.実験より,1)疑似負例の活用により生成文の流暢性を失うことなく正しさが向上する,2)重視する性能指標によって選択すべき損失関数は異なる,3)特定の規則により生成した疑似負例はより効果的に正しさの向上に寄与する,という3つの知見が得られた.また,人間による評価においても,負例の活用が生成文の正しさの向上に寄与することが確かめられた. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2020-NL-246,
号 30,
p. 1-8,
発行日 2020-11-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |