@techreport{oai:ipsj.ixsq.nii.ac.jp:00208179, author = {上原, 由衣 and 石垣, 達也 and 青木, 花純 and 能地, 宏 and 五島, 圭一 and 小林, 一郎 and 宮尾, 祐介 and 高村, 大也 and Yui, Uehara and Tatsuya, Ishigaki and Kasumi, Aoki and Hiroshi, Noji and Keiichi, Goshima and Ichiro, Kobayashi and Yusuke, Miyao and Hiroya, Takamura}, issue = {30}, month = {Nov}, note = {本稿では,日経平均データなどの時系列数値データを入力とし,その値動きを説明する市況テキストを出力するdata-to-text課題を扱う.従来,data-to-textモデルは時系列数値データと正解テキストの対を用いて学習される.既存モデルによる生成文は,例えば「日経平均,続落」を出力すべき入力に対し,「日経平均,反発」と出力するなど,値動きを表す重要語について致命的なエラーを含むことがある.本研究では,このようなエラーを軽減し生成文の正しさを向上させる目的で,正解文だけでなく間違いを含む文を疑似負例として自動生成し学習時に活用する枠組みを提案する.疑似負例は「続落」「反発」といった値動きを表現する語をあらかじめ定義し,正解文中の重要語を別の重要語で置き換えることで自動生成する.疑似負例の活用によるエラー削減の効果について,疑似負例の種類,および学習時に用いる損失関数という2つの観点から分析する.実験より,1)疑似負例の活用により生成文の流暢性を失うことなく正しさが向上する,2)重視する性能指標によって選択すべき損失関数は異なる,3)特定の規則により生成した疑似負例はより効果的に正しさの向上に寄与する,という3つの知見が得られた.また,人間による評価においても,負例の活用が生成文の正しさの向上に寄与することが確かめられた.}, title = {疑似負例を用いたData-to-Textモデルの学習}, year = {2020} }