@techreport{oai:ipsj.ixsq.nii.ac.jp:00220250, author = {鈴木, 雅人 and 新納, 浩幸 and Masato, Suzuki and Hiroyuki, Shinnou}, issue = {20}, month = {Sep}, note = {常識推論は人工知能の難問の 1 つであり,その研究開発のためのタスクがいくつか提案されている.その一つとして CommonGen がある.CommonGen は,概略,数個の入力単語からそれら単語を用いた妥当な文を生成するタスクである.文法上正しい文であっても常識的にはおかしな文を生成することを避けるには常識推論が必要と考えられる.ただし T5 や BART などの文生成用の事前学習済みモデルを利用すれば,ある程度の質の文が生成できることも知られており,このアプローチが現実的である.そのようなアプローチを取った場合,所望の文が生成できるかどうかは入力単語間の関連性に依存していると予想している.本論文ではこの予想を確認するために,日本語 CommonGen のデータセットを試作し,このタスク用の T5 を用いたモデルを構築した.またこの予想から,モデルの性能を向上させるために,入力単語群のハブとなる単語を追加する手法を提案する.}, title = {日本語CommonGenの試作と入力単語間の関連性からの考察}, year = {2022} }