Item type |
SIG Technical Reports(1) |
公開日 |
2022-09-22 |
タイトル |
|
|
タイトル |
日本語CommonGenの試作と入力単語間の関連性からの考察 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Prototype of Japanese CommonGen and Consideration from the Relation Between Input Words |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
知識,メタデータ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
茨城大学工学部情報工学科 |
著者所属 |
|
|
|
茨城大学大学院理工学研究科情報科学領域 |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer and Information Sciences, College of Engineering, Ibaraki University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Department of Computer and Information Sciences, Ibaraki University |
著者名 |
鈴木, 雅人
新納, 浩幸
|
著者名(英) |
Masato, Suzuki
Hiroyuki, Shinnou
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
常識推論は人工知能の難問の 1 つであり,その研究開発のためのタスクがいくつか提案されている.その一つとして CommonGen がある.CommonGen は,概略,数個の入力単語からそれら単語を用いた妥当な文を生成するタスクである.文法上正しい文であっても常識的にはおかしな文を生成することを避けるには常識推論が必要と考えられる.ただし T5 や BART などの文生成用の事前学習済みモデルを利用すれば,ある程度の質の文が生成できることも知られており,このアプローチが現実的である.そのようなアプローチを取った場合,所望の文が生成できるかどうかは入力単語間の関連性に依存していると予想している.本論文ではこの予想を確認するために,日本語 CommonGen のデータセットを試作し,このタスク用の T5 を用いたモデルを構築した.またこの予想から,モデルの性能を向上させるために,入力単語群のハブとなる単語を追加する手法を提案する. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2022-NL-253,
号 20,
p. 1-8,
発行日 2022-09-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |