Item type |
SIG Technical Reports(1) |
公開日 |
2024-06-21 |
タイトル |
|
|
タイトル |
大規模言語モデルを利用した語義定義文からの用例の自動構築 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語資源 (2) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
茨城大学大学院理工学研究科社会インフラシステム専攻 |
著者所属 |
|
|
|
東京農工大学 |
著者所属 |
|
|
|
国立国語研究所 |
著者所属 |
|
|
|
茨城大学大学院理工学研究科情報科学領域 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Major in Society's Infrastructure Systems Science, Ibaraki University |
著者所属(英) |
|
|
|
en |
|
|
Tokyo University of Agriculture and Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Department of Computer and Information Sciences, Ibaraki University |
著者名 |
芝山, 直希
古宮, 嘉那子
浅原, 正幸
新納, 浩幸
|
著者名(英) |
Naoki, Shibayama
Kanako, Komiya
Masayuki, Asahara
Hiroyuki, Shinnou
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
単語の用例は辞書編纂や語学学習などに有益である.しかしその構築は対象の単語が多義語である場合,用例内のその単語の語義が不明であるため,困難である.本論文では大規模言語モデルに辞書中の語義定義文を与えることで,その単語がその語義として使われる用例を生成させる.これによって多義語である単語の各語義に対する用例が構築できる.実験では辞書として岩波国語辞典,大規模言語モデルとして GPT-4o を利用した.構築した用例は SemEval2 の日本語辞書タスクを用いて評価した.具体的には SemEval2 の訓練データから学習したモデル(Base-model)と生成した用例から学習したモデル(LLM-model)を比較することで,生成した用例の評価を行った.LLM-model の正解率は低かったが,教師なしの枠組みである点,構築した用例を Data Augmentation として利用したモデルは Base-model よりも性能が高かった点などから生成した用例は有用だと考えられる. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2024-NL-260,
号 17,
p. 1-7,
発行日 2024-06-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |