ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2024
  4. 2024-NL-259

多様なプロンプトを用いた言語モデルの多角的な知識評価

https://ipsj.ixsq.nii.ac.jp/records/232883
https://ipsj.ixsq.nii.ac.jp/records/232883
c7400b34-ebe5-40ac-938f-22bea4012af7
名前 / ファイル ライセンス アクション
IPSJ-NL24259020.pdf IPSJ-NL24259020.pdf (531.2 kB)
 2026年3月3日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-03-03
タイトル
タイトル 多様なプロンプトを用いた言語モデルの多角的な知識評価
言語
言語 jpn
キーワード
主題Scheme Other
主題 言語モデル
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学大学院情報理工学系研究科
著者所属
東京大学生産技術研究所
著者所属
東京大学生産技術研究所
著者名 趙, 信

× 趙, 信

趙, 信

Search repository
吉永, 直樹

× 吉永, 直樹

吉永, 直樹

Search repository
大葉, 大輔

× 大葉, 大輔

大葉, 大輔

Search repository
論文抄録
内容記述タイプ Other
内容記述 言語モデルが学習データから獲得した関係知識の量を評価をするために,関係知識を表現する穴埋め文(プロンプト)を用いた評価手法が広く用いられている.しかしながら,この評価手法では,評価に用いるプロンプトの言語表現によって評価結果が大きく変動することが知られており,異なる言語モデルの有する関係知識の量を適切に評価することが難しい.そこで本稿では,言語モデルの関係知識をより公平かつ多角的な観点から評価するため,多様なプロンプトに基づく評価データセット MyriadLAMA と,このデータセットを活用した関係知識評価手法 BELIEF を提案する.MyriadLAMA は,既存の関係知識評価データセットである LAMA-UHN の各プロンプトに対し,構文的・意味的に多様なプロンプトを人手と大規模言語モデル (GPT-4) を用いて半自動で大量に生成したものである.BELIEF は,この多数のプロンプトを用いることで,関係知識評価におけるプロンプトバイアスの影響を低減すると共に,知識の一貫性と信頼性の観点も含めた多角的な関係知識の評価を実現する.実験では,複数の事前学習済みモデルの関係知識評価を通して,提案手法の有効性を確認する.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2024-NL-259, 号 20, p. 1-10, 発行日 2024-03-03
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8779
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:17:22.300801
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3