大規模言語モデルに適した容認性判断手法の検討

井手, 佑翼; 西田, 悠人; 大羽, 未悠; 坂井, 優介; Justin, Vasselli; 上垣外, 英剛; 渡辺, 太郎

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

大規模言語モデルに適した容認性判断手法の検討

https://ipsj.ixsq.nii.ac.jp/records/235097

名前 / ファイル	ライセンス	アクション
IPSJ-NL24260006.pdf (1.2 MB)	Copyright (c) 2024 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2024-06-21

タイトル

大規模言語モデルに適した容認性判断手法の検討

タイトル

言語

タイトル

Investigating Acceptability Judgment Methods Suitable for Large Language Models

言語

jpn

キーワード

主題Scheme

Other

主題

LLM応用

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者所属

奈良先端科学技術大学院大学

著者名

井手, 佑翼
西田, 悠人
大羽, 未悠
坂井, 優介
Justin, Vasselli
上垣外, 英剛
渡辺, 太郎

論文抄録

内容記述タイプ

Other

内容記述

ミニマルペアにより構成されるデータセットを用いた容認性判断は，言語モデルの文法知識の評価等に有用である．この評価が妥当であるためには，容認性判断手法が，言語モデルの性能を最大限引き出すものであることが望ましい．しかし，既存の容認性判断研究の多くは，判断対象文の確率に基づく単純な判断手法を検証するに留まっているため，言語モデルの容認性判断性能を最もよく引き出す方法が何であるか明らかでない．そこで本研究では，判断対象文をテンプレートに挿入する新しい確率ベースの判断手法を提案し，これを従来の確率ベース手法やプロンプティングと詳しく比較する．6 つの大規模言語モデルを用いた実験により，提案手法が，従来の確率ベース手法より優れていることを示す．続いて，提案手法とプロンプティングの比較から，全体としては提案手法がやや優れる傾向にあること，文法現象別に見ると両手法で得意とする現象が異なることを示す．最後に，両手法を組み合わせた多数決アンサンブルにより，それぞれの手法単体を上回る性能が実現できることを示す．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10115061

書誌情報

研究報告自然言語処理（NL）

巻 2024-NL-260, 号 6, p. 1-8, 発行日 2024-06-21

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8779

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 09:36:44.701368

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

大規模言語モデルに適した容認性判断手法の検討

× 井手, 佑翼

× 西田, 悠人

× 大羽, 未悠

× 坂井, 優介

× Justin, Vasselli

× 上垣外, 英剛

× 渡辺, 太郎

Versions

Share

Cite as

エクスポート