ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. バイオ情報学(BIO)
  3. 2024
  4. 2024-BIO-78

マニュアルQAタスクに特化したLLMファインチューニングのための頻出質問観点に基づくデータ拡張手法

https://ipsj.ixsq.nii.ac.jp/records/234870
https://ipsj.ixsq.nii.ac.jp/records/234870
d14f9141-29eb-4fe1-a091-169a0c0db7e0
名前 / ファイル ライセンス アクション
IPSJ-BIO24078043.pdf IPSJ-BIO24078043.pdf (1.1 MB)
 2026年6月13日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, BIO:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-06-13
タイトル
タイトル マニュアルQAタスクに特化したLLMファインチューニングのための頻出質問観点に基づくデータ拡張手法
言語
言語 jpn
キーワード
主題Scheme Other
主題 数理モデル化と問題解決1
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
株式会社NTTデータグループ技術革新統括本部システム技術本部/株式会社NTTデータ関西第一公共事業部
著者所属
株式会社NTTデータグループ技術革新統括本部システム技術本部
著者名 森田, 将司

× 森田, 将司

森田, 将司

Search repository
湯浅, 晃

× 湯浅, 晃

湯浅, 晃

Search repository
論文抄録
内容記述タイプ Other
内容記述 GPT-4 等の巨大パラメータをもつ大規模言語モデル(LLM)にはエネルギー消費や特定ドメインへの適用の課題があり,そのため小規模パラメータモデルの研究が盛んになされている.大規模モデルと同等の性能を実現するためには学習データの量や質の課題があり,解決策として大規模モデルを用いて学習データを生成するアプローチが効果的であることが知られている.本稿では,自動車オーナーズマニュアルに基づき,コンテキストをもとに回答する closedQA タスク向けの効果的なデータ拡張手法を提案する.提案手法は頻出質問と質問カテゴリのペアをランダムサンプリングしたものとコンテキストとなるマニュアルを GPT-4 にプロンプトとして与えることで学習データを拡張生成する.実験の結果,本手法によって生成された学習データを用いてファインチューニングした小規模 LLM の性能が GPT-4 と同等となることが確認された.また,本手法により従来手法である Few-shot 法を上回る性能が得られることを確認した.提案手法によって,特定ドメインの QA タスクにおける小規模 LLM のさらなる応用が期待される.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA12055912
書誌情報 研究報告バイオ情報学(BIO)

巻 2024-BIO-78, 号 43, p. 1-2, 発行日 2024-06-13
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8590
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:41:11.940185
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3