WEKO3
アイテム
イギリス文学テクストの影響分析に特化したLLMモデルの開発に向けて
https://ipsj.ixsq.nii.ac.jp/records/2006226
https://ipsj.ixsq.nii.ac.jp/records/2006226215da6b4-9087-4e83-ad7b-dcac93675026
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年12月13日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, CH:会員:¥0, DLIB:会員:¥0 | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-12-06 | |||||||
| タイトル | ||||||||
| 言語 | ja | |||||||
| タイトル | イギリス文学テクストの影響分析に特化したLLMモデルの開発に向けて | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Toward the Development of an LLM Model Specific to Analyze the Influence of English Literary Texts | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | イギリス文学;影響;LLM;比喩;インターテクスチュアリティ | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| 中央大学 国際情報学部 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Faculty of Global Informatics, Chuo University | ||||||||
| 著者名 |
橋本,健広
× 橋本,健広
|
|||||||
| 著者名(英) |
Takehiro Hashimoto
× Takehiro Hashimoto
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本研究は,英米文学のテクスト間の影響分析に特化した大規模言語モデルの開発を試みるものである.英米文学作品から取り出した影響あるテクスト(483件)および比喩の辞書的なデータ(2449件)を利用して学習用データセットを作成し,Sentence-BERTモデルをファインチューニングした.また別に作成した影響分析の評価用データセットを用いてモデルのパフォーマンスを考察した.paraphrase-xlmrおよびparaphrase-mpnetの二つのモデルを中心に,ファインチューニング済みモデルを含む計10種類のモデルのパフォーマンスを比較した.結果として,paraphrase-mpnetを影響のデータセットのみを用いてファインチューニングしたモデルが正確性,類似性の領域でわずかながら高い数値が出た.今後はデータセットの量を増やす必要がある. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This study attempts to develop a large language model, an LLM model specific to analyze the influence of English and American literary texts. We collected 483 pairs of texts of influence and 2449 dictionary-style entries of figure of speech data, and fine-tuned Sentence-BERT models. We evaluated model performance using an evaluation dataset for literary influence that we created. We compared the performance of ten models, including fine-tuned models, primarily based on paraphrase-xlmr and paraphrase-mpnet. We found that the fine-tuned paraphrase-mpnet, which used only the influence dataset, achieved slightly higher scores in accuracy and similarity. Future work requires expanding the dataset size. | |||||||
| 書誌情報 |
じんもんこん2025論文集 巻 2025, p. 373-380, ページ数 8, 発行日 2025-12-06 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||