WEKO3
アイテム
PLaMo Translate: 翻訳特化大規模言語モデルの開発
https://ipsj.ixsq.nii.ac.jp/records/2004363
https://ipsj.ixsq.nii.ac.jp/records/2004363c474231e-791f-4d79-a3d9-0f171a5ea625
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2027年9月14日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-09-14 | |||||||||||||
| タイトル | ||||||||||||||
| 言語 | ja | |||||||||||||
| タイトル | PLaMo Translate: 翻訳特化大規模言語モデルの開発 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 翻訳・多言語 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社Preferred Networks | ||||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社Preferred Networks | ||||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社Preferred Networks | ||||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社Preferred Networks | ||||||||||||||
| 著者名 |
今城,健太郎
× 今城,健太郎
× 平野,正徳
× 野沢,健人
× 中鉢,魁三郎
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 大規模言語モデル(LLM)の発展により、自然言語処理タスクの性能は飛躍的に向上したが、翻訳タスクに特化したモデルの最適化は依然として課題である。本研究では、日本語と英語の翻訳に特化した大規模言語モデル「plamo-2-translate」を提案する。提案モデルは、専用のフォーマットを活用した入出力制御、対訳コーパスと合成データを用いたファインチューニング、Iterative DPOによる最適化を組み合わせ、流暢で文脈に即した翻訳を実現する。評価実験では、BLEU、chrF、BERTScore、COMET、GEMBA-MQMなどの複数の指標において、ベースモデルや他のLLMと比較して同等以上の性能を達成し、特に人間の評価に近いGEMBA-MQMで顕著な改善を確認した。さらに、文体指定やコンテキスト保持などの機能を備え、多様な翻訳ニーズに対応する。本研究で構築したモデルは、Huggingfaceを通じて公開しており、そのほかも様々な形態での公開を進めている。 | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN10115061 | |||||||||||||
| 書誌情報 |
研究報告自然言語処理(NL) 巻 2025-NL-265, 号 10, p. 1-6, 発行日 2025-09-14 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8779 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||