@techreport{oai:ipsj.ixsq.nii.ac.jp:00238505,
 author = {齋藤, 幸史郎 and 水木, 栄 and 大井, 聖也 and 中村, 泰士 and 塩谷, 泰平 and 前田, 航希 and Youmi, Ma and 服部, 翔 and 藤井, 一喜 and 岡本, 拓己 and 石田, 茂樹 and 高村, 大也 and 横田, 理央 and 岡崎, 直観},
 issue = {12},
 month = {Aug},
 note = {日本語のテキストを学習することの意義,そして日本語に強い大規模言語モデル(LLM)の特徴は何であろうか.本研究では,35 種類の日本語・英語の LLM を日英 19 件のタスクで統一的に評価することで,言語とタスク性能の関連性を定量的に分析した.その結果,次の三つの知見を得た.まず,タスク性能の相関行列を分析し,一般教養やコード生成,算術推論は英語と日本語の性能がほぼ比例することを見出した(4.2 節で詳述する).次に,相関行列の主成分分析により,有意義な主成分を三つ確認した.第1主成分は日英問わず大半のタスクに寄与する基礎能力的な因子,第 2 主成分は日本語質問応答と英日翻訳に寄与する因子,第 3 主成分は算術推論とコード生成に寄与する因子である(4.3 節で詳述する).最後に,主成分得点と計算予算の対数との関係を分析し,第 1 主成分は英語向け計算予算,第 2 主成分は日本語向け計算予算に比例することを見出した(ここで,計算予算=パラメータ数×学習トークン数であり,4.4 節で詳述する).以上の分析から,LLM に日本語テキストを学習させることは,主に日本に関する知識の獲得および英日翻訳の向上という効果をもたらすことが示唆された.},
 title = {LLMに日本語テキストを学習させる意義},
 year = {2024}
}