@techreport{oai:ipsj.ixsq.nii.ac.jp:02007744, author = {辻,航平 and 平岡,達也 and 乾,健太郎 and 渡辺,太郎}, issue = {18}, month = {Feb}, note = {現実的なLLMでは,有限の語彙であらゆる言語を表現する必要がある.そのため,英語が主のLLMでは日本語などの非ラテン文字体系言語の語彙サイズが小さくなり,処理が非効率かつ性能が上がりづらくなる.しかし,単純な語彙拡張や語彙置換には,計算負荷や性能低下などの課題がある.そこで本研究では,複数のサブワードが同じ埋め込みを使う埋め込み空間の共有を導入し,語彙サイズを広げることなく,埋め込み空間を小さくすることで,計算効率や性能低下を最低限に抑えながら従来の課題を解決する.}, title = {非ラテン文字体系言語を効率的に処理するためのLLM埋め込み空間の共有}, year = {2026} }