@techreport{oai:ipsj.ixsq.nii.ac.jp:02004151, author = {柳原,皓之介 and 伊東,栄典}, issue = {10}, month = {Sep}, note = {現代の組織において、業務で生成された膨大な文書がデジタルデータとして蓄積されている。多くの組織内蓄積データは死蔵状態にあり、潜在的な価値が活用されていない。死蔵データ活用にはデータ分析が必要であるけれど、組織内蓄積データは機密情報や個人情報を含むため、クラウド等の外部サービスによる活用が困難である。我々は、機密性文書群を安全に活用するため、データ外部漏洩リスクの無いローカル小規模言語モデル(LLM)のチューニングを試みている。既存の公開LLMを基盤とし、学習用データセットでチューニングする。手法として、LoRA (Low-Rank Adaptation)およびRAG (Retrieval-Augmented Generation)を試みた。LoRA化の処理時間短縮のため、高性能GPUを持つ九州大学のスーパーコンピュータ「玄界」を用いた。機密情報の外部漏洩を避けるため、組織内の閉じたネットワーク環境で動作する低性能GPU搭載PCサーバ上でLoRAまたはRAGに対応したLLMを動作させる。本稿では組織内文書群によるLLMチューニングの実現方法を述べる。またチューニングによる性能評価も検討する。}, title = {LoRAによる機密情報を扱うLLM実現の試み}, year = {2025} }