@techreport{oai:ipsj.ixsq.nii.ac.jp:02007752, author = {北野,雄士 and 西田,悠人 and 坂上,温紀 and 上垣外,英剛 and 渡辺,太郎}, issue = {26}, month = {Feb}, note = {大規模視覚言語モデル(LVLM)は個別に事前学習された言語モデル(LLM)と視覚エンコーダから構成される.LVLMの内部機序を解明しようとする既存の試みでは,画像情報がテキストの処理に与える影響に焦点が当てられてきた.しかし,画像情報単体での処理についての理解がなければ,それに立脚したテキストの処理を把握することは容易でない.そこで本研究では,独立成分分析を用いてLLM部分における画像表現を層ごとに分析することによって,画像情報の処理過程を解明することを図る.}, title = {独立成分分析による大規模視覚言語モデルの画像表現の分析}, year = {2026} }