| Item type |
SIG Technical Reports(1) |
| 公開日 |
2026-02-28 |
| タイトル |
|
|
言語 |
ja |
|
タイトル |
独立成分分析による大規模視覚言語モデルの画像表現の分析 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Exploring Visual Representations in Large-Scale Vision-Language Models via Independent Component Analysis |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
視覚言語モデル |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者名 |
北野,雄士
西田,悠人
坂上,温紀
上垣外,英剛
渡辺,太郎
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
大規模視覚言語モデル(LVLM)は個別に事前学習された言語モデル(LLM)と視覚エンコーダから構成される.LVLMの内部機序を解明しようとする既存の試みでは,画像情報がテキストの処理に与える影響に焦点が当てられてきた.しかし,画像情報単体での処理についての理解がなければ,それに立脚したテキストの処理を把握することは容易でない.そこで本研究では,独立成分分析を用いてLLM部分における画像表現を層ごとに分析することによって,画像情報の処理過程を解明することを図る. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2026-NL-267,
号 26,
p. 1-9,
発行日 2026-02-28
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |