WEKO3
アイテム
LLMによるシーン中の物体の形容記述を用いた景観画像の印象予測
https://ipsj.ixsq.nii.ac.jp/records/240583
https://ipsj.ixsq.nii.ac.jp/records/2405837295da62-b639-4b00-9a6b-ba54e0bce846
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年11月11日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, UBI:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-11-11 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | LLMによるシーン中の物体の形容記述を用いた景観画像の印象予測 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | AI | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 東京科学大学情報理工学院情報工学系 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 東京科学大学情報理工学院情報工学系 | ||||||||||||||
| 著者所属 | ||||||||||||||
| LINEヤフー株式会社 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 東京科学大学情報理工学院情報工学系 | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| School of Computing, Department of Computer Science, Institute of Science Tokyo | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| School of Computing, Department of Computer Science, Institute of Science Tokyo | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| LY Corporation | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| School of Computing, Department of Computer Science, Institute of Science Tokyo | ||||||||||||||
| 著者名 |
井手, 海翔
× 井手, 海翔
× 安納, 爽響
× 坪内, 孝太
× 下坂, 正倫
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 近年,都市景観画像に対して,人々が抱く印象を数値評価することが,都市開発や土地ブランディングに役立つとされ研究が進んでいる.既存研究では,景観画像のシーン全体をひとつの物体と仮定する,物体認識ベースの数値予測が中心であったが,シーン内の個々の物体を検出し,検出領域での画像特徴から数値を予測する手法へと進展している.この流れは,シーン全体をベースとする手法の場合,物体のクラスや局所的な特徴を捉えることが困難なために,印象の数値予測の性能が限定的であったことに起因する.一方,物体検出に特化した画像特徴は,景観の印象評価に直接関連性があるとは言いがたい.そこで本研究では,景観画像のシーン中の物体検出に加え,物体等シーン構成要素の形容に関する記述を積極的に活用し,印象予測精度の向上につながるモデルを提案する.その際,印象評価に有効な形容記述の模索の効率化のため,大規模言語モデル(Large Language Model; LLM)を活用する.クラウドソーシングで得た印象評価データセットを用いて,既存手法と提案手法の予測性能を比較することで,提案手法の有用性を示す. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AA11838947 | |||||||||||||
| 書誌情報 |
研究報告ユビキタスコンピューティングシステム(UBI) 巻 2024-UBI-84, 号 8, p. 1-8, 発行日 2024-11-11 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8698 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||