WEKO3
アイテム
テキスト検索可能なシーン画像データベースの構築
https://ipsj.ixsq.nii.ac.jp/records/231948
https://ipsj.ixsq.nii.ac.jp/records/2319489a703b98-9737-4c63-b1ba-8830bebb202a
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-01-18 | |||||||||||
| タイトル | ||||||||||||
| タイトル | テキスト検索可能なシーン画像データベースの構築 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 産業技術総合研究所 | ||||||||||||
| 著者所属 | ||||||||||||
| 産業技術総合研究所 | ||||||||||||
| 著者所属 | ||||||||||||
| 産業技術総合研究所 | ||||||||||||
| 著者名 |
坂口, 翼
× 坂口, 翼
× 大西, 正輝
× 櫻田, 健
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 自動運転や xR の分野において,収集した動画像から 3 次元地図の構築やシーン認識を行う研究開発が盛んに行われている.また,近年大規模言語モデルにより画像説明文生成の精度と汎用性が大幅に向上し,多様なタスクへ応用可能となりつつある.本研究では,地図上に登録された画像から汎用画像言語モデルにより抽出した説明文を利用して,シーンをテキスト検索可能なシステムを構築する.実際に屋内外を撮影した画像に対し複数の具体的なタスクを設定し,システムの有効性と技術課題を検討する. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AA11131797 | |||||||||||
| 書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2024-CVIM-236, 号 26, p. 1-6, 発行日 2024-01-18 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8701 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||