ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2024
  4. 2024-CVIM-236

テキスト検索可能なシーン画像データベースの構築

https://ipsj.ixsq.nii.ac.jp/records/231948
https://ipsj.ixsq.nii.ac.jp/records/231948
9a703b98-9737-4c63-b1ba-8830bebb202a
名前 / ファイル ライセンス アクション
IPSJ-CVIM24236026.pdf IPSJ-CVIM24236026.pdf (17.8 MB)
Copyright (c) 2024 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2024-01-18
タイトル
タイトル テキスト検索可能なシーン画像データベースの構築
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
産業技術総合研究所
著者所属
産業技術総合研究所
著者所属
産業技術総合研究所
著者名 坂口, 翼

× 坂口, 翼

坂口, 翼

Search repository
大西, 正輝

× 大西, 正輝

大西, 正輝

Search repository
櫻田, 健

× 櫻田, 健

櫻田, 健

Search repository
論文抄録
内容記述タイプ Other
内容記述 自動運転や xR の分野において,収集した動画像から 3 次元地図の構築やシーン認識を行う研究開発が盛んに行われている.また,近年大規模言語モデルにより画像説明文生成の精度と汎用性が大幅に向上し,多様なタスクへ応用可能となりつつある.本研究では,地図上に登録された画像から汎用画像言語モデルにより抽出した説明文を利用して,シーンをテキスト検索可能なシステムを構築する.実際に屋内外を撮影した画像に対し複数の具体的なタスクを設定し,システムの有効性と技術課題を検討する.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2024-CVIM-236, 号 26, p. 1-6, 発行日 2024-01-18
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:35:30.192896
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3