ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2024
  4. 2024-CVIM-238

画像クラスタリングに基づくCLIP学習のためのincorrectペア生成法の提案

https://ipsj.ixsq.nii.ac.jp/records/234190
https://ipsj.ixsq.nii.ac.jp/records/234190
b4c2c484-3944-4ce9-98de-e4d6dbe1dae9
名前 / ファイル ライセンス アクション
IPSJ-CVIM24238059.pdf IPSJ-CVIM24238059.pdf (2.9 MB)
Copyright (c) 2024 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
CVIM:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-05-08
タイトル
タイトル 画像クラスタリングに基づくCLIP学習のためのincorrectペア生成法の提案
タイトル
言語 en
タイトル A Proposal for Generating Incorrect Pairs for the CLIP Learning based on Image Clustering
言語
言語 jpn
キーワード
主題Scheme Other
主題 セッション3(PRMU)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
中京大学
著者所属
中京大学
著者所属
中京大学
著者所属
中京大学
著者所属(英)
en
Chukyo University
著者所属(英)
en
Chukyo University
著者所属(英)
en
Chukyo University
著者所属(英)
en
Chukyo University
著者名 田上, 鈴奈

× 田上, 鈴奈

田上, 鈴奈

Search repository
小林, 大起

× 小林, 大起

小林, 大起

Search repository
秋月, 秀一

× 秋月, 秀一

秋月, 秀一

Search repository
橋本, 学

× 橋本, 学

橋本, 学

Search repository
著者名(英) Rina, Tagami

× Rina, Tagami

en Rina, Tagami

Search repository
Hiroki, Kobayashi

× Hiroki, Kobayashi

en Hiroki, Kobayashi

Search repository
Shuichi, Akizuki

× Shuichi, Akizuki

en Shuichi, Akizuki

Search repository
Manabu, Hashimoto

× Manabu, Hashimoto

en Manabu, Hashimoto

Search repository
論文抄録
内容記述タイプ Other
内容記述 CLIP の対照学習には,画像・テキスト間の関連性が高いペア (correct ペア) と,correct ペアの組み合わせを変えて生成された,画像・テキスト間の関連性が低いペア (incorrect ペア) が利用されている.提案手法では,学習性能の向上が可能な incorrect ペアのみを生成する手法を提案する.従来の CLIP は,学習データ内に類似画像が複数存在する場合,関連性の高いペアが incorrect ペアとして扱われ,学習に悪影響を及ぼすという問題がある.そこで,提案手法では,ViT と BERT を用いて correct ペアの画像特徴とテキスト特徴を抽出後,それぞれをクラスタリングし,画像特徴間のクラスタが異なる,類似度の低いペアの付与テキストを交換する.これにより,画像・テキスト間の関連性が低い incorrect ペアのみを作成可能である.Amazon review dataset を用いた実験では,従来の CLIPと比較して Rank@1 スコアが 13.0%,ランダムで incorrect ペアを削減した場合と比較して 6.0% 向上した.
論文抄録(英)
内容記述タイプ Other
内容記述 We proposed a novel method for generating incorrect pairs to enhance learning performance in CLIP’s contrastive learning, addressing the bias in data quantity between correct and incorrect pairs. Vanilla CLIP methods that similar images are considered incorrect pairs, adversely affecting learning. Our approach extracts features of images and texts from correct pairs using ViT and BERT, clusters them, and then swaps texts of low-similarity pairs across different clusters. Experiments on the Amazon review dataset showed a 13.0% improvement in Rank@1 score over conventional CLIP and a 6.0% improvement over randomly reducing incorrect pairs.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2024-CVIM-238, 号 59, p. 1-6, 発行日 2024-05-08
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:52:25.559692
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3