ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2021
  4. 2021-CVIM-226

VQAでの質問文の接頭辞とバイアスの関係についての検討

https://ipsj.ixsq.nii.ac.jp/records/211204
https://ipsj.ixsq.nii.ac.jp/records/211204
4b53c654-439a-4ea0-99b8-2fffd5ca9c45
名前 / ファイル ライセンス アクション
IPSJ-CVIM21226044.pdf IPSJ-CVIM21226044.pdf (900.6 kB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2021-05-13
タイトル
タイトル VQAでの質問文の接頭辞とバイアスの関係についての検討
タイトル
言語 en
タイトル Examination of identifying bias in learning VQA model
言語
言語 jpn
キーワード
主題Scheme Other
主題 卒論スポットライトセッション
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東邦大学
著者所属
東邦大学
著者所属(英)
en
Toho University
著者所属(英)
en
Toho University
著者名 河野, 凌我

× 河野, 凌我

河野, 凌我

Search repository
数藤, 恭子

× 数藤, 恭子

数藤, 恭子

Search repository
著者名(英) Ryoga, Kono

× Ryoga, Kono

en Ryoga, Kono

Search repository
Kyoko, Sudo

× Kyoko, Sudo

en Kyoko, Sudo

Search repository
論文抄録
内容記述タイプ Other
内容記述 Visual Question Answering (VQA) は,画像とその画像に関する質問の提示に対して,質問に対する正しい答えを導き出すタスクで,近年ある程度の性能が確認されたモデルや学習データセットも公開されている.しかし,VideoQA (VQAの動画版) のバイアス分析の研究では,特定の接頭辞の質問は,言語 (質問文) におけるバイアスが大きくなる傾向があるため,その他の接頭辞の質問カテゴリよりも高い正解率になることが明らかにされている.そこで,VQA においてテスト時の質問文に対応する画像情報を欠落させた場合をそうでない場合と比較すると,特定の接頭辞の質問に対する正答率の低下は,その他の接頭辞の質問カテゴリに対する正答率の低下より少ないと予測した.これについて実験を行い,質問文の接頭辞とバイアスの関係についての考察を試みた結果,実験結果は必ずしも予測と一致しなかった.
論文抄録(英)
内容記述タイプ Other
内容記述 Visual Question Answering (VQA) is one of the tasks mainly dealt with in deep learning, which is to derive the correct answer to an image and the question about the image when presented, and some performance has been confirmed in recent years. However, in the study of videoQA (video version of VQA) bias analysis, questions with specific prefixes tend to be highly biased in language (question text). Therefore, comparing the case where the image information corresponding to the question text at the time of the test is omitted in VQA with the case where it is not, we predicted that the decrease in the correct answer rate for questions with a specific prefix would be less than the decrease in the correct answer rate for questions with other prefixes. We verified this by experiments and tried to consider the relationship between the prefix of the question sentence and the bias.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2021-CVIM-226, 号 44, p. 1-5, 発行日 2021-05-13
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 17:52:47.386265
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3