Item type |
SIG Technical Reports(1) |
公開日 |
2021-05-13 |
タイトル |
|
|
タイトル |
VQAでの質問文の接頭辞とバイアスの関係についての検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Examination of identifying bias in learning VQA model |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
卒論スポットライトセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東邦大学 |
著者所属 |
|
|
|
東邦大学 |
著者所属(英) |
|
|
|
en |
|
|
Toho University |
著者所属(英) |
|
|
|
en |
|
|
Toho University |
著者名 |
河野, 凌我
数藤, 恭子
|
著者名(英) |
Ryoga, Kono
Kyoko, Sudo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Visual Question Answering (VQA) は,画像とその画像に関する質問の提示に対して,質問に対する正しい答えを導き出すタスクで,近年ある程度の性能が確認されたモデルや学習データセットも公開されている.しかし,VideoQA (VQAの動画版) のバイアス分析の研究では,特定の接頭辞の質問は,言語 (質問文) におけるバイアスが大きくなる傾向があるため,その他の接頭辞の質問カテゴリよりも高い正解率になることが明らかにされている.そこで,VQA においてテスト時の質問文に対応する画像情報を欠落させた場合をそうでない場合と比較すると,特定の接頭辞の質問に対する正答率の低下は,その他の接頭辞の質問カテゴリに対する正答率の低下より少ないと予測した.これについて実験を行い,質問文の接頭辞とバイアスの関係についての考察を試みた結果,実験結果は必ずしも予測と一致しなかった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Visual Question Answering (VQA) is one of the tasks mainly dealt with in deep learning, which is to derive the correct answer to an image and the question about the image when presented, and some performance has been confirmed in recent years. However, in the study of videoQA (video version of VQA) bias analysis, questions with specific prefixes tend to be highly biased in language (question text). Therefore, comparing the case where the image information corresponding to the question text at the time of the test is omitted in VQA with the case where it is not, we predicted that the decrease in the correct answer rate for questions with a specific prefix would be less than the decrease in the correct answer rate for questions with other prefixes. We verified this by experiments and tried to consider the relationship between the prefix of the question sentence and the bias. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2021-CVIM-226,
号 44,
p. 1-5,
発行日 2021-05-13
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |