2024-03-29T20:34:11Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:002111442024-03-29T05:26:34Z01164:04179:10535:10590
VQAでの質問文の接頭辞とバイアスの関係についての検討Examination of identifying bias in learning VQA modeljpn卒論スポットライトセッションhttp://id.nii.ac.jp/1001/00211038/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=211144&item_no=1&attribute_id=1&file_no=1Copyright (c) 2021 by the Information Processing Society of Japan東邦大学東邦大学河野, 凌我数藤, 恭子Visual Question Answering (VQA) は,画像とその画像に関する質問の提示に対して,質問に対する正しい答えを導き出すタスクで,近年ある程度の性能が確認されたモデルや学習データセットも公開されている.しかし,VideoQA (VQAの動画版) のバイアス分析の研究では,特定の接頭辞の質問は,言語 (質問文) におけるバイアスが大きくなる傾向があるため,その他の接頭辞の質問カテゴリよりも高い正解率になることが明らかにされている.そこで,VQA においてテスト時の質問文に対応する画像情報を欠落させた場合をそうでない場合と比較すると,特定の接頭辞の質問に対する正答率の低下は,その他の接頭辞の質問カテゴリに対する正答率の低下より少ないと予測した.これについて実験を行い,質問文の接頭辞とバイアスの関係についての考察を試みた結果,実験結果は必ずしも予測と一致しなかった.Visual Question Answering (VQA) is one of the tasks mainly dealt with in deep learning, which is to derive the correct answer to an image and the question about the image when presented, and some performance has been confirmed in recent years. However, in the study of videoQA (video version of VQA) bias analysis, questions with specific prefixes tend to be highly biased in language (question text). Therefore, comparing the case where the image information corresponding to the question text at the time of the test is omitted in VQA with the case where it is not, we predicted that the decrease in the correct answer rate for questions with a specific prefix would be less than the decrease in the correct answer rate for questions with other prefixes. We verified this by experiments and tried to consider the relationship between the prefix of the question sentence and the bias.AN10115061研究報告自然言語処理(NL)2021-NL-24844152021-05-132188-87792021-05-12