WEKO3
アイテム
マルチスケールな検出領域を用いた改良型ODAMによる可視化結果の解釈容易性向上
https://ipsj.ixsq.nii.ac.jp/records/234181
https://ipsj.ixsq.nii.ac.jp/records/234181b55524ff-39da-4f5d-9864-40a324d10764
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年5月8日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, CVIM:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-05-08 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | マルチスケールな検出領域を用いた改良型ODAMによる可視化結果の解釈容易性向上 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 卒論スポットライトセッション (CVIM) | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 中部大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 中部大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 中部大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 中部大学 | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Chubu University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Chubu University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Chubu University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Chubu University | ||||||||||||||
| 著者名 |
仲井, 悠真
× 仲井, 悠真
× 平川, 翼
× 山下, 隆義
× 藤吉, 弘亘
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 深層学習モデルによる物体検出は,自動運転や医療画像解析等の分野で幅広く利用されている.特に Transformer を用いた物体検出法はその高い検出精度で注目されているが,モデルの検出結果に対する判断根拠は不明瞭であり,ブラックボックスとされている.この問題に対し,勾配ベースで物体検出結果に対して判断根拠を可視化する手法として,Object Detector Activation Maps (ODAM) が提案されている.ODAM は検出領域に対するアテンションマップを出力するが,ノイズに敏感であることから,検出した物体以外の領域を強調することがある.そこで本研究では,ODAM の解釈容易性の向上を目的とし,マルチスケールな検出領域を用いた改良型 ODAM を提案する.提案手法では,ODAM に与える検出領域が,可視化結果に大きな影響を及ぼすという性質を利用する.具体的には,検出領域の大きさの変化によって検出物体に注視した可視化結果になるという性質を利用し,異なる拡張率を持つ Bounding Box での可視化結果を平均する.これにより,着目する領域の変動を抑制し,可視化結果の忠実度を維持しつつ解釈容易性を高める. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AA11131797 | |||||||||||||
| 書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2024-CVIM-238, 号 50, p. 1-7, 発行日 2024-05-08 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8701 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||