Item type |
Symposium(1) |
公開日 |
2022-08-24 |
タイトル |
|
|
タイトル |
離散化アテンションによる説明可能AIの説明能力向上 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Improving Explanation Ability by Sign Attention Exploiting Difference in Bit Significance |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, Osaka University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
著者名 |
田代, 悠馬
粟野, 皓光
|
著者名(英) |
Yuma, Tashiro
Hiromitsu, Awano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
現代の深層学習アルゴリズムは非常に複雑な人工神経網から成り立っており,人間による推論過程の追跡は困難を極める.深層学習の社会実装が進む一方で,推論誤りがもたらす人的・経済的損失が問題視されており,深層学習アルゴリズムの判断根拠を説明する手法が求められている.例えば,自動運転タスクでは,ステアリング操舵角予測に寄与する領域をアテンション機構によって視覚化する手法が提案されているが,説明能力は依然として低かった.研究ではアテンション機構による説明可能な AI の説明能力の更なる向上を図る.ビット毎の重要度の違いに着目し,画像特徴量を浮動小数点より少ないビット数に離散化することで,符号ビットに限定してアテンションを付加する手法を提案する.提案手法を用いて,ネットワークが出力する着目領域と予測誤差の関係を検証し,提案手法の有効性を示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Modern deep learning algorithms consist of extremely complex artificial neural networks, making it extremely difficult for humans to track the inference process. While the social implementation of deep learning is progressing, the human and economic losses caused by inference errors are becoming more and more problematic, and there is a need for methods to explain the basis for the decisions of deep learning algorithms. For example, in the task of self-driving, a method has been proposed to visualize the regions that contribute to steering angle prediction using an attention mechanism, but its explanatory power was still low. In this study, we focus on the difference in the importance of each bit of activation (i.e., LSBs have the lowest weight and MSBs have the highest weight), and propose a method to add attention only to the sign bits to further improve the explanatory power. The effectiveness of the proposed method is demonstrated by examining the relationship between the prediction error and the region of interest output by the network. |
書誌情報 |
DAシンポジウム2022論文集
巻 2022,
p. 180-187,
発行日 2022-08-24
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |