Item type |
Symposium(1) |
公開日 |
2022-10-17 |
タイトル |
|
|
タイトル |
MEGEX:勾配系の説明可能なAIに対するデータフリーモデル抽出攻撃 |
タイトル |
|
|
言語 |
en |
|
タイトル |
MEGEX: Data Free Model Extraction against Gradient based Explainable AI |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
データフリーモデル抽出攻撃,説明可能な AI, SmoothGrad, Integrated Gradient |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
NTT社会情報学研究所/大阪大学 |
著者所属 |
|
|
|
NTT社会情報学研究所 |
著者所属 |
|
|
|
大阪大学 |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories / Osaka University |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
Osaka University |
著者名 |
三浦, 尭之
芝原, 俊樹
矢内, 直人
|
著者名(英) |
Takayuki, Miura
Toshiki, Shibahara
Naoto, Yanai
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
データフリーモデル抽出攻撃は,訓練済み機械学習モデルをその入出力から復元するモデル抽出攻 撃を,一切の訓練データを用意することなく実現する攻撃である.勾配系の説明可能な AI に対するデー タフリーモデル抽出攻撃がより効率的になることが近年示されたが,実際に用いられる勾配は解釈性向上 のために加工されていることが多い.本稿ではこうした加工が攻撃成功率に与える影響を調査するため, 特に実用されている Integrated Gradient に対する攻撃手法を提案し,実験評価を行った.評価は複数の データセットを用い,データセットの分類難易度が上がると攻撃にはより正確な勾配が必要になるという ことを明らかにした.また,攻撃の成功率と生成モデルの学習度合いの関係を考察するため,学習途中の 生成モデルが出す画像を可視化し,傾向の違いを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Data-free model extraction attacks are model extraction attacks, in which an attacker recovers trained machine learning models from their inferences, without any training data. These attacks against Explainable AI have recently been shown to be more efficient. However, explanations in the world are often modified to improve their interpretability. In this paper, we introduce an attack against Integrated Gradient, which is a gradient-based explainable AI and pratically used in the world, in order to investigate a relationship between their modificaitons and attack success rates. We also conduct experiments to verify the difference in attack success rates between several datasets. In order to examine the relationship between attack success rates and the generative model, we visualized the images produced by the generative model. |
書誌情報 |
コンピュータセキュリティシンポジウム2022論文集
p. 1329-1336,
発行日 2022-10-17
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |