Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-06 |
タイトル |
|
|
タイトル |
本来の定義に則ったAdversarial Exampleの評価 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SPT |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
NTTセキュリティ・ジャパン株式会社 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
早稲田大学 |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者所属(英) |
|
|
|
en |
|
|
NTT |
著者所属(英) |
|
|
|
en |
|
|
NTT Security (Japan) |
著者所属(英) |
|
|
|
en |
|
|
NTT |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者名 |
藤森, 洸
芝原, 俊樹
千葉, 大紀
秋山, 満昭
内田, 真人
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ニューラルネットワークに対する脆弱性攻撃の一つとして,入力データに微小なノイズを加えることで作為的に誤分類を誘発させる Adversarial Example(AE)がある.AE による「攻撃成功」は,ノイズを人間に認識されることなく機械学習モデルを誤分類させることとして定義される.しかし,AE の攻撃手法に関する既存研究では,機械学習モデルを誤分類させることのみが着目されており,ノイズの視認性について評価していない場合がある.そこで本研究では,ノイズの視認性を考慮した本来の攻撃成功の定義に基づき,既存手法の攻撃性能を検証する.具体的には,代表的な攻撃手法である Fast Gradient Sign Method が提案された論文で行われた評価実験と同じ条件下で作成された AE について,摂動の視認性をユーザ調査により確認した上で,攻撃が成功した AE の割合を比較する.本研究の結果より,既存の攻撃手法に対して,本来の定義に基づいた再評価が必要であることがわかった. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12628305 |
書誌情報 |
研究報告セキュリティ心理学とトラスト(SPT)
巻 2023-SPT-50,
号 34,
p. 1-8,
発行日 2023-03-06
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8671 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |