WEKO3
アイテム
ReLUニューラルネットワークにおけるIntegrated GradientのVanilla Gradientへの帰着
https://ipsj.ixsq.nii.ac.jp/records/211048
https://ipsj.ixsq.nii.ac.jp/records/21104831a67460-ef9d-420f-a8f9-927dbbc54a34
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-05-06 | |||||||||||
タイトル | ||||||||||||
タイトル | ReLUニューラルネットワークにおけるIntegrated GradientのVanilla Gradientへの帰着 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | CSEC | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
NTTセキュアプラットフォーム研究所 | ||||||||||||
著者所属 | ||||||||||||
東京大学大学院数理科学研究科 | ||||||||||||
著者所属 | ||||||||||||
NTTセキュアプラットフォーム研究所 | ||||||||||||
著者名 |
三浦, 尭之
× 三浦, 尭之
× 権, 英哲
× 長谷川, 聡
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年,深層学習をはじめとした機械学習の社会への浸透を背景に説明可能な AI に対する期待が高まっている.画像分類などでは,分類結果に対して重要だったピクセルをハイライトする勾配ベースの説明が盛んに研究されており,Sundararajan らによって提案された Integrated Gradient はGoogle Cloud などでサービスとして実装されている.一方で,最もシンプルな勾配ベースの説明である Vanilla Gradient は,訓練済みモデル保護の観点から脆弱性になりうるという報告がなされている.具体的には,入出力の情報から訓練済みモデルを盗み出す Model Extraction 攻撃が,出力に Vanilla Gradient による説明が加わることで効率的にできるという研究結果が報告されている.本研究では,活性化関数に ReLU が用いられているニューラルネットワークが Integrated Gradient による説明も出力する際,その情報から Vanilla Gradient の情報を復元できることを示した.これは,Integrated Gradeint による説明がついたモデルに対しても,説明が脆弱性になりうることを意味し,機械学習モデルのオープンな利活用を推進するにあたって検討しなければならない問題である. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AA12326962 | |||||||||||
書誌情報 |
研究報告インターネットと運用技術(IOT) 巻 2021-IOT-53, 号 26, p. 1-8, 発行日 2021-05-06 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8787 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |