Item type |
Symposium(1) |
公開日 |
2022-10-17 |
タイトル |
|
|
タイトル |
合成データ生成のランダム性が持つRényi差分プライバシー性の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
On Rényi Differential Privacy in Synthetic Data Generation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Renyi-差分プライバシー,合成データ生成,プライバシー保護 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
NTT社会情報研究所 |
著者所属 |
|
|
|
NTT社会情報研究所 |
著者所属 |
|
|
|
NTT社会情報研究所 |
著者所属 |
|
|
|
NTT社会情報研究所 |
著者所属 |
|
|
|
NTT社会情報研究所 |
著者所属 |
|
|
|
群馬大学 |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratories |
著者所属(英) |
|
|
|
en |
|
|
Gunma University |
著者名 |
三浦, 尭之
紀伊, 真昇
芝原, 俊樹
市川, 敦謙
山本, 充子
千田, 浩司
|
著者名(英) |
Takayuki, Miura
Masanobu, Kii
Toshiki, Shibahara
Atsunori, Ichikawa
Juko, Yamamoto
Koji, Chida
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
合成データ生成によるプライバシー保護は,理論的な安全性を定量的に表現するために,統計量や モデルパラメータに差分プライバシー性を保証させるようなノイズを加えることが主流であるが,データ 生成時のランダム性によるプライバシー保護性は考慮されていない.本研究では,元データの平均ベクトルと分散共分散行列を利用した多変量正規分布による合成データ生成方式に対して,データ生成時のランダム性がみたす Renyi 差分プライバシー性を理論的に評価した.具体的には,隣接性が秘匿 n 条件による 場合と,公開 n 条件による場合ごとに,α > 1 を決めたときの合成データ生成が (α, ε)-Renyi 差分プライバシーを満たすような ε の条件を導出した.特に,秘匿 n 条件で導出した ε は,元データのサンプル数を 1000 万件ほどまで大きくすると,ノイズを足すなどの操作をしなくても,同数のサンプルを出力するメカ ニズムが (4, 0.576)-Renyi 差分プライバシーを満たし,また,従来の (ε, δ)-差分プライバシーに換算しても (2.72, 10^−5 )-差分プライバシーを満たすことがわかった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Most privacy-preserving synthetic data generation techniques guarantee differential privacy by adding noise to statistics and model parameters. However, privacy protection due to randomness in data generation is not considered. In this study, we theoretically evaluate the R'enyi differential privacy of randomness in data generation. Specifically, we consider synthetic data generation based on multivariate normal distribution using the mean vector and variance-covariance matrix of the original data. For each of the two adjacency conditions, we derived a condition of ε such that the synthetic data generation satisfies (α, ε)- R'enyi differential privacy with fixed α > 1. In particular, ε derived under the private n regime satisfies (4, 0.576)-R'enyi differential privacy when the number of samples of the original data is increased up to about 10 million samples, and the mechanism to output samples of the same size without any operations such as adding noise satisfies the conventional (ε, δ)-differential privacy, and (2.72, 10^−5 )-differential privacy. |
書誌情報 |
コンピュータセキュリティシンポジウム2022論文集
p. 440-447,
発行日 2022-10-17
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |