@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00223116, author = {三浦, 尭之 and 紀伊, 真昇 and 芝原, 俊樹 and 市川, 敦謙 and 山本, 充子 and 千田, 浩司 and Takayuki, Miura and Masanobu, Kii and Toshiki, Shibahara and Atsunori, Ichikawa and Juko, Yamamoto and Koji, Chida}, book = {コンピュータセキュリティシンポジウム2022論文集}, month = {Oct}, note = {合成データ生成によるプライバシー保護は,理論的な安全性を定量的に表現するために,統計量や モデルパラメータに差分プライバシー性を保証させるようなノイズを加えることが主流であるが,データ 生成時のランダム性によるプライバシー保護性は考慮されていない.本研究では,元データの平均ベクトルと分散共分散行列を利用した多変量正規分布による合成データ生成方式に対して,データ生成時のランダム性がみたす Renyi 差分プライバシー性を理論的に評価した.具体的には,隣接性が秘匿 n 条件による 場合と,公開 n 条件による場合ごとに,α > 1 を決めたときの合成データ生成が (α, ε)-Renyi 差分プライバシーを満たすような ε の条件を導出した.特に,秘匿 n 条件で導出した ε は,元データのサンプル数を 1000 万件ほどまで大きくすると,ノイズを足すなどの操作をしなくても,同数のサンプルを出力するメカ ニズムが (4, 0.576)-Renyi 差分プライバシーを満たし,また,従来の (ε, δ)-差分プライバシーに換算しても (2.72, 10^−5 )-差分プライバシーを満たすことがわかった., Most privacy-preserving synthetic data generation techniques guarantee differential privacy by adding noise to statistics and model parameters. However, privacy protection due to randomness in data generation is not considered. In this study, we theoretically evaluate the R'enyi differential privacy of randomness in data generation. Specifically, we consider synthetic data generation based on multivariate normal distribution using the mean vector and variance-covariance matrix of the original data. For each of the two adjacency conditions, we derived a condition of ε such that the synthetic data generation satisfies (α, ε)- R'enyi differential privacy with fixed α > 1. In particular, ε derived under the private n regime satisfies (4, 0.576)-R'enyi differential privacy when the number of samples of the original data is increased up to about 10 million samples, and the mechanism to output samples of the same size without any operations such as adding noise satisfies the conventional (ε, δ)-differential privacy, and (2.72, 10^−5 )-differential privacy.}, pages = {440--447}, publisher = {情報処理学会}, title = {合成データ生成のランダム性が持つRényi差分プライバシー性の評価}, year = {2022} }