Item type |
SIG Technical Reports(1) |
公開日 |
2015-05-07 |
タイトル |
|
|
タイトル |
近似式を用いたk-匿名性の予測手法と匿名化処理の効率化提案 |
タイトル |
|
|
言語 |
en |
|
タイトル |
The prediction of limit number of classification that satisfies k-anonymity, And suggestion of efficient k-anonymizing process |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
総合研究大学院大学複合化学研究科情報学専攻/ニフティ株式会社 |
著者所属 |
|
|
|
国立情報学研究所 |
著者所属 |
|
|
|
ニフティ株式会社 |
著者所属 |
|
|
|
総合研究大学院大学複合化学研究科情報学専攻 |
著者所属(英) |
|
|
|
en |
|
|
The Graduate University for Advanced Studies, School of Multidisciplinary, Informatics Department / NIFTY Corporation |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Informatics |
著者所属(英) |
|
|
|
en |
|
|
NIFTY Corporation |
著者所属(英) |
|
|
|
en |
|
|
The Graduate University for Advanced Studies, School of Multidisciplinary, Informatics Department |
著者名 |
小栗, 秀暢
曽根原, 登
松井, くにお
Mohammad, Mohammad,Rasool,Sarrafi,Aghdam
|
著者名(英) |
Hidenobu, Oguri
Noboru, Sonehara
Kunio, Matsui
Mohammad, RasoolSarrafiAghdam
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Big Data 分析におけるパーソナルデータの処理は安全性を高めるために膨大な計算量を必要とし,重要な課題である.k-匿名化技術は個人情報の属性値の出現数が k 個 (k>1) 以上になるよう書き換え,個人識別性を減少させる手段として利用される.データ提供者間で互いに情報を公開できない場合,保持する情報を k-匿名化処理し,かつ互いに接続可能な属性値に加工することは難しい.そこで本稿では国勢調査及び 1635 サービスの登録者 434 万人のデータに対して一律の属性値の区分処理を行い,k-匿名レベルの推移調査を行った.その結果,累乗近似を用いた予測値と k-匿名レベルの推移に強い相関があることを明らかにした.これにより属性の区分数による匿名レベルの予測が可能となるため,個人情報を開示せずに匿名化処理が可能かの予測が行えるようになる.本稿では,実データを用いて予測値の正確性と計算回数の減少率を評価し,k-匿名化処理の効率化に寄与できることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Privacy is important issue in Big data analysis. It requires an enormous amount of calculation in order to decrease the risk level of the data. A model that is widely used to protect privacy is k-anonymity, which can be generally defined as a clustering method in which any record in a dataset is indistinguishable from at least k (k>1) other records in the same dataset. If the two data providers need to exchange their data, and not be able to distribute detail information each other, It is difficult to recode these attributes that satisfy k-anonymization and be able to connect each other. We researched the transition investigation of k-value of 4.3 million users on 1635 services that has set same classification processes. As a result, we verified that the transition of the k-value has strong correlation with predicted value obtained by using the power approximation. By its predicted model, we can predict the number of the division of the attribute that satisfies the k-anonymity, and we can connect plural anonymized data by same taxonomy without disclosing personal information. In this paper, we evaluated the reduction rate of the calculation times and accuracy of the predicted value on the real data. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12628305 |
書誌情報 |
研究報告セキュリティ心理学とトラスト(SPT)
巻 2015-SPT-13,
号 3,
p. 1-8,
発行日 2015-05-07
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8671 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |