| Item type |
Journal(1) |
| 公開日 |
2016-09-15 |
| タイトル |
|
|
タイトル |
累乗近似式を用いたk-匿名化処理の効率化 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
An Efficient k-anonymization Algorithm by Predictive Model of the Power Approximation |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:社会の変革に挑戦するセキュリティ技術とプライバシー保護技術] プライバシー保護,k-匿名性,匿名化処理 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| 著者所属 |
|
|
|
総合研究大学院大学複合科学研究科情報学専攻/ニフティ株式会社 |
| 著者所属 |
|
|
|
国立情報学研究所 |
| 著者所属 |
|
|
|
ニフティ株式会社 |
| 著者所属 |
|
|
|
総合研究大学院大学複合科学研究科情報学専攻 |
| 著者所属(英) |
|
|
|
en |
|
|
The Graduate University for Advanced Studies, School of Multidisciplinary, Informatics Department, SOKENDAI / NIFTY Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
National Institute of Informatics |
| 著者所属(英) |
|
|
|
en |
|
|
NIFTY Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
The Graduate University for Advanced Studies, School of Multidisciplinary, Informatics Department, SOKENDAI |
| 著者名 |
小栗, 秀暢
曽根原, 登
松井, くにお
モハマド, ラスール サラフィ アグダム
|
| 著者名(英) |
Hidenobu, Oguri
Noboru, Sonehara
Kunio, Matsui
Mohammad, Rasool Sarrafi Aghdam
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ビッグデータ分析においてパーソナルデータの個人識別性を減少させ,安全性を高める手段として,k-匿名化処理が利用される.属性の出現数を統計的に利用するk-匿名化処理を行う場合,処理負荷が高く,処理結果のk-匿名性の予測ができないという難点がある.そこで,大規模なデータから一定規模の情報を抽出する場合,出力された結果の多くが正規分布に準じるという性質から累乗近似型の予測式を提案した.提案した予測式は重相関係数0.9以上の値で実測値と近似したが,予測誤差が発生するため正確な数値が必要な場合に利用が難しい.そこで,匿名化可能な情報区分を予測し,予測地点から匿名化処理を開始するアルゴリズムを提案した.実験によって,一般的な匿名化アルゴリズムと比較したところ,k ≧ 50のとき3.5%~12.5%の処理量で匿名化処理が達成できることを確認した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Privacy is an important issue in big data analysis. An enormous amount of calculation is required to decrease the privacy risks associated with various data. The k-anonymity model is widely used to protect privacy, but it is difficult to predict the k-anonymity of datasets that are processed statistically. We proposed a k-anonymity predictive model that uses a power approximation based on the property that most data have a normal distribution when extracted at a constant scale from large-scale data. This predictive model took out multiple correlation coefficient scores of more than 0.9. However, if there are prediction errors, the model cannot be used when correct numerical values are required. We therefore proposed an anonymizing algorithm that starts processing from a prediction spot and compared it experimentally with a general anonymizing algorithm. We found that processing could be achieved with a throughput of 3.5%-12.5% at k ≧ 50. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 57,
号 9,
p. 2034-2044,
発行日 2016-09-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |