Item type |
Journal(1) |
公開日 |
2021-09-15 |
タイトル |
|
|
タイトル |
健康診断データとレセプトデータの匿名加工情報を用いた疾病リスク分析 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Analysis of Diseases Risk for Anonymously Processed Information of Medical Examination and Health Insurance Claims |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:Society 5.0を実現するコンピュータセキュリティ技術] 匿名加工,再識別,健康診断データ,レセプトデータ,相対リスク,オッズ比,k-匿名 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00212761 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
明治大学大学院先端数理科学研究科/日本学術振興会 |
著者所属 |
|
|
|
明治大学大学院先端数理科学研究科 |
著者所属 |
|
|
|
明治大学総合数理学部 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Advanced Mathematical Sciences, Meiji University / Japan Society for the Promotion of Science |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Advanced Mathematical Sciences, Meiji University |
著者所属(英) |
|
|
|
en |
|
|
School of Interdisciplinary Mathematical Sciences, Meiji University |
著者名 |
伊藤, 聡志
池上, 和輝
菊池, 浩明
|
著者名(英) |
Satoshi, Ito
Kazuki, Ikegami
Hiroaki, Kikuchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
健康診断は非常に有用なデータであり,個人がこれから罹患する危険性のある病気を予測できる可能性がある.近年の法制度の改正やプライバシ意識の高まりを受けて,個人情報保護法改正によって利用目的を明確にしないで個人データを取得することを禁じられたため,診断結果と傷病の関係を見る主流の手法であった長期間のコホート研究が困難になった.そこで,この問題を解決する手法として,本研究では匿名加工情報に着目する.本稿では,あるヘルスケア企業が取得した10年間の20万人分の健康診断データと28万人分のレセプトデータのからなる匿名加工情報を用いて,従来のコホート研究に類するような新しい分析が可能であるかどうかを研究する.相対リスクやロジスティック回帰を用いて疾病の罹患リスクの分析を行い,複数の予測アルゴリズムを用いて3年以内の罹患を予測するモデルを作成する.また,健康診断データをいくつかの疑似識別子についてk-匿名化することにより,分析精度がどれだけ変化するのかを明らかにする. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
A medical examination is very useful and helps predicting diseases risks for patients. Long-term cohort studies have been made to predict diseases risk. However, the cohort study becomes difficult since the Act on the Protection of Personal Information fully came into effect in Japan, where it is prohibited to obtain personal data without specifying clear purpose of use. In this paper, we focus on the Anonymously Processed Information to address this problem. We analyze an anonymously processed information to predict the diseases risk using the anonymously processed information of medical examination and health insurance claim data consisting of 200,000 and 290,000 individuals. We aim to prove that an Anonymously Processed Information would be a new methodology as well as the conventional cohort data. We analyze a diseases risk by performing a logistic regression and calculating a relative risk and develop some machine-learning models which predict the likelihood of the diseases in three years given individual medical examination. Finally, we reveal how much the accuracy of analysis is reduced by k-anonymizing data. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 62,
号 9,
p. 1560-1574,
発行日 2021-09-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |