@techreport{oai:ipsj.ixsq.nii.ac.jp:00183384, author = {田口, 勝弥 and 若宮, 翔子 and 荒牧, 英治 and Katsuya, Taguchi and Shoko, Wakamiya and Eiji, Aramaki}, issue = {31}, month = {Sep}, note = {個人情報の取り扱いについて関心が高まるにつれ,匿名化に関する需要が高まっている.本研究では,位置情報の匿名化に焦点を当てる.位置情報の匿名化については,これまで,GPS 情報や住所などのテキスト表現をマスクする手法が多かった.しかし,思わぬ語や句の組み合わせで位置情報が判明してしまう場合もあり,複雑な問題となっている.本研究では,「位置情報の特定」 について,位置 (座標やエリア) 推定,もしくは,位置が分かりそうかどうか (本稿では位置推定の実現可能性と呼ぶ) という 2 つの観点から,多段階の匿名化レベル,ならびに,任意のレベルまで自動匿名化する手法を提案する.まず,位置情報付き発言から作成した位置を推定する分類器を構築し,次に発言について位置推定の実現可能性を持つかどうかタグ付けを行った.さらに,これらを用いて,機械では位置を推定できる / 推定できないが,人間には位置が分かりそう / 分かりそうにない,という複数のレベルに発言を分類する.どのレベルを位置情報の匿名化とみなすかは用途に依存する.本研究は,位置を 「特定できる」 ことと 「特定できそう」 であることの両方を考慮した新しい匿名化研究である., Nowadays, personal information has drawn much attention, requiring the advanced technology on de-identification. This study focuses on location information. The conventional approaches remove the GPS information or expressions such as addresses. However, there can be a complicated case where location information can be estimated with unexpected combinations of non-address words. To deal with this phenomenon, this study proposes two types of de-identification level. One point is to estimate location, and the other is to estimate whether location can be estimated or not (what we call “feasibility of location estimating”). To realize both levels of de-identification, first, we make with geo-tagged texts a classifier which estimates locations. We, next, tagged texts with feasibility of location estimating. By using the classifier and newly tagged texts, we classify texts with these classifiers into four levels. We believe our novel concepts on de-identification are essential for various practical applications.}, title = {位置推定とその実現可能性を考慮した新しい匿名化の提案}, year = {2017} }