2024-03-28T23:58:30Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000480182023-04-27T10:00:04Z01164:04179:04201:04204
プライバシ保護に向けた固有表現処理技術Named Entity Recognition on Privacy Protectionjpnhttp://id.nii.ac.jp/1001/00048018/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48018&item_no=1&attribute_id=1&file_no=1Copyright (c) 2005 by the Information Processing Society of JapanATR知能ロボティクス研究所西南女学院大学 ATR知能ロボティクス研究所ATR知能ロボティクス研究所ATR知能ロボティクス研究所ATR知能ロボティクス研究所ATR知能ロボティクス研究所小作, 浩美相良, かおる納谷, 太桑原彰教阿部, 明典小暮, 潔本論文では、医療看護現場で収録した音声データの書き起こしテキストが与えられたとき、プライバシ保護を目的とした個人情報の抽出、および、データの分析用途に合わせて個人情報を自動的に抽出し変更するための手法について示す。まず、医療現場にて収集した看護師の会話データの特徴を示し、それに応じた固有表現抽出の方法について議論する。その結果、我々は、人名の表記パターンを利用した固有表現抽出技術を採用し、データから人名を抽出する実験を行った。結果として、精度91.2%、再現率94.7%が得られた。In this paper,we propose an automatic named entity recognition and extraction method. It is designed to recognize personal information for privacy protection,and according to situations to automatically extract and hide personal information. Especially we focus on the method that can be applied to medical applications. First,we show features of spoken dialogue data by nurses collected in a hospital,then we discuss a method to extract personal information from the data. We adopted a named entity recognition method by using a pattern dictionary for name expressions. We did name extraction experiments to the above data to obtain a recall rate 94.7%,a precision rate 91.2% in average.AN10115061情報処理学会研究報告自然言語処理(NL)200573(2005-NL-168)61662005-07-222009-06-30