@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00201072,
 author = {相良, かおる and 山崎, 誠 and 麻子, 軒 and 東条, 佳奈 and 小野, 正子 and 内山, 清子 and Kaoru, Sagara and Makoto, Yamazaki and Ma, Tzu-Hsuan and Kana, Tojo and Masako, Ono and Kiyoko, Uchiyama},
 book = {じんもんこん2019論文集},
 month = {Dec},
 note = {個人情報を含む医療記録に含まれる合成語の語構成は明らかになってはいない。一方、電子化された医療記録の自然言語処理を支援するため、医療記録から用語を収集し公開している分ち書き用辞書ComeJisyoの登録語数は111,664 語となり、言語資源としての利用が可能となった。本研究では本辞書の登録語から一般的な語を含む合成語7,194語を選定し、これらの語構成を明らかにする。具体的には、合成語7,194語は意味的に適切な単位(語構成要素という)分割し、得られた語構成要素に意味的ラベルを付与する。その結果、合成語は16,451要素(異なりでは3,230要素)に分割され、101種類の意味ラベルによって分類された。合成語の語構成要素列において語頭に多く出現する意味ラベルは「身体部位(37%)」次いで「状態(32%)」、語末に多く出現する意味ラベルは「疾患(56%)」次いで「症状(9%)」であった。, The word structure of compound words in medical records containing sensitive personal information has not been clarified. On the other hand, Come-JisyoSjis-1 a dictionary for word segmentation of electronic medical records, has 111,664 words collected from medical records and can be used as a language resource. In this study, we select 7,194 compound words including general words from words in Come-JisyoSjis-1 and clarify their word structure. Specifically, 7,194 compound words are divided into 16,451 semantically appropriate word components (the number of word types is 3,230). These 3,230 word components can be classified by 101 kinds of semantic labels. As a result, the followings are found. The semantic label “body part (37%)” is the most frequently used as the first component of compound words, and then “state (32%)”. The semantic label “disease (56%)” and “symptom (9%)” are frequently appeared in the end of compound words.},
 pages = {57--64},
 publisher = {情報処理学会},
 title = {実践医療用語の語構成要素-意味を基準とした分割},
 volume = {2019},
 year = {2019}
}