Item type |
Symposium(1) |
公開日 |
2019-12-07 |
タイトル |
|
|
タイトル |
実践医療用語の語構成要素-意味を基準とした分割 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Semantic analysis of medical compound words |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
医療用語; 語構成要素; 意味分類; 医療記録 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
西南女学院大学 |
著者所属 |
|
|
|
国立国語研究所 |
著者所属 |
|
|
|
大阪大学 |
著者所属 |
|
|
|
目白大学 |
著者所属 |
|
|
|
西南女学院大学 |
著者所属 |
|
|
|
湘南工科大学 |
著者所属(英) |
|
|
|
en |
|
|
Seinan Jo Gakuin University, National Institute for Japanese Languege and Linguistics, Osaka University, Mejiro University, Seinan Jo Gakuin University, Shonan Institute of Technology |
著者名 |
相良, かおる
山崎, 誠
麻子, 軒
東条, 佳奈
小野, 正子
内山, 清子
|
著者名(英) |
Kaoru, Sagara
Makoto, Yamazaki
Ma, Tzu-Hsuan
Kana, Tojo
Masako, Ono
Kiyoko, Uchiyama
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
個人情報を含む医療記録に含まれる合成語の語構成は明らかになってはいない。一方、電子化された医療記録の自然言語処理を支援するため、医療記録から用語を収集し公開している分ち書き用辞書ComeJisyoの登録語数は111,664 語となり、言語資源としての利用が可能となった。本研究では本辞書の登録語から一般的な語を含む合成語7,194語を選定し、これらの語構成を明らかにする。具体的には、合成語7,194語は意味的に適切な単位(語構成要素という)分割し、得られた語構成要素に意味的ラベルを付与する。その結果、合成語は16,451要素(異なりでは3,230要素)に分割され、101種類の意味ラベルによって分類された。合成語の語構成要素列において語頭に多く出現する意味ラベルは「身体部位(37%)」次いで「状態(32%)」、語末に多く出現する意味ラベルは「疾患(56%)」次いで「症状(9%)」であった。 |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The word structure of compound words in medical records containing sensitive personal information has not been clarified. On the other hand, Come-JisyoSjis-1 a dictionary for word segmentation of electronic medical records, has 111,664 words collected from medical records and can be used as a language resource. In this study, we select 7,194 compound words including general words from words in Come-JisyoSjis-1 and clarify their word structure. Specifically, 7,194 compound words are divided into 16,451 semantically appropriate word components (the number of word types is 3,230). These 3,230 word components can be classified by 101 kinds of semantic labels. As a result, the followings are found. The semantic label “body part (37%)” is the most frequently used as the first component of compound words, and then “state (32%)”. The semantic label “disease (56%)” and “symptom (9%)” are frequently appeared in the end of compound words. |
書誌情報 |
じんもんこん2019論文集
巻 2019,
p. 57-64,
発行日 2019-12-07
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |