WEKO3
アイテム
医学生物学文献からの専門用語の抽出に向けて:タンパク質名の自動抽出
https://ipsj.ixsq.nii.ac.jp/records/12980
https://ipsj.ixsq.nii.ac.jp/records/12980caaa7eaa-bf44-4e43-b67b-89e76090316d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-08-15 | |||||||
タイトル | ||||||||
タイトル | 医学生物学文献からの専門用語の抽出に向けて:タンパク質名の自動抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extracting Technical Terms from Medical and Biological Articles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
東京大学医科学研究所 | ||||||||
著者所属 | ||||||||
東京大学医科学研究所 | ||||||||
著者所属 | ||||||||
東京大学医科学研究所 | ||||||||
著者所属 | ||||||||
東京大学医科学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Medical Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Medical Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Medical Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Medical Science, University of Tokyo | ||||||||
著者名 |
福田, 賢一郎
× 福田, 賢一郎
|
|||||||
著者名(英) |
Kenichiro, Fukuda
× Kenichiro, Fukuda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 専門分野の文献処理では,専門用語の処理が重要な位置を占める.しかし専門用語はたえず新たに作られ続けるため,専用の辞書をあらかじめ用意できたとしても未知語に遭遇することは避けられない.また,専門用語には領域専門家の間でのみ通用するあいまいな表記が存在する.このため,専門家が文献中で専門用語辞典の見出しに正確に一致するように言葉を選ぶことは少ない.このような理由により,専門用語を同定するために,優れた専門用語辞典をあらかじめ網羅的に作成することは困難である.我々は本報告で医学生物学分野を取りあげ,領域固有の辞書をあらかじめ用意することなく専門用語を抽出する手法を提案する.我々の手法は未知語・既知語の区別なく適用でき,さらに表記の多様性にも対応している.我々はMEDLINE1)に登録されている論文要旨に対してタンパン質名の抽出実験を行い,適合率94.70%,再現率98.84%の結果を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In processing documents of special fields,adequate processing of technical terms is important.However,technical terms are generated everyday and one cannot avoid encountering words unknown to the system.Moreover,vague expressions which are used only among the area experts exist.Therefore,in some fields,a technical term dictionary prepared beforehand may not work effectively.In this report,we propose a technique by which special terms are extracted adequately without background knowledge.Our technique can be applied to unknown words as well as already-known words and is robust against the variety of expressions.We implemented and evaluated our technique against abstracts of medical and biological articles which were retrieved from MEDLINE1).We obtained the result of 94.70% precision and 98.8% recall. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 39, 号 8, p. 2421-2430, 発行日 1998-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |