WEKO3
アイテム
テンプレートマッチングと照応解析を利用した文献からの蛋白質活性部位情報抽出方式
https://ipsj.ixsq.nii.ac.jp/records/10689
https://ipsj.ixsq.nii.ac.jp/records/10689c4a559e5-6abc-4e6f-b8a0-4db3d336f0ec
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-03-15 | |||||||
タイトル | ||||||||
タイトル | テンプレートマッチングと照応解析を利用した文献からの蛋白質活性部位情報抽出方式 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Extraction of Protein Active Site Information from Literature Using Template Matching and Anaphor Analysis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | バイオインフォマティクス | |||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者名 |
兼田, 佳和
× 兼田, 佳和
|
|||||||
著者名(英) |
Yoshikazu, Kaneta
× Yoshikazu, Kaneta
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 蛋白質の機能は活性部位と呼ばれる局所的な部位によって決定されることから,詳細な活性部位情報をデータベース化することが望まれている.活性部位情報は蛋白質の構造解析実験に関する論文に記述されているが,この数は数万編に上るため,人手で抽出するのは時間的・労力的に困難である.そこで本研究では,文献から活性部位情報を自動抽出する方式を提案する.文献には複文を用いた表現が多いため,単純な文字列照合によるテンプレートマッチングは難しい.したがって,入力文の構文解析を行うことで複文と単文用のテンプレートとの照合を可能にする.テンプレートマッチングによる情報抽出の結果には照応詞が含まれる.蛋白質に関する文献では照応詞に数量表現が多用されることに注目し,照応詞-先行詞間の数量一致性に基づく照応解析手法を提案する.提案手法を10編の文献に適用して評価を行った結果,照応解析と情報抽出のF値はそれぞれ0.81,0.70となった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The function of a protein is determined by its local functional site, called an active site. For functional analysis of proteins, it is important to accumulate information about the location and the chemical properties of active sites. This paper presents a method of automatically extracting protein active site information from literature. Since complex expressions frequently occur in scientific documents, syntactic analysis is used to match complex sentences, while the extraction rule is employed for simple sentences. The anaphora is contained in the information extraction result. Because numerical phenetics and symbolic expressions are frequently used in the anaphora, we propose an anaphora analysis method based on the consistency of the numerical phenetics between an anaphor and an antecedent. We applied the proposed method to actual scientific literature, obtaining 0.81 anaphora analysis F-measure and 0.70 information extraction F-measure. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 46, 号 3, p. 888-897, 発行日 2005-03-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |