@techreport{oai:ipsj.ixsq.nii.ac.jp:00059088, author = {Md.AhaduzzamanMunna and 大川剛直 and Md., AhaduzzamanMunna and Takenao, Ohkawa}, issue = {128(2005-BIO-003)}, month = {Dec}, note = {我々は、蛋白質構造解析に関する文献から、蛋白質機能情報の抽出を支援するシステムPROFESS (PROtein Functional site information Extraction Support System)を開発している。PROFESSは、機能情報記述文の特定機能、機能情報記述文からの情報抽出機能、抽出結果の手動編集機能を備え、機能情報のデータベース化を総合的に支援する。本稿では、SVMを利用した機能情報記述文の特定手法について述べる。PROFESSが対象とする文献には、必ず対応する立体構造データが存在する。このことを利用し、提案手法では、機能情報関連キーワードや記述パターンといった「文に関する特徴」に加え、文中に記述されている残基と相互作用対象の3次元空間上での距離といった「構造に関する特徴」をもとに、各文を特徴ベクトルで表現し、SVMによる学習を実現する。提案手法を蛋白質の構造解析関連の7編の文献に適用した結果、機能情報記述文の特定に関する平均再現率は0.72、平均F値は0.70となった。, We are developing PROFESS, a system to assit with the extraction of protein functional site information from the literature related to protein structural analysis. PROFESS supports distinguishing the sentences related to functional site information, extracting functional site information from the distinguished sentences, and modification of the extracted information to make a correct database of functional site information. In this paper, we describe the method which uses SVM to distinguish the sentences related to functional site information. In this method, each sentence in the literature is expressed by a vector for SVM considering the following features: (1) feature related to structure that is the distance on the structure between the two interacting objects which are written in the sentence, (2) keywords related to functional site information, (3) expression patterns of the functional site information related sentences. The proposed method was applied to seven documents related to structural analysis of protein for distinguishing sentences related to functional site information, where the average recall value and F value were 0.72 and 0.70, respectively.}, title = {蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式}, year = {2005} }