WEKO3
アイテム
系列パターンを素性とした論文概要文の自動分類
https://ipsj.ixsq.nii.ac.jp/records/50446
https://ipsj.ixsq.nii.ac.jp/records/50446aea697a9-88b5-4a84-b716-a62710465e91
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-03-13 | |||||||
タイトル | ||||||||
タイトル | 系列パターンを素性とした論文概要文の自動分類 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
山崎, 貴宏
× 山崎, 貴宏
|
|||||||
著者名(英) |
Takahiro, Yamasaki
× Takahiro, Yamasaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 科学・技術論文の概要には研究の目的や背景,手法,結論などが述べられており,各文がそれらの役割を持って構成されている.概要中で各文の果たす役割を判別することは,文を単位としたテキスト分類問題とみなすことができる.テキスト分類問題への機械学習の適用に際には,多くの場合単語を素性としたモデル("bag-of-words")用いられるが,各文の役割判定のタスクにおいては語順が大きな手掛かりとなると考えられ,bag-of-wordsモデルのみでは不十分と考えられる.本稿では,テキストマイニングの手法によって抽出されたパターンを素性として用い,医学論文データベースMEDLINEの概要文の分類に適用し,その有効性を報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We explore the use of (possibly non-contiguous) word sequence patterns as the features in the task of automatocally classifying sentences in the MEDLINE abstracts. in this task, the categories to which the sentences are classified are determined not by their topics, but in accordance with the typical subsections in the abstracts; i.e., Background, Objectives, Conclusions, etc. The bag-of words representation commonly used in text categorization is inadequate for this partcular task, as the turns of phrase or expression characterize the categories better than the individual content words. An improvement of 3 to 11 points in terms of F-measure was observed when the sequential patterns mined with the PrefixSpan algorithm were usued in addition to the bag-of-word features. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2003, 号 30(2002-ICS-132), p. 129-134, 発行日 2003-03-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |