WEKO3
アイテム
文献クラスタの概念的特徴づけを用いた文献の自動分類
https://ipsj.ixsq.nii.ac.jp/records/40347
https://ipsj.ixsq.nii.ac.jp/records/403475bebb1ae-c0f8-4ecd-aed3-675cecf3df1e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-09-17 | |||||||
タイトル | ||||||||
タイトル | 文献クラスタの概念的特徴づけを用いた文献の自動分類 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automated Document Classification based on Conceptual Characterizing of Document Clusters | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
大分大学知能情報システム工学科 | ||||||||
著者所属 | ||||||||
大分大学知能情報システム工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Intelligent Systems Oita University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Intelligent Systems Oita University | ||||||||
著者名 |
中島, 誠
× 中島, 誠
|
|||||||
著者名(英) |
Makoto, Nakashima
× Makoto, Nakashima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 大量の電子化された文献の中から必要とするものをうまく取り出すための方策として,文献を内容に応じてクラスタに分類しておくことが重要とされてきた.従来からの自動分類の手法の多くは,文献キーワードの出現頻度をもとに,未分類の文献を既存のクラスタに精度高く分類できるよう方法を求めてきた.しかしながら,望む文献をうまく取り出すには,文献の管理に際し各文献クラスタの内容や他のクラスタとの関連を利用者が容易に理解できる表現が望まれる.この要求に応えるため,ここでは,キーワードをシソーラス等の概念階層中の記述子に置き換え,分類精度の向上に寄与しながら,クラスタの内容を概念的に特徴づける簡潔な表現が得られる自動分類の手法を定式化する.実験を通じて,従来の方法と遜色のない分類精度をより簡潔な表現で得られることを確かめた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The categorization of documents into predefined clusters becomes increasingly important due to the increased availability of documents in digital form. The keyword-based approaches in automated categorization of documents are insufficient in clarifying the contents of the clusters, since the keywords usually have some conceptual relations. We here formulate a document classification method of finding simplified conceptual expressions based on the subject descriptors in a concept hierarchy for characterizing the clusters so as to clarifying the contents of documents in each cluster by keeping the classification accuracy fairly high. The simplification is done by removing the less informative descriptors and by evaluating the changed expressions based on the classification accuracy when any document in the predefined clusters is treated as a new document. The availability of the proposed method was also examined computationally. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2002, 号 87(2002-FI-068), p. 87-94, 発行日 2002-09-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |