WEKO3
アイテム
目次と帯を用いた図書の自動分類
https://ipsj.ixsq.nii.ac.jp/records/40157
https://ipsj.ixsq.nii.ac.jp/records/40157d63035fe-59ac-4b3f-aab6-6e79cfd3fe1c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-03-22 | |||||||
タイトル | ||||||||
タイトル | 目次と帯を用いた図書の自動分類 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Categorization using Title and a Table of Contents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
値 | 駿河台大学文化情報学部 | |||||||
著者所属 | ||||||||
値 | 慶應義塾大学文学部 | |||||||
著者所属 | ||||||||
値 | 慶應義塾大学文学部 | |||||||
著者所属 | ||||||||
値 | 国立情報学研究所 | |||||||
著者所属(英) | ||||||||
言語 | en | |||||||
値 | Surugadai University | |||||||
著者所属(英) | ||||||||
言語 | en | |||||||
値 | Keio University | |||||||
著者所属(英) | ||||||||
言語 | en | |||||||
値 | National Institute of Informatics | |||||||
著者所属(英) | ||||||||
言語 | en | |||||||
値 | Keio University | |||||||
著者名 |
石田, 栄美
× 石田, 栄美
|
|||||||
著者名(英) |
Emi, ISHIDA
× Emi, ISHIDA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 書名だけでなく目次や帯情報を用いて,図書を日本十進分類法の分類カテゴリに自動分類する実験を行った。分類手法には,相対出現率と相互情報量にもとづく重み付けとSupport Vector Machine(SVM)による手法を用いた。「BOOK」データベースとNII-CATデータを統合した24 000件を用いて学習させたところ,重み付けに相対出現率と相互情報量を用いた場合は,書名に加えて目次と帯情報を用いた場合の効果が認められた。また,機械学習手法よりも,統計的手法のほうが有効であった。分類カテゴリの分野ごとの再現率を調べたところ,分野によって再現率に大きな差があった。さらに,帯情報などが有効な分野もあり,書名,目次,帯を用いた効果が分野ごとに異なることが明らかになった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we describe methods of classifying Japan MARC records to class number of Nippon Decimal Classification. We compare the performance of three categorization method, based on mutual information(MI), relative frequency and SVM. In each method, training data are title and table of contents and blurb on the flap in Japan MARC records. The experimental results show that the best performance is MI using title and table of contents and OBI, but other methods are not. In failure analysis, we found the performance depends on subject of class number. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2006, 号 33(2006-FI-082), p. 85-92, 発行日 2006-03-22 |
|||||||
Notice | ||||||||
値 | SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |