WEKO3
アイテム
対応分析とベイジアンネットワークを用いた文書分類
https://ipsj.ixsq.nii.ac.jp/records/19394
https://ipsj.ixsq.nii.ac.jp/records/19394f8f7b3b9-6103-41ce-bd20-eea4c0f46e8f
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2003-05-22 | |||||||
| タイトル | ||||||||
| タイトル | 対応分析とベイジアンネットワークを用いた文書分類 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Document Categorization using Correspondence Analysis and Bayesian Networks | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 松下電器産業株式会社 | ||||||||
| 著者所属 | ||||||||
| 松下電器産業株式会社 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Matsushita Electric Industrial Co., Ltd. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Matsushita Electric Industrial Co., Ltd. | ||||||||
| 著者名 |
福重, 貴雄
菅野祐司
× 福重, 貴雄 菅野祐司
|
|||||||
| 著者名(英) |
Yoshio, Fukushige
Yuji, Kanno
× Yoshio, Fukushige Yuji, Kanno
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 文書ベクトルのような高次元データをベイジアンネットワークを用いて分類するには、有効素性の選択による次元削減や適切な離散化が必須の課題となる。筆者らは、単語文書空間における対応分析とMDL規準に基づいた離散化をベイジアンネットワークに組み合わせて用いることによって、上記の問題の解決を図った。上記方式を二つのベイジアンネットnaive Bayes型とTAN型と組み合わせて、RWCテキストコーパスを対象として評価実験を行い、F値で平均8%(最大18%)の分類能力の向上を確認した。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In utilizing Bayesian networks as a categorizer, it is often problematic when the data to be categorized are represented in a vector form with very high dimension, like document vectors in a vector space model. In this paper, we address this issue by reducing the dimensionality with correspondence analysis (CA) and an MDLP-based discretization, and using the resultant data as the input to a Bayesian network leaner. In our empirical validation with the RWC corpus, this method compares favorably with the conventional results on the same data, showing 8% improvement of F-measure on average (max. 18%) | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2003, 号 51(2003-DBS-130), p. 167-174, 発行日 2003-05-22 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||