WEKO3
アイテム
階層構造におけるカテゴリの統合と類似文書抽出への適用
https://ipsj.ixsq.nii.ac.jp/records/47832
https://ipsj.ixsq.nii.ac.jp/records/4783222d2b5d4-7cfe-4549-b1da-59d61d1c2bbc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-05-25 | |||||||
タイトル | ||||||||
タイトル | 階層構造におけるカテゴリの統合と類似文書抽出への適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Integrating Cross-Language Hierarchies and its Application to Relevant Document Extraction | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Medicine and Engineering University of Yamanashi | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Medicine and Engineering University of Yamanashi | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Medicine and Engineering University of Yamanashi | ||||||||
著者名 |
佐野, 司
市岡, 健一
福本, 文代
× 佐野, 司 市岡, 健一 福本, 文代
|
|||||||
著者名(英) |
Sano, Tsukasa
Ichioka, Kenichi
Fukumoto, Fumiyo
× Sano, Tsukasa Ichioka, Kenichi Fukumoto, Fumiyo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では 日英のカテゴリ階層構造に注目し カテゴリ同士の類似性を推定し カテゴリを統合する手法を提案する. 本手法では一方の階層構造に分類されている文書を 他方の階層構造に分類することにより 異なる階層間におけるカテゴリ同士の類似性を推定する. 文書を分類するための手法として機械学習SVMsを用いた. また 類似性を求めるために $\chi2$statisticsを用いた. さらに 得られたカテゴリの組に対しアプリオリアルゴリズムを用いることで 類似したカテゴリ集合を抽出した. 統合したカテゴリの有効性を検証するため 類似文書の抽出を行った結果 適合率は 0.328であり階層構造を利用しない手法(0.088)と比較して精度の向上がみられた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a method for integrating cross-language category hierarchies, i.e. Reuters'96 and UDC code hierarchy of Japanese by estimating category similarities. First, we classify documents from one hierarchy into categories with another hierarchy using cross-language text classification technique, and extract category pairs of two hierarchies. Next, we apply X2 statistics to these pairs in order to obtain similar category pairs, and finally we apply the generating function of Apriori to the result of category pairs, and find sets of similar categories. Moreover, we examined whether or not integrating hierarchies helps to support retrieval of relevant documents. The retrieval result of 0.328 precision showed improvement over the baselines. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 47(2007-NL-179), p. 55-60, 発行日 2007-05-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |