WEKO3
アイテム
素性の組み合わせを実現するPower Set Kernalとその高速化
https://ipsj.ixsq.nii.ac.jp/records/50445
https://ipsj.ixsq.nii.ac.jp/records/50445f070476b-9523-4946-91ae-ce21877de815
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-03-13 | |||||||
タイトル | ||||||||
タイトル | 素性の組み合わせを実現するPower Set Kernalとその高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Power Set Kernel for Feature Combination : Data Mining approach for its fast classifiers | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
工藤, 拓
× 工藤, 拓
|
|||||||
著者名(英) |
Taku, Kudo
× Taku, Kudo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,Support Vector Machineを中心とするKernel法が注目され,多くの分野に応用されている.Kernel法により,これまで巧妙に選択する必要があった「組み合わせ素性」を一般性や計算量を落とすことなく取り入れることができる.しかし,Kernelを用いた場合には,素性の組み合わせは陰に展開されるため,有効な素性の分析が難しく,さらに,解析時の計算量が大きくなる問題がある.本稿では,まず,素性の組合わせを実現するPower Set Kernalを定式化する.次に,バスケットマイニングアルゴリズムを用いて,サポートベクターの集合から有効な素性の組み合わせを発見し,単純な線型分類器に変換することで,解析の速度向上を試みる.日本語わかち書き,及び,日本語係り受け解析における実験では,Kernelを用いた通常の解析器に比べ,約30-280倍の速度向上に成功した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The kernel method (e.g., Support Vector Machines) attracts a great deal of attention recently. The merit of the kernel method is that the effective feature combination, which has been manually selected in the previous approaches, is implicity expanded without loss of generally and computational cost. However, the kernel-based approach is usually too slow to classify large-scale test data. In this paper, we first foumulate a Power Set Kernal which gives a dot product of two sets. Then, we extend the Basket Mining algorithm to convert a kernel-based classifier into a simple and fast liner classifier. Experimental results on Japanese Word Segmentation and Japanese Dependency Paesing show that our new classifier is about 30-281 times faster than the standard kernel-based callisier. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2003, 号 30(2002-ICS-132), p. 123-128, 発行日 2003-03-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |