WEKO3
アイテム
トランスダクティブ・ブースティング法によるテキスト分類
https://ipsj.ixsq.nii.ac.jp/records/48616
https://ipsj.ixsq.nii.ac.jp/records/48616367384f2-bfa2-431f-a312-a38aa364075b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-09-21 | |||||||
タイトル | ||||||||
タイトル | トランスダクティブ・ブースティング法によるテキスト分類 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Categorization Using a Transductive Boosting Method | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
ATR人間情報通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Human Information Processing Research Laboratories | ||||||||
著者名 |
平, 博順
× 平, 博順
|
|||||||
著者名(英) |
Hirotoshi, Taira
× Hirotoshi, Taira
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,トランスダクテイブ・ブーステイング法によるテキスト分類手法を提案する.テキスト分類法の学習で使用する大規模な訓練データの作成にはコストや時間がかかる.そのため訓練データが少ない場合でも高い分類精度が得られる学習法が求められている.トランスダクティブ法は訓練データだけでなく,分類クラスの付与されていないテストデータの分布も学習の考慮に入れることにより分類精度を上げる方法である.本稿ではこれをブーステイングに対し適用し,実験を行なった.その結果,従来のブースティングによる学習に比べて高精度のテキスト分類器を学習できることが確認された.特に少数の訓練データしかない場合にも高い精度が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a new text categorization method using transductive boosting. All learning-based classification methods share on one common problem: It is not possible to have a large corpus of categorized text. This is because it is difficult to make a corpus easily and cheaply. It is therefore important that the learner is able to make efficient generalizations using a small amount of training data. We tackle here the problem of learning from small training samples by taking a transductive approach, instead of an inductive approach. We adopt a transductive method in a boosting algorithm for the task of text categorization. The categorization performance was improved significantly. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2000, 号 86(2000-NL-139), p. 69-76, 発行日 2000-09-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |