WEKO3
アイテム
プーリング手法を用いた学術論文の自動判別実験
https://ipsj.ixsq.nii.ac.jp/records/40094
https://ipsj.ixsq.nii.ac.jp/records/40094e7043c30-aa20-4dbe-a030-932b1401700b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2007-03-27 | |||||||
| タイトル | ||||||||
| タイトル | プーリング手法を用いた学術論文の自動判別実験 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Automatic Detection for Academic Articles Using Pooling Method | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 大東文化大学 | ||||||||
| 著者所属 | ||||||||
| 亜細亜大学 | ||||||||
| 著者所属 | ||||||||
| 駿河台大学 | ||||||||
| 著者所属 | ||||||||
| 鉄道総合技術研究所 | ||||||||
| 著者所属 | ||||||||
| 慶應義塾大学大学院 | ||||||||
| 著者所属 | ||||||||
| 慶應義塾大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Daito Bunka University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Asia University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Surugadai University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Railway Technical Research Institute | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Keio University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Keio University | ||||||||
| 著者名 |
池内, 淳
安形, 輝
石田, 栄美
野末, 道子
宮田, 洋輔
上田, 修一
× 池内, 淳 安形, 輝 石田, 栄美 野末, 道子 宮田, 洋輔 上田, 修一
|
|||||||
| 著者名(英) |
Atsushi, IKEUCHI
Teru, AGATA
Emi, ISHIDA
Michiko, NOZUE
Yosuke, MIYATA
Shuichi, UEDA
× Atsushi, IKEUCHI Teru, AGATA Emi, ISHIDA Michiko, NOZUE Yosuke, MIYATA Shuichi, UEDA
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 機械学習におけるテキスト分類実験を行うためには、予め判定されたテストコレクションを必要とする。しかしながら、ラベル付きデータの作成については、その多大なコストの問題がしばしば指摘されてきた。本研究では、ウェブから日本語学術論文 PDF ファイルを自動的に判別・収集することを目的として、20 000件のラベル付きデータを学習集合とし、およそ 52 万件のラベルなしデータを実験集合とした自動判別実験を行った。また、複数の分類アルゴリズムによって学術論文であると判定されたファイルをプーリングすることによって、各々の手法の性能比較を行った。その結果、本実験環境におけるプーリング手怯の有効性が示された。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In machine learning study, we need to prepare test collections for conducting text categorization experiments. However, it has been frequently pointed out that constructing labeled data set is expensive and / or time-consuming. The purpose of this study is automatically identifying and collecting academic articles in Japanese PDF files on the Web. Then, we conducted the automatic detecting experiment using pooling method and compared the performance of various classifiers. Results confirmed applicability and usefulness of pooling method in this experimental environment. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10114171 | |||||||
| 書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2007, 号 34(2007-FI-086), p. 33-40, 発行日 2007-03-27 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||