WEKO3
アイテム
F値最大化学習に基づく文書の多重ラベリング
https://ipsj.ixsq.nii.ac.jp/records/47779
https://ipsj.ixsq.nii.ac.jp/records/47779e60c7e36-67fc-4b68-9441-d928cafd1c27
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-09-25 | |||||||
タイトル | ||||||||
タイトル | F値最大化学習に基づく文書の多重ラベリング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Multi-labeling of Documents based on F-score Maximization | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者名 |
藤野, 昭典
× 藤野, 昭典
|
|||||||
著者名(英) |
Akinori, FUJINO
× Akinori, FUJINO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テキスト分類問題は,一般的に各文書に複数のラベルを付与する問題(多重ラべリング問題)として定義される。本稿では,機械学習アプローチに基づく多重ラベリング法に焦点を当て,モデル統合と F1 値最大化に基づく分類器設計法を提案する.提案法では,まず,データへのラベル付与の可否を判定する2値分類のためのモデルをラベル毎に複数個設計する.次に,これらのモデルを訓練データに対して F1 値を最大化させるように統合する.3つの実テキストデータセットを用いた実験により,提案法は,1つのデータに多くのラベルが付与され,多数のラベルの組合せが存在するデータセットに対して特に有用であることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Text categorization is generally defined as a multi-labeling problem, where multiple category labels are assigned to each text document. We focus on machine learning approaches to multi-labeling problems and present a classifier design method based on model combination and Fi-score maximization. In our formulation, we first design multiple models for binary classification per category label, which determine whether a category label is assigned or not to each data sample. Then, we combine these models to maximize the F± -score of a training dataset. Using three real text datasets, we confirmed experimentally that our proposed method was useful especially for the datasets where many category labels were assigned to each data sample and which consisted of many combinations of category labels. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 94(2007-NL-181), p. 29-34, 発行日 2007-09-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |