Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-11 |
タイトル |
|
|
タイトル |
文書分類における効果的なマルチタスク学習のための汎用的サブタスクの要件分析 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An Experimental Analysis of Sub-tasks for Multi-task Learning-based Text Classification |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
分析・生成 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
同志社大学大学院文化情報学研究科 |
著者所属 |
|
|
|
同志社大学文化情報学部 |
著者所属 |
|
|
|
名古屋大学数理・データ科学教育研究センター |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Culture and Information Science, Doshisha University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Culture and Information Science, Doshisha University |
著者所属(英) |
|
|
|
en |
|
|
Mathematical and Data Science Center, Nagoya University |
著者名 |
木村, 優介
駒水, 孝裕
波多野, 賢治
|
著者名(英) |
Yusuke, Kimura
Takahiro, Komamizu
Kenji, Hatano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
文書分類において,キーフレーズや固有表現の抽出をサブタスクとしたマルチタスク学習によって,分類精度が向上することが報告されている.しかし,マルチタスク学習を用いるためには本来の文書分類のアノテーションに加え,サブタスクのアノテーションが必要となり,余分に人的・金銭的コストがかかる.そのため,これらのコストはマルチタスク学習を実践的に適用する際の障壁となっている.これに対し,著者らは経験則に基づく手法によってサブタスクのラベルを機械的に付与することで低コストなサブタスクを実現する研究を行い,分類精度が向上することを確認した.低コストなサブタスクは,これまでのテキスト分析に関わる知見を転用できる可能性があり,その可用性の議論を行う必要がある.加えて,どのようなサブタスクが文書分類の性能向上に寄与するかについての要件が明らかにはなっていない.そこで,本研究では,マルチタスク学習において汎用的サブタスクを適用することで文書分類の精度が向上する要件を分析し,明らかにする. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Multi-task learning, in which a phrase extraction such as key phrase extraction and named entity extraction is chosen for a sub-task, has shown improvements for the accuracy of text classification. However, multi-task learning requires extra annotations for sub-tasks in addition to the annotation for the mainstream text classification task. That extra annotation incurs extra human and financial costs, which are typically not small. These costs are therefore a barrier to the practical application of multi-task learning. To deal with this issue, the authors conducted research on realizing sub-tasks by automatic labeling for sub-tasks using a heuristic method, and confirmed that it improved classification accuracy. Although the previous findings can be widely applicable to other heuristic-based labeling methods to create sub-tasks, their availability has not been discussed. In addition, the requirements that such sub-tasks should satisfy have not been revealed. Therefore, this study attemps to clarify the requirements for improving the accuracy of text classification by using generic subtasks in multi-task learning. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-255,
号 12,
p. 1-6,
発行日 2023-03-11
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |