@techreport{oai:ipsj.ixsq.nii.ac.jp:00225299, author = {木村, 優介 and 駒水, 孝裕 and 波多野, 賢治 and Yusuke, Kimura and Takahiro, Komamizu and Kenji, Hatano}, issue = {12}, month = {Mar}, note = {文書分類において,キーフレーズや固有表現の抽出をサブタスクとしたマルチタスク学習によって,分類精度が向上することが報告されている.しかし,マルチタスク学習を用いるためには本来の文書分類のアノテーションに加え,サブタスクのアノテーションが必要となり,余分に人的・金銭的コストがかかる.そのため,これらのコストはマルチタスク学習を実践的に適用する際の障壁となっている.これに対し,著者らは経験則に基づく手法によってサブタスクのラベルを機械的に付与することで低コストなサブタスクを実現する研究を行い,分類精度が向上することを確認した.低コストなサブタスクは,これまでのテキスト分析に関わる知見を転用できる可能性があり,その可用性の議論を行う必要がある.加えて,どのようなサブタスクが文書分類の性能向上に寄与するかについての要件が明らかにはなっていない.そこで,本研究では,マルチタスク学習において汎用的サブタスクを適用することで文書分類の精度が向上する要件を分析し,明らかにする., Multi-task learning, in which a phrase extraction such as key phrase extraction and named entity extraction is chosen for a sub-task, has shown improvements for the accuracy of text classification. However, multi-task learning requires extra annotations for sub-tasks in addition to the annotation for the mainstream text classification task. That extra annotation incurs extra human and financial costs, which are typically not small. These costs are therefore a barrier to the practical application of multi-task learning. To deal with this issue, the authors conducted research on realizing sub-tasks by automatic labeling for sub-tasks using a heuristic method, and confirmed that it improved classification accuracy. Although the previous findings can be widely applicable to other heuristic-based labeling methods to create sub-tasks, their availability has not been discussed. In addition, the requirements that such sub-tasks should satisfy have not been revealed. Therefore, this study attemps to clarify the requirements for improving the accuracy of text classification by using generic subtasks in multi-task learning.}, title = {文書分類における効果的なマルチタスク学習のための汎用的サブタスクの要件分析}, year = {2023} }