@techreport{oai:ipsj.ixsq.nii.ac.jp:00227590, author = {三浦, 拓人 and 金井, 秀明 and 白井, 清昭 and Takuto, Miura and Hideaki, Kanai and Kiyoaki, Shirai}, issue = {6}, month = {Aug}, note = {近年,ユーザがどれだけ親しみやすさを感じているかに応じて対話内容を制御する対話システムの実現に向けて,話者が相手に対して抱く親密度を推定する研究が盛んに行われている.しかし,親密度のラベルが付与されたコーパスの整備が進んでいないことから,先行研究による親密度推定の精度はそれほど高くない.そこで,本研究は,少量のラベル付きデータと大量のラベルなしデータの両方を用いる半教師あり学習手法を探求する.半教師あり学習の既存手法は,ラベル付きデータの量が少ないために,それによって学習された初期モデルの性能が低く,これを用いたラベルなし訓練データに対する自動ラベル付けが上手くいかない課題がある.これに対し,我々は,親密度推定タスクと関連があり,充分な量のラベル付きデータが確保できる補助タスクのモデルを活用し,初期モデルの品質を向上させる手法を提案する.その予備的検討として,本論文では,感情認識タスクと対話行為推定タスクについて,それらの補助タスクとしての妥当性を検証した.その結果,これら 2 つのタスクが話者の親密度推定の半教師あり学習に用いる補助タスクとして有望であることを確認した., In recent years, there are many attempts to estimate intimacy of a speaker to develop a dialogue system that can control conversation with respect to the degree of the speaker's intimacy with the system. However, as an amount of available corpora labeled with the speaker's intimacy is rather limited, the accuracy of intimacy estimation of previous work was not so high. This study aims at investigating a method of semi-supervised learning that use a small labeled data and large unlabeled data. In semi-supervised learning, in general, since the amount of labeled data is small, the performance of the initial model learned by it is low, and there is a problem that automatic labeling of unlabeled training data using this is not successful. Therefore, we propose a method that utilizes a model of a supplemental task, which is relevant to the intimacy estimation task and enough labeled data is available for, to improve the quality of the initial model. As a preliminary study, this paper verifies the validity of Emotion Recognition Conversation task and Dialog Act Estimation task as the supplemental task in our proposed method. It is found that these two tasks are promising as the supplemental task in the semi-supervised learning for speaker's intimacy estimation.}, title = {補助タスクを利用した話者の親密度推定モデルの半教師あり学習に対する予備的検討}, year = {2023} }