Item type |
SIG Technical Reports(1) |
公開日 |
2023-08-25 |
タイトル |
|
|
タイトル |
補助タスクを利用した話者の親密度推定モデルの半教師あり学習に対する予備的検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Preliminary Study of Speaker Intimacy Estimation by Semi-supervised Learning Using Classifiers of Supplemental Tasks |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
データ構築とその有用性 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者名 |
三浦, 拓人
金井, 秀明
白井, 清昭
|
著者名(英) |
Takuto, Miura
Hideaki, Kanai
Kiyoaki, Shirai
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,ユーザがどれだけ親しみやすさを感じているかに応じて対話内容を制御する対話システムの実現に向けて,話者が相手に対して抱く親密度を推定する研究が盛んに行われている.しかし,親密度のラベルが付与されたコーパスの整備が進んでいないことから,先行研究による親密度推定の精度はそれほど高くない.そこで,本研究は,少量のラベル付きデータと大量のラベルなしデータの両方を用いる半教師あり学習手法を探求する.半教師あり学習の既存手法は,ラベル付きデータの量が少ないために,それによって学習された初期モデルの性能が低く,これを用いたラベルなし訓練データに対する自動ラベル付けが上手くいかない課題がある.これに対し,我々は,親密度推定タスクと関連があり,充分な量のラベル付きデータが確保できる補助タスクのモデルを活用し,初期モデルの品質を向上させる手法を提案する.その予備的検討として,本論文では,感情認識タスクと対話行為推定タスクについて,それらの補助タスクとしての妥当性を検証した.その結果,これら 2 つのタスクが話者の親密度推定の半教師あり学習に用いる補助タスクとして有望であることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, there are many attempts to estimate intimacy of a speaker to develop a dialogue system that can control conversation with respect to the degree of the speaker's intimacy with the system. However, as an amount of available corpora labeled with the speaker's intimacy is rather limited, the accuracy of intimacy estimation of previous work was not so high. This study aims at investigating a method of semi-supervised learning that use a small labeled data and large unlabeled data. In semi-supervised learning, in general, since the amount of labeled data is small, the performance of the initial model learned by it is low, and there is a problem that automatic labeling of unlabeled training data using this is not successful. Therefore, we propose a method that utilizes a model of a supplemental task, which is relevant to the intimacy estimation task and enough labeled data is available for, to improve the quality of the initial model. As a preliminary study, this paper verifies the validity of Emotion Recognition Conversation task and Dialog Act Estimation task as the supplemental task in our proposed method. It is found that these two tasks are promising as the supplemental task in the semi-supervised learning for speaker's intimacy estimation. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-257,
号 6,
p. 1-9,
発行日 2023-08-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |