Item type |
SIG Technical Reports(1) |
公開日 |
2023-11-09 |
タイトル |
|
|
タイトル |
理解度の表出パタンのユーザ間類似度を用いた理解度推定技術の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Understanding level estimation using similarities between users’ understanding expression patterns |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
日本電信電話株式会社/関西大学 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
関西大学 |
著者所属(英) |
|
|
|
en |
|
|
Nippon Telegraph and Telephone Corporation / Kansai University |
著者所属(英) |
|
|
|
en |
|
|
Nippon Telegraph and Telephone Corporation |
著者所属(英) |
|
|
|
en |
|
|
Nippon Telegraph and Telephone Corporation |
著者所属(英) |
|
|
|
en |
|
|
Nippon Telegraph and Telephone Corporation |
著者所属(英) |
|
|
|
en |
|
|
Kansai University |
著者名 |
北岸, 佑樹
俵, 直弘
小川, 厚徳
浅見, 太一
米澤, 朋子
|
著者名(英) |
Yuki, Kitagishi
Naohiro, Tawara
Atsunori, Ogawa
Taichi, Asami
Tomoko, Yonezawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
web 会議に参加する聴衆個々の,第三者から見た理解している/していない様子を理解度と定義し,聴衆の上半身が映る動画から理解度を推定する.理解度などの内面推定においては,ユーザ毎の表出パタンの個人差が精度劣化の主要な原因と考えられており,推定モデルをユーザ毎に学習し,各モデルの推論結果を表出パタンの類似度に基づいて重み和する方法や,個人を識別する情報を補助情報として用いる方法が,個人差に起因する精度劣化を抑える手法として提案されている.しかしこれらの手法には,学習/推論コストがユーザ数に応じて増加する,個人識別情報に表出パタンの類似性が十分に表れるとは限らない,といった問題がある.本稿では 1) 理解度の表出パタンの類似性を直接表現できる理解度類似ベクトルを新たに導入し,2) このベクトルを,個人差を表すための特徴量として用いることで,全ユーザ共通の単一モデルで個人差を考慮した理解度推定を行う手法を提案する.実験の結果,ベースラインおよび従来法と比べて unweighted average recall においてそれぞれ最大 12.8 %, 13.6 % 改善した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We define three-degree understanding levels of low/neutral/high as an audience member looks like they are understanding or not, and estimate the understanding level from the video, which shows the face and upper body of the audience member. In estimating the internal state of humans, such as the understanding level, the differences among each user’s expression patterns of the understanding level degrade estimation performance. The conventional work tackled this problem by training user-specific models and summarized the results over all the user-specific models. However, this method requires more training/estimation cost corresponding to the number of users. The other works tackled this problem by using individual identification information to eliminate the effect of individual differences in the expression patterns. However, the individual identification information does not always include information on similarities in the understanding expression patterns between individuals. In this paper, we propose a new method of understanding level estimation using a single model that uses similarities of expression of understanding level. Experimental results show that the proposed method improves unweighted average recall by up to 12.8 % and 13.6 % in comparison to the baseline and conventional methods, respectively. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10100541 |
書誌情報 |
研究報告コンピュータグラフィックスとビジュアル情報学(CG)
巻 2023-CG-192,
号 27,
p. 1-6,
発行日 2023-11-09
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8949 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |