Item type |
SIG Technical Reports(1) |
公開日 |
2021-02-25 |
タイトル |
|
|
タイトル |
CNNとTransformerエンコーダを用いたうつ状態の重症度の解析 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A CNN-Transformer-Based Network for Depression Severity Recognition |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
セッション3-2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
立命館大学 |
著者所属 |
|
|
|
立命館大学 |
著者所属 |
|
|
|
蘇州大学 |
著者所属 |
|
|
|
蘇州大学 |
著者所属 |
|
|
|
滋賀大学 |
著者所属 |
|
|
|
立命館大学 |
著者所属 |
|
|
|
立命館大学 |
著者所属(英) |
|
|
|
en |
|
|
Ritsumiekan University |
著者所属(英) |
|
|
|
en |
|
|
Ritsumiekan University |
著者所属(英) |
|
|
|
en |
|
|
Soochow University |
著者所属(英) |
|
|
|
en |
|
|
Soochow University |
著者所属(英) |
|
|
|
en |
|
|
Shiga University |
著者所属(英) |
|
|
|
en |
|
|
Ritsumiekan University |
著者所属(英) |
|
|
|
en |
|
|
Ritsumiekan University |
著者名 |
劉, 家慶
柴, 樹榕
黄, 越
黄, 辛隠
健山, 智子
岩本, 祐太郎
陳, 延偉
|
著者名(英) |
Jia-Qing, Liu
Shu-Rong, Chai
Yue, Huang
Xin-Yin, Huang
Tomoko, Tateyama
Yutaro, Iwamoto
Yen-Wei, Chen
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ストレスが多い現代社会では "うつ病” が大きな問題になっており,早期発見と適切な治療により,大部分の改善が期待できる.近年,情報化技術の進展により,音声特徴からのうつ状態検出の知識が蓄積されつつある.臨床現場から指摘されているうつ病患者の特徴は,診察会話中の音声変化からも確認できる.機械学習における Transformer モデルは,自然言語処理における業界標準であるが,音声変化の特徴用いたうつ状態の検出では,この transformer の適切な構成方法は報告させていない.本研究では,CNN による特徴ベクトル生成と Transformer エンコー ダの自己注意機構により,画像のフレーム間の関係を考慮したエンコードによるうつ病診断の重症度解析について提案する.はじめに,CNN によりスペクトログラムをフレーム毎に得られた音声を特徴ベクトルへ変換する.そして,そして,Transformer エンコー ダの自己注意機構により,画像のフレーム間の関係を考慮したエンコードを用いることで,音声フルーム間の関係を考慮したうつ病に対する評価を行う.この結果,従来の手法に比べうつ病状態の検出精度が向上した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Depressive symptoms are a massive problem in this stressful modern society. Early screening of depressive symptoms helps to reduce the number and intensity of their depression episodes. Automatic detection of depressive symptoms from audio cues has gained increasing interest in recent years. Transformer-based neural networks represent a successful self-attention mechanism that achieves state-of-the-art results in language understanding and sequence modeling. However, their application to visual data and, in particular, to the depressive severity detection task has not yet been deeply investigated. In this paper, we propose a transformer-based architecture for the depressive task. The temporal feature analysis using transformer computed after the feature extraction performed by DensNet. Our experimental results show that the proposed method can achieve CCC of 0.34 when using validation set and 0.24 when using test set, significantly outperforming the baseline method score CCC of 0.165. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2021-CVIM-225,
号 25,
p. 1-3,
発行日 2021-02-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |