ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音楽情報科学(MUS)
  3. 2023
  4. 2023-MUS-137

音素クラス属性を考慮した感情ラベル列の推定による音声感情認識

https://ipsj.ixsq.nii.ac.jp/records/226332
https://ipsj.ixsq.nii.ac.jp/records/226332
01de2791-a5d3-451d-b9f5-f08b6b294f74
名前 / ファイル ライセンス アクション
IPSJ-MUS23137028.pdf IPSJ-MUS23137028.pdf (1.4 MB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
MUS:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-06-16
タイトル
タイトル 音素クラス属性を考慮した感情ラベル列の推定による音声感情認識
タイトル
言語 en
タイトル Speech Emotion Recognition based on Emotional Label Sequence Estimation Considering Phoneme Class Attribute
言語
言語 jpn
キーワード
主題Scheme Other
主題 一般発表
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
立命館大学大学院情報理工学研究科
著者所属
立命館大学情報理工学部
著者所属
立命館大学情報理工学部
著者所属(英)
en
Graduate School of Information Science and Engineering, Ritsumeikan University
著者所属(英)
en
Collage of Information Science and Engineering, Ritsumeikan University
著者所属(英)
en
Collage of Information Science and Engineering, Ritsumeikan University
著者名 永瀬, 亮太郎

× 永瀬, 亮太郎

永瀬, 亮太郎

Search repository
福森, 隆寛

× 福森, 隆寛

福森, 隆寛

Search repository
山下, 洋一

× 山下, 洋一

山下, 洋一

Search repository
著者名(英) Ryotaro, Nagase

× Ryotaro, Nagase

en Ryotaro, Nagase

Search repository
Takahiro, Fukumori

× Takahiro, Fukumori

en Takahiro, Fukumori

Search repository
Yoichi, Yamashita

× Yoichi, Yamashita

en Yoichi, Yamashita

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,深層学習を利用し音声の感情を適切に分類する音声感情認識の研究が盛んに取り組まれている.本研究では特に系列化された感情ラベル(感情ラベル列)の推論による音声感情認識に取り組む.感情ラベル列の予測によって,時間と共に変化する発話内の感情状態を正確に認識できるようになることが期待される.従来研究では有声音素の数に基づいて正解の感情ラベル列を用意していたが,同じ感情であっても音韻によって異なる音響的な差異は考慮されていなかった.故に,本研究では母音や有声,無声子音などを示す音素クラス属性を考慮した感情ラベル列推定に基づく音声感情認識を提案した.結果,提案手法によって認識率が改善することがわかった.
論文抄録(英)
内容記述タイプ Other
内容記述 Recently, many researchers have tackled speech emotion recognition (SER), which predicts emotion conveyed by speech. In this paper, we focus on SER based on emotional label sequence estimation. We expect that emotion label sequence estimation enables accurate recognition of emotional states in the utterances that change over time. Previous studies have prepared emotional label sequences based on the number of voiced phonemes. However, conventional methods are not considered acoustic differences between phonemes for the same emotion. Therefore, we propose SER based on emotional label sequence estimation considering phoneme class attributes, including vowels, voiced consonants, unvoiced consonants, etc. As a result, we found that the performance was improved by the proposed method.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10438388
書誌情報 研究報告音楽情報科学(MUS)

巻 2023-MUS-137, 号 28, p. 1-6, 発行日 2023-06-16
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8752
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:30:41.026300
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3