WEKO3
アイテム
はぁ
https://ipsj.ixsq.nii.ac.jp/records/238721
https://ipsj.ixsq.nii.ac.jp/records/238721631f3d83-8497-4299-ae9f-72b581fc6756
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-08-26 | |||||||||
タイトル | ||||||||||
タイトル | はぁ | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
資源タイプ | conference paper | |||||||||
著者所属 | ||||||||||
関西大学 | ||||||||||
著者所属 | ||||||||||
関西大学 | ||||||||||
著者名 |
清野, 陽平
× 清野, 陽平
× 山西, 良典
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 人間のコミュニケーションにおいて,言語的な情報だけではなく,パラ言語情報も重要な役割を果たしている. パラ言語とは,言語の意味内容とは別に,声の高低,イントネーション,話す速度,リズムなど,音声の非言語的な側面を指す. 我々は,パラ言語に着目することで,「はぁ」という言語的な意味を持たない1発話から発話者の意図や感情を一定の精度で読み取ってコミュニケーションをとることができる. 本研究では,ゲームを用いて収集した8種類のコンテクストに対応した「はぁ」発話データを収集した. 発話収集時のゲーム内で顔表情や動きなども視聴したうえでの人間の「はぁ」発話の8種類のコンテクストに対する正答率は約63%であった. 収集した発話データから抽出されたMFCC特徴量を用いてLightGBMによるコンテクスト推定を行ったところを平均約0.58のF1-Scoreで推定できることが示された. チャンスレベルや人間の推定結果をベースラインとすると,音声特徴量だけで構築された推定モデルは比較的高い精度でコンテクストを推定できたことが確認された. また,人間の推定結果と提案モデルからの推定率の比較から,人間と提案モデル間での特定のコンテクストにおける認識の差異が明らかになった. |
|||||||||
書誌情報 |
エンタテインメントコンピューティングシンポジウム2024論文集 巻 2024, p. 205-209, 発行日 2024-08-26 |
|||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |