@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00238721,
 author = {清野, 陽平 and 山西, 良典},
 book = {エンタテインメントコンピューティングシンポジウム2024論文集},
 month = {Aug},
 note = {人間のコミュニケーションにおいて,言語的な情報だけではなく,パラ言語情報も重要な役割を果たしている.
パラ言語とは,言語の意味内容とは別に,声の高低,イントネーション,話す速度,リズムなど,音声の非言語的な側面を指す.
我々は,パラ言語に着目することで,「はぁ」という言語的な意味を持たない1発話から発話者の意図や感情を一定の精度で読み取ってコミュニケーションをとることができる.
本研究では,ゲームを用いて収集した8種類のコンテクストに対応した「はぁ」発話データを収集した.
発話収集時のゲーム内で顔表情や動きなども視聴したうえでの人間の「はぁ」発話の8種類のコンテクストに対する正答率は約63%であった.
収集した発話データから抽出されたMFCC特徴量を用いてLightGBMによるコンテクスト推定を行ったところを平均約0.58のF1-Scoreで推定できることが示された.
チャンスレベルや人間の推定結果をベースラインとすると,音声特徴量だけで構築された推定モデルは比較的高い精度でコンテクストを推定できたことが確認された.
また,人間の推定結果と提案モデルからの推定率の比較から,人間と提案モデル間での特定のコンテクストにおける認識の差異が明らかになった.},
 pages = {205--209},
 publisher = {情報処理学会},
 title = {はぁ},
 volume = {2024},
 year = {2024}
}