@techreport{oai:ipsj.ixsq.nii.ac.jp:00231312, author = {岸, 恵汰 and 佐藤, 清秀 and 小坂, 哲夫}, issue = {20}, month = {Nov}, note = {音響および言語情報を利用した音声感情認識に関する研究について述べる.音響情報については発話全体の統計情報および発話の時系列特徴の両方を利用する.一方言語情報については一旦音声認識を行い,その結果得られるテキストから感情の認識を行う.最後に両者の情報を融合することにより感情認識を行う.音響特徴のみの認識率は 77.25%,言語特徴のみの認識率は 51.5% であるが融合により 82.25% まで向上する.本稿ではなぜこのような向上が得られるかの理由について明らかにする.次に言語特徴のみの性能が低いため, 話し言葉を考慮した事前学習モデルを利用することにより大幅な性能向上が得られることを示す.また改良した言語特徴のみの感情認識についてオープンタスクでも評価を行い,今回提案した言語特徴による感情認識モデルは汎用的に使用可能なことを示す.}, title = {話し言葉を考慮した音響および言語特徴併用による音声感情認識}, year = {2023} }