@techreport{oai:ipsj.ixsq.nii.ac.jp:00238524, author = {鎌田, 万由 and 千代延, 未帆 and 髙田, 雅美 and Mayu, Kamada and Miho, Chiyonobu and Masami, Takata}, issue = {4}, month = {Aug}, note = {本稿では,高齢話者の発話を認識するための音声認識器の認識率改善を目的としている.音声認識器を開発する場合,明瞭な発音やノイズが少ない音声データを学習データとして用いることが一般的である.明瞭な発音やノイズの少ない音声データを使用した音声認識器を使用する場合,発音が不明瞭であったり,声に震えが生じやすい高齢話者の音声をテストデータとする場合,認識率が下がる.この認識率の低下を改善するために,転移学習を行い,学習データに加工した音声を用いる.本稿では,音声認識器である Whisper を用いて転移学習を行う.また,音声加工として高齢者の音声特性の 1 つである嗄声と,声の震えを再現するための加工を音声に施す.高齢者の嗄声を再現するために残差信号を変換するノイズ強調法を使用する.また,高齢者の声の震えを再現するためにトレモロを使用する.未加工の音声を学習データとして用いたものと加工した音声を学習データとして用いたものに対して高齢者の音声をテストデータとして与え,認識率の算出を行う.}, title = {転移学習を用いた高齢話者の音声認識率向上手法}, year = {2024} }