@techreport{oai:ipsj.ixsq.nii.ac.jp:00211528, author = {金澤, 尚希 and 鈴木, 基之}, issue = {19}, month = {Jun}, note = {近年,様々な手法のサイレント音声技術が研究されているが,精度の改善が目下の課題である.これらの手法の内,本研究では唇画像からの音声生成に注目した.現在,DNN を用いて唇画像からスペクトル特徴量や基本周波数を推定して音声生成を行う手法では話者性が生成した音声の品質にどの程度の影響を与えるか考慮されていない.そのため,本研究では特定話者モデル,不特定話者モデル,話者適応モデルに評価実験を行った.その結果,話者適応モデルの正答率は 71% となり,不特定話者モデルより 10 ポイント程度向上することがわかった.}, title = {唇画像からの音声生成における話者依存性の分析}, year = {2021} }