@techreport{oai:ipsj.ixsq.nii.ac.jp:00209761, author = {藤田, 健一 and 安藤, 厚志 and 井島, 勇祐 and Kenichi, Fujita and Atsushi, Ando and Yusuke, Ijima}, issue = {23}, month = {Feb}, note = {本研究では,音声合成における個人ごとの音素継続時間長のモデル化に適した話者埋め込み手法について検討を行う.従来の話者埋め込みベクトルの生成手法であるx-vectorやi-vectorなどでは,メルスペクトログラムなどのスペクトル特徴量を用いているが,スペクトル特徴量は発話リズムなどの時間的特徴を明に含まないため,発話リズムの個人性が表現されていない可能性があった.そこで本論文では,音素とその継続時間長を用いた時間的特徴に基づく話者埋め込みベクトルの生成手法を提案する.そして,話者照合実験及び話者ベクトル分布から提案法は一定の話者照合精度を示し,かつ音素継続時間長が類似している話者では類似した話者埋め込みベクトルが生成されることを示す.}, title = {音素継続時間長のモデル化のための 発話リズムに基づく話者埋め込みの検討}, year = {2021} }