@techreport{oai:ipsj.ixsq.nii.ac.jp:00234701, author = {山内, 一輝 and 中田, 亘 and 齋藤, 佑樹 and 猿渡, 洋 and Kazuki, Yamauchi and Wataru, Nakata and Yuki, Saito and Hiroshi, Saruwatari}, issue = {14}, month = {Jun}, note = {本論文では,離散音声トークン生成に基づくテキスト音声合成モデルおける decoding 戦略について探求する.我々は,テキスト生成における嗜好データに基づく decoding 戦略に着想を得た,離散音声トークン生成に向けた主観評価値予測に基づく新たな decoding 戦略を提案する.主観評価実験により,提案手法が合成音声の degeneration 問題を回避し,自然性を向上させるのに有効であることを示す.提案手法はモジュール性および拡張性が高く,音声合成モデルをアライメントするための有望なアプローチである.}, title = {離散音声トークン生成によるテキスト音声合成のための音声主観評価値予測に基づくdecoding戦略}, year = {2024} }