@techreport{oai:ipsj.ixsq.nii.ac.jp:00213244,
 author = {藤井, 一貴 and 齋藤, 佑樹 and 猿渡, 洋 and Kazuki, Fujii and Yuki, Saito and Hiroshi, Saruwatari},
 month = {Oct},
 note = {日本語音声合成において,合成音声のアクセントは合成音声の品質に大きく寄与するだけでなく,正確な情報伝達を行う上で重要な情報である.しかし,音素や文字などの生テキストに近い情報から音声を予測する End-to-End 日本語音声合成では,合成音声のアクセント誤りが頻出する.提案手法では非自己回帰型 End-to-End 音声合成モデルの代表である FastSpeech2 に入力する音素記号に,テキスト解析により得られた韻律情報を取り込むことで,アクセント誤りの改善を目指す.また,韻律情報を抽出する際のテキスト解析で用いる辞書の影響も調査する.実験的評価の結果より,提案手法が合成音声の韻律予測精度と自然性を有意に改善させることを示す.},
 title = {韻律情報で条件付けされた非自己回帰型End-to-End日本語音声合成の検討},
 year = {2021}
}