@techreport{oai:ipsj.ixsq.nii.ac.jp:00241630, author = {平田, 瑞葵 and 藤江, 真也 and 小林, 哲則 and Mizuki, Hirata and Shinya, Fujie and Tetsunori, Kobayashi}, issue = {10}, month = {Dec}, note = {前置き,核,補足など,各文章の段落内での役割を補助情報として与えることで,段落文章をメリハリ良く発話できる音声合成方式を実現する.これまで,韻律パラメタ生成と音声合成を二段階で行う Merlin,End-to-End 方式の VITS を対象に検討してきたが,前者には音質の問題が,後者には役割に応じたメリハリを十分表現できないという問題があった.ここでは音質が良いとされる End-to-End 方式の中で,韻律制御部を独立して持つことに特徴を持つ JETS を対象とした.JETS では,韻律の違いが韻律制御部に集約して学習されることから,韻律変化の特徴を捉え易くなることが期待できる.実験の結果,JETS は他手法に比べ役割に応じた韻律変化を良く表現できること,学習時に韻律制御部の損失の重みを大きくすることで,核の部分を更に強調できることが確認できた.}, title = {役割情報付与に基づく重要文強調音声合成―ピッチ予測の重みづけによる強調度合の制御}, year = {2024} }