@techreport{oai:ipsj.ixsq.nii.ac.jp:00226344,
 author = {滝沢, 力 and 平井, 重行},
 issue = {40},
 month = {Jun},
 note = {メディア作品などの音響制作では,様々な知識や経験,スキルが要求される.望んだ音をイメージし,音韻や韻律などのニュアンスを含んだ擬音語を発話することは比較的容易であり,それらを入力として効果音に変換する生成モデルを本研究では提案している.そこでは,具体的な効果音として,様々なニュアンス表現が考えられる爆発音に焦点を当て,データセットの作成および学習,合成を試みた.その学習済モデルで,ある程度のニュアンスを考慮した合成が可能であるものの,合成音の品質向上に向けて取り組むべき課題がある.その課題のうち,今回はニューラルボコーダに注目し,iSTFTNet を用いた波形合成を試みた.本稿では,これまで利用してきた CBHG・Griffin-Lim アルゴリズムと,iSTFTNet のそれぞれで効果音を合成した結果から,その音質や波形の特徴について比較検討した内容を報告する.},
 title = {オノマトペ音声を用いた効果音合成技術におけるニューラルボコーダの検討},
 year = {2023}
}