@techreport{oai:ipsj.ixsq.nii.ac.jp:00231296,
 author = {西, 悠希 and 岩野, 公司 and 篠田, 浩一 and Yuki, Nishi and Koji, Iwano and Koichi, Shinoda},
 issue = {4},
 month = {Nov},
 note = {近年拡散モデルと呼ばれる生成モデルが注目されている．GAN と比べ，拡散モデルは安定に学習できるが，生成段階の計算コストが大きいという問題点がある．この傾向は音声強調への拡散モデルの応用に関しても同様である．本稿では，音声強調のための拡散モデルにおいて，Encoder，Decoder を用いることによる潜在空間にて音声信号を圧縮し，圧縮された信号から拡散モデルにより雑音を除去することで，精度を保ちつつ計算コストの削減することが可能なことを示す．雑音と音声を同時に用いる訓練で Encoder，Decoder を学習した結果，PESQ を低下させずに生成時間を 50% 以上減少させることに成功した．},
 title = {拡散モデルを用いた音声強調の計算量削減},
 year = {2023}
}