@techreport{oai:ipsj.ixsq.nii.ac.jp:00231296, author = {西, 悠希 and 岩野, 公司 and 篠田, 浩一 and Yuki, Nishi and Koji, Iwano and Koichi, Shinoda}, issue = {4}, month = {Nov}, note = {近年拡散モデルと呼ばれる生成モデルが注目されている.GAN と比べ,拡散モデルは安定に学習できるが,生成段階の計算コストが大きいという問題点がある.この傾向は音声強調への拡散モデルの応用に関しても同様である.本稿では,音声強調のための拡散モデルにおいて,Encoder,Decoder を用いることによる潜在空間にて音声信号を圧縮し,圧縮された信号から拡散モデルにより雑音を除去することで,精度を保ちつつ計算コストの削減することが可能なことを示す.雑音と音声を同時に用いる訓練で Encoder,Decoder を学習した結果,PESQ を低下させずに生成時間を 50% 以上減少させることに成功した.}, title = {拡散モデルを用いた音声強調の計算量削減}, year = {2023} }