<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-05-21T08:29:38Z</responseDate>
  <request verb="GetRecord" metadataPrefix="oai_dc" identifier="oai:ipsj.ixsq.nii.ac.jp:00183679">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00183679</identifier>
        <datestamp>2025-01-20T03:34:18Z</datestamp>
        <setSpec>1164:5159:9063:9265</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習</dc:title>
          <dc:title>Generative adversarial training of the noise generation model for speech synthesis using speech in noise</dc:title>
          <dc:creator>宇根, 昌和</dc:creator>
          <dc:creator>齋藤, 佑樹</dc:creator>
          <dc:creator>高道, 慎之介</dc:creator>
          <dc:creator>北村, 大地</dc:creator>
          <dc:creator>宮崎, 亮一</dc:creator>
          <dc:creator>猿渡, 洋</dc:creator>
          <dc:creator>Masakazu, Une</dc:creator>
          <dc:creator>Yuki, Saito</dc:creator>
          <dc:creator>Shinnnosuke, Takamichi</dc:creator>
          <dc:creator>Daichi, Kitamura</dc:creator>
          <dc:creator>Ryoichi, Miyazaki</dc:creator>
          <dc:creator>Hiroshi, Saruwatari</dc:creator>
          <dc:description>高品質な統計的パラメトリック音声合成システムの構築には，スタジオ等の理想的な環境で収録された音声データの利用が不可欠であるため，現存する膨大な音声データのうち，音声合成の学習に利用可能なものは非常に限定される．本稿では，雑音環境下音声から高品質な音声合成を構築する方法を提案する．従来，そのような音声を学習データとして用いる場合，spectral subtraction 等の雑音抑圧処理を施した後に，通常の音声合成の学習を行う．しかしながら，雑音スペクトルの生成分布をパラメトリックに定義する雑音抑圧法は処理後の音声を歪ませ，さらに，その歪みは音声合成の学習時に増幅されて合成音声品質を悪化させる．そこで本稿では，敵対的学習アルゴリズムにより学習される雑音生成モデルを用いた，音声合成の学習法を提案する．雑音生成モデルは，観測雑音スペクトルの統計量を持つように学習され，雑音スペクトルを確率的に生成する．テキストから音声スペクトルを生成する音声合成モデルは，生成雑音を加算した後のスペクトルが雑音環境下音声のスペクトルに一致するように学習される．提案法は，雑音スペクトルの生成分布を柔軟にモデル化でき，さらに，雑音加算過程を考慮して音声合成モデルを学習するため，従来法において生じる品質低下を低減できる．実験的評価では，いくつかの雑音抑圧強度と SN 比において合成音声を作成し，提案法の知覚的音質が従来法を上回ることを示す．</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2017-10-06</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告音声言語情報処理（SLP）</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>2017-SLP-118</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>6</dc:identifier>
          <dc:identifier>2188-8663</dc:identifier>
          <dc:identifier>AN10442647</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/183679/files/IPSJ-SLP17118001.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
