ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2016
  4. 2016-SLP-112

Deep Learningを利用した任意話者の声質変換

https://ipsj.ixsq.nii.ac.jp/records/169874
https://ipsj.ixsq.nii.ac.jp/records/169874
e28dd443-bdc5-4b82-9ff3-cc9426dbfc24
名前 / ファイル ライセンス アクション
IPSJ-SLP16112003.pdf IPSJ-SLP16112003.pdf (1.0 MB)
Copyright (c) 2016 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2016-07-21
タイトル
タイトル Deep Learningを利用した任意話者の声質変換
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声合成・声質変換
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
電気通信大学大学院情報システム学研究科
著者所属
電気通信大学大学院情報システム学研究科
著者所属
ソリッドスフィア株式会社
著者所属
電気通信大学大学院情報システム学研究科
著者所属
電気通信大学大学院情報システム学研究科
著者所属
電気通信大学大学院情報システム学研究科
著者所属(英)
en
Graduate School of Information Systems, The University of Electro-Communications
著者所属(英)
en
Graduate School of Information Systems, The University of Electro-Communications
著者所属(英)
en
Solid Sphere, inc.
著者所属(英)
en
Graduate School of Information Systems, The University of Electro-Communications
著者所属(英)
en
Graduate School of Information Systems, The University of Electro-Communications
著者所属(英)
en
Graduate School of Information Systems, The University of Electro-Communications
著者名 関井, 祐介

× 関井, 祐介

関井, 祐介

Search repository
折原, 良平

× 折原, 良平

折原, 良平

Search repository
小島, 圭介

× 小島, 圭介

小島, 圭介

Search repository
清, 雄一

× 清, 雄一

清, 雄一

Search repository
田原, 康之

× 田原, 康之

田原, 康之

Search repository
大須賀, 昭彦

× 大須賀, 昭彦

大須賀, 昭彦

Search repository
論文抄録
内容記述タイプ Other
内容記述 声質変換手法として Gaussian Mixture Model(GMM) を用いた手法や Deep Neural Network(DNN) を用いた手法が研究されている.これらの多くは一対一の声質変換手法を提案しており,複数話者の入力に対応した研究は多くない.また,従来の DNN を用いた声質変換手法では,一対一変換および多対一変換において複雑なネットワークを用いるため,変換に要する時間が長くなるという問題がある.本研究では,複数話者の声質変換に対応するにあたり,オートエンコーダを用いた声質変換手法を提案する.提案手法では,オートエンコーダで次元圧縮した高次特徴量を目的話者の高次特徴量へ DNN で変換し,目的話者のオートエンコーダを用いて音響特徴量に復元する.評価実験では,従来の DNN を用いた声質変換手法より声質変換精度が向上し,変換に要する時間を短縮できたことを確認した.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2016-SLP-112, 号 3, p. 1-6, 発行日 2016-07-21
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 08:49:03.048923
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3