ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2021
  4. 2021-SLP-137

唇画像からの音声生成における話者依存性の分析

https://ipsj.ixsq.nii.ac.jp/records/211594
https://ipsj.ixsq.nii.ac.jp/records/211594
84782033-6a39-4b92-b1fa-5b4d0c118f17
名前 / ファイル ライセンス アクション
IPSJ-SLP21137019.pdf IPSJ-SLP21137019.pdf (982.3 kB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2021-06-11
タイトル
タイトル 唇画像からの音声生成における話者依存性の分析
言語
言語 jpn
キーワード
主題Scheme Other
主題 ディスカッション
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
大阪工業大学大学院情報科学研究科
著者所属
大阪工業大学
著者名 金澤, 尚希

× 金澤, 尚希

金澤, 尚希

Search repository
鈴木, 基之

× 鈴木, 基之

鈴木, 基之

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,様々な手法のサイレント音声技術が研究されているが,精度の改善が目下の課題である.これらの手法の内,本研究では唇画像からの音声生成に注目した.現在,DNN を用いて唇画像からスペクトル特徴量や基本周波数を推定して音声生成を行う手法では話者性が生成した音声の品質にどの程度の影響を与えるか考慮されていない.そのため,本研究では特定話者モデル,不特定話者モデル,話者適応モデルに評価実験を行った.その結果,話者適応モデルの正答率は 71% となり,不特定話者モデルより 10 ポイント程度向上することがわかった.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2021-SLP-137, 号 19, p. 1-6, 発行日 2021-06-11
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 17:44:47.045173
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3