ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. アクセシビリティ(AAC)
  3. 2022
  4. 2022-AAC-18

健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討

https://ipsj.ixsq.nii.ac.jp/records/216850
https://ipsj.ixsq.nii.ac.jp/records/216850
472b917b-1697-4f0e-91f7-a130644498a8
名前 / ファイル ライセンス アクション
IPSJ-AAC22018004.pdf IPSJ-AAC22018004.pdf (4.0 MB)
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
AAC:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2022-03-01
タイトル
タイトル 健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討
タイトル
言語 en
タイトル A study on high-intelligibility speech synthesis of dysarthric speakers using voice conversion from normal speech and multi-speaker vocoder
言語
言語 jpn
キーワード
主題Scheme Other
主題 聴覚・言語障害支援(1)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
株式会社ヒューマンテクノシステム
著者所属
東北大学大学院工学研究科
著者所属
東北大学大学院工学研究科
著者所属
株式会社ヒューマンテクノシステム
著者所属(英)
en
Human Techno System Co., Ltd.
著者所属(英)
en
Tohoku University
著者所属(英)
en
Tohoku University
著者所属(英)
en
Human Techno System Co., Ltd.
著者名 高野, 哲朗

× 高野, 哲朗

高野, 哲朗

Search repository
能勢, 隆

× 能勢, 隆

能勢, 隆

Search repository
金垣, 葵

× 金垣, 葵

金垣, 葵

Search repository
渡辺, 聡

× 渡辺, 聡

渡辺, 聡

Search repository
著者名(英) Tetsuro, Takano

× Tetsuro, Takano

en Tetsuro, Takano

Search repository
Takashi, Nose

× Takashi, Nose

en Takashi, Nose

Search repository
Aoi, Kanagaki

× Aoi, Kanagaki

en Aoi, Kanagaki

Search repository
Satoshi, Watanabe

× Satoshi, Watanabe

en Satoshi, Watanabe

Search repository
論文抄録
内容記述タイプ Other
内容記述 健常話者の音声から構音障害話者の音声へと声質変換することにより,障害話者の声色を維持しつつ聞き取りやすい合成音声を生成する検討を行った.少量の障害話者データであっても鮮明な音声が得られる多数話者ボコーダを利用し,話速変換による本人性の向上や,音高拡張による抑揚の単調性の解消,ファインチューニングによる単語データのみの学習でその有効性を示した.
論文抄録(英)
内容記述タイプ Other
内容記述 In this study, we investigated the possibility of generating intelligible synthetic speech by converting the voice of a normal speaker to that of a dysarthric speaker while maintaining the tone of the speaker’s voice. Using a multi-speaker vocoder which can produce clear synthetic voice even with a small amount of impaired speaker data, we demonstrated the effectiveness of speech rate conversion to improve voice similarity, pitch augmentation to overcome monotonicity of intonation, and fine tuning to learn with word data.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA12752949
書誌情報 研究報告アクセシビリティ(AAC)

巻 2022-AAC-18, 号 4, p. 1-6, 発行日 2022-03-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2432-2431
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 15:42:45.823518
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3