Item type |
SIG Technical Reports(1) |
公開日 |
2022-03-01 |
タイトル |
|
|
タイトル |
健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A study on high-intelligibility speech synthesis of dysarthric speakers using voice conversion from normal speech and multi-speaker vocoder |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
聴覚・言語障害支援(1) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
株式会社ヒューマンテクノシステム |
著者所属 |
|
|
|
東北大学大学院工学研究科 |
著者所属 |
|
|
|
東北大学大学院工学研究科 |
著者所属 |
|
|
|
株式会社ヒューマンテクノシステム |
著者所属(英) |
|
|
|
en |
|
|
Human Techno System Co., Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Tohoku University |
著者所属(英) |
|
|
|
en |
|
|
Tohoku University |
著者所属(英) |
|
|
|
en |
|
|
Human Techno System Co., Ltd. |
著者名 |
高野, 哲朗
能勢, 隆
金垣, 葵
渡辺, 聡
|
著者名(英) |
Tetsuro, Takano
Takashi, Nose
Aoi, Kanagaki
Satoshi, Watanabe
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
健常話者の音声から構音障害話者の音声へと声質変換することにより,障害話者の声色を維持しつつ聞き取りやすい合成音声を生成する検討を行った.少量の障害話者データであっても鮮明な音声が得られる多数話者ボコーダを利用し,話速変換による本人性の向上や,音高拡張による抑揚の単調性の解消,ファインチューニングによる単語データのみの学習でその有効性を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this study, we investigated the possibility of generating intelligible synthetic speech by converting the voice of a normal speaker to that of a dysarthric speaker while maintaining the tone of the speaker’s voice. Using a multi-speaker vocoder which can produce clear synthetic voice even with a small amount of impaired speaker data, we demonstrated the effectiveness of speech rate conversion to improve voice similarity, pitch augmentation to overcome monotonicity of intonation, and fine tuning to learn with word data. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12752949 |
書誌情報 |
研究報告アクセシビリティ(AAC)
巻 2022-AAC-18,
号 4,
p. 1-6,
発行日 2022-03-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2432-2431 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |