WEKO3
アイテム
1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善
https://ipsj.ixsq.nii.ac.jp/records/69900
https://ipsj.ixsq.nii.ac.jp/records/699002ed6516b-a1ee-4c44-9b46-3d710af692ff
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-07-15 | |||||||
タイトル | ||||||||
タイトル | 1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of sound quality and speaker individuality for alaryngeal speech based on one-to-many eigenvoice conversion | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声変換 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
土井, 啓成
中村, 圭吾
戸田, 智基
猿渡, 洋
鹿野, 清宏
× 土井, 啓成 中村, 圭吾 戸田, 智基 猿渡, 洋 鹿野, 清宏
|
|||||||
著者名(英) |
Hironori, Doi
Keigo, Nakamura
Tomoki, Toda
Hiroshi, Saruwatari
Kiyohiro, Shikano
× Hironori, Doi Keigo, Nakamura Tomoki, Toda Hiroshi, Saruwatari Kiyohiro, Shikano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 喉頭摘出者は自身の声帯振動を用いた発声が不可能であるため,代用発声法で発声を行う.代用発声法により,喉頭摘出者は発声が可能になるが,生成される無喉頭音声は,健常者の通常音声と比較して,音質が低く,話者性も劣化してしまう.そのため本稿では,統計的手法による無喉頭音声の音質及び話者性の改善を試みる.無喉頭音声の音質改善には,統計的声質変換に基づく音質改善法 (AL-to-Spech) がこれまでに提案されている.本稿では,AL-to-Speech に対して,変換音声の声質を柔軟に制御することができる 1 対多固有声変換を導入することで,音質及び話者性の改善を行う.客観評価及び主観評価結果から,提案法が高い音質改善効果を持ちつつ,声質の制御が可能であることを示し,無喉頭音声の音声及び話者性の改善に有効であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes the improvement method based on one-to-many eigenvoice conversion (EVC) for sound quality and speaker individuality of three types of alaryngeal speech: esophageal speech; electrolaryngeal speech; and body-conducted silent electrolaryngeal speech. Although alaryngeal speech allows laryngectomees to utter speech sounds, it suffers from lack of naturalness and speaker individuality. To improve the sound quality of alaryngeal speech, alaryngeal-speech-to-speech (AL-to-Speech) methods based on statistical voice conversion have been proposed. This paper further applies one-to-many EVC capable of flexibly adapting the conversion model to given target natural voices to the AL-to-Speech methods for recovering speaker individuality of alaryngeal speech. The experimental results of objective and subjective evaluations demonstrate that the proposed methods yield significant improvements of speech quality and make the converted voice quality similar to the given target voice quality. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2010-SLP-82, 号 2, p. 1-6, 発行日 2010-07-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |