WEKO3
アイテム
実用的なささやき声の生成法: Phantom Silhouette方式の歌声への適用
https://ipsj.ixsq.nii.ac.jp/records/218498
https://ipsj.ixsq.nii.ac.jp/records/218498d192793f-447e-42da-a58c-eddce7d9c716
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2022-06-10 | |||||||
タイトル | ||||||||
タイトル | 実用的なささやき声の生成法: Phantom Silhouette方式の歌声への適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A practical method of generating whisper voice: Application of phantom silhouette method to a singing voice | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ポスターセッション3 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
大学入試センター研究開発部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Division, National Center for University Entrance Examinasions | ||||||||
著者名 |
内田, 照久
× 内田, 照久
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまで,通常発話の音声をささやき声に変換する実用的な方法として,Phantom Silhouette 方式を提案してきた.それは,高品質な vocoder 型の音声分析合成法を利用した,パラメトリックな簡便法である.疑似ささやき声の生成にあたっては,まず,通常発話音声を WORLD で分析する.次に,抽出したスペクトル包絡を基にして,聴感上,ささやき声に聞こえるようにスペクトルの特徴を操作する.それを声帯音源信号の代わりに雑音で駆動することで,全体を無声化したターゲット音声を合成する.今回は,歌声のささやき声化にこの手法を適用した.素材として,リアルな歌声に加えて,ボーカロイドの歌声や,NEUTRINO のニューラル・ネットワークを用いた AI 歌声も対象として,歌声のささやき声化を検証した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have proposed the phantom silhouette method as a practical method for converting normal speech into whispered speech. It is a simple parametric method that uses high-quality vocoder-type speech analysis and synthesis. A standard speech is first analyzed using WORLD. Then, based on the extracted spectral envelope, spectral features are manipulated so that the voice sounds like a whisper. The target speech is then synthesized by driving it with noise instead of the vocal source signal to make the whole speech sound voiceless sound. In the present study, this method was applied to a singing voice to generate the singing whisper voice. In addition to authentic singing voices, VOCALOID voices and a singing voice synthesized by a neural network using NEUTRINO were also used as materials to generate the whispering of singing voices. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2022-SLP-142, 号 39, p. 1-6, 発行日 2022-06-10 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8663 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |