WEKO3
アイテム
モーラ単位で高さを制御可能な音声デザインを前提とした日本語テキスト音声合成システムの試作
https://ipsj.ixsq.nii.ac.jp/records/226388
https://ipsj.ixsq.nii.ac.jp/records/226388a7681c96-c7b7-4939-863f-3bb9ca7b7823
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-06-16 | |||||||
| タイトル | ||||||||
| タイトル | モーラ単位で高さを制御可能な音声デザインを前提とした日本語テキスト音声合成システムの試作 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | ディスカッション | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 明治大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Meiji University | ||||||||
| 著者名 |
森勢, 将雅
× 森勢, 将雅
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本研究では,人間が大雑把なリクエストを与え,与えられた条件をある程度満たしつつ自然な音声を合成する音声デザイン(本プロジェクトでは,このようなデザイン法を「ビスポーク音声デザイン」として実現を目指している)に向けた取り組みを進めている.現在のテキスト音声合成(Text-to-Speech; TTS)技術は,Tacotron 2 等ですでに人間と等価な品質を実現しており,現在では表情豊かな発話や計算コストの削減など様々な方向で発展的な研究が進められている.本稿では,VOICEROID や VOICEVOX などの日本語 TTS システムにはモーラ単位でのピッチ操作機能が備わっていることに着目し,ピッチの制御性を重視した日本語 TTS システム「サーフィス」を提案する.具体的には,点ピッチパターンの考え方に着目し,モーラ単位で 7 段階のピッチ情報を与えることにより,大雑把なピッチ情報をリクエストできるシステムを試作した.本稿では実装の概要,および簡単に音質の検証をした結果を述べる. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2023-SLP-147, 号 17, p. 1-5, 発行日 2023-06-16 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8663 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||