| Item type |
SIG Technical Reports(1) |
| 公開日 |
2017-10-06 |
| タイトル |
|
|
タイトル |
組み込みシステム向け日本語テキスト音声合成ソフトウェア |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Japanese text-to-speech software for embedded systems |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
デベロッパーズフォーラム |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
株式会社KDDI総合研究所 |
| 著者所属 |
|
|
|
株式会社KDDI総合研究所 |
| 著者所属 |
|
|
|
株式会社KDDI総合研究所 |
| 著者所属(英) |
|
|
|
en |
|
|
KDDI Research, Inc. |
| 著者所属(英) |
|
|
|
en |
|
|
KDDI Research, Inc. |
| 著者所属(英) |
|
|
|
en |
|
|
KDDI Research, Inc. |
| 著者名 |
西澤, 信行
小原, 朋広
菅谷, 史昭
|
| 著者名(英) |
Nobuyuki, Nishizawa
Tomohiro, Obara
Fumiaki, Sugaya
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
KDDI 総合研究所が開発を進めている日本語音声合成ソフトウェア 「N2」 をベースに,組み込みシステム向け日本語テキスト音声合成ソフトウェアを開発したので報告する.また,ソフトウェアの動作検証用に小型のマイコンボードを試作したので併せて紹介する.これまでに KDDI 総合研究所では,HMM 音声合成における処理の高速化を目的として,HMM 音声合成におけるパラメータ軌跡計算処理の固定小数点演算化や疑似 QMF バンク上での正弦波合成に基づく音声波形生成等に取り組み,既にこれらの成果は現在のバージョンの N2 に反映されている.それにより N2 の基本的な処理が組み込みシステム向けテキスト音声合成ソフトウェアに求められる処理量に抑えられていることを確認したことから,組み込みシステム向けに特化した音声合成システムを作るのではなく,従来の N2 を PC,スマートフォンから組み込みシステムまでスケーラブルに動作するように改修した.音声合成処理のアルゴリズムは従来の N2 と同じであり,従来の PC やスマートフォンで用いている 24.4 万語の形態素辞書データと音響モデルデータを用いて,PC やスマ―フォン上の N2 と同じ合成音声波形をマイコンボード単体で得られることを確認した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This report describes our development of Japanese text-to-speech (TTS) software for embedded systems that is based on our commercial TTS software ”N2.” In addition, the report also introduces a small microcomputer (microcontroller) board to verify operation of the TTS software. KDDI Research, Inc. has worked on reduction of computational cost of HMM speech synthesis such as parameter trajectory calculation only by fixed-point arithmetic and speech waveform generation based on sinusoidal synthesis on pseudo QMF banks, etc. These efforts have already been reflected in the current version of N2. Since the processing performance required for text-to-speech synthesis software for embedded systems has been achieved by the methods, this development was mainly done by porting of N2 for embedded devices rather than creating a new speech synthesis system specialized for embedded systems. Consequently, N2 has acquired a wide range of scalability from PC to microcontroller. Experimental evaluation with the HMMs and 244k morphological dictionary for text analysis from the current version of N2 showed that the completely same results as the those by PCs and smartphones can be obtained by the microcomputer board alone. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2017-SLP-118,
号 7,
p. 1-8,
発行日 2017-10-06
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |