WEKO3
アイテム
音響的特徴を用いた話し言葉の断片発話単位への分割
https://ipsj.ixsq.nii.ac.jp/records/56587
https://ipsj.ixsq.nii.ac.jp/records/56587b9f3799e-3ef7-4699-9a72-045f691d4dbc
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2008-12-02 | |||||||
| タイトル | ||||||||
| タイトル | 音響的特徴を用いた話し言葉の断片発話単位への分割 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Segmentation of Spoken Language into unit of Utterance Fragment using Acoustics Features | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科/情報通信研究機構知識創成コミュニケーション研究センター/国際電気通信基礎技術研究所音声言語コミュニケーション研究所 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科/情報通信研究機構知識創成コミュニケーション研究センター/国際電気通信基礎技術研究所音声言語コミュニケーション研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Nara Institute of Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Nara Institute of Science and Technology / National Institute of Information and Communications Technology / Advanced Telecommunications Research Institute International | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Nara Institute of Science and Technology / National Institute of Information and Communications Technology / Advanced Telecommunications Research Institute International | ||||||||
| 著者名 |
瀬戸山, 勝義
柏岡, 秀紀
ニックキャンベル
× 瀬戸山, 勝義 柏岡, 秀紀 ニックキャンベル
|
|||||||
| 著者名(英) |
Katsuyoshi, Setoyama
Hideki, Kashioka
Nick, Campbell
× Katsuyoshi, Setoyama Hideki, Kashioka Nick, Campbell
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 現在までの音声合成技術は文を一単位として処理することが多かった.しかし,実対話において,人間は長い発話文を一度に処理することは稀であり,多くの場合,短い断片的な発話を用いる.このような短い断片的な発話を断片発話とし,音声合成の計算処理単位として用いる事を提案する.本稿では, HMM により断片発話の音響的特徴をモデル化し,そのモデルを用いた断片発話単位へのセグメンテーション実験を行なった結果を報告する.実験には,トピックフリーの雑談対話音声を収録した ESP-C コーパスを用いた. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | It is common for speech synthesis technology to process each sentence as one single and independent unit. However, in human speech production, it is perhaps unusual to process a long utterance as a single discrete unit, and typically a series of short utterance fragments is produced in such cases. Such a fragmentary short utterance is assumed to be a minimal discourse unit, and it is proposed here that similar chunks should be used as the basic units for speech synthesis in order to speed-up the calculation processing. In this paper, the acoustic features of such utterance fragments is modeled by HMM, and the paper reports on the result of an experimental the segmentation of a natural speech corpus into optimal units for processing as utterance fragments according to the the model. The ESP-C casual conversation speech corpus was used as material for the experiment. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 123(2008-SLP-074), p. 67-72, 発行日 2008-12-02 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||