WEKO3
アイテム
音声の構造的表象に基づく日本語母音系列連続発声の認識
https://ipsj.ixsq.nii.ac.jp/records/56850
https://ipsj.ixsq.nii.ac.jp/records/568500858bd31-0144-429c-aa2a-4868eb552c3a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-12-21 | |||||||
タイトル | ||||||||
タイトル | 音声の構造的表象に基づく日本語母音系列連続発声の認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Recognition of continuous utterances of Japanese vowel sequences based on structural representation of speech | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属 | ||||||||
日立製作所 | ||||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. School of Frontier Science, Univ. of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. School of Frontier Science, Univ. of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. School of Info. Sci. and Tech., Univ. of Tokyo | ||||||||
著者名 |
朝川, 智
× 朝川, 智
|
|||||||
著者名(英) |
Satoshi, ASAKAWA
× Satoshi, ASAKAWA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声には話者の声道形状の特性、音響機器の特性などの非言語的特徴が不可避的に混入するが、近年、これらを表現する次元を原理的に保有しない音響的普遍構造が提案されている。これは、音声事象の物理的実体を捨象し、関係のみを捉えることによって得られる音声の構造的表象である。本稿では、連続的に発声された日本語母音系列を認識タスクとして構造的表象に基づく音声認識を検討する。連続発声の分布系列化の際には HMM の学習を利用し、パラメータ推定手法として ML 推定のほかに MAP 推定およびベイズ推定の各手法を比較する。さらに、連続発声構造間の照合時に生じる、音響事象と HMM の状態との対応付けのズレの問題および状態数の異なる構造間照合の問題に対して、DP に基づく構造間比較手法を提案し、その有効性を実験的に検討する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Non-linguistic features such as vocal tract shapes and acoustic devices are inevitably involved in speech. Recently, a new representation of speech without any dimensions indicating the non-linguistic features was proposed. It discards the absolute properties of speech events and captures only the interrelations among them. In this paper, recognition experiments of continuous utterances of Japanese vowel sequences using stractural representation of speech are carried out. Distribution sequences are obtained from continuous utterances by training HMMs, and ML-based, MAP-based and Bayes-based methods are investigated for the estimation of the HMM parameters. Furthermore, to solve problems in continuous utterances recognition, a DP-based structural matching method is proposed and examined in recognition experiments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2006, 号 136(2006-SLP-064), p. 119-124, 発行日 2006-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |