Item type |
SIG Technical Reports(1) |
公開日 |
2021-02-24 |
タイトル |
|
|
タイトル |
複数の隠れマルコフモデルの重み付けによるベイズ基準のもとでの最適な音素の予測 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An optimal prediction of phoneme under Bayes criterion by weighting multiple hidden Markov models |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SP1 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学基幹理工学部応用数理学科 |
著者所属 |
|
|
|
早稲田大学基幹理工学部応用数理学科 |
著者所属 |
|
|
|
早稲田大学基幹理工学部応用数理学科 |
著者所属(英) |
|
|
|
en |
|
|
Department of Applied Mathematics, School of Fundamental Science and Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Department of Applied Mathematics, School of Fundamental Science and Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Department of Applied Mathematics, School of Fundamental Science and Engineering, Waseda University |
著者名 |
山岡, 大志
齋藤, 翔太
松嶋, 敏泰
|
著者名(英) |
Taishi, Yamaoka
Shota, Saito
Toshiyasu, Matsushima
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では, 隠れマルコフモデルを用いた予測問題の予測方法について提案を行う.具体的には予測問題の一つである音素認識についての提案である.音素認識の従来の研究は,予測に用いる隠れマルコフモデルをある基 準で一つに定めている.また定めた隠れマルコフモデルに対して,学習データからパラメータ等を推定し,それらを用いて新規音声データに対応する音素を予測していた.本研究では,損失関数として 0-1損失を仮定し,統計的決定理論に基づき,ベイズ基準のもとで最適な予測を定式化する.すなわち隠れマルコフモデルとそのパラメータを推定し,それらを用いて予測するのではなく,直接的に予測の誤り確率を最小にする予測を提案する.この予測は理論最 適性を有するものの,その計算には次の二つの問題が含まれている:(i) 状態遷移系列の和計算の計算量が音声の長さに対して指数オーダーとなること,(ii) 隠れマルコフモデルのパラメータの事後分布による積分の解析的な計算が困難であること.これらの問題を解決するために,本研究では,問題 (i) に対してはビタビアルゴリズム,問題 (ii) に対しては変分ベイズ法を適用し,ベイズ準最適なアルゴリズムを提案する.このアルゴリズムは,複数の隠れマルコフ モデルの近似事後分布による重み付き平均により予測を行う.人工データを用いた数値実験を行うことで,従来研究のようにモデルを一つに選択して予測する手法に比べて,提案手法の方が誤認識率が小さいことを確かめた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we propose a prediction method for prediction problems using a hidden Markov model. Specifically, it is a proposal for phoneme recognition, which is one of the prediction problems. In the previous studies on phoneme recognition using the Hidden Markov Model, the Hidden Markov Model used for prediction is defined as one by a certain criteria. In addition, for the defined Hidden Markov Model, parameters were estimated from the training data, and the phonemes corresponding to the new speech data were predicted using paremters. In this peper, we assume 0-1 loss as the loss function, and formulate the optimum prediction based on Bayesian criterion. In other words, instead of selecting one Hidden Markov Model and estimating its parameters and making predictions using them, we propose a prediction that directly minimizes the probability of error in the prediction. Although this prediction is theoretically optimal, its calculation involves two problems: (i) The complexity of the sum calculation of the state transition series is on the exponential order with respect to the length of the voice.(ii) It is difficult to analytically calculate the integral by the posterior distribution of the parameters of the Hidden Markov Model. In order to solve these problems, in this paper, we apply the Viterbi algorithm for problem (i) and the Variational Bayesian method for problem (ii), and propose a Bayesian semi-optimal algorithm. This algorithm makes predictions by weighted averages of approximate posterior distributions of multiple Hidden Markov Models. By conducting numerical experiments using artificial data, it was confirmed that the proposed method has a smaller false recognition rate than the method of selecting and predicting one model as in the previous research. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2021-SLP-136,
号 22,
p. 1-6,
発行日 2021-02-24
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |