@techreport{oai:ipsj.ixsq.nii.ac.jp:00062667, author = {久保, 陽太郎 and 渡部, 晋治 and 中村, 篤 and エリックマクダーモット and 小林, 哲則 and Yotaro, Kubo and Shinji, Watanabe and Atsushi, Nakamura and Erik, McDermott and Tetsunori, Kobayashi}, issue = {6}, month = {Jul}, note = {本稿ではカーネルマシンに基づく音声認識法を提案する.提案手法では,Log-Linear タイプの出力分布を持つ連続分布型隠れマルコフモデル (CD-HMM) を最小相対エントロピー識別によって学習させる時の目的関数,および学習されたモデルのパラメタにカーネル法に基づく表現を導入する.従来のカーネル法ベースの音声認識と異なり,提案法は隠れマルコフモデルの構造をそのまま利用しているため,音声認識問題をフレーム列,隠れ状態列,ラベル列の 3 つの系列の変換問題として取り扱うことができる.そのため,提案法には動的計画法を用いた各種探索技法を容易に組み込むことができる.これは現代的な音声認識システムの実装には必要不可欠な要素である.加えて,本稿では提案法を効率的に実現するために,Cutting Plane 法を拡張した最適化アルゴリズムについても提案する.提案法の評価は孤立音素認識タスクにて行なった.評価の結果として,提案モデルがテストデータを用いて十分に調整した CD-HMM と同等の性能を持つことを確認した., This article describes a novel method for automatic speech recognition (ASR) based on kernel-based nonlinear classification. The new approach is obtained by substituting kernel function into inner-product performed in the dual problem of a learning problems of CD-HMMs formulated using minimum relative entropy discrimination (MRED). Unlike earlier work on sequential pattern recognition using kernel methods, our method can accurately model the three kinds of hierarchical dynamic patterns in CD-HMMs. Sequences of discrete-valued labels (string-level) or hidden states (state-level), as well as sequences of continuousvalued speech-derived frames (frame-level) can all be represented within the same kernel-based framework. Therefore, many efficient sequential pattern recognition algorithms for CD-HMMs (e.g. dynamic programming, Viterbi decoding, and the forward-backward algorithm) can be integrated into the new approach. This is an essential requirement for state-of-the-art speech recognition systems. We also describe a practical and effective optimization procedure for the proposed model, based on a cutting plane algorithm. The performance of the proposed method was evaluated in isolated phoneme recognition experiments. The method was found to be comparable with well-tuned conventional models.}, title = {最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識}, year = {2009} }