WEKO3
アイテム
最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
https://ipsj.ixsq.nii.ac.jp/records/62667
https://ipsj.ixsq.nii.ac.jp/records/626678d5529b1-e7eb-49c1-9c1f-95f77639ca48
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2009-07-10 | |||||||
| タイトル | ||||||||
| タイトル | 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | A Kernel Machine Derived by Minimum Relative Entropy Discrimination For Automatic Speech Recognition | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 音響モデル | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 早稲田大学 | ||||||||
| 著者所属 | ||||||||
| NTTコミュニケーション科学基礎研究所 | ||||||||
| 著者所属 | ||||||||
| NTTコミュニケーション科学基礎研究所 | ||||||||
| 著者所属 | ||||||||
| NTTコミュニケーション科学基礎研究所 | ||||||||
| 著者所属 | ||||||||
| 早稲田大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Waseda University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| NTT Communication Science Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| NTT Communication Science Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| NTT Communication Science Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Waseda University | ||||||||
| 著者名 |
久保, 陽太郎
渡部, 晋治
中村, 篤
エリックマクダーモット
小林, 哲則
× 久保, 陽太郎 渡部, 晋治 中村, 篤 エリックマクダーモット 小林, 哲則
|
|||||||
| 著者名(英) |
Yotaro, Kubo
Shinji, Watanabe
Atsushi, Nakamura
Erik, McDermott
Tetsunori, Kobayashi
× Yotaro, Kubo Shinji, Watanabe Atsushi, Nakamura Erik, McDermott Tetsunori, Kobayashi
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本稿ではカーネルマシンに基づく音声認識法を提案する.提案手法では,Log-Linear タイプの出力分布を持つ連続分布型隠れマルコフモデル (CD-HMM) を最小相対エントロピー識別によって学習させる時の目的関数,および学習されたモデルのパラメタにカーネル法に基づく表現を導入する.従来のカーネル法ベースの音声認識と異なり,提案法は隠れマルコフモデルの構造をそのまま利用しているため,音声認識問題をフレーム列,隠れ状態列,ラベル列の 3 つの系列の変換問題として取り扱うことができる.そのため,提案法には動的計画法を用いた各種探索技法を容易に組み込むことができる.これは現代的な音声認識システムの実装には必要不可欠な要素である.加えて,本稿では提案法を効率的に実現するために,Cutting Plane 法を拡張した最適化アルゴリズムについても提案する.提案法の評価は孤立音素認識タスクにて行なった.評価の結果として,提案モデルがテストデータを用いて十分に調整した CD-HMM と同等の性能を持つことを確認した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This article describes a novel method for automatic speech recognition (ASR) based on kernel-based nonlinear classification. The new approach is obtained by substituting kernel function into inner-product performed in the dual problem of a learning problems of CD-HMMs formulated using minimum relative entropy discrimination (MRED). Unlike earlier work on sequential pattern recognition using kernel methods, our method can accurately model the three kinds of hierarchical dynamic patterns in CD-HMMs. Sequences of discrete-valued labels (string-level) or hidden states (state-level), as well as sequences of continuousvalued speech-derived frames (frame-level) can all be represented within the same kernel-based framework. Therefore, many efficient sequential pattern recognition algorithms for CD-HMMs (e.g. dynamic programming, Viterbi decoding, and the forward-backward algorithm) can be integrated into the new approach. This is an essential requirement for state-of-the-art speech recognition systems. We also describe a practical and effective optimization procedure for the proposed model, based on a cutting plane algorithm. The performance of the proposed method was evaluated in isolated phoneme recognition experiments. The method was found to be comparable with well-tuned conventional models. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-77, 号 6, p. 1-6, 発行日 2009-07-10 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||