ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2009
  4. 2009-SLP-077

最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識

https://ipsj.ixsq.nii.ac.jp/records/62667
https://ipsj.ixsq.nii.ac.jp/records/62667
8d5529b1-e7eb-49c1-9c1f-95f77639ca48
名前 / ファイル ライセンス アクション
IPSJ-SLP09077006.pdf IPSJ-SLP09077006.pdf (319.0 kB)
Copyright (c) 2009 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2009-07-10
タイトル
タイトル 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
タイトル
言語 en
タイトル A Kernel Machine Derived by Minimum Relative Entropy Discrimination For Automatic Speech Recognition
言語
言語 jpn
キーワード
主題Scheme Other
主題 音響モデル
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
早稲田大学
著者所属
NTTコミュニケーション科学基礎研究所
著者所属
NTTコミュニケーション科学基礎研究所
著者所属
NTTコミュニケーション科学基礎研究所
著者所属
早稲田大学
著者所属(英)
en
Waseda University
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
Waseda University
著者名 久保, 陽太郎 渡部, 晋治 中村, 篤 エリックマクダーモット 小林, 哲則

× 久保, 陽太郎 渡部, 晋治 中村, 篤 エリックマクダーモット 小林, 哲則

久保, 陽太郎
渡部, 晋治
中村, 篤
エリックマクダーモット
小林, 哲則

Search repository
著者名(英) Yotaro, Kubo Shinji, Watanabe Atsushi, Nakamura Erik, McDermott Tetsunori, Kobayashi

× Yotaro, Kubo Shinji, Watanabe Atsushi, Nakamura Erik, McDermott Tetsunori, Kobayashi

en Yotaro, Kubo
Shinji, Watanabe
Atsushi, Nakamura
Erik, McDermott
Tetsunori, Kobayashi

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿ではカーネルマシンに基づく音声認識法を提案する.提案手法では,Log-Linear タイプの出力分布を持つ連続分布型隠れマルコフモデル (CD-HMM) を最小相対エントロピー識別によって学習させる時の目的関数,および学習されたモデルのパラメタにカーネル法に基づく表現を導入する.従来のカーネル法ベースの音声認識と異なり,提案法は隠れマルコフモデルの構造をそのまま利用しているため,音声認識問題をフレーム列,隠れ状態列,ラベル列の 3 つの系列の変換問題として取り扱うことができる.そのため,提案法には動的計画法を用いた各種探索技法を容易に組み込むことができる.これは現代的な音声認識システムの実装には必要不可欠な要素である.加えて,本稿では提案法を効率的に実現するために,Cutting Plane 法を拡張した最適化アルゴリズムについても提案する.提案法の評価は孤立音素認識タスクにて行なった.評価の結果として,提案モデルがテストデータを用いて十分に調整した CD-HMM と同等の性能を持つことを確認した.
論文抄録(英)
内容記述タイプ Other
内容記述 This article describes a novel method for automatic speech recognition (ASR) based on kernel-based nonlinear classification. The new approach is obtained by substituting kernel function into inner-product performed in the dual problem of a learning problems of CD-HMMs formulated using minimum relative entropy discrimination (MRED). Unlike earlier work on sequential pattern recognition using kernel methods, our method can accurately model the three kinds of hierarchical dynamic patterns in CD-HMMs. Sequences of discrete-valued labels (string-level) or hidden states (state-level), as well as sequences of continuousvalued speech-derived frames (frame-level) can all be represented within the same kernel-based framework. Therefore, many efficient sequential pattern recognition algorithms for CD-HMMs (e.g. dynamic programming, Viterbi decoding, and the forward-backward algorithm) can be integrated into the new approach. This is an essential requirement for state-of-the-art speech recognition systems. We also describe a practical and effective optimization procedure for the proposed model, based on a cutting plane algorithm. The performance of the proposed method was evaluated in isolated phoneme recognition experiments. The method was found to be comparable with well-tuned conventional models.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2009-SLP-77, 号 6, p. 1-6, 発行日 2009-07-10
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 02:30:42.021338
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3