WEKO3
アイテム
統計的言語情報を用いたHMM - LR文章発声音声認識の評価
https://ipsj.ixsq.nii.ac.jp/records/37571
https://ipsj.ixsq.nii.ac.jp/records/37571d667a77d-3fe6-41f4-adac-f7bf7fcdac63
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1992 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1992-09-10 | |||||||
タイトル | ||||||||
タイトル | 統計的言語情報を用いたHMM - LR文章発声音声認識の評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Evaluation of the HMM - LR Speech Recognition System against Continuous Sentential Utterances with the Aid of Stochastic Linguistic Knowledge | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ATR自動翻訳電話研究所 | ||||||||
著者所属 | ||||||||
ATR自動翻訳電話研究所 | ||||||||
著者所属 | ||||||||
ATR自動翻訳電話研究所 | ||||||||
著者所属 | ||||||||
ATR自動翻訳電話研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telephony Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telephony Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telephony Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telephony Research Laboratories | ||||||||
著者名 |
北, 研二
× 北, 研二
|
|||||||
著者名(英) |
Kenji, Kita
× Kenji, Kita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | HMM?LR音声認識システムを連続発声の文認識に適用した結果について述べる。これまでに我々は、HMM?LR音声認識システムを日本語の文節発声の音声認識に適用し、高い認識率が得られることを示した。今回、文レベルでの連続音声認識を行なうにあたり、いくつかの改良を行なった。まず最初に、従来の文節認識実験では、HMM音韻モデルの学習データとして単語発声のデータのみを用いていたが、連続発声中での調音結合の影響に対処するために、連続発声のデータを追加した。次に、日本語の文に対する文法を作成することにより、文認識を可能とした。このため、文節内の文法的制約を記述した文節内文法と、文節間の文法的制約を記述した文節間文法をそれぞれ別個に開発し、これらの2つの文法を統合化することによって、文の文法を作った。更に、言語の統計的な情報を用いることにより、高精度の音声認識を目指した。ここでは、統計的な言語モデルとして、確率文脈自由文法と生成規則間のマルコフモデルを用いた場合について評価を行なった。以上の改良をほどこしたHMM?LR音声認識システムを、約750単語を含む「国際会議への参加登録申し込み」タスクで評価した結果、特定話者で83.9%の文認識率を達成した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes recent efforts to improve the HMM-LR speech recognition system for continuously spoken sentences. The HMM-LR system has been applied to Japanese phrase recognition and has attained high recognition performance. However, up to now, the system has not been applied to continuous spoken sentence recognition. In this work, several improvements have been made on the system. The first improvement is HMM training with continuous utterances as well as word utterances. In previous implementation, HMMs have been trained with only word utterances. Continuous utterances are included in HMM training data because coarticulation effects are much stronger in continuous utterances. The second improvement is the development of a sentential grammar for Japanese. The sentential grammar was created by combining inter- and intraphrase grammars, which were developed separately. The third improvement is the incorporation of stochastic linguistic knowledge, which includes stochastic CFG and an N-gram model of production rules. The system was evaluated using continuously spoken sentences from a conference registration task that includes approximately 750 words. A sentence accuracy of 83.9% was attained in the speaker-dependent condition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 1992, 号 69(1992-HI-044), p. 25-32, 発行日 1992-09-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |