WEKO3
アイテム
単語N - gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理
https://ipsj.ixsq.nii.ac.jp/records/12699
https://ipsj.ixsq.nii.ac.jp/records/1269948321486-845e-4c72-b931-3e74878e834f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-04-15 | |||||||
タイトル | ||||||||
タイトル | 単語N - gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Dealing with Out -of- vocabulary Words and Filled Pauses in Word N - gram Based Speech Recognition System | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:音声言語情報処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 大語彙連続音声認識 | |||||||
著者所属 | ||||||||
豊橋技術科学大学情報処理センター | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報工学系/現在,奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Center, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Computer Sciences, Toyohashi University of Technology/Presently Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者名 |
甲斐, 充彦
× 甲斐, 充彦
|
|||||||
著者名(英) |
Atsuhiko, Kai
× Atsuhiko, Kai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 対話音声認識システムや大語彙のディクテーションシステムにおいては システムの辞書に登録されていない未知語や 間投詞・言い直し・言い淀みなどのユーザの要求に関係のない冗長語の扱いが重要である. このような問題に対処するために 本研究では単語N-gram言語モデルを用いた連続音声認識アルゴリズムにおいて 未知語処理を導入してその効果を調べた. 未知語処理法として サブワード単位の音響モデルを用いたサブワード系列デコーダを併用し これによって未知語候補の生成と検証を行う方法を用いる. この方法は 以前に文脈自由文法を用いたシステムにおいて有効性を確かめている. 本論文では この方法に基づいて 単語N-gramベースの認識アルゴリズムに未知語処理を効率的に導入する方法を提案している. 音声対話システムのタスクにおいて 未知語や冗長語を含む発話を用いて評価実験を行った結果 意味的な誤りが最大で48%減少した. また 文脈自由文法に基づく同様なシステムと比較した結果 意味理解精度の向上に効果があることが分がった. さらに 大語彙連続音声認識タスクにおける効果を確かめるため 新聞記事の読み上げ音声を用いた評価実験を行った結果 単語単位での認識精度の改善は小さいが 文レベルでの高い未知語検出性能が示された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | For practical use of spoken dialog systems and dictation systems, it is important to cope with out-of-vocabulary words and filled pauses including the phenomena such as interjection, restart and hesitation. To address these problems, this study tries to use an unknown-word processing (UWP) method for a word N-gram language model based continuous speech recognition system. We investigate an UWP method which employs a subword sequence decoder with subword acoustic models to produce unknown-word hypotheses. This method has been shown to be effective on a small vocabulary task tested with a context-free grammar-based recognition system. This paper proposes an efficient method for incorporating the UWP into a word N-gram language model-based recognition system. We performed a series of experiments to show the effectiveness of the method for spoken dialog tasks and a dictation task. The experimental results show that a semantic accuracy was improved by 48% using the UWP method. Also, in compared with the result of a system using context-free grammar, the word N-gram based system could further improve the semantic accuracy for spontaneous speech. Furthermore, We performed are cognition experiment for a large-vocabulary dictation task. As a result, although only a slight improvement was observed in terms of the word accuracy, the high performance for detecting the existence of unknown-word in an utterance could be achieved. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 40, 号 4, p. 1383-1394, 発行日 1999-04-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |