WEKO3
アイテム
状況に依存してマルチモーダル情報の選択が可能な連想認識モデルによる音声認識
https://ipsj.ixsq.nii.ac.jp/records/57688
https://ipsj.ixsq.nii.ac.jp/records/5768858e1a13b-dfbf-4596-ae19-e8c77ed443d0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-24 | |||||||
タイトル | ||||||||
タイトル | 状況に依存してマルチモーダル情報の選択が可能な連想認識モデルによる音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A model of connected word speech recognition by associative memory model that select the multi - modal information depending on context. | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京農工大学工学研究科 | ||||||||
著者所属 | ||||||||
東京農工大学生物システム応用科学研究科 | ||||||||
著者所属 | ||||||||
東京農工大学生物システム応用科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Technology, Tokyo University of Agriculture & Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Bio - Applications and Systems Engineering, Tokyo University of Agriculture & Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Bio - Applications and Systems Engineering, Tokyo University of Agriculture & Technology | ||||||||
著者名 |
西崎, 誠
× 西崎, 誠
|
|||||||
著者名(英) |
Makoto, Nishizaki
× Makoto, Nishizaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 孤立単語音声の認識には,DPマッチングが有効であることはよく知られている.ところがDPの扱う対象が連続音声になると,単語の認識は急に難しくなる.通常これらの問題を解決するために,文の構造や意味に関する情報が利用される.これに対し本稿では,状況に応じた認識が可能な連想記憶モデルPATONを用い,状況に依存してさまざまなモダリティ情報を利用することが,単語認識における曖昧性を解消し認識率の向上に有効であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is well known that a continuous speech recognition task by DP matching makes a lot of erroneous recognized candidates because of lack of word segmentation and co-articulation. To avoid such errors, syntax and semantics of sentence are used usually. In this paper, we propose another mechanism based on associative memory with attention which select the multi-modal input depending on a context. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1998, 号 68(1998-SLP-022), p. 83-90, 発行日 1998-07-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |