WEKO3
アイテム
未知固有表現を含む音声の認識
https://ipsj.ixsq.nii.ac.jp/records/56992
https://ipsj.ixsq.nii.ac.jp/records/569925c213b3e-a0f0-4027-abdd-e50453af3fe2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-07-16 | |||||||
タイトル | ||||||||
タイトル | 未知固有表現を含む音声の認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech recognition of unregistered expressions | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学 国際情報通信研究科 | ||||||||
著者所属 | ||||||||
松下電器産業(株)先端技術研究所 | ||||||||
著者所属 | ||||||||
早稲田大学 国際情報通信研究科/ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
早稲田大学 国際情報通信研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Global Information and Telecommunication Institute, Waseda Univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Technology Research Laboratories,Matsushita Electric Industrial Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Global Information and Telecommunication Institute, Waseda Univ./ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Global Information and Telecommunication Institute, Waseda Univ. | ||||||||
著者名 |
冨田, 達彦
× 冨田, 達彦
|
|||||||
著者名(英) |
Tatsuhiko, Tomita
× Tatsuhiko, Tomita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 任意の未登録語を含む音声認識を目指して、複数の単語列からなる未登録固有表現を含む音声の認識実験を行なった。タスクとしてTV番組検索タスクに対し、通常の単語クラスNグラムを上層のモデルに、下層には、未登録固有表現(TV番組名)に対する単語連接制約モデルを未登録語(人名)に対する単語構造モデルの2つを作成した。音声認識実験により、新たに加えた下層の単語連接制約モデルの性能と、2つの未登録語モデル間の交互作用を調べた。実験実験の結果、未登録表現箇所はほぼ正しく同定され、全未登録語・表現を辞書登録した性能上限モデルに迫る単語認識率を得た。また、未登録表現と異種の未登録語間の混在や誤認識は見られず、階層化言語モデルの単語連接への拡張可能性が判明した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Aiming at speech recognition with arbitrary OOV expressions, speech recognition experiments were carried out using speech with OOV expressions consisting of multiple words. For a TV program retrieval task, a hierarchical language model was newly composed using conventional word class N-grams as an upper layered model and two lower layered models consisting of word N-grams for an OOV expressions (TV program names) and a statistical phonotactic word-structure model for OOV words of another class (personal name). Speech recognition experiment results showed reasonable performance of word N-grams for OOV expressions and no serious interference between two OOV models, which confirms the availability of a hierarchical OOV model with word-level statistics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 69(2005-SLP-057), p. 117-122, 発行日 2005-07-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |