WEKO3
アイテム
機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合
https://ipsj.ixsq.nii.ac.jp/records/57260
https://ipsj.ixsq.nii.ac.jp/records/5726053f33d64-ec7e-4ebb-b887-3f371c957621
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-02-07 | |||||||
タイトル | ||||||||
タイトル | 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Combining Outputs of Multiple LVCSR Models by Machine Learning | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学工学部情報工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学工学部情報工学系 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学工学部情報工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学工学部情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dpt. Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dpt. Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dpt. Intelligence Sci. and Tech., Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dpt. Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dpt. Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者名 |
小玉, 康広
× 小玉, 康広
|
|||||||
著者名(英) |
Yasuhiro, Kodama
× Yasuhiro, Kodama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,機械学習を用いて複数の大語彙連続音声認識モデルの出力を混合するタスクに対して,SVM(Support Vector Machines)を適用する.SVMにより複数モデルの出力を混合する規則を学習し,この規則を用いて,デコーダ,音響モデルの異なる26種類の大語彙日本語連続音声認識モデルの出力の混合を行ったところ,認識率最大の単独モデル,および,決定リスト学習や(重み付き)多数決を用いた混合の単語認識率を上回る性能が達成できた.その単語誤り改善率は,認識率最大の単独モデルに対して最大で72%,また,多数決法による複数モデル混合に対して最大で36%という高い性能であった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We apply SVM learning technique to the task of combining outputs of multiple LVCSR models, where, as features of SVM learning, information such as the pairs of the models which output the hypothesized word are useful for improving the word recognition rate. Experimental results show that the combination results achieve a relative word error reduction of up to 72 % against the best performing single model and that of up to 36 % against ROVER. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 14(2002-SLP-045), p. 95-100, 発行日 2003-02-07 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |