WEKO3
アイテム
スカラ量子化を利用したクライアント・サーバ型音声認識の実現とサーバ部の高速化の検討
https://ipsj.ixsq.nii.ac.jp/records/57573
https://ipsj.ixsq.nii.ac.jp/records/57573281223b0-2a57-4b9c-a715-c00a0a31099d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-12-20 | |||||||
タイトル | ||||||||
タイトル | スカラ量子化を利用したクライアント・サーバ型音声認識の実現とサーバ部の高速化の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Client - server based speech recognition and its fast recognition algorithm using scalar quantization | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
キヤノン(株)情報技術研究所 | ||||||||
著者所属 | ||||||||
現キヤノン(株)画像技術研究所 | ||||||||
著者所属 | ||||||||
キヤノン(株)情報技術研究所 | ||||||||
著者所属 | ||||||||
キヤノン(株)情報技術研究所 | ||||||||
著者所属 | ||||||||
キヤノン(株)情報技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Laboratory, Canon Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Visual Information Technology Development Laboratory, Canon Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Laboratory, Canon Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Laboratory, Canon Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Laboratory, Canon Inc. | ||||||||
著者名 |
小坂, 哲夫
× 小坂, 哲夫
|
|||||||
著者名(英) |
Tetsuo, Kosaka
× Tetsuo, Kosaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | スカラ量子化による音声認識用音声符号化,および符号化データを利用したサーバ部の高速化という特徴を持つ,クライアント・サーバ型音声認識システムを実現した.クライアント部ではパラメータをスカラ量子化することにより10kbpsまたは5.2kbps符号化を行なう.サーバ部では量子化データを直接参照し,table-lookupにより粗い尤度計算を行ない.さらに復号化したデータを用いて,尤度の高い部分の再計算を行ない,尤度計算全体の高速化を図る.粗い尤度計算には混合分布の次元独立演算法(IDMM)を用いる.以上の提案法を評価するため,符号化による圧縮を行なわない80kbpsシステム(baseline)と10kbps,5.2kbpsシステムの比較実験を行なった.この結果認識率の低下なしに圧縮が行なえることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a claient-server based speech recognition system, which is characterized by speech coding for speech recognition using scalar quantization and a fast recognition algorithm at the server side using the coded data. At the client side, speech parameters are coded into 10kbps or 5.2kbps by using scalar quantization method. At the server side, rough likelihood calculation is carried out by reference to scalar quantized data first. After that likelihood re-calculation is carried out by using decoded data. In this step, states which have the higher output probabilities are selected and re-calculated. This two-step algotirhm can save the total cost of the likelihood calculation. In comparative recognition experiments between 80kbps (baseline), 10kbps and 5.2kbps systems, the results showed that the proposed algorithm could compless parameters without degradation of the recognition rate. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 108(1999-SLP-029), p. 163-168, 発行日 1999-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |