WEKO3
アイテム
話し言葉認識に向けた基本技術と応用
https://ipsj.ixsq.nii.ac.jp/records/48005
https://ipsj.ixsq.nii.ac.jp/records/4800570d293f8-b4d8-4102-86ea-65e6f1a9940c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-09-30 | |||||||
タイトル | ||||||||
タイトル | 話し言葉認識に向けた基本技術と応用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Basic Technologies for Spontaneous Speech Recognition and Its Applications | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Media and Information Research Laboratories, NEC Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Media and Information Research Laboratories, NEC Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Media and Information Research Laboratories, NEC Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Media and Information Research Laboratories, NEC Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Media and Information Research Laboratories, NEC Corporation | ||||||||
著者名 |
磯谷亮輔
× 磯谷亮輔
|
|||||||
著者名(英) |
Ryosuke, Isotani
× Ryosuke, Isotani
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識の対象は,コマンドや読み上げ文から,自然な会話調の文発声や人が人に向かって話しかけている音声など,いわゆる「話し言葉」へと広がってきている.話し言葉認識の基盤となるのは大語彙連続音声認識技術である.大語彙連続音声認識は一般に多くの計算量とメモリを必要とするが,携帯端末で処理を行いたい場合や,1台のサーバで多回線の処理を行いたい場合などには,リソースの削減が必要となる.そこで我々は,サーバからPDAクラスの端末までリソースに応じて動作するスケーラブルな大語彙連続音声認識のフレームワークを開発した.本稿では,その基本技術と,さまざまな応用事例を紹介する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The targets of automatic speech recognition are now expanding from voice commands and read speech to “spontaneous speech” such as naturally spoken utterances and human-to-human communications. The basis of spontaneous speech recognition is the large vocabulary continuous speech recognition (LVCSR) technology, which generally requires much computational capacity and memory. We have developed a scalable LVCSR framework which works on PDA-class terminals as well as sever computers depending on their available resources. It enables LVCSR on mobile terminals and multi-channel processing on a PC server. This paper presents the basic technologies of our LVCSR and its applications. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 94(2005-NL-169), p. 109-116, 発行日 2005-09-30 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |