2024-03-29T01:44:09Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000401802023-04-27T10:00:04Z01164:03500:03515:03517
話し言葉認識に向けた基本技術と応用Basic Technologies for Spontaneous Speech Recognition and Its Applicationsjpnhttp://id.nii.ac.jp/1001/00040180/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=40180&item_no=1&attribute_id=1&file_no=1Copyright (c) 2005 by the Information Processing Society of JapanNECメディア情報研究所NECメディア情報研究所NECメディア情報研究所NECメディア情報研究所NECメディア情報研究所磯谷亮輔畑崎香一郎服部, 浩明奥村明俊渡辺, 隆夫音声認識の対象は,コマンドや読み上げ文から,自然な会話調の文発声や人が人に向かって話しかけている音声など,いわゆる「話し言葉」へと広がってきている.話し言葉認識の基盤となるのは大語彙連続音声認識技術である.大語彙連続音声認識は一般に多くの計算量とメモリを必要とするが,携帯端末で処理を行いたい場合や,1台のサーバで多回線の処理を行いたい場合などには,リソースの削減が必要となる.そこで我々は,サーバからPDAクラスの端末までリソースに応じて動作するスケーラブルな大語彙連続音声認識のフレームワークを開発した.本稿では,その基本技術と,さまざまな応用事例を紹介する.The targets of automatic speech recognition are now expanding from voice commands and read speech to “spontaneous speech” such as naturally spoken utterances and human-to-human communications. The basis of spontaneous speech recognition is the large vocabulary continuous speech recognition (LVCSR) technology, which generally requires much computational capacity and memory. We have developed a scalable LVCSR framework which works on PDA-class terminals as well as sever computers depending on their available resources. It enables LVCSR on mobile terminals and multi-channel processing on a PC server. This paper presents the basic technologies of our LVCSR and its applications.AN10114171情報処理学会研究報告情報学基礎(FI)200594(2005-FI-080)1091162005-09-302009-06-30