WEKO3
アイテム
DARPA SPINEタスクのためのATR音声認識システム
https://ipsj.ixsq.nii.ac.jp/records/57374
https://ipsj.ixsq.nii.ac.jp/records/573749c2138ce-6010-4844-9dce-e6d04545d6b8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-12-20 | |||||||
タイトル | ||||||||
タイトル | DARPA SPINEタスクのためのATR音声認識システム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | ATR System for Robust Speech Recognition in Real World Noisy and Channel Environments | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ART Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ART Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ART Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ART Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ART Spoken Language Translation Research Labs. | ||||||||
著者名 |
マルコフ, コンスタンチン
× マルコフ, コンスタンチン
|
|||||||
著者名(英) |
Konstantin, Markov
× Konstantin, Markov
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、DARPA SPINE2タスク用に構築した、ATR音声認識システムについて述べる。このタスクでは、実環境における雑音や伝送歪みを含む音声データを対象とする。本システムでは、それらのデータを頑健に認識するために、周波数差分スペクトルに基づくメルスケール・ケプストラム特徴量、オンラインMLLR適応化、単語単語の仮説統合などのいくつかの技術を効果的に組み入れている。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents the ATR speech recognition system designed for the DARPA SPINE2 evaluation task. The system is capable of dealing with speech from highly variable, real world noisy conditions and communication channels. A number of robust techniques were implemented, such as differential spectrum mel-scale cepstrum features, on-line MLLR adaptation and world level hypothesis combination, which led to significant reduction of the world error rate. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2001, 号 123(2001-SLP-039), p. 37-43, 発行日 2001-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |