WEKO3
アイテム
特徴量強調における教師なし話者適応に関する検討
https://ipsj.ixsq.nii.ac.jp/records/87740
https://ipsj.ixsq.nii.ac.jp/records/877402dae0648-7bb6-4d49-bf28-9f2759686b21
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-12-13 | |||||||
タイトル | ||||||||
タイトル | 特徴量強調における教師なし話者適応に関する検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on Unsupervised Speaker Adaptation for Feature Enhancement | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ポスターセッション | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所/東京大学情報理工学系研究科 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
東京大学情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation / Graduate School of Information and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information and Technology, The University of Tokyo | ||||||||
著者名 |
グェンドゥックズイ
吉岡, 拓也
峯松, 信明
広瀬, 啓吉
× グェンドゥックズイ 吉岡, 拓也 峯松, 信明 広瀬, 啓吉
|
|||||||
著者名(英) |
Duy, NguyenDuc
Takuya, Yoshioka
Nobuaki, Minematsu
Keikichi, Hirose
× Duy, NguyenDuc Takuya, Yoshioka Nobuaki, Minematsu Keikichi, Hirose
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,音声認識技術は様々なアプリケーションで使用されている.しかし,録音環境に含まれる雑音や残響等の音響的な歪みにより認識性能が大幅に低下する.この問題の解決策として,クリーン音声の GMM を用いて観測音声の特徴量から音響的歪みの影響を取り除く特徴量強調技術が知られている.一方,モバイルデバイスへの音声入力に代表される最近のアプリケーションの多くでは,多様な環境で録られた認識対象個人の音声データを蓄積しておくことが容易にできる.しかしながら,こうした個人データをどのように扱えば特徴量強調を含む認識システム全体の性能を効果的に向上できるかは明らかでない.本研究では,特徴量強調に用いるクリーン音声 GMM の MAP 適応と音声認識に用いる音響モデルの MLLR 適応のいくつかの組み合わせ方について,その効果を実験的に比較検討する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Speech recognition has been an active research area for many years, and nowadays, it is being used in many practical applications. However, the recognition performance is often seriously degraded by noise and reverberation present in recording environments. One promising approach to solve this problem is feature enhancement, which attempts to restore clean feature vectors using a GMM of clean speech. Meanwhile, in many recent applications including those to mobile devices, it is easy to collect target user's speech data recorded in various environments. However, how to exploit these data for improving the performance of a speech recognizer that performs feature enhancement is an open question. This study experimentally compares different methods for combining MAP adaptation of the clean speech GMM and MLLR adaptation of the recognizer's acoustic model. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2012-SLP-94, 号 23, p. 1-6, 発行日 2012-12-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |