WEKO3
アイテム
NMFと音響モデル併用型DNNに基づく音声区間検出
https://ipsj.ixsq.nii.ac.jp/records/190620
https://ipsj.ixsq.nii.ac.jp/records/190620faf41625-a580-4f3d-9719-e0aa7995be1a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2018 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2018-07-19 | |||||||
タイトル | ||||||||
タイトル | NMFと音響モデル併用型DNNに基づく音声区間検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | DNN based voice activity detectionwith joint use of NMF and acoustic model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声認識 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
デンソーアイティーラボラトリ | ||||||||
著者名 |
太刀岡, 勇気
× 太刀岡, 勇気
|
|||||||
著者名(英) |
Yuuki, Tachioka
× Yuuki, Tachioka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声区間検出を行う際には,パワーに基づく方法がよく使われる.しかしながらこの方法は高騒音下において性能の低下が著しいため,近年ではスペクトルの形状を考慮するような方法が提案されており,とりわけ深層神経回路網に基づく方法が性能が良いことが知られている.本報では,この方法の更なる改善を目的として,発話者の特徴や発話内容に応じた補助特徴量を用いる方法を提案する.特徴量として,非負値行列因子分解の活性化と音素ごとの事後確率を採用し,これらの有効性を車内環境での評価実験により確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | For voice activity detection, power-based methods are widely used; however, because these methods are susceptible to noise, recently, methods that consider the shape of spectrum have been proposed. In particular, deep neural network based methods have outperformed other methods. This paper aims to improve these methods by using auxiliary features that correspond to the speaker characteristics and the contents of the utterances. This paper proposes to use activation of non-negative matrix factorization and posterior probabilities of phonemes as an auxiliary feature and validates the effectiveness on the experiments in in-car environments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2018-SLP-123, 号 7, p. 1-6, 発行日 2018-07-19 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8663 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |