WEKO3
アイテム
話者方位情報とゼロ交差情報に基づくハンズフリー発話区間検出の評価
https://ipsj.ixsq.nii.ac.jp/records/56827
https://ipsj.ixsq.nii.ac.jp/records/56827a63c629a-febf-4b7e-a1d1-c056a902cb0d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-02-10 | |||||||
タイトル | ||||||||
タイトル | 話者方位情報とゼロ交差情報に基づくハンズフリー発話区間検出の評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An Evaluation of Hands-free Voice Activity Detection Based on Talker Direction and Zero Crossing Detection | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
立命館大学大学院 理工学研究科 | ||||||||
著者所属 | ||||||||
立命館大学大学院 理工学研究科 | ||||||||
著者所属 | ||||||||
立命館大学大学院 理工学研究科 | ||||||||
著者所属 | ||||||||
立命館大学 情報理工学部 | ||||||||
著者所属 | ||||||||
立命館大学 情報理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者名 |
傳田遊亀
× 傳田遊亀
|
|||||||
著者名(英) |
Yuki, DENDA
× Yuki, DENDA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ハンズフリー音声認識において発話区間検出(Voice Activity Detection : VAD)は必要不可欠である。ゼロ交差情報などの時間特徴量に基づいた時間領域 VAD 法は、雑音によって歪みを受けた遠隔発話に対して十分な性能を得られないという問題がある。また、話者方位情報などの空間特徴量に基づいた空間領域 VAD 法は、指向性雑音環境下で大きく性能が劣化するという問題がある。本稿ではこれらの問題を解決するために、時間領域 VAD 法と空間領域 VAD 法を統合することを検討し、話者方位情報とゼロ交差情報に基づいた雑音に頑健な空間-空間領域ハンズフリー VAD 法を提案する。提案手法は、音声の到来方向推定に特化した WCSP (Weighted Cross-power Spectrum Phase)法によって空間安定度と空間信頼度を抽出する。そして、抽出した空間特徴量に基づく適応型ゼロ交差検出法によって発話区間を頑健に検出する。実オフィス環境における評価実験の結果、提案手法は従来手法よりも高い発話区間検出性能を得られることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Voice activity detection (VAD) is indispensable for hands-free speech recognition. Time domain VAD algorithms based on time domain features such as zero crossing information cannot perform satisfactory VAD performance against distant-talking noisy speech. In addition, spatial domain VAD algorithms based on spatial domain features such as talker direction information provides degraded VAD performance due to directional interferences. To overcome these problems, in this paper, we study to integrate the time domain VAD algorithm and the spatial domain VAD algorithm; therefore, we propose the noise robust time-spatial domain VAD algorithm based on talker direction information and zero crossing information. The proposed algorithm firstly extracts two spatial features: spatial reliability and spatial stability, based on WCSP (Weighted Cross-power Spectrum Phase) analysis. Then, adaptive zero crossing detection based on extracted spatial features robustly detects voice activity frame. As a result of evaluation experiments in an actual office room, we confirmed that the performance of the proposed VAD algorithm is superior to that of the conventional VAD algorithms. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2007, 号 11(2007-SLP-065), p. 109-114, 発行日 2007-02-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |