ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2000
  4. 119(2000-SLP-034)

マイクロホンアレーを用いたHMMに基づく音源識別の評価

https://ipsj.ixsq.nii.ac.jp/records/57455
https://ipsj.ixsq.nii.ac.jp/records/57455
9c66bd2c-348f-4e18-b89c-cf84fad54e0e
名前 / ファイル ライセンス アクション
IPSJ-SLP00034006.pdf IPSJ-SLP00034006.pdf (801.2 kB)
Copyright (c) 2000 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2000-12-21
タイトル
タイトル マイクロホンアレーを用いたHMMに基づく音源識別の評価
タイトル
言語 en
タイトル Evaluation of Sound Source Discrimination Based on HMMs Using a Microphone Array
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
ATR音声言語通信研究所/奈良先端科学技術大学院大学情報科学研究科
著者所属
ATR音声言語通信研究所
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属(英)
en
ATR Spoken Language Translation Research Laboratories/Graduate School of Information Science, Nara Institute of Science and Technology
著者所属(英)
en
ATR Spoken Language Translation Research Laboratories
著者所属(英)
en
Graduate School of Information Science, Nara Institute of Science and Technology
著者名 西浦, 敬信 中村, 哲 鹿野, 清宏

× 西浦, 敬信 中村, 哲 鹿野, 清宏

西浦, 敬信
中村, 哲
鹿野, 清宏

Search repository
著者名(英) Takanobu, Nishiura Satoshi, Nakamura Kiyohiro, Shikano

× Takanobu, Nishiura Satoshi, Nakamura Kiyohiro, Shikano

en Takanobu, Nishiura
Satoshi, Nakamura
Kiyohiro, Shikano

Search repository
論文抄録
内容記述タイプ Other
内容記述 テレビ会議システムや音声による機器の制御において,発話者から離れた位置にあるマイクロホンで発話者の音声を高音質に受音することは極めて重要である.そこで発話者から離れた位置にあるマイクロホンでも発話者の音声を高音質に受音する方法としてマイクロホンアレーが注目されている.マイクロホンアレーを用いて高音質に発話者の音声を受音するためには,発話者の方向を推定することが必要となる.しかし,これまでの方向推定に関する研究では,複数の音源方向を推定することは多数試みられているが,その中から話者方向を推定することは困難であった.そこで本稿では,HMMに基づく音源識別を用いた話者位置推定法を提案する.まず,マイクロホンアレーを用いて音源方向を推定したのちに,ビームフォーミングを行い,その音を高音質に受音する.その後,HMMを用いた音声および環境音モデルにより音声・非音声の識別を行うことにより話者方向を推定する.また,本システムの音声認識性能も合わせて評価する.評価実験の結果,本手法により残響下でも良好に音声・非音声が識別でき,話者の方向を推定できることがわかった.
論文抄録(英)
内容記述タイプ Other
内容記述 It is very important for a hands-free speech interface to capture distant talking speech with high quality. A microphone array is an ideal candidate as an effective method for capturing distant talking speech. However, it is necessary to localize the target talker before capturing distant talking speech using a microphone array. In the conventional method of talker localization, it is difficult to estimate the target talker position accurately among localized sound sources, while the sound sources can be easily localized in a multiple sound source environment. To cope with this problem, we propose a talker localization algorithm by discriminating the sound sources using statistical speech and noise models based on HMMs (Hidden Marcov Models). First, the directions of signal arrival are estimated using a microphone array. Then, the desired sound signals are enhanced by steering the directivities to the estimated directions of signal arrival. The talker can be localized after discriminating between "speech" or "noise" from the desired sound signals using statistical speech and noise HMMs. In this paper, we evaluate the discrimination performance for the source position-known condition and position-unknown condition. The system recognizes the input from a sound source which is discriminated as being "speech" using statistical speech and noise HMMs. As a result, we confirm that the talker position is localized accurately because speech and noise can be discriminated effciently in reverberant environments.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 情報処理学会研究報告音声言語情報処理(SLP)

巻 2000, 号 119(2000-SLP-034), p. 31-36, 発行日 2000-12-21
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 04:28:49.298896
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3