WEKO3
-
RootNode
アイテム
ロボットに装着されたマイク信号中からの音韻キュー探索による話者方向の同定
https://ipsj.ixsq.nii.ac.jp/records/47716
https://ipsj.ixsq.nii.ac.jp/records/47716cba0f5b2-3553-4005-94e8-303f632bb9cd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-05-15 | |||||||
タイトル | ||||||||
タイトル | ロボットに装着されたマイク信号中からの音韻キュー探索による話者方向の同定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speaker-direction Detection under Mechanical Noises based on Multi-speaker Phoneme-cue Search | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
関西学院大学理工学部情報科学学科 | ||||||||
著者所属 | ||||||||
関西学院大学理工学部情報科学学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kwansei Gakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kwansei Gakuin University | ||||||||
著者名 |
沼波, 宰
川端, 豪
× 沼波, 宰 川端, 豪
|
|||||||
著者名(英) |
Tsukasa, Nunami
Takeshi, Kawabata
× Tsukasa, Nunami Takeshi, Kawabata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音韻キュー探索に基づく話者方向同定の新しい手法を提案する。三つのマイクをロボットの左右の肩と胸に設置することで三角形を形成し、全方向の方向同定を行う。それぞれのチャンネルに対し、機械音からなる直接雑音が混入した音声中から複数の音韻の成分を探索し、その探索された母音部分の時間差を三角形の各辺について求め、統合することで角度判定を行う。本報告では、まず異なる話者の音韻キューを使用した場合の性能劣化を検証する。その後、本人を含めた複数話者の音韻キューを併用したマルチテンプレート法の性能を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes an improvement of the speaker-direction detection method based on the multi-speaker phoneme-cue search. Three microphones, located at robot shoulders and a chest, make a triangle and enable all directional speaker-direction detection. The system searches for the spectral elements of several vowels with the three-channel noisy speech with direct motor and mechanical noises. The time delays among these three channels indicate the speaker direction. First, this paper shows the degradation of direction-detection accuracy in the case that another person’s vowels are used for phoneme cues. After that, we show the effectiveness of the multi-speaker phoneme-cue approach. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2008, 号 46(2008-NL-185), p. 65-70, 発行日 2008-05-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |