WEKO3
アイテム
高次統計量の分布モデルを用いた音声・環境音識別法の検討
https://ipsj.ixsq.nii.ac.jp/records/57127
https://ipsj.ixsq.nii.ac.jp/records/57127be5f130d-6474-4bbe-98d6-62f84a90e478
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-07-17 | |||||||
タイトル | ||||||||
タイトル | 高次統計量の分布モデルを用いた音声・環境音識別法の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Investigation of Voice/Sound Activity Classifier using Distribution Models of Fourth - Order Statistics | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
産業技術総合研究所情報処理研究部門 | ||||||||
著者所属 | ||||||||
産業技術総合研究所情報処理研究部門 | ||||||||
著者所属 | ||||||||
産業技術総合研究所情報処理研究部門 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
AIST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
AIST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
AIST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者名 |
吉村, 隆
× 吉村, 隆
|
|||||||
著者名(英) |
Takashi, Yoshimura
× Takashi, Yoshimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音響信号の種類毎にモデル化された高次統計量の分布を用いて、新たな入力の分布から音声と他の環境音を識別する手法について検討を行った。高次統計量として,独立成分分析などで用いられる尖度に着目した.尖度を確率変数とした確率密度関数を信号の種類毎に推定し,入力信号との平均対数尤度が安定して最大となる信号の種類を識別結果としたところ,提案手法は実験結果より特に単発性環境音と音声を区別するのに有効である可能性が示された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We investigate an effective classifier of voice/sound activity. The classifier is constructed by distribution models of fourth-order statistics, especially kurtosis. The distribution models are estimated by kernel density of each voice/sound category. The mean logarithmic probabilities of each voice/sound category were calculated from kurtosis of input signals. Categories with stable and high probabilities were classification results of the input signals. Experimental results show that proposed classification methods are more effective in identification of voice and separated short sound. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2004, 号 74(2004-SLP-052), p. 137-142, 発行日 2004-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |