WEKO3
アイテム
HMMを用いた環境音識別の検討
https://ipsj.ixsq.nii.ac.jp/records/57559
https://ipsj.ixsq.nii.ac.jp/records/57559fad6f1cd-8182-4a53-b493-9d16a4a1e402
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-12-20 | |||||||
タイトル | ||||||||
タイトル | HMMを用いた環境音識別の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Environmental Sound Discrimination Based on Hidden Markov Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
三木, 一浩
× 三木, 一浩
|
|||||||
著者名(英) |
Kazuhiro, Miki
× Kazuhiro, Miki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 実環境において音声によるコミュニケーションを行なう場合、人間は音場の中から対象となる音源つまり、発話者を同定し、その方向から来る音に聞き耳を立て、相手の音声の認識を行なう。このとき、人間はそれらの環境音の中であっても音声を識別し発話を認識することができる。したがって、自律移動ロボットなどのシステムにおける音声認識を考える場合についても、環境音と音声を識別することは大変重要になる。本稿では種々の環境音が存在する状況において音声認識を行なうための第一歩として、HMMを用いた環境音の認識実験および環境音と音声の識別を試みる。3状態HMMによる90種類の環境音に対する認識実験では95.4%の認識率が得られた。また、本稿では環境音のクラスモデルを用いたHMM合成法を提案する。提案法を用いて環境音の重畳した音声に対する認識実験を行なった結果、音声区間の前の雑音を使用して雑音モデルを学習する従来のHMM合成法に対して高い認識性能が得られた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In real acoustic environments, human communicates each other through speech by focusing on the target speech sound among environmental sounds. We can easily discriminate the target sound from other environmental sounds. For hands-free speech recognition, the discrimination of the target speech from environmental sounds is inevitable. This mechanism might also be important even for the self moving robot to sense acoustic environments and communicate with human. This paper proposes HMM-based environmental sound recognition. Environmental sounds are modeled by three state HMMs and evaluated using 90 kinds of environmental sounds. The recognition accuracy was 95.4%. This paper also proposes recognition of the environment sound-added isolated words by HMM composition. The experiments show the HMM composition of speech HMMs and a HMM of class environmental sounds outperforms the conventional HMM composition of speech HMMs and a noise HMM trained using noise periods prior to the target speech in the environments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 108(1999-SLP-029), p. 79-84, 発行日 1999-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |