WEKO3
アイテム
局所特徴量によるフィッシャー重みマップに基づく音素認識
https://ipsj.ixsq.nii.ac.jp/records/56863
https://ipsj.ixsq.nii.ac.jp/records/568633961c6cd-804b-42b4-afcf-fc3fe343d2a4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-12-22 | |||||||
タイトル | ||||||||
タイトル | 局所特徴量によるフィッシャー重みマップに基づく音素認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Phoneme Recognition Based on Fisher Weight Map to Local Features | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
神戸大学自然科学研究科 | ||||||||
著者所属 | ||||||||
神戸大学自然科学研究科 | ||||||||
著者所属 | ||||||||
神戸大学自然科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduated School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduated School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduated School of Science and Technology, Kobe University | ||||||||
著者名 |
加藤俊祐
× 加藤俊祐
|
|||||||
著者名(英) |
Shunsuke, KATO
× Shunsuke, KATO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、高次局所自己相関(HLAC)とフィッシャー重みマップ(FWM)に基づく新しい音声特徴抽出法について提案する。現在、音響・音声認識分野では、MFCC が広く用いられているが、時間特徴が表現できていないという問題がある。この問題を解決するために、時間ー周波数平面上の3x3局所領域において、35種類の局所パターンに対する局所自己相関特徴を計算し、これを局所特徴量とする。ある一定の時間幅を持つ時間ー周波数平面(フレーム)において、35種類の局所パターンごとに、識別効果の高い領域の局所特徴量に重みを付けて加算し、音声特徴ベクトル(35次元)を形成する。この重みをフィッシャー重みマップと呼ぶ。音素認識において、HLAC と FWM の有効性を確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a new feature extraction method based on higher-order local auto-correlation (HLAC) and Fisher weight map (FWM). Widely used MFCC features lack temporal dynamics. To solve this problem, 35 types of local auto-correlation features are computed within two-dimensional local regions. These local features are accumulated over more global regions by weighting high scores on the discriminative areas where the typical features among all phonemes are well expressed. This score map is called Fisher weight map. We verified the effectiveness of the HLAC and FWM through total phoneme recognition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2006, 号 136(2006-SLP-064), p. 197-202, 発行日 2006-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |