WEKO3
アイテム
モーラ情報を用いた単語音声認識の検討
https://ipsj.ixsq.nii.ac.jp/records/57276
https://ipsj.ixsq.nii.ac.jp/records/57276fe5db7c1-b001-4d45-94cb-5dae32b340ff
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-12-16 | |||||||
タイトル | ||||||||
タイトル | モーラ情報を用いた単語音声認識の検討 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
鳥取大学工学部 | ||||||||
著者所属 | ||||||||
鳥取大学工学部 | ||||||||
著者所属 | ||||||||
鳥取大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Tottori university | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Tottori university | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Tottori university | ||||||||
著者名 |
妹尾, 貴宏
× 妹尾, 貴宏
|
|||||||
著者名(英) |
Takahiro, Seo
× Takahiro, Seo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在,単語音声認識では特徴パラメータとしてケプストラムが使用されている.ケプストラムは,低次にフォルマント情報を,高次にピッチ情報を,それぞれ含んでいる.従来の音声認識では,入力パラメータとして,フォルマント情報が使用されている.ピッチ情報は,ピッチ周波数を安定して抽出するのが困難なため,通常使用されない.しかし,最近の研究でピッチ周波数とモーラ情報には依存関係があることが知られている.本研究では,ピッチ情報のかわりにモーラ情報を使用することによりフォルマントにおけるピッチの影響を分離できると仮定し,モーラ情報を使用して単語音声認識を行った.その結果,多くの話者に対し認識率が向上した.また,モーラ情報を使用した認識結果は,語頭語尾を考慮したモデルやTriphoneモデルの認識結果よりも高い,という結果が得られた.その結果,モーラ情報の有効性が認められた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, in word speech recognition, cepstram is normally used as parameters. And, pitch information is not normally used because it is difficult to extract pitch frequency steady. However, in recent reserches, it is known that there is a relation between pitch frequency and mora information. Then in this paper, we performed word speech recognition using mora information in stead of pitch and examined its validity. In the results, by using mora information, error rate of word speech recognition could decrease for many speeker. And comparing the results of word speech recognition using mora information with using begining and ending of a word or using triphone , the recognition rate using mora infomation was higher. And the efficiency of this way was confirmed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2002, 号 121(2002-SLP-044), p. 55-61, 発行日 2002-12-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |