WEKO3
アイテム
モーラ情報を用いた音素ラベリング方式の検討
https://ipsj.ixsq.nii.ac.jp/records/57175
https://ipsj.ixsq.nii.ac.jp/records/5717571b42899-0b37-4fba-bfbf-3a8bfb4453cb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-12-18 | |||||||
タイトル | ||||||||
タイトル | モーラ情報を用いた音素ラベリング方式の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Segmentation using Mora position and Mora length and Accent | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
鳥取大学工学部知能情報工学科 | ||||||||
著者所属 | ||||||||
鳥取大学工学部知能情報工学科 | ||||||||
著者所属 | ||||||||
鳥取大学工学部知能情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Knowledge Engineering, Faculty of Engineering, Tottori University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Knowledge Engineering, Faculty of Engineering, Tottori University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Knowledge Engineering, Faculty of Engineering, Tottori University | ||||||||
著者名 |
村上, 仁一
× 村上, 仁一
|
|||||||
著者名(英) |
Jin-Ichi, Murakami
× Jin-Ichi, Murakami
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識や合成システムなどの音声情報処理の研究において,音その境界位置を示すラベリングデータは重要である.自動ラベリングの研究は従来から多くの研究機関で行われている.しかし現段階の精度はまだ十分ではなく,さらに高い精度が要求されている.ところで音声信号は大きく2つの情報で構成されている.1つはフォルマントで,もう1つはピッチである.この2つの情報を分離するためにケプストラム分析が良く利用される.この分析方法では,低次の項にフォルマントが、高次の項にピッチが抽出される。現在の音声認識や音素ラベリングでは,フォルマント情報が利用されている.つまりケプストラム分析をして低次の項が利用される,しかしケプストラム分析をおこなった場合,ケプストラムの低次の項は,高次の項の影響を受けることが知られている.つまりフォルマントを計算するときに,ピッチが影響することが知られている.一方,ピッチ周波数と単語のモーラ数およびモーラ位置の間に依存関係があることが報告されている.本論文では,このピッチ周波数と単語のモーラ数およびモーラ位置の関係を使うことで,フォルマントにおけるピッチの影響を分離できると仮定した.そして,この関係を使用して自動ラベリングを行えば,音素境界位置の精度は向上すると予想した.この予想を検証するため,始めに母音・促音・撥音を単語のモーラ数および単語のモーラ位置で分類して音素HMMの学習を行った.次に作成した音素HMMを使用して単語の音素ラベリングデータを作成した.最後に求められた音素境界位置と,人手によって付与された音素境界位置の差の標準偏差を調べた.この標準偏差のモーラ数およびモーラ位置を使用したときとしないときで調べて,本手法の有効性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we consider that the influences between pitch and formant could be separated using the relation of the mora and pitch. And using this relation, the accuracy of the phoneme boundaries will improve. First we trained the phone HMM using mora information. Next we calculate the alignment (phoneme boundaries) using this phone HMM. Last, we evaluated the standard deviation between the obtained phoneme boundaries and human checked phoneme boundaries. As the result of experiments, The effectiveness of mora information is proved. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 124(2003-SLP-049), p. 145-150, 発行日 2003-12-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |