WEKO3
アイテム
実況・対談における発声変形を考慮した音響モデルの検討
https://ipsj.ixsq.nii.ac.jp/records/56923
https://ipsj.ixsq.nii.ac.jp/records/56923fee283b4-0569-405b-9f22-b7ae64e07e70
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-12-21 | |||||||
タイトル | ||||||||
タイトル | 実況・対談における発声変形を考慮した音響モデルの検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Acoustic models for utterance variation in broadcast commentary and conversation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者名 |
佐藤庄衛
× 佐藤庄衛
|
|||||||
著者名(英) |
Shoei, SATO
× Shoei, SATO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,放送音声の認識率の低下の要因の一つである発話スタイルの影響を改善するため,学習音声中の発声変形頻度を基準とする発声変形用音響モデルの導入法を検討した.発声変形を取り扱う単位として,トライフォン単位と単語単位,およびこれらの単位間でHMMを共有する場合と独立したHMMを用いる場合を取り上げ,次の二つのタスクにおいて,誤認識単語の削減効果を比較した.第一のタスクは,メタデータ制作を目的としたJリーグ中継の実況音声の認識であり,絶叫発話と話速の速い部分を対象とし,発声変形の単位を単語としてHMMを共有した場合に,キーワード誤りの15%が削減された.第二のタスクはニュース番組中の対談部分の認識であり,話速の速い部分に起こる発声変形を対象とした.認識実験の結果,発声変形の単位を単語とし,HMMを共有しない場合が,認識率と探索空間の面から有利であることが確認された.一方,発声変形とみなす単位を単語とした場合の実験結果から.発声変形に単語依存性があることが確認され,HMMを共有した場合に認識誤りの10%が削減された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper investigates acoustic models for utterance variation and their units to improve recognition performance. Using a phoneme or a word as a unit of the variation, the models for utterance variation were trained for frequently observable variation. The variation models sharing HMMs among these models were also examined. The models trained for excitedly uttered words reduced 15% of key word errors in sports commentary. The models trained for rapidly pronounced reduced words 10% of word errors in conversational news. The results also showed dependence of the variation upon words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 127(2005-SLP-059), p. 31-36, 発行日 2005-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |