WEKO3
アイテム
日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価
https://ipsj.ixsq.nii.ac.jp/records/56922
https://ipsj.ixsq.nii.ac.jp/records/569223fe25ace-4802-4f75-ad4c-61d5bcbc7412
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-12-21 | |||||||
タイトル | ||||||||
タイトル | 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance evaluation of lecture speech recognition by pronunciation variant model using Corpus of Spontaneous Japanese | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属 | ||||||||
山形大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Yamagata University | ||||||||
著者名 |
阿部, 拓也
× 阿部, 拓也
|
|||||||
著者名(英) |
Takuya, ABE
× Takuya, ABE
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,自然発話に近い大規模な音声データべ-スを用いて,大語彙連続音声認識が研究されている.本論文では,2004年6月に公開された「『日本語話し言葉コーパス:CSJ』最終公開版」の書き起こしテキストを用いて,音声に忠実な読みを持つ形態素解析データを作成し,その解析データから構築した言語モデル(これを,発音変形依存モデルと呼ぶ)の性能評価を行う.さらに,音響モデル,言語モデルに対して評価セットの認識結果を用いて教師なし適応を繰り返し行い,その性能について評価する.公開版CSJのtestset1により評価した結果,発音変形依存モデルを用いて平均19.96%の単語誤り率を達成し,教師なし適応を繰り返し行うことで,最終的に平均15.41%の単語誤り率を達成した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In recent years, many aggressive approaches for large vocabulary continuous speech recognition system trained on large-scale spontaneous speech database have been investigated. In this paper, we introduce a method of language modeling based on morphological analysis data designed for pronunciation variant. Tile method was evaluated on the Corpus of Spontaneous Japanese (CSJ) and reduced the word error rate (WER) by about 5 0/o absolute. In addition, unsupervised adaptation of both acoustic and language models was introduced to improve the recognition performance fu1.ther. The result showed the decrease in WER fron1 19.96 % without adaptation to 15.41 % with unsupervised adaptation. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 127(2005-SLP-059), p. 25-30, 発行日 2005-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |