WEKO3
アイテム
話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識
https://ipsj.ixsq.nii.ac.jp/records/56585
https://ipsj.ixsq.nii.ac.jp/records/565853c8dbbe5-ff96-4d61-898c-e5e4de8061df
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-12-02 | |||||||
タイトル | ||||||||
タイトル | 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Recognition by Topic Models with Continuous / Discontinuous Topic Changes | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Guraduate School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Guraduate School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者名 |
佐古, 淳
× 佐古, 淳
|
|||||||
著者名(英) |
Atsushi, Sako
× Atsushi, Sako
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,話題の連続/不連続変化を考慮したトピックモデルを提案し, MIT 講義音声コーパスを用いて行った評価実験について述べる.実環境においては,話者交代や話し方,話題の変化などにより音響的・言語的特徴が時々刻々と変化する.このような変化に対応するため,発話単位で環境適応を行う逐次追従型音声認識が注目されている.本研究では,言語的な変化に着目し,話題の連続的な変化を考慮するモデルとして Online Topic Model を用いた言語モデル適応,及び話題の不連続な変化を考慮するモデルとしてIbpicHMMを用いた言語モデル適応を提案する.評価実験により,これらのトピックモデルを用いることで単語誤り率 (WER) を改善出来ることを確認した.また,刻々と変化する話題を追跡することで,認識結果全体を用いた言語モデルのバッチ適応よりも良好な結果を得ることが出来た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose topic models with continuous/discontinuous topic changes, and describe experiments using MIT Open Course Ware corpus. In a real environment, acoustic and language features vary momentarily depending on speakers, speaking styles or topic changes. To accommodate these changes, speech recognition with incremental tracking of changing environments has attracted attention. We propose a language model adaptation technique by Online Topic Model for continuous topic changes, and a technique by Topic HMM for discontinuous topic changes. The experimental results showed the improvements of Word Error Rate with these topic models. Moreover, the proposed methods outperformed the batch adaptation of language model using whole speech recognition results by tracking temporal changes of topics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 123(2008-SLP-074), p. 55-60, 発行日 2008-12-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |