ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2010
  4. 2010-SLP-082

ベイズ推論を用いた連続音声からの言語モデル学習

https://ipsj.ixsq.nii.ac.jp/records/69914
https://ipsj.ixsq.nii.ac.jp/records/69914
d53e0377-de84-4e13-8462-044833cefeb8
名前 / ファイル ライセンス アクション
IPSJ-SLP10082016.pdf IPSJ-SLP10082016.pdf (514.8 kB)
Copyright (c) 2010 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2010-07-15
タイトル
タイトル ベイズ推論を用いた連続音声からの言語モデル学習
タイトル
言語 en
タイトル Learning a Language Model from Continuous Speech using Bayesian Inference
言語
言語 jpn
キーワード
主題Scheme Other
主題 言語モデル
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学情報学研究科
著者所属
京都大学情報学研究科
著者所属
京都大学情報学研究科
著者所属
京都大学情報学研究科
著者所属(英)
en
Kyoto University, Graduate School of Informatics
著者所属(英)
en
Kyoto University, Graduate School of Informatics
著者所属(英)
en
Kyoto University, Graduate School of Informatics
著者所属(英)
en
Kyoto University, Graduate School of Informatics
著者名 Graham, NEUBIG 三村, 正人 森, 信介 河原, 達也

× Graham, NEUBIG 三村, 正人 森, 信介 河原, 達也

Graham, NEUBIG
三村, 正人
森, 信介
河原, 達也

Search repository
著者名(英) Graham, Neubig Masato, Mimura Shinsuke, Mori Tatsuya, Kawahara

× Graham, Neubig Masato, Mimura Shinsuke, Mori Tatsuya, Kawahara

en Graham, Neubig
Masato, Mimura
Shinsuke, Mori
Tatsuya, Kawahara

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿ではテキストを用いず,連続音声のみから言語モデルを学習する方法を提案する.音響モデルのみを用いて作成された音素ラティスに対して推論を行い,単語境界と言語モデルを同時に学習する.具体的には,ノンパラメトリックベイズ法に基づく階層的 Pitman-Yor 言語モデルを利用し,パラメータは WFST に基づいたギブスサンプリングで推定する.会議音声を用いた実験において,提案手法によって学習された言語モデルはパープレキシティ及び音声認識の音素誤り率を有意に改善することができた.さらに,ラティス処理と単語単位の獲得が誤り率の改善に貢献していることがわかった.
論文抄録(英)
内容記述タイプ Other
内容記述 This paper proposes a technique for learning a language model directly from continuous speech, without the use of text. Inference is performed over phoneme lattices generated using only acoustic model scores, and word boundaries and a language model are learned simultaneously. A Bayesian non-parametric Hierarchical Pitman-Yor language model is used, and parameters are estimated with WFST-based Gibbs sampling. An experiment was performed using meeting speech, and language models built using the proposed techniques were able to significantly lower ASR phoneme error rates. In addition, lattice processing and word boundary discovery were shown to contribute significantly to this improvement.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2010-SLP-82, 号 16, p. 1-6, 発行日 2010-07-15
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 23:43:09.790012
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3